文字列に含まれる複数のスペースを1つに置換
生データを処理しているとよく遭遇する複数のスペースを含む文章.
2つ以上のスペースを1つにしたいときは以下のコマンド
' '.join(mystring.split())FlairでサクッとNERを実行するコード [Python]
from flair.data import Corpusfrom flair.datasets import ColumnCorpusfrom flair.models import SequenceTaggerfrom flair.tr ...
mod_wsgiをインストールする時のエラーの対処法
エラーに遭遇
pip install mod_wsgiを実行すると,以下のようなエラーがでた
ERROR: Command errored out with exit status 1: command:/home/ubuntu/ ...pyenvでインストールした環境を削除 [Python]
# 現状確認pyenv versions>>* 3.8.6>>system (set by/home/ubuntu/.pyenv/version)# pythonの環境を元のsystemのものに戻すpyenv global system# ...
Flair trainer.trainのパラメータ一覧 [Python]
“””
Trains any class that implements the flair.nn.Model interface.
:param base_path: Main p ...
ImportError: numpy.core.multiarray failed to import [Python]
Traceback (most recent call last):
File “/home/ubuntu/script/train.py”, line 1, in
from flair.dat ...
How to create vocab.txt ? [BERT][ELECTRA][Tokenizers]
pip install tokenizersfrom tokenizers import BertWordPieceTokenizerfrom glob import globimport jsontxt_path = '/path/to/ ...
現在使っているPythonのPYTHON PATHを調べる
Cloud9やSpyderなどのIDEを使っていると、PYTHON PATHを求められることがあるので、これを調べる方法を紹介
調べる方法は簡単で、現在使っているpythonで以下を入力するだけ
python -m ...ELECTRAのpre-trainingを自作データで行う
前準備
この記事は、一つ前の記事の続きとして書きます。
前提条件として、一つ前の記事に沿って、openwebtextをダウンロードし、build_openwebtext_pretraining_dataset.py を実行し ...
BERTのpre-trainingを実行 [2020/9版]
前準備
Tensorflow(GPU版)をpipでインストール。pipのバージョン違いで混乱することがあるため、私はpython -m pipでインストールした。バージョンは1.15にすること。
python -m pip ins ...