BERT | VasteeLab

BERTをfine-tuningする際のTips [自分用メモ]

AI SHIFT様が作成されたブログ記事が分かりやすかったので、筆者としての解釈を自分用メモとして残すことにする。

Kaggleで学んだBERTをfine-tuningする際のTips①〜学習効率化編〜 | 株式会社AI ...

を参照すると，以下のようにBEiTから特徴を抽出するコードが書かれている．

from transformers import BeitFeatureExtractor, BeitModelfrom PIL import Imag ...

5月 27, 2021

Hugging faceで文をTokenizeすると元の文のSpan情報が失われてしまう。これにより、NERでラベル付けしたトークンの位置をサブワード分割された文の中で見失ってしまうことがある。この困りごとを解決してくれるのが、ret ...

5月 17, 2021BERT

9月 20, 2022

BERTを用いて文や単語から特徴抽出していると、取り出されたベクトルに出現する数字が、バッチサイズを示しているのか、トークン数を示しているのかなどが分からなくなってしまう。見覚えがあるが何の数字だったか混乱した場合は、「BERT 76 ...

2月 1, 2021BERT,Flair

2月 4, 2021

Hugging FaceのTransformersを使って，事前学習済モデルを読み込んで推定させるとタイトルのようなエラーがでることがある．

このエラーはBERTにおけるトークン（サブワード）の最大長512を超えた文が入力 ...