vastee | VasteeLab - パート 10

BERTをfine-tuningする際のTips [自分用メモ]

2月 24, 2022BERT,PyTorch,Transformer

AI SHIFT様が作成されたブログ記事が分かりやすかったので、筆者としての解釈を自分用メモとして残すことにする。

Kaggleで学んだBERTをfine-tuningする際のTips①〜学習効率化編〜 | 株式会社AI ...

記事を読む BERTをfine-tunin ...

無料で閲覧可能なアメリカの経済指標データ [FRED]

2月 23, 2022Stock

7月 2, 2022

投資をしていると，株価だけではなく，雇用統計やガソリン価格などを観察したいと思うことがあるだろう．そんなときはセントルイス連邦準備銀行の研究部門によって維持されている経済指標データ閲覧サイトFREDを使うと良い．

本記事で ...

記事を読む無料で閲覧可能な ...

JAXでGPUを使う

2月 22, 2022JAX

2月 23, 2022

Pytorchだと.cuda()などでGPUを使うのだが、JAXの場合はpipインストール時にcudaのバージョンを指定することでGPUを使うことができる。

環境にインストールされているCUDAのバージョンが10.02の場 ...

記事を読む JAXでGPUを使う

On-the-flyの意味 [技術スラング]

2月 18, 2022技術スラング

On-the-Fly Attention Modulation for Neural Generation

というタイトルの論文に遭遇。

アブストをDeepLで翻訳すると以下のようになった。

「深層 ...

記事を読む On-the-flyの意味 ...

“sledge hammer” approachの意味することは？[技術スラング]

2月 18, 2022技術スラング

Googleの提供する深層学習フレームワークFlaxのドキュメントを読んでいると“sledge hammer” approachという表現に遭遇。

Linen supports the capture of interme ...

記事を読む “sledge hammer” ...

MLP-Mixerに関する検証用コード

2月 1, 2022PyTorch

MLP-Mixerに関して、GitHub – rishikksh20/MLP-Mixer-pytorch: Unofficial implementation of MLP-Mixer: An all-MLP Archit ...

記事を読む MLP-Mixerに関す ...

wav2vecで用いられるロス関数に関して

2月 1, 2022Transformer

Facebook(現メタ) AIが公開した新しい音声フレームワークwav2vecに関して、ロス関数にフォーカスをあてた説明を行う。

wav2vec 2.0: A Framework for Self-Supervised ...

記事を読む wav2vecで用いら ...

Weight Sharering (重み共有)の実装方法 [Pytorch]

1月 31, 2022PyTorch

Pytorchのチュートリアルから、weight sharering（重み共有）の実装方法を紹介する。

今回扱うのは以下のチュートリアルである。

Learning PyTorch with Examples — ...

記事を読む Weight Sharering ...

KLとJS Divergenceの違い

1月 21, 2022Deep Learning,GAN

KL(Kullback-Leibler) divergenceと Jensen-Shannon(JS) divergenceは、２つの確率分布の類似性を知るための指標である。

KL divergenceは以下の式で得られ、 ...

記事を読む KLとJS Divergenc ...

Mode droppingとは？ [深層学習][GAN]

1月 21, 2022Deep Learning,GAN

画像のいくつかの表現しにくいモードがGeneratorに無視されてしまうこと。前回の記事で説明したモード崩壊(Mode dropping)と近いGANの失敗原因となる。

モード崩壊と比べて解説記事が少ないため、筆者の推測込 ...

記事を読む Mode droppingと ...