NLP

Thumbnail of post image 144

自然言語で書かれたテキストの前処理として、“I, you, we, am, are” など、一般的に用いられるトークン (Stop word) や、数字や、句読点などを除去することがある。この前処理には、Gen ...

AWS

Thumbnail of post image 056

サーバー上でpythonスクリプトをcronで動かそうとしたとき、うまくいかなかったときのことをメモする。

まず、Google検索でみつかったいくつかのブログを参考にし、crontabの記述を確認したり、権限を確認したり、 ...

書籍紹介

Thumbnail of post image 042

3年で終わるつもりが、もう7年目・・・奨学金なし、貯金なし、社会人経験もほとんどない・・・博論が終わってもポストがない・・・周りは何をしているのか全く理解してくれないし、「で、まだ博論書いているの?」と言われ続ける日々。自身もかつて博 ...

Python

Thumbnail of post image 056

インストール

pip install pyyaml

まずは、config.yamlを作成

# config.yamln_class: 10xml_path:/home/ubuntu/disk/xml

次にconfi ...

Pandas,Python

Thumbnail of post image 064

from pathlib import Pathdef txt_to_df(str_txt): # TXTをDataframeに変換する、何らかの処理 return dftxt_path = Path("./txt/")all_df = p ...

Python

Thumbnail of post image 166

ElsevierやSpringerなどのオンラインジャーナルは、一般的に、論文がXMLで提供されている。XMLで提供された論文からは、タイトルやアブストラクトや本文が取り出しやすいため、テキスト解析に重宝する。

今回はXM ...

Python

Thumbnail of post image 149

from datetime import datetimedatetime.now().strftime("%Y-%m-%d-%H-%M-%S")>>'2020-07-15-05-15-42'

Uncategorized

Thumbnail of post image 172

以下に3つのdataframe生成し、結合するスクリプトを示す。
pd.concatを使うと、dataframeを縦連結することができる。あまり使わないと思うが、axisのオプションで横連結にすることも可能だ。

impo ...

Uncategorized

Thumbnail of post image 064

以下のAWS公式ドキュメントに沿って実施した。

流れとしては、インスタンスのプライマリドメインの定義→Wordpressダッシュボードでサブドメインを追加である。

Uncategorized

Thumbnail of post image 151

AWS Lightsailで、Wordpressのインスタンスを立てた時、初期パスワードを取得するときのコマンドを紹介する。

cd ~cat bitnami_application_password