SciSpaCyでテキストからStopWord, 句読点, 数字を除去する
data:image/s3,"s3://crabby-images/99812/99812cdfc3b50a0c762f4605788efb98445aa557" alt="Thumbnail of post image 144"
自然言語で書かれたテキストの前処理として、“I, you, we, am, are” など、一般的に用いられるトークン (Stop word) や、数字や、句読点などを除去することがある。この前処理には、Gen ...
cronが動かないときに試したこと[cron]
data:image/s3,"s3://crabby-images/d177e/d177e1bda5f84f8a28b9bb39f9a3d3eaf6066e0b" alt="Thumbnail of post image 056"
サーバー上でpythonスクリプトをcronで動かそうとしたとき、うまくいかなかったときのことをメモする。
まず、Google検索でみつかったいくつかのブログを参考にし、crontabの記述を確認したり、権限を確認したり、 ...
博論日記 [書籍紹介]
data:image/s3,"s3://crabby-images/7143d/7143d70cc118d45567e7b33b0d1cd098d2d277be" alt="Thumbnail of post image 042"
3年で終わるつもりが、もう7年目・・・奨学金なし、貯金なし、社会人経験もほとんどない・・・博論が終わってもポストがない・・・周りは何をしているのか全く理解してくれないし、「で、まだ博論書いているの?」と言われ続ける日々。自身もかつて博 ...
yamlでスクリプトの引数やファイルパスなどを読み込む [Python][yaml]
data:image/s3,"s3://crabby-images/bf14d/bf14d2a8deb0ca3a3933fc46b5117893d7cae937" alt="Thumbnail of post image 056"
インストール
pip install pyyamlまずは、config.yamlを作成
# config.yamln_class: 10xml_path:/home/ubuntu/disk/xml次にconfi ...
「TXTを1つずつ読み込んで空のDataframeに結合」を繰り返す [Python][Pandas]
data:image/s3,"s3://crabby-images/d2835/d283526a5b2e0f86f7a819d06c6f2f065e89500b" alt="Thumbnail of post image 064"
XML論文からキーワードを抽出し、ワードクラウドで表示[Python]
data:image/s3,"s3://crabby-images/61cec/61cec8f9c10e2aa726113fbe80218b747ba4c4d8" alt="Thumbnail of post image 166"
ElsevierやSpringerなどのオンラインジャーナルは、一般的に、論文がXMLで提供されている。XMLで提供された論文からは、タイトルやアブストラクトや本文が取り出しやすいため、テキスト解析に重宝する。
今回はXM ...
現在時刻を文字列に変換[Python]
data:image/s3,"s3://crabby-images/be307/be30737e6cbc60e3d29def5a5969e320cacc1802" alt="Thumbnail of post image 149"
複数のデータを空のdataframeから生成し、結合する方法[Python][Pandas]
data:image/s3,"s3://crabby-images/99812/99812cdfc3b50a0c762f4605788efb98445aa557" alt="Thumbnail of post image 172"
以下に3つのdataframe生成し、結合するスクリプトを示す。
pd.concatを使うと、dataframeを縦連結することができる。あまり使わないと思うが、axisのオプションで横連結にすることも可能だ。
AWS Multisiteでサブドメインを追加するまで[AWS][Lightsail][WordPress]
data:image/s3,"s3://crabby-images/147dc/147dc72b4b84a6ce77b98410aa394ce0a63ebdee" alt="Thumbnail of post image 064"
以下のAWS公式ドキュメントに沿って実施した。
流れとしては、インスタンスのプライマリドメインの定義→Wordpressダッシュボードでサブドメインを追加である。
WordPressの初期パスワードの取得コマンド[AWS][Lightsail]
data:image/s3,"s3://crabby-images/f042f/f042f11cfed9cb8b8bbb2db19e9053182ea5f478" alt="Thumbnail of post image 151"
AWS Lightsailで、Wordpressのインスタンスを立てた時、初期パスワードを取得するときのコマンドを紹介する。
cd ~cat bitnami_application_password