read_csvでsep=Noneとengine=’python’とすると自動区切り文字検出モードになる [pandas]
data:image/s3,"s3://crabby-images/4d660/4d66068f43d27c75a965e66ddb0e947c6613a2c5" alt="Thumbnail of post image 058"
Pandasのread_csv関数におけるsep=Noneとengine='python'の使用
pandasは、データ解析やデータ操作に広く使われるPythonのライブラリであり、その中でもCSVファイルを読み込むread_csv関数 ...
[行番号, 列名]で値取得
data:image/s3,"s3://crabby-images/0581d/0581d73d2773e1dbec47000fddb15761c8942e6a" alt="Thumbnail of post image 193"
# 列名のみのデータフレーム作成df = pd.DataFrame({'person':,\ 'name':,\ 'num':}) person name num0 a aa 1001 b bb 2002 c cc 3003 a aaa 1 ...
CounterをDictionary(辞書)に変換[Python]
data:image/s3,"s3://crabby-images/be307/be30737e6cbc60e3d29def5a5969e320cacc1802" alt="Thumbnail of post image 043"
import pandas as pdfrom collections import Counterd = Counter({'A': 1, 'B': 2, 'C': 3})df = pd.DataFrame.from_dict(d, or ...
「TXTを1つずつ読み込んで空のDataframeに結合」を繰り返す [Python][Pandas]
data:image/s3,"s3://crabby-images/d2835/d283526a5b2e0f86f7a819d06c6f2f065e89500b" alt="Thumbnail of post image 039"
from pathlib import Pathdef txt_to_df(str_txt): # TXTをDataframeに変換する、何らかの処理 return dftxt_path = Path("./txt/")all_df = p ...
条件にpassがある関数をapplyするとNaNが返ってくる[Python][Pandas]
data:image/s3,"s3://crabby-images/f042f/f042f11cfed9cb8b8bbb2db19e9053182ea5f478" alt="Thumbnail of post image 173"
import pandas as pddef func(row): if row < 3: return row + row else: passdf = pd.DataFrame({'A':,'B':,'C':})df = df.a ...
pandasで自作関数をapplyするときはaxis=1を設定する[Pandas][Python]
data:image/s3,"s3://crabby-images/2a7a6/2a7a6d16d606b2055fd00fabdf01835f10c83960" alt="Thumbnail of post image 068"
import pandas as pddef func(row): if row < 3: return row + row else: return row + rowdf = pd.DataFrame({'A':,'B':,'C' ...
DataFrameから複数列を抽出[Python][Pandas]
data:image/s3,"s3://crabby-images/be307/be30737e6cbc60e3d29def5a5969e320cacc1802" alt="Thumbnail of post image 072"
import pandas as pddf = pd.read_csv("./train.csv")df = df]
空のDataFrameに1行ずつデータを追加[pandas]
data:image/s3,"s3://crabby-images/4d660/4d66068f43d27c75a965e66ddb0e947c6613a2c5" alt="Thumbnail of post image 189"
サンプル
import pandas as pddf = pd.DataFrame()for i in range(5): tmp_series = pd.Series() df = df.append(tmp_series, ...pd.read_csvでUnicodeDecodeErrorがでるときの対処法[Python][Pandas]
data:image/s3,"s3://crabby-images/72097/72097d5f85bf9576eaa69611b2fdd8bb79de2286" alt="Thumbnail of post image 034"
Windowsでpd.read_csvを使うと頻繁にエラーがでる.
エラーがでにくいcsvの読み込み方を見つけたので,メモ.
df = pd.read_csv("./hoge.csv", engine="python ...複数のCSVを読み込んで一つのDataframeにまとめる[Python][Pandas]
data:image/s3,"s3://crabby-images/a8371/a83710bd0144c74c198b82d5bc889c0f3a88fdbd" alt="Thumbnail of post image 182"
hogeというフォルダの中に複数のCSVが配置されているとき、
以下のコードで複数のCSVを一つのDataFrame(表)としてまとめることが可能
from glob import globimport pandas ...