時系列データ分析を効率的に "pandasによる時系列データ処理" #pyconjp #pyconjp_202
to_datetimeはかしこいので人間が理解できるフォーマットなら大概parseできる formatオプション付ければ日本語日時もいける #pyconjp_202
2016-09-22 15:37:42時系列の話はちらほら聞くけどパネルデータの話ってあまり実務では聞かないというか時系列に吸収されてるんじゃないか疑惑(適当に言っているので間違ってるかも)と思ったけどやっぱパネル系の手法自体滅多に聞かない気がする。#pyconjp_202
2016-09-22 15:38:13Series=列、DataFrame=表で、列を並べて表にするのは頭では分かるんだけどRDBMS的にはきもちわるさを感じる… まぁ現実には一部SeriesのIndexが欠けてたりするからIndexでmergeして表になるのが良いと思うんだけど #pyconjp_202
2016-09-22 15:39:42pandas_datareaderでyahoo financeから株価データを取るときにtickerをlistで渡すとPanelで返ってきます(余談) #pyconjp_202
2016-09-22 15:40:50このへんの話はオライリーの「Pythonによるデータ分析入門」に詳しいからぜひ買おうね #pyconjp_202
2016-09-22 15:43:07> df.interporate() 昔、わざわざ scipy.interporate() を使ってた… #pyconjp #pyconjp_202
2016-09-22 15:44:49rolling.mean()はSimple-MAだからTA-Lib使ってもいいんじゃないかという気もする #pyconjp_202
2016-09-22 15:45:08np.log(closes/closes.shift(1)) ってやると行列的に対数収益率が計算できて便利です #pyconjp_202
2016-09-22 15:46:05> pd.Grouper df.groupby()ばかり使っていて、Grouper知らなかった… #pyconjp #pyconjp_202
2016-09-22 15:48:31> df['発売日'].dt.weekday datetime型なら、 `.dt` が使える! #pyconjp #pyconjp_202
2016-09-22 15:50:30汚いデータに「ありがとう」と言葉をかけ続けるときれいなデータになるからpandasは不要説 #pyconjp_202
2016-09-22 15:54:25sm.tsa.seasonal_decomposeで時系列データの成分分解ができる。シンプル。 #pyconjp #pyconjp_202
2016-09-22 15:56:47