正しい意思決定のために… Pythonによるオープンデータプラットフォームを構築せよ #PyConJP_C #pyconjp

日本のオープンデータプラットフォームをPythonでつくる Yuta Kashino https://pycon.jp/2015/ja/schedule/presentation/53/
5
前へ 1 ・・ 3 4 次へ
nanakenashi @nanakenashi

ExcelとかPDFのパースは、要するに頑張ったんだろうか #pyconjp_c

2015-10-10 13:39:33
OpenDataTaylorSwift @t_s_institute

ようやく聞く体勢整った。 Taylor Swift の話聞いている。 #pyconjp #PyConJP_C

2015-10-10 13:40:52
じぇーでぃーさん@がんばらない @j_doby

ちなみに e-Stat のクソデータ、当然ながら項目によって全てフォーマットが違いますからね。共通しているのは拡張子だけですからね。 #pyconjp #PyConJP_C

2015-10-10 13:41:05
Keita @KeitaW09

識者のコメントとデータを表示することでその妥当性を検証したりもできるらしい. #PyConJP_C

2015-10-10 13:41:13
SHIMIZU Taku @takuan_osho

これを作り上げるのに費やした労力凄そう #pyconjp #PyConJP_C

2015-10-10 13:42:03
じぇーでぃーさん@がんばらない @j_doby

BeautifulSoup, lxml で普通にスクレイピングしているらしい #pyconjp #PyConJP_C

2015-10-10 13:42:57
じぇーでぃーさん@がんばらない @j_doby

「XMLの定義が間違っていても数年変わらない。お役所仕事なのでそこだけは信頼できる」 #pyconjp #PyConJP_C

2015-10-10 13:43:32
Shinichi Nakagawa / 中川 伸一 @shinyorke

tornadoをバックエンドにして非同期な処理やらせるのはいいよねー #pyconjp #PyConJP_C

2015-10-10 13:43:41
ぬいぐるみにされた犬bot @M_T_Asagi

「ココ重要なんですが政府のやることはお役所仕事なので、間違ったタグを書いても数年は変わりません」 (会場笑い) 「ここだけは信用できます」 (会場爆笑) #PyConJP_C

2015-10-10 13:44:13
Tatsuro Fujii @FGtatsuro

PythonからExcelは結構簡単に扱える(簡単にパースができるとは言っていない) #PyConJP_C

2015-10-10 13:44:17
FJ @FJKei

データは全部Pandasのデータフレームに突っ込むと良い。 #pyconjp #PyConJP_C

2015-10-10 13:44:56
すずどら @sz_dr

今日だけでelastic searchってキーワード何回も聞いてる気がする #PyConJP_C

2015-10-10 13:45:05
takapy@🗺✈️⛺️🏔 @takahiro0129

スクレイピングやサニタイズはやはり力づくか… #pyconjp_c #pyconjp

2015-10-10 13:45:16
Tatsuro Fujii @FGtatsuro

pandasでデータを整形するっていうのはいいな #PyConJP_C

2015-10-10 13:45:45
SHIMIZU Taku @takuan_osho

さらっとサニタイズしてるって言ってたけど、データ毎にカスタマイズしたプログラム作ってるんだろうなあ。辛そう #pyconjp #PyConJP_C

2015-10-10 13:47:01
nanakenashi @nanakenashi

データごとのサニタイズはプラグインとかに切り出してエコシステムにしたりできないのかな。手伝う人絶対いると思うけど #pyconjp_c

2015-10-10 13:48:52
ECD @Sino_Mitsuki

クローズドβページみれない。。。 #PyConJP_C

2015-10-10 13:49:02
前へ 1 ・・ 3 4 次へ