「不揃いなデータ達の分析を行う前のTips」(ARG第7回Webインテリジェンスとインタラクション研究会 特別企画)
WI2の特別講演「不揃いなデータ達の分析を行う前のTips」が始まる.チュートリアル講演者は,豊橋技術科学大学の吉田光男先生,日本IBMの伊川洋平氏,東京大学の佐々木一氏,座長は,東大の榊氏と杉原でお送りします. #sigwi2
2015-11-28 12:53:29#sigwi2 今から、データの前処理的な泥臭い話を講演していただくという、あまり他に無い企画を始めます。 #副座長
2015-11-28 13:04:30最初の講演者は,吉田先生.Webデータのスクロールについて.ご本人の希望で内容のツイートは控えます. #sigwi2
2015-11-28 13:05:33CiNii へのアクセスは、普通にアクセスキーをもらうか、ダンプデータをもらえるはず。J-Stage も API キーがあったけど、API バージョンがかわってからどうなったのかな? #sigwi2
2015-11-28 13:32:08位置情報付きツイートの話のもよう.世の中のセンサーとしてツイッター(ソーシャルメディア)を使う.世の中というのは,電車が動かない,水が買いたいのに買えない,など. #sigwi2
2015-11-28 13:39:20TVを見ながら実況しているユーザが多いので,紅白歌合戦における出演者の地域性を分析した→関ジャニには全国的に人気があり,コブクロは関西中心でツイートがあった(←大阪の路上で活動していたから?). #sigwi2
2015-11-28 13:42:17.@ceekz そうなんですよね。アップデートしたとき、半年ぐらい待ってから公開はまだがと問い合わせたのですが、しばらくお待ちくださいという返事のままでした #sigwi2
2015-11-28 13:44:44ソーシャルメディアにおける位置情報は,メッセージ中の地名,居住地,現在地.ソーシャルメディアにおける位置情報の抽出方法について説明する・ #sigwi2
2015-11-28 13:45:55調査用データセットにはTwitter streaming APIを利用して,ユーザ居住地,メッセージ中の地名,メッセージの発信場所を推定する. #sigwi2
2015-11-28 13:48:52居住地として設定されるテキスト:正式名称,正式名称の異表記(下北沢,駅名,など),地名ではないが特定の場所を示す表現(試される大地など),地名ではない表現(地球,どこか,など) #sigwi2
2015-11-28 13:51:38