位置情報と紐付いたオフィシャルサイト情報
位置情報と紐付いたCGMコンテンツDBは山ほどあるが 位置情報と紐付いたオフィシャルサイトのDBが存在しない それが必要だというのが持論だが 今日むっちゃ賛同してくれる人に会った
2009-11-25 21:50:12位置情報と紐付いたオフィシャルサイトDBが出来ればナビッピのデータ並に有用だと思うのだが ベストな作り方が思いつかない 人手でやるのは膨大過ぎるし クロールしてもどこがオフィシャルか判定出来ないし
2009-11-25 21:53:27一番あり得るのは「オフィシャルサイト情報を集めるための」CGMサイトを作る事だが ユーザに情報登録のモチベーションを生むのが難しそうだ
2009-11-25 21:56:39@kokogiko 同感。30min.はCGMサイトではないので、オフィシャルな情報も集めていますよと。
2009-11-26 01:18:10位置情報+αの価値創造はまだまだ工夫の余地が有りそうだ 今日会った人には「東京都 偏差値」「東京都 人口密度」とか検索しなくても東京付近の地図出しながら「偏差値」「人口密度」と検索したら東京のそれが出て欲しいと言っていた
2009-11-25 22:02:15ローカルコンテンツにはそもそもオフィシャルサイトがないものが多いから被リンクが集約されないのでは?ex)ラーメン二郎 RT @kokogiko 位置情報と紐付いたCGMコンテンツDBは山ほどあるが 位置情報と紐付いたオフィシャルサイトのDBが存在しない...
2009-11-26 10:36:28オフィシャルサイトがどこかってのがネット上ではわからないんですよね。Google ビジネスセンターに登録されていればオフィシャルかも。 RT @kokogiko 位置情報と紐付いたCGMコンテンツDBは山ほどあるが 位置情報と紐付いたオフィシャルサイトのDBが存在しない...
2009-11-26 10:40:09位置情報と紐付けたいオフィシャルサイト情報って 店とかもそうだけど むしろ公的機関なんかをより想定してる 引越し先の雰囲気確認なんかで 周辺の学校や警察署や病院のオフィシャルサイトが地図上から判れば非常に有用
2009-11-26 11:31:13とっかかりとして各都道府県のトップを起点として地方公共団体ドメインのページだけをクローリングするのはどうでしょうか。LocoSticker でもやってみようかな。 RT @kokogiko 位置情報と紐付いたオフィシャルサイトDBが出来ればナビッピのデータ並に有用だと思うのだが…
2009-11-26 19:02:13Wikipediaの全ページのデータをごにょごにょしたら「組織・団体名、所在地、ウェブサイトのURL」のよさげなリストができた。だいたい2万5千件。もうちょっと整形しないといけないけど。
2009-12-14 00:34:33はじめはAWSのMapReduceの練習問題にしようと思ってたんだけど、試しにローカルで動かしたら8分くらいで終わってしまった。4GBくらいのファイルを1パスでなめるだけだから、そんなもんか。
2009-12-14 00:43:51LocoStickerのジオコーダは番地までのデータしかないので、今回作ったリストの住所を精度良く緯度経度に変換しようと思ったら他所のジオコーダにお世話にならないといけないというのが切ない。
2009-12-14 00:57:57昨日作ったリストを地図で検索できるようにしてみた。ひっそりとお試し公開。 http://api.locosticker.jp/demo/official_site_search.html @kokogiko が前に言ってたオフィシャルサイト検索っぽくなったでしょうか?
2009-12-14 22:51:50出身中学のサイトは一応あるのにリンクが載ってなかったので、気になってWikipedia の該当項目を編集してしまった。
2009-12-14 23:15:00@tfukui おおー、目指してるのはそんな感じです。さすがです。ただ、個人的に欲しいのは、企業じゃなくて警察・学校・病院・役所とか、そういった公的機関のそれなんですよね。或いは、企業でも小売店・食堂とか、「その場所」に営業主体があるもの。そういうデータって手に入らないです?
2009-12-15 10:40:43@kokogiko 学校はそこそこ出ると思います。役所は県庁、市役所、町役場の類はそろってます。たしかに企業ばっかり目立ってますね。できればカテゴリ分けして表示の切り替えをできるようにしたいです。
2009-12-15 10:57:29まずは Wikipedia のデータでこのくらいまではできるということで。地図上に表示してみたら、「この施設のリンクがあるといいのに」っていう具体的なイメージが出てきますね。病院、駅、保育園、警察、消防署、図書館、あたり。がんばってデータ収集の方法考えます。
2009-12-15 11:05:19ベースのデータはできたので、CGM的にデータを集めることもできるんじゃないかなとも思います。「ここが無いじゃないか」という投稿欲を刺激できるといいのですが。
2009-12-15 11:10:04