言語処理屋さんが連携していく様子その2

「現在、東北関東大震災に関して様々なところで種々の情報が飛び交っています。その中でも、特に被災された方々の安否情報は最も重要な情報であり、できるだけ正確な情報を大量に整理する必要があります。しかしながら実際は情報は大量でかつ様々なところに分散して存在しているために探しにくいだけでなく(略)」ということで多くの専門家が協力し、必要な言語資源を重複すること無く構築する試みが行われています。 進展の様子がハッシュタグ #anpi_nlp として進んでいますが、その記録として現時点までの全ツイートを残しておきます。 関連1: プロジェクトとして動き出すまでの様子 http://togetter.com/li/111529 続きを読む
1
Masato Hagiwara (萩原正人) @mhagiwara_ja

#anpi_nlp いいですね。使わせていただきます! @jmizuno @rtokuhisa 単語区切りが分かりづらそうなので,#anpi_nlpでどうでしょうか

2011-03-15 11:04:09
Ryoko TOKUHISA / 徳久良子 @rtokuhisa

@kmura @jmizuno @mhagiwara @inuikentaro @underspecified @yotarow 先程、乾さんと電話で話しました。内容詳細は乾さんと萩原さんにメールしましたのでそちらをご覧ください。 #anpi_nlp

2011-03-15 11:57:05
masaoutiyama @masaoutiyama

@kmura @mhagiwara #anpi_nlp media wiki でしたら本日中に立ち上げられると思います。

2011-03-15 12:08:50
Masato Hagiwara (萩原正人) @mhagiwara_ja

.@masaoutiyama @kmura ありがとうございます!そこに #anpi_nlp 的な情報を集約させていただければと思います。

2011-03-15 12:14:18
Junta MIZUNO @jmizuno

#anpi_nlp NHK教育で流れている安否情報の音声って自動書き起こしできないのかな?漢字変換までやって間違えるとかえって混乱しそうだから,平仮名のままとか.

2011-03-15 13:58:15
Masato Hagiwara (萩原正人) @mhagiwara_ja

昨日の安否関連ツイートに人名・地名・組織名をタグ付けしたデータ、数は少ないですがあります。欲しい方は連絡ください #anpi_nlp

2011-03-15 16:58:07
Taiichi Hashimoto @taiichi84

@mhagiwara @kmura 拡張固有表現のモデルがあります.ノートなので,全部で6時間ぐらいかかると思います.組織名を追加して,解析をはじめます.たぶん,提供できるのは夜中かな. #anpi_nlp

2011-03-15 17:12:13
masaoutiyama @masaoutiyama

@kmura @mhagiwara #anpi_nlp media wiki のページを作成しました。 http://trans-aid.jp/ANPI_NLP/ 誰でもがアカウントを作成してファイルをアップロードできるようになっています。

2011-03-15 17:13:22
Koji Murakami @kmura

@masaoutiyama @mhagiwara #anpi_nlp 早速ありがとうございます!こちらで整えたデータなど、実体、リンクなど、共有できる情報を上げさせていただきます。

2011-03-15 17:22:50
Masato Hagiwara (萩原正人) @mhagiwara_ja

ありがとうございます!早速使わせてもらっています RT @masaoutiyama @kmura #anpi_nlp media wiki のページを作成しました。 http://trans-aid.jp/ANPI_NLP/

2011-03-15 17:30:43
Masato Hagiwara (萩原正人) @mhagiwara_ja

RT @masaoutiyama: @kmura @mhagiwara #anpi_nlp media wiki のページを作成しました。 http://trans-aid.jp/ANPI_NLP/ 誰でもがアカウントを作成してファイルをアップロードできるようになっています。

2011-03-15 17:34:29
Yasutaka SHINDOH  @y_shindoh

RT @masaoutiyama: @kmura @mhagiwara #anpi_nlp media wiki のページを作成しました。 http://trans-aid.jp/ANPI_NLP/ 誰でもがアカウントを作成してファイルをアップロードできるようになっています。

2011-03-15 17:34:41
Masato Hagiwara (萩原正人) @mhagiwara_ja

Google Person Finder のダンプデータ見てるが、やはり名前の表記揺れがひどい。旧字体、カナ、ローマ字。これを入力側でなんとかすることはできないので、名寄せ技術がかなり役立つと思う。また NLP の出番ですね #anpi_nlp

2011-03-15 17:52:37
Taku Kudo @taku910

RT @masaoutiyama: @kmura @mhagiwara #anpi_nlp media wiki のページを作成しました。 http://trans-aid.jp/ANPI_NLP/ 誰でもがアカウントを作成してファイルをアップロードできるようになっています。

2011-03-15 19:33:36
イルカ人間 @niam

RT @mhagiwara: Google Person Finder のダンプデータ見てるが、やはり名前の表記揺れがひどい。旧字体、カナ、ローマ字。これを入力側でなんとかすることはできないので、名寄せ技術がかなり役立つと思う。また NLP の出番ですね #anpi_nlp

2011-03-15 20:38:16
Atsushi Fujita @akf

Google Person Finder に仙台・福島在住の知人の名前を入れても全然出てこないので,何とかならないかと考えています.名寄せも一つの手ですが,Facebookばりの柔軟な照合で,Recall重視にしてはどうかと思います.G社の方々,いかが? #anpi_nlp

2011-03-15 20:38:36
清水信哉/Elephantech/Climate Tech @shinyashimizu_j

RT @mhagiwara: Google Person Finder のダンプデータ見てるが、やはり名前の表記揺れがひどい。旧字体、カナ、ローマ字。これを入力側でなんとかすることはできないので、名寄せ技術がかなり役立つと思う。また NLP の出番ですね #anpi_nlp

2011-03-15 20:41:44
@heigazen

RT @akf: Google Person Finder に仙台・福島在住の知人の名前を入れても全然出てこないので,何とかならないかと考えています.名寄せも一つの手ですが,Facebookばりの柔軟な照合で,Recall重視にしてはどうかと思います.G社の方々,いかが? #anpi_nlp

2011-03-15 20:41:52
Atsushi Fujita @akf

@mhagiwara さんの指摘のように異体字やひらがなカタカナ表記の統合でかなりカバーできると思いますが,外国人の方の名前には,アルファベット翻字+類似文字列検索も必要です.@chokkanorg さんの SimString とか. #anpi_nlp

2011-03-15 20:43:50
Yohei Kawaguchi @yohekawag

RT @akf: Google Person Finder に仙台・福島在住の知人の名前を入れても全然出てこないので,何とかならないかと考えています.名寄せも一つの手ですが,Facebookばりの柔軟な照合で,Recall重視にしてはどうかと思います.G社の方々,いかが? #anpi_nlp

2011-03-15 20:51:19
Yasutaka SHINDOH  @y_shindoh

RT @akf: Google Person Finder に仙台・福島在住の知人の名前を入れても全然出てこないので,何とかならないかと考えています.名寄せも一つの手ですが,Facebookばりの柔軟な照合で,Recall重視にしてはどうかと思います.G社の方々,いかが? #anpi_nlp

2011-03-15 20:55:16
ケン・ヤマナカ @sturm_tonnerre

RT @mhagiwara: Google Person Finder のダンプデータ見てるが、やはり名前の表記揺れがひどい。旧字体、カナ、ローマ字。これを入力側でなんとかすることはできないので、名寄せ技術がかなり役立つと思う。また NLP の出番ですね #anpi_nlp

2011-03-15 20:56:11
Taku Kudo @taku910

RT @akf: Google Person Finder に仙台・福島在住の知人の名前を入れても全然出てこないので,何とかならないかと考えています.名寄せも一つの手ですが,Facebookばりの柔軟な照合で,Recall重視にしてはどうかと思います.G社の方々,いかが? #anpi_nlp

2011-03-15 21:09:55
Masato Hagiwara (萩原正人) @mhagiwara_ja

そうですね。特に中国人名は、NLP2011のプログラムのように、漢字・日本読み・中国読み・ピンインが混在して大変なことになります RT @akf ... 外国人の方の名前には,アルファベット翻字+類似文字列検索も必要です #anpi_nlp

2011-03-15 23:09:38
1 ・・ 23 次へ