言語処理屋さんが連携していく様子その2
#anpi_nlp いいですね。使わせていただきます! @jmizuno @rtokuhisa 単語区切りが分かりづらそうなので,#anpi_nlpでどうでしょうか?
2011-03-15 11:04:09@kmura @jmizuno @mhagiwara @inuikentaro @underspecified @yotarow 先程、乾さんと電話で話しました。内容詳細は乾さんと萩原さんにメールしましたのでそちらをご覧ください。 #anpi_nlp
2011-03-15 11:57:05@kmura @mhagiwara #anpi_nlp media wiki でしたら本日中に立ち上げられると思います。
2011-03-15 12:08:50.@masaoutiyama @kmura ありがとうございます!そこに #anpi_nlp 的な情報を集約させていただければと思います。
2011-03-15 12:14:18#anpi_nlp NHK教育で流れている安否情報の音声って自動書き起こしできないのかな?漢字変換までやって間違えるとかえって混乱しそうだから,平仮名のままとか.
2011-03-15 13:58:15昨日の安否関連ツイートに人名・地名・組織名をタグ付けしたデータ、数は少ないですがあります。欲しい方は連絡ください #anpi_nlp
2011-03-15 16:58:07@mhagiwara @kmura 拡張固有表現のモデルがあります.ノートなので,全部で6時間ぐらいかかると思います.組織名を追加して,解析をはじめます.たぶん,提供できるのは夜中かな. #anpi_nlp
2011-03-15 17:12:13@kmura @mhagiwara #anpi_nlp media wiki のページを作成しました。 http://trans-aid.jp/ANPI_NLP/ 誰でもがアカウントを作成してファイルをアップロードできるようになっています。
2011-03-15 17:13:22@masaoutiyama @mhagiwara #anpi_nlp 早速ありがとうございます!こちらで整えたデータなど、実体、リンクなど、共有できる情報を上げさせていただきます。
2011-03-15 17:22:50ありがとうございます!早速使わせてもらっています RT @masaoutiyama @kmura #anpi_nlp media wiki のページを作成しました。 http://trans-aid.jp/ANPI_NLP/
2011-03-15 17:30:43RT @masaoutiyama: @kmura @mhagiwara #anpi_nlp media wiki のページを作成しました。 http://trans-aid.jp/ANPI_NLP/ 誰でもがアカウントを作成してファイルをアップロードできるようになっています。
2011-03-15 17:34:29RT @masaoutiyama: @kmura @mhagiwara #anpi_nlp media wiki のページを作成しました。 http://trans-aid.jp/ANPI_NLP/ 誰でもがアカウントを作成してファイルをアップロードできるようになっています。
2011-03-15 17:34:41Google Person Finder のダンプデータ見てるが、やはり名前の表記揺れがひどい。旧字体、カナ、ローマ字。これを入力側でなんとかすることはできないので、名寄せ技術がかなり役立つと思う。また NLP の出番ですね #anpi_nlp
2011-03-15 17:52:37RT @masaoutiyama: @kmura @mhagiwara #anpi_nlp media wiki のページを作成しました。 http://trans-aid.jp/ANPI_NLP/ 誰でもがアカウントを作成してファイルをアップロードできるようになっています。
2011-03-15 19:33:36RT @mhagiwara: Google Person Finder のダンプデータ見てるが、やはり名前の表記揺れがひどい。旧字体、カナ、ローマ字。これを入力側でなんとかすることはできないので、名寄せ技術がかなり役立つと思う。また NLP の出番ですね #anpi_nlp
2011-03-15 20:38:16Google Person Finder に仙台・福島在住の知人の名前を入れても全然出てこないので,何とかならないかと考えています.名寄せも一つの手ですが,Facebookばりの柔軟な照合で,Recall重視にしてはどうかと思います.G社の方々,いかが? #anpi_nlp
2011-03-15 20:38:36RT @mhagiwara: Google Person Finder のダンプデータ見てるが、やはり名前の表記揺れがひどい。旧字体、カナ、ローマ字。これを入力側でなんとかすることはできないので、名寄せ技術がかなり役立つと思う。また NLP の出番ですね #anpi_nlp
2011-03-15 20:41:44RT @akf: Google Person Finder に仙台・福島在住の知人の名前を入れても全然出てこないので,何とかならないかと考えています.名寄せも一つの手ですが,Facebookばりの柔軟な照合で,Recall重視にしてはどうかと思います.G社の方々,いかが? #anpi_nlp
2011-03-15 20:41:52@mhagiwara さんの指摘のように異体字やひらがなカタカナ表記の統合でかなりカバーできると思いますが,外国人の方の名前には,アルファベット翻字+類似文字列検索も必要です.@chokkanorg さんの SimString とか. #anpi_nlp
2011-03-15 20:43:50RT @akf: Google Person Finder に仙台・福島在住の知人の名前を入れても全然出てこないので,何とかならないかと考えています.名寄せも一つの手ですが,Facebookばりの柔軟な照合で,Recall重視にしてはどうかと思います.G社の方々,いかが? #anpi_nlp
2011-03-15 20:51:19RT @akf: Google Person Finder に仙台・福島在住の知人の名前を入れても全然出てこないので,何とかならないかと考えています.名寄せも一つの手ですが,Facebookばりの柔軟な照合で,Recall重視にしてはどうかと思います.G社の方々,いかが? #anpi_nlp
2011-03-15 20:55:16RT @mhagiwara: Google Person Finder のダンプデータ見てるが、やはり名前の表記揺れがひどい。旧字体、カナ、ローマ字。これを入力側でなんとかすることはできないので、名寄せ技術がかなり役立つと思う。また NLP の出番ですね #anpi_nlp
2011-03-15 20:56:11RT @akf: Google Person Finder に仙台・福島在住の知人の名前を入れても全然出てこないので,何とかならないかと考えています.名寄せも一つの手ですが,Facebookばりの柔軟な照合で,Recall重視にしてはどうかと思います.G社の方々,いかが? #anpi_nlp
2011-03-15 21:09:55そうですね。特に中国人名は、NLP2011のプログラムのように、漢字・日本読み・中国読み・ピンインが混在して大変なことになります RT @akf ... 外国人の方の名前には,アルファベット翻字+類似文字列検索も必要です #anpi_nlp
2011-03-15 23:09:38