第36回セマンティックウェブとオントロジー研究会のまとめ #sig_swo
ステークホルダーの情報としてはDBpediaから抽出した職業情報,関係推定にもちいるシナリオはアクションプランニングで蓄積してきたデータを用いる。 #sig_swo
2015-07-09 14:59:30シナリオによって異なるステークホルダー(関係者)を抽出し、シナリオに賛成なのか反対なのかをDBpediaを用いて推定するのが目的。 #sig_swo
2015-07-09 14:54:44DBpediaデータセットを用いたステークホルダー表出とシナリオにおける関係推定(早矢仕さん) #sig_swo
2015-07-09 14:50:31日本語で同じことをしたいなと思うのだけど、DBpedia Japaneseのクラスのマッピングをちゃんとしないといけない問題にぶちあたる予感。 #sig_swo
2015-07-09 14:43:20エンティティリンキングを先にやることで固有表現抽出の精度をあげることにも成功。 #sig_swo
2015-07-09 14:28:47なぜ2位以降と大きな差をつけられたか。他はentity linkingにNER(固有表現抽出器)を使っている。TwitterのNER自体、最新のものでもF1値で22.46〜51.5%くらいしか出ないので、end-to-endでメンション検出をしたのが効いた模様。 #sig_swo
2015-07-09 14:26:34tweetだと表記ゆれなどの影響があるのでメンション候補検索はファジー検索(編集距離2以内), あいまい検索(クエリ内の単語の67%以上が含まれているか), アクロニム検索(データを作っておく)し、候補から正しいメンションをrandom forestで選択させる #sig_swo
2015-07-09 14:16:524つの教師付き学習器を使用。entity linkingとNIL Mention detectionをしてから、それぞれでクラスを同定する。entity linkingではメンション・エンティティ辞書を予め作成。すべてのn-gramをメンション候補として検索。 #sig_swo
2015-07-09 14:12:01Twitterからのエンティティリンキング。NEEL Challenge: ツイートに対するエンティティリンキングのコンペティション。 ルールが複雑すぎて最終的に7チームしか参加しなかった。 scc.lancs.ac.uk/research/works… #sig_swo
2015-07-09 14:07:40学習にはrandom forestを使用。エンティティが固有表現であることを示す特徴が重要。 #sig_swo
2015-07-09 14:03:49CSAWデータセットがAmazon Mechanical Turkを使って役立つかをアノテートしてもらい、データセットを生成。72%ほどの人が同じアノテーションをしていた。 #sig_swo
2015-07-09 14:02:47他にentity class feature(Wikipediaのクラス), topical coherence feature(エンティティと文章の類似度)も特徴量として使用。#sig_swo
2015-07-09 14:01:03人間に役立つエンティティを自動的に認識できるかを教師あり学習で二値分類。特徴量はlink probability(Wikipedia内でリンクとして出現するか), entity features(著名度や固有度)など6つ。 #sig_swo
2015-07-09 13:58:15何をエンティティにするか? → Wikification(知識ベースの中にあるものは皆エンティティとする),Named Entity Linking(固有名詞のみをエンティティにする) #sig_swo
2015-07-09 13:53:30Wikipedia Link-based Measure[Milne and Witten 08] 2つのエンティティの類似度をそれぞれにリンクしているエンティティの類似度から測れる #sig_swo
2015-07-09 13:52:12Linkify: テキストの中からエンティティ名を自動でリンクに変換するサービス。 linkify.mobi/?locale=ja #sig_swo
2015-07-09 13:48:54招待講演「知識ベースを活用したエンティティリンキング」(Studio Ousia 山田育矢さん)。WWW2015のNamed Entity rEcognition and Linking (NEEL) Challengeで優勝したときの内容についての講演。 #sig_swo
2015-07-09 13:46:05#sig_swo あー,Studio Ousiaって,NEEL Challengeで優勝したところか. ousia.jp/ja/page/ja/201…
2015-07-09 13:43:33#sig_swo 生物規範工学の話、ねじLODのDBpedia Japaneseとのリンク付けで直面した問題と酷似している
2015-07-09 11:56:05