第36回セマンティックウェブとオントロジー研究会のまとめ #sig_swo

第36回セマンティックウェブとオントロジー研究会 のまとめです. 日時  :2015年7月9日(木),10日(金) 場所  :国立情報学研究所 主催  :人工知能学会 セマンティックウェブとオントロジー研究会 (SWO) 続きを読む
0
Fuyuko Ito Matsumura @wintermelon

ステークホルダーの情報としてはDBpediaから抽出した職業情報,関係推定にもちいるシナリオはアクションプランニングで蓄積してきたデータを用いる。 #sig_swo

2015-07-09 14:59:30
Fuyuko Ito Matsumura @wintermelon

シナリオによって異なるステークホルダー(関係者)を抽出し、シナリオに賛成なのか反対なのかをDBpediaを用いて推定するのが目的。 #sig_swo

2015-07-09 14:54:44
Fuyuko Ito Matsumura @wintermelon

DBpediaデータセットを用いたステークホルダー表出とシナリオにおける関係推定(早矢仕さん) #sig_swo

2015-07-09 14:50:31
Hideaki Takeda @takechan2000

山田さんの発表は川村氏、岡崎氏、関根氏、より濃い質問の連続。#sig_swo

2015-07-09 14:50:18
Fuyuko Ito Matsumura @wintermelon

日本語で同じことをしたいなと思うのだけど、DBpedia Japaneseのクラスのマッピングをちゃんとしないといけない問題にぶちあたる予感。 #sig_swo

2015-07-09 14:43:20
小出誠二 @seijikoide

#sig_swo freebase のクラスって信頼できるのかなあ.

2015-07-09 14:36:23
Fuyuko Ito Matsumura @wintermelon

エンティティリンキングを先にやることで固有表現抽出の精度をあげることにも成功。 #sig_swo

2015-07-09 14:28:47
小出誠二 @seijikoide

#sig_swo Twitter のコンテンツだからというところが多いよね.

2015-07-09 14:27:32
Fuyuko Ito Matsumura @wintermelon

なぜ2位以降と大きな差をつけられたか。他はentity linkingにNER(固有表現抽出器)を使っている。TwitterのNER自体、最新のものでもF1値で22.46〜51.5%くらいしか出ないので、end-to-endでメンション検出をしたのが効いた模様。 #sig_swo

2015-07-09 14:26:34
Shusaku Egami @reali_ze

#sig_swo これ資料公開して欲しいな・・・もとの論文か何かはどっかにあるんだろうか

2015-07-09 14:19:42
Fuyuko Ito Matsumura @wintermelon

tweetだと表記ゆれなどの影響があるのでメンション候補検索はファジー検索(編集距離2以内), あいまい検索(クエリ内の単語の67%以上が含まれているか), アクロニム検索(データを作っておく)し、候補から正しいメンションをrandom forestで選択させる #sig_swo

2015-07-09 14:16:52
Fuyuko Ito Matsumura @wintermelon

4つの教師付き学習器を使用。entity linkingとNIL Mention detectionをしてから、それぞれでクラスを同定する。entity linkingではメンション・エンティティ辞書を予め作成。すべてのn-gramをメンション候補として検索。 #sig_swo

2015-07-09 14:12:01
Fuyuko Ito Matsumura @wintermelon

Twitterからのエンティティリンキング。NEEL Challenge: ツイートに対するエンティティリンキングのコンペティション。 ルールが複雑すぎて最終的に7チームしか参加しなかった。 scc.lancs.ac.uk/research/works… #sig_swo

2015-07-09 14:07:40
Fuyuko Ito Matsumura @wintermelon

学習にはrandom forestを使用。エンティティが固有表現であることを示す特徴が重要。 #sig_swo

2015-07-09 14:03:49
Fuyuko Ito Matsumura @wintermelon

CSAWデータセットがAmazon Mechanical Turkを使って役立つかをアノテートしてもらい、データセットを生成。72%ほどの人が同じアノテーションをしていた。 #sig_swo

2015-07-09 14:02:47
Fuyuko Ito Matsumura @wintermelon

他にentity class feature(Wikipediaのクラス), topical coherence feature(エンティティと文章の類似度)も特徴量として使用。#sig_swo

2015-07-09 14:01:03
Fuyuko Ito Matsumura @wintermelon

人間に役立つエンティティを自動的に認識できるかを教師あり学習で二値分類。特徴量はlink probability(Wikipedia内でリンクとして出現するか), entity features(著名度や固有度)など6つ。 #sig_swo

2015-07-09 13:58:15
Fuyuko Ito Matsumura @wintermelon

何をエンティティにするか? → Wikification(知識ベースの中にあるものは皆エンティティとする),Named Entity Linking(固有名詞のみをエンティティにする) #sig_swo

2015-07-09 13:53:30
Fuyuko Ito Matsumura @wintermelon

Wikipedia Link-based Measure[Milne and Witten 08] 2つのエンティティの類似度をそれぞれにリンクしているエンティティの類似度から測れる #sig_swo

2015-07-09 13:52:12
Fuyuko Ito Matsumura @wintermelon

Linkify: テキストの中からエンティティ名を自動でリンクに変換するサービス。 linkify.mobi/?locale=ja #sig_swo

2015-07-09 13:48:54
Fumihiro Kato @fumi1

#sig_swo きゃりーぱみゅぱみゅのきゃりーってKyaryって書くの?

2015-07-09 13:48:06
Fuyuko Ito Matsumura @wintermelon

招待講演「知識ベースを活用したエンティティリンキング」(Studio Ousia 山田育矢さん)。WWW2015のNamed Entity rEcognition and Linking (NEEL) Challengeで優勝したときの内容についての講演。 #sig_swo

2015-07-09 13:46:05
Hokuto Takai @tsubame959

#sig_swo あー,Studio Ousiaって,NEEL Challengeで優勝したところか. ousia.jp/ja/page/ja/201…

2015-07-09 13:43:33
小出誠二 @seijikoide

DBpediaの上位下位概念は,ISAではなくて,カテゴリーだよね.#sig_swo

2015-07-09 11:56:16
Shusaku Egami @reali_ze

#sig_swo 生物規範工学の話、ねじLODのDBpedia Japaneseとのリンク付けで直面した問題と酷似している

2015-07-09 11:56:05