第26回セマンティックウェブとオントロジー研究会 (SIG-SWO)
collection 型って,要するに key-value の集積なのね. 属性と属性値の集積って,事例ベース推論と同じ #sig_swo
2011-12-14 13:43:04データ抽出とRDFマッピングの分離。ここがこれまでのテーブル型情報抽出研究と違うところ。前者はソフトウエア専門家がソフトウエア的に最適な手法を適用。後者は専門家が担当して手でルールを書く。 #sig_swo
2011-12-14 13:43:16専門家はJSONに出力されたキー・バリューの組合せを見て、キーとRDFのプロパティのマッピングルールを作成する。 #lodac #sig_swo
2011-12-14 13:46:50情報の専門家と各分野の専門家の分業体制。表形式のウェブサイトから情報を抽出した後、各分野の専門家にバトンタッチ、チェックしてもらった後、最終的な情報システムへ投入。ウェブサイトの変更が追えるよう、各情報はそれぞれバージョン管理する。 #sig_swo #lodac
2011-12-14 13:48:23実際はWebページにアクセスして、テーブルっぽいデータを探し当てて、情報を抜き出すというところが大変で鍵。 RT @seijikoide collection 型って,要するに key-value の集積なのね. 属性と属性値の集積って,事例ベース推論と同じ #sig_swo
2011-12-14 13:48:24今後の課題:統合検索サイトへの対応(複数館のコレクションが混在),専門家向けのマッピングルール作成用UIの開発,処理の見直し(JSONに中間出力を行わないように改良),同定作業(どの作者とどの作者が同じか) #sig_swo #lodac
2011-12-14 13:48:57まとめ:キー・バリューデータを抽出してRDFを生成するLODAC Distillerを開発。LODAC Museumにて活用中。他分野のサイトにも適用予定。 #lodac #sig_swo
2011-12-14 13:49:42Q1:LODAC Museumでは何館くらい集めていて,どれくらいルールを書き換えなければならなかったか? #lodac #sig_swo
2011-12-14 13:50:20モノの情報については,どのクラスのモノかということは,マッピングルールで記述できるようにしている #lodac #sig_swo
2011-12-14 13:52:16Q2:クラスやインスタンスの関係も取得することができるか?クラスを推測できる仕組みを入れることはできないか? #lodac #sig_swo
2011-12-14 13:52:57それが実装されると便利ですね RT @seijikoide: 属性の集積から事例のクラスを推定するのが,Schank流事例ベース推論なのです.#sig_swo
2011-12-14 13:57:33生物情報基盤構築に向けた生物関連データのLinked Data化の取り組み(NII 南さん) #sig_swo #lodac
2011-12-14 13:58:58そこはこの研究では人がやります。まあ数がたかがしれているので。RT @seijikoide 属性の集積から事例のクラスを推定するのが,Schank流事例ベース推論なのです.#sig_swo
2011-12-14 13:59:53現在の生物情報は,種情報,種名情報,分布・標本情報に分けられ,それぞれの情報がCoL, GBIF, BOLD, S-Net, EoLなど様々なサービスで個別に保持・公開されている。 これらをLODで繋いでいきたい。 #lodac #sig_swo
2011-12-14 14:00:44ぼくも参加してます。人生初の情報系研究者とのコラボプロジェクト。 RT @wintermelon: 生物情報基盤構築に向けた生物関連データのLinked Data化の取り組み(NII 南さん) #sig_swo #lodac
2011-12-14 14:00:52様々な生物多様性情報、さらに分野外の情報までをLinked Oped Dataで「千手観音」のようにつないでいく。 #sig_swo #lodac
2011-12-14 14:02:18RT @wintermelon: 現在の生物情報は,種情報,種名情報,分布・標本情報に分けられ,それぞれの情報がCoL, GBIF, BOLD, S-Net, EoLなど様々なサービスで個別に保持・公開されている。 これらをLODで繋いでいきたい。 #lodac #sig_swo
2011-12-14 14:03:16今回は蝶類のデータをLOD化した。パイロット研究に適した種数であること、情報がリッチであること、基本情報がDBで公開されていることが理由。分類学者 @mothprogとも連携。日本産蝶類和名学名便覧[猪俣ほか2010]のデータを使っている。 #lodac #sig_swo
2011-12-14 14:03:40パイロットプロジェクトで対象とするのは蝶類。日本産蝶類和名学名便覧を提供しております。 http://t.co/ozPrg82L #lodac #sig_swo
2011-12-14 14:04:39蝶のデータと外部のデータをリンク。リンク作成のキーは分類群名、種の学名。Google Refineで作成。 #lodac #sig_swo
2011-12-14 14:05:55