LOD/SWで本当に議論すべきこと

LODチャレンジとLOD/SWな活動に対する @gaou_ak さんの批評をまとめました。誰でも編集可能ですので、ご自由に追加・修正してください。
2
Kazuharu Arakawa @gaou_ak

LODチャレンジに《僕個人が感じる》本質的な気持ち悪さについて少し考えてみた。一番はhttp://t.co/jk6Vszifの存在な気がする。このサイトではURI/URLをIDに対し付加し、RDF形式に変換はするが、本質的なデータはテーブルモデルのまま。ERですらない。

2012-01-31 11:46:14
Kazuharu Arakawa @gaou_ak

二番目は結果的にでてきているアプリが、ウェブマッシュアップ系ばかりな点。つまり、構造化されたデータというのはAPIコールの形で既にウェブ上に蔓延していて(それらは当然WWWの上でLinkedであって)、RDF/LODの新規性がない。(部分的には一番目の理由に起因する)

2012-01-31 11:48:59
Kazuharu Arakawa @gaou_ak

三番目は、アイデアとしてでてきているものに、本質的なLOD/RDFの必要性が必ずしも感じられない点。つまり、それはERモデル+APIコールの上に実装できるものが多いし、パフォーマンスなどを考慮しても今現実的なソフトウェア設計としてはLOD/RDFを用いないと思うものが多い。

2012-01-31 11:51:08
Kazuharu Arakawa @gaou_ak

試みとしてはすごく大事だし、このチャレンジが開催される意義はあると思うんだけど、思惑がわからない。

2012-01-31 11:57:37
Kazuharu Arakawa @gaou_ak

ERモデルでも、スキーマの構造や設計思想を理解せずにデータの連結をしても意味がない。同様に、RDFでもRDFスキーマ、URI、オントロジーの設計を無視してデータの連結をしてもクオリティの高いアウトプットを得られるわけではない、はず。

2012-01-31 12:04:59
Kazuharu Arakawa @gaou_ak

データ保持方法としてのERモデルに対するRDFモデルの利点があることは明白。スキーマを固定せず、ネストが自由に組めて、整合性チェックができる。

2012-01-31 12:08:18
Kazuharu Arakawa @gaou_ak

データ共有方法としてRDF/XMLの利点があることも明白。データのシンタックスが共有できる。

2012-01-31 12:09:16
Kazuharu Arakawa @gaou_ak

ただし、ここからが劇的に飛躍していると思う。そのリンクに本当に意味があるのか。そのURI/URLは妥当なのか。そのpredicateは有用なのか。本当にコンピュータに優しく、自動化でき、ネット上の「知」が繋がる状況ができるのか。

2012-01-31 12:12:13
Kazuharu Arakawa @gaou_ak

データを持つこと、公開すること、そこまでは良くできていると思うんだけど、その後そのデータをどうするの?っていうところに関して、結果的にLOD/SWコミュニティはなんら回答を持ち得ていないように感じる。

2012-01-31 12:13:36
Kazuharu Arakawa @gaou_ak

結局そこはcurationの問題で、UK政府のデータ、dbpedia、UniProt、サイネスなどのcurationされるグループ内ではうまくまわると思うけど、その外との連携が「勝手に」うまくいくとは到底思えない。

2012-01-31 12:17:40
Kazuharu Arakawa @gaou_ak

"Data is not information, information is not knowledge, knowledge is not wisdom."

2012-01-31 12:19:33
Kazuharu Arakawa @gaou_ak

LOD/SWは(ここもcurationやAIによってちゃんとpredicateとオントロジーがつけられれば)データを情報に昇華させることはできるかもしれないが、情報を「知」に結びつける方法がまだ議論されていないと思う。でもそれをLOD/SWは約束しているように見える。

2012-01-31 12:21:32
Kazuharu Arakawa @gaou_ak

長く書いたけれど、《僕が感じる》気持ち悪さは最終的にはここに行き着く。約束できないことを約束している点。それから、本当はこの問題点を明らかにできないと解決できないわけだが、問題発見を横において《約束》してしまっている点。

2012-01-31 12:22:53
Kazuharu Arakawa @gaou_ak

今LOD/SWで一番議論しなければいけないのは、情報の集合をどうやって《知》に昇華させるか、だと思う。この問題設定を避けて通るべきではない。

2012-01-31 12:24:21
Kazuharu Arakawa @gaou_ak

という話を3/23-24日にJAISTで開催される第15回オープンバイオ研究会で多分します。http://t.co/a0fuIWkz ←って宣伝かよ!

2012-01-31 12:25:23
Kazuharu Arakawa @gaou_ak

informationをknowledgeに、knowledgeをwisdomに、まではアイデアも先行研究も大量にあるんだが、その先を考えると、フレーム問題に行き着くんだよなぁ。ロボット工学のホットなテーマなはずだけど、ここ数年の研究全く追えてない。勉強が必要。

2012-01-31 12:47:53
Kazuharu Arakawa @gaou_ak

人間の知能の本質の一つって、フレーム問題における閾値っぽいよね。 #妄想

2012-01-31 12:49:56
cory (K.Oshita) @adnm

LODチャレンジって、LODを知へ昇華するためのブレストをコンテストという形でやってるイメージがある。あえて悪く言うと、その辺のアイデアをアウトソーシングして、状況を打開できる何らかの糸口をつかみ取ろうとしている、みたいな

2012-01-31 12:51:01
cory (K.Oshita) @adnm

「例えLODであろうとも情報の価値は一定じゃない」とか必要な議論はたぶんまだまだあるんだけど、とりあえず「公開してつなげよう!」というのを進めてる段階なんだろう。そういう意味じゃ、前回のチャレンジデーでの議論が聞けなかったのは痛い

2012-01-31 12:51:06
cory (K.Oshita) @adnm

LODチャレンジが終わって、そこに出てきたモノに対して考察をやって、そこでやっと本質が始まる気がする。「とにかく何でも繋げればいいわけじゃない」って話題あたりが始めの議論としてきたらいいのかね

2012-01-31 12:53:00
cory (K.Oshita) @adnm

偉そうなこと言う前に作業しますごめんなさい

2012-01-31 12:54:32
Kazuharu Arakawa @gaou_ak

@adnm ベルタランフィだよね、whole is not just the sum of all parts

2012-01-31 12:55:32
cory (K.Oshita) @adnm

@gaou_ak ですね。とりあえずLODを増やして扱えるリソースを増やしたいって思想は理解できるんですが、やっぱり人が使って意味のあるデータと無いデータの差はどうしても出てくると思います

2012-01-31 13:02:46
Kazuharu Arakawa @gaou_ak

@adnm イーターネットが広がれば自然とそこにゴーストが宿るのかどうか。少なくともデータベースを大量に集めたところで知識ベースにならないことは確か。

2012-01-31 13:05:18