生物分野のLODとURIに関する@gaou_akさんの考察

生物分野のLOD作製のガイドラインやURIデザインに関する, @gaou_ak さんのコメントが示唆に富んでいたので, まとめさせていただきました
3
Kazuharu Arakawa @gaou_ak

Linked Dataのガイドラインとしては、Open Government Dataの8基準 http://t.co/NJk6lpH3 が目的指向なまとめで、BioHackathonのTokyo Manifestoは手続き指向。

2012-01-23 17:51:28
Kazuharu Arakawa @gaou_ak

Tokyo Manifestoは後発なわけなので、OGDの目的に対になる具体的なSyntaxの提案として出すとみんなが幸せになれるのでは。http://t.co/TL8BF2TX

2012-01-23 17:53:42
Kazuharu Arakawa @gaou_ak

Dataには著作権は本来ないが、Curateされたデータ(生物学では多い)には著作権が発生する可能性がある。ここがOGD Principleの8項と矛盾する可能性はあるのだけれど。でもせめて項目7と合わせて、CC0じゃなくてもCCレベルのライセンスを選ぶ事、とかにはできるはず。

2012-01-23 17:55:18
Kazuharu Arakawa @gaou_ak

Linked Open Data Essentials ( http://t.co/DWG8pzBs )無料PDFがあるし、短い(速読で5分もかからないで読めた)ので、現時点のまとめとしては読んでおいてもいいかも。ただ、結局この分野黎明期すぎて具体性も体系もほとんどない。

2012-01-23 17:58:54
Kazuharu Arakawa @gaou_ak

http://t.co/oIHBws9C、bio2rdfとほぼ同じ事をより良くやっている。メンテもされているし、bio2rdfの酷いID管理と違い、controlされたID管理がなされている。bio2rdfの完全な上位互換になりそうだ。

2012-01-23 19:05:22
Kazuharu Arakawa @gaou_ak

が、気持ちは非常に良くわかるんだけど、というか他に現実的な解決方法がないんだけど、http://t.co/nvkntGz2 みたいなIDのURIってなぁ、、、。いやー、わかるんだけど。わかるんだけどね、これだとなー。

2012-01-23 19:06:26
Kazuharu Arakawa @gaou_ak

BioLOD/SciNet、結構良くできてるなぁ。なかなかすごい。色使いとレイアウト、UIのヒエラルキーが全然洗練されていないのが残念。今度marchをBioLODベースで作り直してみよっと。

2012-01-23 19:18:45
Kazuharu Arakawa @gaou_ak

自動IDに自動IDが付加されて、、、って、デジャヴだな。

2012-01-23 19:26:48
Kazuharu Arakawa @gaou_ak

Linked Dataは、atomがエントリではなくデータ自体になるので、どうURIをふり、どういうpredicateをつけるか、センスが問われる。ここに潜在的な大きな矛盾がある。atomが細かくなるので人手では対処しきれない。一方より詳細な人手によるキュレーションが要求される。

2012-01-23 19:34:30
Kazuharu Arakawa @gaou_ak

均質にデータの整備を行うと、atomがより細かいので、労力的にぜったいにエントリベースの既存の方式(UniProt/NCBI Entrez/GenomeNetなどの集中型データウェアハウス)やBioMartに利便性で劣ってしまう。

2012-01-23 19:37:53
Kazuharu Arakawa @gaou_ak

僕はこの矛盾こそが、Linked DataやSemantic Webがパっとしない一番の理由だと強く感じている。この矛盾を解決する方法はただ1つ。大規模情報のプロセシングがそうであるように、Bowtie構造で処理をすることだ。1度、情報を集約し、質の高い情報に落とし込む事。

2012-01-23 19:40:55
Kazuharu Arakawa @gaou_ak

データの価値は全て等価ではない。データベースの価値も全て等価ではない。エントリ内のプロパティも全て等価ではない。この価値の優劣を、科学的センスによって、強制的につけてしまうこと。これはSWの方向性と逆だが、これをしないと実用的なLDの活用にならないと思う。

2012-01-23 19:43:53
Kazuharu Arakawa @gaou_ak

僕が本来Restauro-G v.2でやりたいのはまさにここ。

2012-01-23 19:45:12