生物分野のLODとURIに関する@gaou_akさんの考察
Linked Dataのガイドラインとしては、Open Government Dataの8基準 http://t.co/NJk6lpH3 が目的指向なまとめで、BioHackathonのTokyo Manifestoは手続き指向。
2012-01-23 17:51:28Tokyo Manifestoは後発なわけなので、OGDの目的に対になる具体的なSyntaxの提案として出すとみんなが幸せになれるのでは。http://t.co/TL8BF2TX
2012-01-23 17:53:42Dataには著作権は本来ないが、Curateされたデータ(生物学では多い)には著作権が発生する可能性がある。ここがOGD Principleの8項と矛盾する可能性はあるのだけれど。でもせめて項目7と合わせて、CC0じゃなくてもCCレベルのライセンスを選ぶ事、とかにはできるはず。
2012-01-23 17:55:18Linked Open Data Essentials ( http://t.co/DWG8pzBs )無料PDFがあるし、短い(速読で5分もかからないで読めた)ので、現時点のまとめとしては読んでおいてもいいかも。ただ、結局この分野黎明期すぎて具体性も体系もほとんどない。
2012-01-23 17:58:54http://t.co/oIHBws9C、bio2rdfとほぼ同じ事をより良くやっている。メンテもされているし、bio2rdfの酷いID管理と違い、controlされたID管理がなされている。bio2rdfの完全な上位互換になりそうだ。
2012-01-23 19:05:22が、気持ちは非常に良くわかるんだけど、というか他に現実的な解決方法がないんだけど、http://t.co/nvkntGz2 みたいなIDのURIってなぁ、、、。いやー、わかるんだけど。わかるんだけどね、これだとなー。
2012-01-23 19:06:26BioLOD/SciNet、結構良くできてるなぁ。なかなかすごい。色使いとレイアウト、UIのヒエラルキーが全然洗練されていないのが残念。今度marchをBioLODベースで作り直してみよっと。
2012-01-23 19:18:45Linked Dataは、atomがエントリではなくデータ自体になるので、どうURIをふり、どういうpredicateをつけるか、センスが問われる。ここに潜在的な大きな矛盾がある。atomが細かくなるので人手では対処しきれない。一方より詳細な人手によるキュレーションが要求される。
2012-01-23 19:34:30均質にデータの整備を行うと、atomがより細かいので、労力的にぜったいにエントリベースの既存の方式(UniProt/NCBI Entrez/GenomeNetなどの集中型データウェアハウス)やBioMartに利便性で劣ってしまう。
2012-01-23 19:37:53僕はこの矛盾こそが、Linked DataやSemantic Webがパっとしない一番の理由だと強く感じている。この矛盾を解決する方法はただ1つ。大規模情報のプロセシングがそうであるように、Bowtie構造で処理をすることだ。1度、情報を集約し、質の高い情報に落とし込む事。
2012-01-23 19:40:55データの価値は全て等価ではない。データベースの価値も全て等価ではない。エントリ内のプロパティも全て等価ではない。この価値の優劣を、科学的センスによって、強制的につけてしまうこと。これはSWの方向性と逆だが、これをしないと実用的なLDの活用にならないと思う。
2012-01-23 19:43:53