日本地球惑星科学連合2013 U-02 Global Data Science

日本地球惑星科学連合(#JpGU)の2013年大会のセッション「U02 Global Data Science - Global Data System」に関する話題です。この学会のこの日の話題については@kobiwa_netさんのまとめ「日本地球惑星科学連合 2013年大会(5/20) 」があり、そこに追加しようとも思いましたが、長くなるので別にしました。
8
TOYODA Eizi @e_toyoda

軍事となんかいがいほぼ全部だから幅広さが実感される。

2013-05-20 14:59:47
TOYODA Eizi @e_toyoda

いろいろ見るべき点がある / DIASデータ俯瞰システム http://t.co/qCSXLpyjLz

2013-05-20 15:06:27
TOYODA Eizi @e_toyoda

まず分散検索。jamstec との連携、詳細は不明。ファイル入稿か。パンゲアについては検索結果からOAI取得と聞こえたが気のせいだろうか。 @e_toyoda

2013-05-20 15:12:09
TOYODA Eizi @e_toyoda

ついで、検索をナローダウンする為に分類を2つ指定したときのヒット件数をマトリックスで示すのは、一部が執着する「ブラウズ」のよい代替となろう @e_toyoda

2013-05-20 15:13:25
TOYODA Eizi @e_toyoda

doi に3層処理構造あるとの話。単なる短縮URLサービスじゃないんだ。詳細調べる価値がありそう

2013-05-20 15:42:02
TOYODA Eizi @e_toyoda

CrossRef は DOIの逆引きをしてくれる。つまり検索だ。

2013-05-20 15:44:47
TOYODA Eizi @e_toyoda

ああなんだ、会員様サービスか。で、NDL, NII, JST とかが代替サービスをやるんだと。

2013-05-20 15:46:54
TOYODA Eizi @e_toyoda

人類全体なんていうから何かと思ったら、Google/WDS/GEOの比較。

2013-05-20 15:59:24
TOYODA Eizi @e_toyoda

伝統的なメタデータはデータに諸元が従属する木構造だが、多数のオブジェクトが相互にリンクする自由がある冪との説。単なる関連図に陥らない為になんらかの結び目がひつようだとおもうが。

2013-05-20 16:12:41
Junya Terazono 寺薗淳也 @terakinizers

@e_toyoda クロスリンクというのは確かに便利なのですが、関連するデータが増えてくるとn乗で複雑になるという点で気をつけないといけないと思います。もっとも、それは人間がみるという前提であって、machine readableであれば話は別ですが。

2013-05-20 16:40:27
TOYODA Eizi @e_toyoda

@terakinizers 各種の丸に関係さえあれば線を引くと全対全に近づいて機械にもあまり意味がないので、極力疎行列化するような工夫が必要なんだと予想しますすが、まあ、そんなこと絵にできないですわね。

2013-05-20 16:49:56
Junya Terazono 寺薗淳也 @terakinizers

セッションが押しまくって休憩時間はわずか5分となった。これから、大石先生 @mo2010 のプレゼン。

2013-05-20 16:23:26
TOYODA Eizi @e_toyoda

vo は no-center なんだという。以前も聞いたような気がするが、今となってみるとその意義がよくわかる。

2013-05-20 16:31:39
TOYODA Eizi @e_toyoda

コミュニティからもメタデータを集める、データ形式を規制しないという一方で解析ソフトウェアが全ての形式に対応するという3点をあわせると(話自体は知っているが英語で聞くと)奇異に聞こえる。もちろん、できたところから対応、という解決なわけだが

2013-05-20 17:12:13
大石雅寿(手洗い&うがいで風邪知らず) @mo0210

(午後の第一セッションの座長と第二セッション先頭での講演。おわり。くたびれた。)

2013-05-20 17:14:17
大石雅寿(手洗い&うがいで風邪知らず) @mo0210

(話すときだけ来て、話し終わったら消える人が多い。何のための講演なのか?)

2013-05-20 17:16:02
Hideaki Takeda @takechan2000

big dataのセッションにいると、"Only 1 petabyte"なんて言っているわけで、そろそろこの上の呼称を学ばないといけないらしい。ふむふむexabyteなのか。

2013-05-20 17:34:11
TOYODA Eizi @e_toyoda

メタデータにアノテート機能というのはよく眼にするが、「このデータを使った研究を共有しよう」といういいかたは面白い。引用要請するよりいいかもしれない。まあ、いずれにしても国家機関がやるのは容易なことではないと思うので、すみわけだわね。

2013-05-20 17:59:38
Junya Terazono 寺薗淳也 @terakinizers

@e_toyoda 「個人情報が…」とかいうことになるとめちゃくちゃめんどくさいですね。また、科学データは国家の枠を超えるので、国ごとにシステムが縛られてしまう可能性も考えなければいけません。NPOなどに委託できればいいのですが。

2013-05-20 18:01:14
TOYODA Eizi @e_toyoda

階層分類は、丁寧に作りこんでいるのをみると、まねできないなあと思う。それは umbrella organization に求められても困るし、やろうと市tもいけないと思う。

2013-05-20 18:01:36
Junya Terazono 寺薗淳也 @terakinizers

@e_toyoda これはそうだと思います。もっとも複雑なシステムも最近はマシンパワーで押し切るという悪しき習慣(笑)が存在するので、そういうことを誰かが思いつかないといいのですが。

2013-05-20 18:01:58
TOYODA Eizi @e_toyoda

@terakinizers DIASでもWDSでもいいんですが、せっかくアカデミックセクターでやってるんで、クラウドソースするようなチャレンジはそっちでやってもらえばいいとおもいます。もちろん、実験的なNPOもありだと思います。

2013-05-20 18:07:36