生物情報学で使われる巨大グラフのサイズ

生物情報学で使われる巨大グラフの規模感について
2
Takuya Akiba @iwiwi

生物情報学で使われる巨大なグラフがあれば欲しいのですが,そういうのってあるんでしょうか,どなたかそういうデータセットご存知ないでしょうか. スケールフリーとかスモールワールドとかに従う系のやつがいいです. 20K 辺ぐらいの小さいのしか持ってない.

2012-10-26 14:34:06
Masahiro Kasahara @mkasahara

@iwiwi 巨大の定義を教えて下さい。1Bノードぐらいですか?

2012-10-26 14:35:13
Takuya Akiba @iwiwi

@mkasahara めっちゃでかいw 逆にそこまでデカいのは想定してませんでした(あるんでしょうか?) 自分の今の都合だと 数 M 辺〜数百 M 辺ぐらいが嬉しいですが,その圏内でなくても割と純粋に興味あります.

2012-10-26 14:37:45
Masahiro Kasahara @mkasahara

@iwiwi http://t.co/V1u95lop こんな目的でグラフをこっちの業界では使っていますが、ホントに 30B nodes ぐらいは皆さん普通に扱ってます。

2012-10-26 14:48:19
Masahiro Kasahara @mkasahara

@iwiwi Convey Computer みたいにこのグラフの問題を専用マシンで解いて並列度を上げてレイテンシを抑えるとか、そんなこともやってるひとが居ますね。http://t.co/DSdKjMyF

2012-10-26 14:49:23
Takuya Akiba @iwiwi

@mkasahara うおーメチャデカですね.バイオインフォの方々のスケールはマジでヤバイ…… De Bruijn graph はたまに聞きます. 無知で適当なこと聞いて申し訳ないのですが,こういうグラフってスケールフリーとかスモールワールドとか満たす系なんでしょうか?

2012-10-26 14:54:39
Takuya Akiba @iwiwi

@mkasahara なるほど,やっぱりそういう系は 1M 辺届かないぐらいのサイズのものなんですね. ゲノム解読のグラフって,ゲノム解読の目的のために作られるということは,その上で行われる処理は非常に特定された物になっているのでしょうか? 質問ばかりすみません.

2012-10-26 14:57:15
Takuya Akiba @iwiwi

@mkasahara ふむふむナルホド…… よく分かりました,詳しく教えてくださってありがとうございましたm(__)m

2012-10-26 15:04:52
Masahiro Kasahara @mkasahara

@iwiwi えーっと、どのような処理をすればよいのか私を含め皆さん研究中なので、クエリーの種類が完全に決まっているということは全く無いのですが、「このタイプの処理は絶対必要!」というようなタイプの処理のパターンというのはいくつかあります。

2012-10-26 15:06:28
Akihiro Okuno @choplin

@iwiwi スケールフリーだとPPIとかinteractome系がパッと思いつきますがあまり大きくはないですね。node 数十K edge 数百K 位のボリュームです。

2012-10-26 15:01:34
Takuya Akiba @iwiwi

@choplin なるほどー,やはりその辺だとそういうサイズのデータになってしまうんですね,ありがとうございます.

2012-10-26 15:03:50