XDSの統計値の読み方Tips (ヘボXDSer用)

結晶のテーブル作成に困窮するダメXDSer(笑)を救う神の助言
14
Ryorishu @ryorishu

XDSのaverage I/sigmaってどこなの?Rmergeどうするの?死ぬの?

2013-01-08 14:13:56
K. Yam @yam_cpp

@ryorishu "SUBSET OF INTENSITY DATA WITH SIGNAL/NOISE >= -3.0 AS FUNCTION OF RESOLUTION"のI/SIGMAが<I/σ>です.R-FACTOR observedがR-mergeです.

2013-01-08 14:29:21
Ryorishu @ryorishu

@yam_cpp 不勉強な自分には非常にありがたいです。。。

2013-01-08 14:32:51
K. Yam @yam_cpp

@ryorishu CORRECT.LPの中にこのテーブルは幾つかありますが,最後に出てくるテーブルが全フレーム範囲の統計値になります.I/SIGMAは<merged I / σ(merged I)>です(念のため

2013-01-08 14:36:46
Ryorishu @ryorishu

@yam_cpp 丁寧にありがとうございます。ついでで申し訳ないんですが、よく論文に載ってるようなmesured Reflectionsとかunique Reflectionsって先ほどのテーブルのすぐ下のNUMBER OF~の値なんでしょうか。

2013-01-08 15:08:28
K. Yam @yam_cpp

@ryorishu ですね,NUMBER OF REFLECTIONSの数字がそれです.つまりOBSERVED / UNIQUEがredundancy (multiplicity)で,UNIQUE / POSSIBLEがcompletenessになります.

2013-01-08 15:15:18
Ryorishu @ryorishu

@yam_cpp テーブル中のNUMBER OF UNIQUEのtotalと、テーブル下のNUMBER OF UNIQUE ACCEPTED REFRECTIONSの値が異なっているのですが、結局はテーブル中ではなく、その下の方を参照すれば良いのでしょうか。

2013-01-08 15:30:57
K. Yam @yam_cpp

@ryorishu テーブル下の数字は,I/sigmaが-3未満の数字も含んでいるので,構造解析で使われるデータと言う意味ではテーブル中の数字を見ればOKです.但しその意味ではCORRECT.LPの一番下の数字にもご注意下さい.詳しくは:http://t.co/lDBMQ8Or

2013-01-08 15:45:05
とりさん @biochem_fan

そうそう、話は変わるけど、XDS の CORRECT.LP に出てくる統計値は I/sigma > -3 でカットオフされてるけど、XDS_ASCII.HKL にはすべての反射が入ってて、実際にフィルタされるのは XDSCONV のステップなんだね。

2013-01-09 00:44:49
とりさん @biochem_fan

XSCALE と XDSCONV やるのが面倒なので、最近は XDS_ASCII.HKL を ccp4i の GUI から AIMLESS に食わせて処理してたんだけど、カットオフ適用前の全ての反射が渡されるせいか統計値がだいぶズレてて、しばらく悩んでしまった。

2013-01-09 00:48:12
とりさん @biochem_fan

このへんの事情は、xds wiki の FAQ に書いてあるが、なかなか気づかない結構な罠だと思う。

2013-01-09 00:50:02
K. Yam @yam_cpp

@biochem_fan ですね.xdsconvでは,merged I/sigmaが-3未満になる反射と,sigmaが負値として記録されている反射を捨てた上で,処理が行われているはずです.

2013-01-09 00:54:44
とりさん @biochem_fan

@yam_cpp 実際にカットオフするのは XDSCONV なのに、XDS のログにカットオフ後の値が出てくるというのは、設計思想がFAQに書いてあるとはいえ、まぎらわしいような気がします。

2013-01-09 00:56:05
K. Yam @yam_cpp

@biochem_fan さらにCORRECTでalienのrejectがされた場合も,テーブルにはreject前の情報が載ってるので,これも罠ですよね.ところでxscaleは必ずしも必要では無いと思いますが,複数のデータセットを処理する場合ってことでしょうか?

2013-01-09 00:57:14
とりさん @biochem_fan

@yam_cpp alien の reject の件もなのですね。勉強になります。xscale は、確かに省略可能な場合が多いです。

2013-01-09 01:01:27
K. Yam @yam_cpp

@biochem_fan なので"downstream"で使われるデータのテーブルと言う意味では,CORRECT→REMOVE.HKLを作成→再度CORRECT(もしまたalienが出たら繰り返し)をしないと得られないことになりますね..面倒ですね.

2013-01-09 01:04:43
とりさん @biochem_fan

@yam_cpp 論文の Table I には、どれを載せるのが主流なのでしょう?

2013-01-09 01:09:04
K. Yam @yam_cpp

@biochem_fan それは…皆さんがどうやっているか,正直分かりません.正確さを考慮すれば,むしろ今ならXDS_ASCII.HKLをphenix.merging_statisticsに投げれば同様の基準でフィルタしてくれるので,その方が良いのかも知れません.

2013-01-09 01:15:12
K. Yam @yam_cpp

@biochem_fan Table 1は重要な情報が載ってない(例えばHKLのsigma cutoff値とか,XDSならREJECT_ALIEN=とか)気がするので,正直どこまで意味があるか難しいですよね.その意味でPDBにはせめてunmergedのデータを載せて欲しいと..

2013-01-09 01:18:44
とりさん @biochem_fan

@yam_cpp phenix.merging_statistics という手もあるのですね。早速試してみます。うちは HKL2000 派ばかりで、XDS の流儀が分からないので、とても参考になります。

2013-01-09 01:18:57
K. Yam @yam_cpp

@biochem_fan 去年の秋以降あたりのバージョンを使って頂ければ,正しくフィルタしてくれるはずです>merging_statistics (最近使ってませんが).こちらは現在XDS派を拡大中です(なかなか細かいところに興味を持ってくれる人はいませんが

2013-01-09 01:29:49
とりさん @biochem_fan

@yam_cpp unmerged 欲しいですよね。画像のデポジットは容量的に非現実的にせよ、unmerged があるだけでも、いろいろ病的結晶の症例検討ができそうですし。

2013-01-09 01:20:38
K. Yam @yam_cpp

@biochem_fan ですね.unmergedを必須にすれば,統計値なんかも全部サーバ側で正しく計算してくれてデータの信頼性も上がりますし.

2013-01-09 01:31:46
ひ○たく @kun32xu

どこからともなく現れてTLで困ったXDSerたちを救済していく。人は彼のことをヤム神と呼ぶ。

2013-01-08 17:07:25