.@dritoshiさんの,NGS解析始めた人がコンピューティングでつまづきがち
NGSデータ解析のチュートリアルを受けてコピペでツールを動かせるようにはなったが、いまいち自分でできるようになった気がしない、という相談が何度も受ける。
2014-04-07 23:53:33@druoh 統計ツールと同じで、まず使ってみて次に原理が気になる、という順番なのでしょう。やり方自体はネットに情報が溢れているけど、そもそも環境構築ができなくて相談にくる人も多いです。
2014-04-08 00:29:16そんな人には、まずは「Linux標準教科書」を通読することを進める。シェル、コマンドの使いかた、ファイルシステム、パス、パイプ、プロセス、ユーザとアクセス権限、シェルスクリプト、TCPなどを理解してもらう。
2014-04-08 00:04:54あとは、あまり初心者向けではないが「Linuxサーバ構築標準教科書8章」か「Linuxセキュリティ標準教科書6章」でSSHと鍵を、必要ならば「Linuxサーバ構築標準教科書1章」でRAIDについて学んでもらう
2014-04-08 00:15:56次は「高信頼システム構築標準教科書」4章で rsync, NFS を、7章でシステム監視を学ぶ。ここまでだいたい Linux や Unix を使い熟している感がでてくる。OS X になってもぐぐれば自力で同じレベルの熟練度になれるはず。
2014-04-08 00:18:47ここまですべてクリエイティブコモンズ (CC BY NC ND) なので無料で勉強できる。必要なのはやる気と時間だけ。
2014-04-08 00:22:47足りない点とては、メモリやCPU、ハードディスクが何しているか理解して、科学計算とどのように関わるか、を知っておく必要があるが、このあたりは良い文章が思い付かない。
2014-04-08 00:22:53ここまでくれば、巷に溢れているNGS解析解説サイトのコマンドをコピペすれば、なんとか解析ができるようになるでしょう。
2014-04-08 00:31:41コンピューティングがわからないのか、データ(ベース)がわからないのか、計算(アルゴリズム、統計)がわからないのか、シーケンス技術がわからないのかを分けて考えると良いと思います。NGSという文脈で検索すると、解説の豊富さは、計算>シーケンス技術>データ>>コンピューティンの順
2014-04-08 00:36:37なので、コンピューティングで躓いていても、気付かなかったり、どうしていいかわからなくなりがち。これら全部の知識をまるっとまとめて、ウェットの人はバイオインフォマティクスと呼ばれているっぽい。
2014-04-08 00:38:18このあたりのごくごく基本的な知識を、沖縄以北から北海道以南までに、こぐ僅かだけ生息する希少種であるバイオインフォマティクス研究者に、教育させるのはお互いにとって不幸。
2014-04-08 00:43:20昨日書き忘れた事。GNU screen を学ぶこと、を入れ忘れた。サーバにログインして計算している間に、接続を切っても計算したままにできるので、必須です。
2014-04-08 17:27:13