@yanaoki あれもびみょうなんですけどね。。最近のMRUnitとくらべてだとどうかわからないですが、Jobに対してテストが書けるのと、多段MRのテストがちょっと書きやすいとか、そのくらいです。
2011-07-28 22:06:26Asakusaのtest-driverだけ切り離したらどうか説もあるけど、ツンデレ門とくっついてることに価値があるという側面もあり、なんとも。
2011-07-28 22:08:02あと、0.21.x以降だと思うけど、MiniDfsCluster的なものでもうちょっと疑似分散っぽいテストが、簡単かどうかはさておき、できるはずで、そういう意味だとMRUnitの存在意義はどうなのかという話も。
2011-07-28 22:09:23@marblejenka 参考にさせていただきます(^-^)/。なんかMRUnitって開発があまり活発じゃないんですかねぇ、不思議。
2011-07-28 22:11:49@yanaoki たぶん生MRって書いてる人は実は相当少なくて、Pig/Hiveのレイヤでどうにかしているのかなと。Pig/Hiveのテストは書いたことないので何ともですが。
2011-07-28 22:13:51jiraみてると、あーそれたしかにMRUnitつかってるとはまりんぐ><、みたいなのがあり、 http://t.co/1lQ1KgQ 世間知らずだった少年時代から自分だけを信じてきたような、そんな気分になる。
2011-07-28 22:26:27生MapReduceのプログラムを書くのが少ないとして、Pig/Hiveならどうするか。PigはPigUnitなるものがあるようだけど
2011-07-28 22:26:50どうにかすべきじゃないかという心情もある反面、MR書いてるとか(笑)みたいな話はなきにしもあらずで、どうすべきかは悩ましいところ。
2011-07-28 22:29:30JUnitで実行されるのか。Jenkinsでくえるのかな>PigUnit - Pig script testing simplified. http://bit.ly/phD2vE
2011-07-28 22:29:52jiraとコードを見る限りだと、パッチは投げられてるけどあたってないとかそんな感じか。E. Summerってたしかclouderaの人だし、たぶんcloudera的にもMRUnitはいらんとかそういう雰囲気なのだろう。
2011-07-28 22:35:11Hiveの場合はHiveUnit的なものは無いし、どうすんのがいいのかねえ。いっそのことProcessBuilderでhive実行しちゃったほうがJenkinsで結果を食えて良いみたいなところがあんのかな
2011-07-28 22:35:29MRUnitがあるからMapReduceの単体テストができるので大丈夫的な議論はみたことあるような気がするけど、それは多分書いたことない人が言っているか、段数1なMRしかテストしたことがないかのどちらかか。
2011-07-28 22:37:19@marblejenka MRを書くような場面って結構凝ったことするので(しリアライズとかMultiとか)、そういう痒いところがテストできないと意味ねー、とか思いました。
2011-07-28 22:37:35@marblejenka MiniDFSClusterって、クラスタのスタブだと思うので、それ使ったテストは「単体テスト」としては粒度が荒すぎるんじゃないかなあという気がしました。
2011-07-28 23:12:23@marblejenka かといって、map&reduce は粒度が細かすぎる=期待結果がそれ自体で業務的な意味を持たない場合があるし、そもそも容易にテストできる代物でもないので、頑張ってクラス単体をテストしても不毛な感もあり、どうしたものか、という感じです。
2011-07-28 23:19:07@miyakawa_taku そんな感じですね。単体テストの単体ってなんなのか、みたいな話だと思いますが、やっぱ意味のある単位でテストしたいなあと。
2011-07-29 10:44:38