構造上の1つの場所を意味上の1つの内容に対応させる。構造と意味の一致が整然データの特徴である。なるほど #tokyor
2017-06-24 15:36:30messy dataの例で出てくる天気データは、人間にはわかりやすい(お天気ニュースでもよく出てきて、読み方慣れている)。tidy dataは、Rでは扱い易いんだけど、人間には直感的に理解しにくい可能性がある。 #tokyor
2017-06-24 15:48:48だから、tidy dataを初めて読んだとき理解するのが難しかったのかも #TokyoR vita.had.co.nz/papers/tidy-da… twitter.com/iiiaui/status/…
2017-06-24 15:51:25#TokyoR 整然データ(tidy data)は、構造化された数値データを分析するときにはいいのだが、テキストのような非構造化データを扱うときは不便に感じる(あくまで個人的見解)。たとえば、こんな感じ > cran.r-project.org/web/packages/t…
2017-06-24 15:53:47整然データの発表で使わなかったネタの蔵出し。整然データの概念を提唱したウィッカム氏は、整然データの定義を触れるときに、コッドの第3正規形だよねと言っていたんだけれども、第3正規形でない整然データはたぶんありうる。 #tokyor pic.twitter.com/rDg6RQW3sg
2017-06-24 16:02:49整然データの発表で使わなかったネタの蔵出し。表型のデータだと整然データでうまくいきますが、テキストデータとか画像データとかでは別の方法が当然必要になりますね。 #TokyoR pic.twitter.com/xM6jZJJ58r
2017-06-24 16:04:11整然データの発表で使わなかったネタの蔵出し。整然データに基づく分析について詳しく知りたい人は、R4DS r4ds.had.co.nz や Heavy Watal さんのページheavywatal.github.io を。 #TokyoR pic.twitter.com/DBQwg7KFXe
2017-06-24 16:06:28整然データの発表で使わなかったネタの蔵出し。「ゴミと クズと カスを 足して 3で 割った ような データ」って3拍が続いて心地よいですよね。実際そう言うデータを見たときは心地よくないと思いますけど。 #TokyoR pic.twitter.com/bfFpJmbpZt
2017-06-24 16:08:49はじめてのR 実践編
#TokyoR の豪腕司会者 @aad34210 氏の発表で、R for Everyoneの第2版が出ていることを知る。 amazon.co.jp/Everyone-Advan… 第2版の邦訳もそのうち出るっぽい。
2017-06-24 16:09:23蓑田さん執筆のManateeの記事 → book.mynavi.jp/manatee/detail… #tokyor
2017-06-24 16:12:16目次のタイトルだけでもdplyr, purrr, tidyverse, Rmarkdown, shinyあたりの話が追加されてるみたい。総ページ数が100ページ増えてるし,翻訳大変そう〜 #TokyoR twitter.com/soogie/status/…
2017-06-24 16:27:43