0
データ・マエショリスト入門 データの読み込みから{dplyr}の基本まで
matsumura @y__mattu
本日の初心者セッションのスライドをアップしました。 slideshare.net/mattuyuya/2017…
あ~る・芸人一郎 @r_geinin
続いてデータ・マエショリスト入門 #TokyoR
職業、自宅警備員 @kashitan
data.tableは文字エンコードでハマるのでfreadをオススメとのこと #tokyor
職業、自宅警備員 @kashitan
@kashitan #TokyoR freadじゃなくてreadrでした。すみません。。。
nob @nob_ymkw
データ読み込み速度を試す用のcsvファイルやtsvファイルを簡単に作るRのパッケージは無いかな? #tokyor
Fumiaki Nishihara(西原史暁) @f_nisihara
Rで read.csv() 関数を使ってCSVを読み込むとき、stringsAsFactors = FALSE をおまじないのように使うことに関する詳しい事情は『R言語徹底解説』の第2章あたりに説明が。 #TokyoR
Fumiaki Nishihara(西原史暁) @f_nisihara
素のRで transform() を使う場合は、transform(df, hoge = df$piyo / df$foo) のようにデータフレームの名前(df)を繰り返すのが基本だけど、dplyrパッケージのmutate()なら繰り返すが必要ないため便利。 #TokyoR
Fumiaki Nishihara(西原史暁) @f_nisihara
dplyrパッケージでのデータフレームの結合には、inner_join() のほかに、right_join() や semi_join() などが。これらも含め、以下のページにdplyrパッケージについて色々説明も。 heavywatal.github.io/rstats/dplyr.h… #TokyoR
Hiroaki Yutani @yutannihilation
「kazutanさんという方がおられるんですが、」 #TokyoR
Fumiaki Nishihara(西原史暁) @f_nisihara
Rの dplyr パッケージや purrr パッケージなどは Hadley Wickham さんというR界のネ申が開発にあたっていて、一貫した設計思想で作られていたりします。tidyverse はパッケージ名であると同時に、彼のそうした思いが組み込まれた世界です。 #TokyoR
naka-x @X_chi
#TokyoR 来てる。前処理の発表、参考になった
Fumiaki Nishihara(西原史暁) @f_nisihara
Kazutan.R kazutan.github.io/kazutanR/ には割と色んなR関係の資料があります。よく使われているパッケージの情報が色々。 #TokyoR
えりばー @eriver_jpn
dplyrにWindow関数があるなんて知らんかった。。。わざわざzoo使ったりしてたぞ。。。まだまだ初心者と実感。 #TokyoR
脱!初心者セッション
あ~る・芸人一郎 @r_geinin
初心者セッションの最後を飾るのは、文字列データをどう上手く扱うか? #TokyoR
あ~る・芸人一郎 @r_geinin
エンコーディングは読み込む前に確認を #TokyoR
Fumiaki Nishihara(西原史暁) @f_nisihara
stringi パッケージでは、函数名が大体 stri_...で始まっていて、stringr パッケージでは、函数名が大体 str_... で始まっています。 #TokyoR
職業、自宅警備員 @kashitan
read.table(..., encoding="CP932")でSJIS読み込めなくてエディタで修正していたのは良い思い出。(正しくはfileEncoding="CP932") #tokyor
あ~る・芸人一郎 @r_geinin
文字列処理するなら`stringi/stringr`パッケージ、正規表現も組み合わせると無敵?! #TokyoR
Fumiaki Nishihara(西原史暁) @f_nisihara
Rでの文字列処理用パッケージである stringr パッケージ(stringi パッケージでなく)については heavywatal.github.io/rstats/stringr… に説明が色々。 #TokyoR
応用セッション 目指せ地理空間データマスター
残りを読む(99)

コメント

ログインして広告を非表示にする
ログインして広告を非表示にする