更新 2014年5月21日作成 2013年4月21日

第30回R勉強会＠東京 #TokyoR

第30回R勉強会＠東京 #TokyoR のツイートまとめ。 http://atnd.org/events/38512

プログラミング R データサイエンティスト統計データマイニング tokyor 勉強会

bob3bob3
4047
0
1
1

前へ 1 2 3 ・・ 10 次へ

Takashi Minoda @aad34210

初心者セッションの資料をSlideshareにアップロードしました。http://t.co/HbAUk0ccLP #TokyoR

2013-04-20 16:13:00

おばけ @obk3n

『Rってpackageが多くて便利だよね～』 …便利でしょうか？Package依存症はときに思考を止める。やりたい処理が具体的なら自作することも大切。車輪の再発明は決して無駄じゃない。血となり肉となる、って思うよ。#tokyor

2013-04-20 16:13:29

いとーちゃん @ito_yan

分散分析を使うとき、データはいくつかの仮定(分散の均一性とか)を満たす必要があるのだけど、「Rによるやさしい統計学」ではあまりその辺に触れてないかなと思いました。 #TokyoR

2013-04-20 16:13:47

Hidekazu Tanaka @holidayworking

ストアドプロシージャーの話が出てくるとは思わなかった #TokyoR

2013-04-20 16:17:52

タニキ @taniki_no_teiou

データ解析のDBならRDBはPostgreがオススメ、理由はMySQLはWindow関数が使えない。PostgreはPL/RでRとの連携が可能。 #TokyoR

2013-04-20 16:18:05

おばけ @obk3n

分散分析。事前条件の吟味って大切。自分のデータの性質を吟味せずに使うと、火傷しますよね。誤差分散の正規性や群間の分布の違いなど、使用する際の縛りは多いです。何か放り込めば結果は出る。でも、その妥当性は別の話。#tokyor

2013-04-20 16:19:04

石川木場郎 @dichika

へーSQLだとそういう風に書くんだ

2013-04-20 16:21:03

タニキ @taniki_no_teiou

基本データ解析するときはWindow関数がミソ、これがないので、MySQLは単なるRank関数の実装でも副問い合わせを使用しないといけない。　#TokyoR

2013-04-20 16:21:31

Hidekazu Tanaka @holidayworking

サーバが高負荷の原因を調べていたら ORDER BY RAND() を使っている SQL が連発されていることがありましたね #TokyoR

2013-04-20 16:21:32

おばけ @obk3n

MySQLとPostgresSQLはスピードの議論が長年行われてました。でも、近年のPCスペックはスピードを吸収しつつあり、どちらも遜色ない気がします。ユーザー数やネット上の情報量を考えるとPostgresSQLも良いと思います。#tokyor

2013-04-20 16:22:18

石川木場郎 @dichika

おおポスグレ勧めてる

2013-04-20 16:23:14

レセプトおじさん @Hiro_macchan

SQLServer だとORDER BY NEWID()でいいのかな？

2013-04-20 16:24:08

石川木場郎 @dichika

「Pigを勉強中です！(ﾁﾗｯ」

2013-04-20 16:24:31

しまじろうよう社会常識身に付け中 @you_s1025

MySQL にも DWH 用途のエンジンありますよ。 infinidb とか InfoBright とか。 #TokyoR

2013-04-20 16:24:45

いとーちゃん @ito_yan

何のために統計学があるかって考えてみると、一つは適切な推測のためでしょう。全データを調べられれば問題ないですが、大概（時間的、金銭的）コストが大きすぎて現実的ではないわけです。だからこそサンプリングして得られたデータから信頼区間のようなものを作って、大体この程度とするわけです。

2013-04-20 16:28:32

Vidar @Vidar_vape

驚きの男性率の高さ #tokyor

2013-04-20 16:31:50

kos59125 @kos59125

人多いなぁ。

2013-04-20 16:32:10

鮭 @shakezo_

室内あったかい

2013-04-20 16:34:27

kos59125 @kos59125

一様分布といえば通常は min も max も存在するけど，実用では min と max の一方または両方がが存在しない場合も扱いたい。

2013-04-20 16:36:17

kos59125 @kos59125

実際計算上ほとんど変わりはないけど，気持ち的なアレ。

2013-04-20 16:37:43

WADA Kazuya @wdkz

@mikado_hito 今日も期待してます！！ #tokyor #マサ齋藤

2013-04-20 16:39:40

Vidar @Vidar_vape

Rで始める協調フィルタリング #tokyor

2013-04-20 16:40:52

テラモナギ @teramonagi

こいつは何をしているんだ・・・？w #TokyoR

2013-04-20 16:42:32

過学習(bias and variance) @biasandvariance

欠測値の補完と共通するところが多いように思った。

2013-04-20 16:49:17

kos59125 @kos59125

灰色の羊ってどういう由来だろう。

2013-04-20 16:51:17

前へ 1 2 3 ・・ 10 次へ

いま話題のタグ