2012年10月30日

ad:tech tokyo 2012 de テック勉強会 #AdTechTech

http://www.facebook.com/events/487714861258804/ 以下、転記。 ad:tech tokyoの会場でWeb広告の技術を中心とした勉強会を行います! 機械学習、データ分析、パフォーマンス向上、Erlang、UXなど、今ホットなトピックが勢揃いです。 続きを読む
1
太田祐一さん「Mahout in adtech」
ちゃちゃき @chachaki

始まりますた 「Mahout in adtech」太田さん ハッシュタグあんのかなこれ。とりあえずー #AdTechTech

2012-10-30 14:04:37
ちゃちゃき @chachaki

ユーザーの行動履歴、属性などをKVSに保存→ユーザーの特徴をベクトル化・標準化。mahoutでk-Means→Random Forestモデルを作成(バッチ処理)→KVSからユーザーの情報を取得してRandom Forestでユーザーを分類(フロント) #AdTechTech

2012-10-30 14:09:14
ちゃちゃき @chachaki

主にHadoopを用いてデータマイニングや機械学習するためのJavaライブラリ。(今回はver0.7を使います。) 結構バグがあるので直して使わないといけないところがある。バージョンが変わると特にアナウンスもなく使えなくなるものがある。 #AdTechTech

2012-10-30 14:10:42
ちゃちゃき @chachaki

k-Means Cluster。てっく煮ブログさんを参照。 http://t.co/NDiaWxho #AdTechTech

2012-10-30 14:14:24
ちゃちゃき @chachaki

k-Means 前処理。ユーザーベクトルをスペース区切りに整形したテキストファイル→key:Text Value:VectorWritable #AdTechTech

2012-10-30 14:16:02
ちゃちゃき @chachaki

スペース区切りはマッパー処理のソースをいじれば、カンマ区切りにするこもできる #AdTechTech

2012-10-30 14:17:44
ちゃちゃき @chachaki

k-Means。コマンドで、入力パス、初期ノードパス(ランダムも可)、結果出力パス、クラスタ数、距離計算手法、最大イテレーション回数、などを指定する #AdTechTech

2012-10-30 14:19:19
ちゃちゃき @chachaki

Random Forest。決定木はいわゆるYES/NOチャートみたいなもの。Random Forestは母集団からランダムにデータを取り出して、それぞれ決定木に入れて、多数決をとる。 #AdTechTech

2012-10-30 14:25:18
BASH @bash0C7

ガラス棟505のtech勉強会にきた。満員御礼や! #AdTechTech

2012-10-30 14:25:47
ちゃちゃき @chachaki

Random Forestの前処理。先ほどの出力結果を、クラスタIDとユーザベクトルのカンマ区切りへ変換。→Create Decisiton Forest 。Describe処理&BuildForest処理。 #AdTechTech

2012-10-30 14:29:00
ちゃちゃき @chachaki

Test Decision Forest。実際にモデル化したものが正しく機能するかのテスト。TestForest処理 #AdTechTech

2012-10-30 14:32:48
ちゃちゃき @chachaki

ユーザー分類フロー。userid→サイト訪問→フロントサーバでKVSに問い合せてユーザー情報を取得→ユーザー上方をベクトル化してRandomForest→クラスタIDを取得 #AdTechTech

2012-10-30 14:34:46
ちゃちゃき @chachaki

ユーザーベクトルをいかに作るか、説明変数をどうするかが一番重要。 #AdTechTech

2012-10-30 14:41:08
ちゃちゃき @chachaki

クラスタ数をどう決めるか。 #AdTechTech

2012-10-30 14:43:24
今井雄太さん、松尾康弘さん(AWS)「AWSをハイパフォーマンスで使うには」
ちゃちゃき @chachaki

今井雄太さん、松尾康弘さん(AWS) タイトル:AWSをハイパフォーマンスで使うには #AdTechTech

2012-10-30 14:51:26
ちゃちゃき @chachaki

アマゾンの3つのビジネス。一般消費者様向けサービス=Eコマース。セラー様向けサービス=マーケットプレイス。企業様向け=クラウドコンピューティングサービス。 #AdTechTech

2012-10-30 14:54:11
ちゃちゃき @chachaki

広告業界とAWS。グローバルでAWSが使われている。DSP、配信、集計、キャンペーンサイトでなどなど #AdTechTech

2012-10-30 14:56:06
ちゃちゃき @chachaki

AWSの様々なサービス。主にはEC2、S3、Elastic MapReduce、ELBなど #AdTechTech

2012-10-30 14:57:30
ちゃちゃき @chachaki

Amazon CloudFrontの引き合いが多くなっている。タグバナーなど #AdTechTech

2012-10-30 14:58:00
ちゃちゃき @chachaki

リファレンスアーキテクチャもあります。Ad系はこうなどなど #AdTechTech

2012-10-30 14:58:20
残りを読む(77)

コメント

コメントがまだありません。感想を最初に伝えてみませんか?