編集可能
2016年2月13日

Kaggle - Malware Classification Challenge勉強会

Kaggle - Malware Classification Challenge勉強会(http://connpass.com/event/25007/)に関係しそうな発言のまとめ どの発表に対する発言なのかは推測なので、間違っていたら適宜編集していただけるとありがたいです。
1
司会の@olanleedさんによる「挨拶と説明」
@ntddkさんの「マルウェアを機械学習する前に」
いしたー @sonicair

タスクに応じたアルゴリズムを選択する必要がある #Kaggle_m

2016-02-13 13:08:50
@olanleedさんの「Deep Learning for Malware Detection」(発表資料
言うべきことを言わない価値サゲオ @nknskn

#Kaggle_m 深層学習とは。多層構造のニューラルネットを用いて任意の関数を近似する手法。期待されていること:自ら特徴量を獲得

2016-02-13 13:12:11
カドラ @k_kadora

みにくいアヒルの子定理 #Kaggle_m

2016-02-13 13:13:27
言うべきことを言わない価値サゲオ @nknskn

#Kaggle_m タスクの種類に応じてモデルやパラメータを調整しなければ有効な特徴量を獲得できない -> 聖杯などなかった

2016-02-13 13:13:36
Masa @asas_mimi

ノーフリーランチ vs. Deep Learning #Kaggle_m

2016-02-13 13:13:49
カドラ @k_kadora

深層学習の時代でも特徴量の設計は重要 #Kaggle_m

2016-02-13 13:14:41
Hiroki Yamamoto @tereka114

DeepLearning = 聖杯とすると DeepLearningで戦う我々は、聖杯戦争をしているのでしょうか。 #Kaggle_m

2016-02-13 13:14:43
言うべきことを言わない価値サゲオ @nknskn

#Kaggle_m みにくいアヒルの子定理。与えられたタスクとは独立に特徴量を設計することはできない。深層学習の時代でも特徴量も設計は重要。ex)なんのBoWを取る?

2016-02-13 13:14:53
言うべきことを言わない価値サゲオ @nknskn

#Kaggle_m マルウェア対策。機械学習はいろいろな箇所で用いられている。異常検知(ファイル、プロセス、トラフィック)、検体の分類(既知、亜種、新種)等。どうやって?→パターンマッチとかヒューリスティックとか

2016-02-13 13:16:26
言うべきことを言わない価値サゲオ @nknskn

#Kaggle_m s/ヒューリスティック/ヒューリスティクス/g

2016-02-13 13:17:13
言うべきことを言わない価値サゲオ @nknskn

#Kaggle_m マルウェア解析。静的解析:逆アセンブル結果、セクション情報を見る。動的解析:APIトレースログ、トラフィックをみる

2016-02-13 13:23:53
言うべきことを言わない価値サゲオ @nknskn

#Kaggle_m Kaggle で主流になっているアルゴリズム。ブースティング。複数の弱学習記を組み合わせて強学習記を生成するメタアルゴリズム。

2016-02-13 13:29:26
言うべきことを言わない価値サゲオ @nknskn

#Kaggle_m マルウェアを機械学習させる戦略。文書分類などで使われている手法が使えるのでは。N-gram,Bag of Words, Binary, TF-IDF, etc

2016-02-13 13:37:35
言うべきことを言わない価値サゲオ @nknskn

#Kaggle_m Bag of N-gram の利点。無難。そこそこ精度が出る。欠点。高次元になりやすい。語の意味が失われる。語の順序が失われる。

2016-02-13 13:39:19
言うべきことを言わない価値サゲオ @nknskn

#Kaggle_m 欠点の語の順序は重要だと思われる。命令の順序に相当するはず。BoWのように順序が失われるのは好ましくない。

2016-02-13 13:40:51
言うべきことを言わない価値サゲオ @nknskn

#Kaggle_m そこで RNNLM と Paragraph Vector について考えてみる。

2016-02-13 13:41:33
残りを読む(97)

コメント

コメントがまだありません。感想を最初に伝えてみませんか?