デブサミ夏2018【A-4】 機械学習チームにおけるソフトウェアエンジニア〜役割、キャリア #devsumiA

0
マサーシー@MASA-SEE @masashi0509

次 機械学習チームにおけるソフトウェアエンジニア〜役割、キャリア/伊藤 敬彦 [クックパッド]さん #devsumi #devsumiA

2018-07-27 12:54:25
マサーシー@MASA-SEE @masashi0509

機械学習プロジェクトの特徴 - コードだけでは完結しない - コードを読んでも振る舞いがわからない - 入力データに依存する これらの機械学習の導入、管理の難しさをエンジニアで対処する。 ⇒データサイエンティストをサポートするチームを結成 #devsumi #devsumiA

2018-07-27 13:06:53
とーます @grimrose

サイクルが回らないプロジェクト… #devsumiA

2018-07-27 13:07:59
まめぴか@年内暇 @mame_pika

開発サイクルは回さないとな…。 耳が痛い。 #devsumiA

2018-07-27 13:09:30
まめぴか@年内暇 @mame_pika

データ取れるようになる前に、リサーチャーやデータサイエンティストを雇うな。 データにアクセスできないデータサイエンティストととは…。 →丘サーファー。 #devsumiA

2018-07-27 13:10:34
Shunji Sumida @narista

データを簡単に取得できる環境を用意する前にデータサイエンティストやリサーチャーを大量に雇う。これでは陸サーファーの大量創出😅 #devsumiA

2018-07-27 13:10:47
マサーシー@MASA-SEE @masashi0509

データ取得に関連するアンチパターン データを簡単に取得出来る環境を構築するするまえにデータサイエンティストを雇うことがある。データにアクセスできないデータサイエンティストなんて丘サーファーと同じ。やめたほうがいい。 #devsumi #devsumiA

2018-07-27 13:12:34
ゆずたそ / Sho Yokoyama (風音屋) @yuzutas0

@takahi_i さんによるご講演。データにアクセスできないデータサイエンティストが多い問題。あるある。 #devsumiA #devsumi

2018-07-27 13:13:10
Shunji Sumida @narista

基盤の準備だけでなく、自動でデータの投入更新が行われるようにしないと効率的に作業を進められない #devsumiA

2018-07-27 13:13:26
とーます @grimrose

今の課題だな…計算機リソースの確保 #devsumiA

2018-07-27 13:14:49
マサーシー@MASA-SEE @masashi0509

計算機リソースの枯渇 機械学習チームメンバ全員が快適に作業出来る環境を整えることが重要。 cookpadではSlack上で計算機の確保をお願いするとEC2インスタンスを立ち上げてくれる仕組みを利用。 なんか汎用機の時代みたいになってきたな。 #devsumi #devsumiA

2018-07-27 13:16:00
Shunji Sumida @narista

計算機リソースが足らなくて実験が進められないことは問題。高コスト人材を無駄に遊ばせない仕掛けが必要 #devsumiA

2018-07-27 13:16:08
マサーシー@MASA-SEE @masashi0509

なんか動作しているようだがモデルを生成しているコードが理解できない。(JupyterNoteBookをそのままコピペしたスクリプト)やばいのでNotebookをスクリプト化していく。 #devsumi #devsumiA

2018-07-27 13:18:08
Shunji Sumida @narista

実験はJupyter Notebookだけど、それをまずクラス構成をきちんとしてスクリプトに 落とし込む。エンジニアにとっては基本のキ?だけど意外に機械学習界隈ではコードが何をやってるのか可読性の悪いコード多し。リファクタリングとか。意外だけどそんな基本なことできてないらしい。 #devsumiA

2018-07-27 13:19:50
とーます @grimrose

notebookからスクリプトへconvertするのにリファクタリング本が役に立つ #devsumiA

2018-07-27 13:20:25
鳴き声が「痛いよ~痛いよ~」と聞こえる猫 @followbcxxx

デブサミ夏2018【A-3】データウェアハウスの設計手法『ディメンショナル・モデリング』のすすめ #devsumiA togetter.com/li/1250773

2018-07-27 13:21:07
Shunji Sumida @narista

自動テストもちゃんとやる。つか、そこもか、と想定外の意外さに慄いてる #devsumiA

2018-07-27 13:21:12
マサーシー@MASA-SEE @masashi0509

機械学習でもCIは重要。 ただでさえ中身がわかりづらい機械学習でテストが無いのは恐怖。 #devsumi #devsumiA

2018-07-27 13:21:45
とーます @grimrose

テストが書かれていない機械学習のコード はホントに怖い #devsumiA

2018-07-27 13:22:13