
次 機械学習チームにおけるソフトウェアエンジニア〜役割、キャリア/伊藤 敬彦 [クックパッド]さん #devsumi #devsumiA
2018-07-27 12:54:25
機械学習プロジェクトの特徴 - コードだけでは完結しない - コードを読んでも振る舞いがわからない - 入力データに依存する これらの機械学習の導入、管理の難しさをエンジニアで対処する。 ⇒データサイエンティストをサポートするチームを結成 #devsumi #devsumiA
2018-07-27 13:06:53
データ取れるようになる前に、リサーチャーやデータサイエンティストを雇うな。 データにアクセスできないデータサイエンティストととは…。 →丘サーファー。 #devsumiA
2018-07-27 13:10:34
データを簡単に取得できる環境を用意する前にデータサイエンティストやリサーチャーを大量に雇う。これでは陸サーファーの大量創出😅 #devsumiA
2018-07-27 13:10:47
データ取得に関連するアンチパターン データを簡単に取得出来る環境を構築するするまえにデータサイエンティストを雇うことがある。データにアクセスできないデータサイエンティストなんて丘サーファーと同じ。やめたほうがいい。 #devsumi #devsumiA
2018-07-27 13:12:34
@takahi_i さんによるご講演。データにアクセスできないデータサイエンティストが多い問題。あるある。 #devsumiA #devsumi
2018-07-27 13:13:10
基盤の準備だけでなく、自動でデータの投入更新が行われるようにしないと効率的に作業を進められない #devsumiA
2018-07-27 13:13:26
計算機リソースの枯渇 機械学習チームメンバ全員が快適に作業出来る環境を整えることが重要。 cookpadではSlack上で計算機の確保をお願いするとEC2インスタンスを立ち上げてくれる仕組みを利用。 なんか汎用機の時代みたいになってきたな。 #devsumi #devsumiA
2018-07-27 13:16:00
計算機リソースが足らなくて実験が進められないことは問題。高コスト人材を無駄に遊ばせない仕掛けが必要 #devsumiA
2018-07-27 13:16:08
なんか動作しているようだがモデルを生成しているコードが理解できない。(JupyterNoteBookをそのままコピペしたスクリプト)やばいのでNotebookをスクリプト化していく。 #devsumi #devsumiA
2018-07-27 13:18:08
実験はJupyter Notebookだけど、それをまずクラス構成をきちんとしてスクリプトに 落とし込む。エンジニアにとっては基本のキ?だけど意外に機械学習界隈ではコードが何をやってるのか可読性の悪いコード多し。リファクタリングとか。意外だけどそんな基本なことできてないらしい。 #devsumiA
2018-07-27 13:19:50
デブサミ夏2018【A-3】データウェアハウスの設計手法『ディメンショナル・モデリング』のすすめ #devsumiA togetter.com/li/1250773
2018-07-27 13:21:07
機械学習でもCIは重要。 ただでさえ中身がわかりづらい機械学習でテストが無いのは恐怖。 #devsumi #devsumiA
2018-07-27 13:21:45