このまとめをお気に入りにして応援しよう!
0
マサーシー@MASA-SEE @masashi0509
次 機械学習チームにおけるソフトウェアエンジニア〜役割、キャリア/伊藤 敬彦 [クックパッド]さん #devsumi #devsumiA
マサーシー@MASA-SEE @masashi0509
機械学習プロジェクトの特徴 - コードだけでは完結しない - コードを読んでも振る舞いがわからない - 入力データに依存する これらの機械学習の導入、管理の難しさをエンジニアで対処する。 ⇒データサイエンティストをサポートするチームを結成 #devsumi #devsumiA
まめぴか@🧱🐻🐉 @mame_pika
開発サイクルは回さないとな…。 耳が痛い。 #devsumiA
まめぴか@🧱🐻🐉 @mame_pika
データ取れるようになる前に、リサーチャーやデータサイエンティストを雇うな。 データにアクセスできないデータサイエンティストととは…。 →丘サーファー。 #devsumiA
Shunji Sumida @narista
データを簡単に取得できる環境を用意する前にデータサイエンティストやリサーチャーを大量に雇う。これでは陸サーファーの大量創出😅 #devsumiA
マサーシー@MASA-SEE @masashi0509
データ取得に関連するアンチパターン データを簡単に取得出来る環境を構築するするまえにデータサイエンティストを雇うことがある。データにアクセスできないデータサイエンティストなんて丘サーファーと同じ。やめたほうがいい。 #devsumi #devsumiA
ゆずたそ @yuzutas0
@takahi_i さんによるご講演。データにアクセスできないデータサイエンティストが多い問題。あるある。 #devsumiA #devsumi
Shunji Sumida @narista
基盤の準備だけでなく、自動でデータの投入更新が行われるようにしないと効率的に作業を進められない #devsumiA
マサーシー@MASA-SEE @masashi0509
計算機リソースの枯渇 機械学習チームメンバ全員が快適に作業出来る環境を整えることが重要。 cookpadではSlack上で計算機の確保をお願いするとEC2インスタンスを立ち上げてくれる仕組みを利用。 なんか汎用機の時代みたいになってきたな。 #devsumi #devsumiA
Shunji Sumida @narista
計算機リソースが足らなくて実験が進められないことは問題。高コスト人材を無駄に遊ばせない仕掛けが必要 #devsumiA
マサーシー@MASA-SEE @masashi0509
なんか動作しているようだがモデルを生成しているコードが理解できない。(JupyterNoteBookをそのままコピペしたスクリプト)やばいのでNotebookをスクリプト化していく。 #devsumi #devsumiA
Shunji Sumida @narista
実験はJupyter Notebookだけど、それをまずクラス構成をきちんとしてスクリプトに 落とし込む。エンジニアにとっては基本のキ?だけど意外に機械学習界隈ではコードが何をやってるのか可読性の悪いコード多し。リファクタリングとか。意外だけどそんな基本なことできてないらしい。 #devsumiA
とーます@悪いオタクらしい @grimrose
notebookからスクリプトへconvertするのにリファクタリング本が役に立つ #devsumiA
鳴き声が「痛いよ~痛いよ~」と聞こえる猫 @followbcxxx
デブサミ夏2018【A-3】データウェアハウスの設計手法『ディメンショナル・モデリング』のすすめ #devsumiA togetter.com/li/1250773
Shunji Sumida @narista
自動テストもちゃんとやる。つか、そこもか、と想定外の意外さに慄いてる #devsumiA
マサーシー@MASA-SEE @masashi0509
機械学習でもCIは重要。 ただでさえ中身がわかりづらい機械学習でテストが無いのは恐怖。 #devsumi #devsumiA
とーます@悪いオタクらしい @grimrose
テストが書かれていない機械学習のコード はホントに怖い #devsumiA
残りを読む(16)
ログインして広告を非表示にする
ログインして広告を非表示にする