クローリングのスペシャリストが語る、クローラー運用の裏側! まとめ #crawler_ops

2016年8月21日(日)に開催されたイベント「クローリングのスペシャリストが語る、クローラー運用の裏側!」のツイートをまとめました。 http://bayside-tech-bridge.connpass.com/event/36712/ 上記イベントページには公開可能な資料もありますのでぜひアクセスください。
2
とれびー (Hiroaki Ninomiya) @treby006

いまどきなSPAのサービスならなんかAPIありそうな気もするががが #crawler_ops

2016-08-21 14:54:32
ldk2iln3yt201 @ldk2iln3yt201

クロウラーのメンテナンスが大変→メンテナンスしやすいつくりにする XPathをガチガチにすると少しの変更で対応作業が発生する。class等を直接していするケースにすれば多少の変更に耐えられたりする。 #crawler_ops #bayside_tech_bridge

2016-08-21 15:08:32
ldk2iln3yt201 @ldk2iln3yt201

@seimiyajun (訂正)これ「デザイン変更に強いつくりにする」についてでした。 #crawler_ops #bayside_tech_bridge

2016-08-21 15:11:45
auchida @utwang

@shida 実際に運用から得られたためになるノウハウだった。参考にしたい #crawler_ops #bayside_tech_bridge

2016-08-21 15:13:10
ldk2iln3yt201 @ldk2iln3yt201

「既存クローラーがスパゲッティ化していて匠の技が必要だった」クローラーは構造上スパゲッティ化しやすいのかもですね。 #crawler_ops #bayside_tech_bridge

2016-08-21 15:26:44
ldk2iln3yt201 @ldk2iln3yt201

「リトライ単位を細かくするのがキモ。サービス側にも負担かけないし、時間もかからなくなる。」 #crawler_ops #bayside_tech_bridge

2016-08-21 15:31:13
とれびー (Hiroaki Ninomiya) @treby006

一回ナウい感じでクローラーサービス作りたいな(こなみ感) #crawler_ops

2016-08-21 15:32:06
とれびー (Hiroaki Ninomiya) @treby006

おかしいのがあるって監視するのすごく重要ですよね。この辺の力伸ばしていきたい #crawler_ops

2016-08-21 15:33:22
auchida @utwang

ニュースパスのクローラー、責務の分担がしっかりされていて、すごい構造化されているな。 #crawler_ops #bayside_tech_bridge

2016-08-21 15:36:07
とれびー (Hiroaki Ninomiya) @treby006

practicalなところは確かに感あって勉強になる。 #crawler_ops

2016-08-21 15:37:07
auchida @utwang

IP偽装しない。むしろクロールしてくださいというサービスであればそれができる。 #crawler_ops #bayside_tech_bridge

2016-08-21 15:38:37
auchida @utwang

へー、Akamaiのクロッピング!便利だな。 #crawler_ops #bayside_tech_bridge

2016-08-21 15:40:22
auchida @utwang

管理画面を作るのは重要なんだな #crawler_ops #bayside_tech_bridge

2016-08-21 15:44:25
auchida @utwang

プレビューがでるとは。すげー。 #crawler_ops #bayside_tech_bridge

2016-08-21 15:45:14
とれびー (Hiroaki Ninomiya) @treby006

そうよね、管理画面よね。みんなで幸せになろう #crawler_ops

2016-08-21 15:45:32
auchida @utwang

エンジニア以外で運用できるクローラー。 #crawler_ops #bayside_tech_bridge

2016-08-21 15:46:13
そかも🏊️ @s0kam0

サイトコンテンツをクラウドストレージに丸々保存しておくのは、確かにデバッグに便利そう。 #crawler_ops #bayside_tech_bridge

2016-08-21 17:36:22
くぺぴぷ @yosms3

クローラー勉強会に参加してきた。意外とLambdaじゃなくてEC2でやってところが多いらしい Azure の話を振ってみたら、みんな存在は知ってるレベルだった... fb.me/KP2CceVN

2016-08-21 17:56:03
mosa / 榎本 @mosa_siru

#crawler_ops 本日の資料はこちらにあげています ニュースパスのクローラーアーキテクチャとマイクロサービス slideshare.net/mosa_siru/ss-6…

2016-08-21 22:17:38