限定公開でまとめを作れば、相互フォローやフォロワー限定でまとめを共有できます!

岡崎市中央図書館向けクローラ作成者が逮捕・不起訴の件(Vol.1 - 6月24日以降分)

「岡崎市中央図書館に1秒間に1回アクセスしたら逮捕されたけど不起訴になった件について」 http://togetter.com/li/30698 上記のリストが長くなったので24日以降分のリストを新規に作りました。 続きを読む
図書館 DOS 高木浩光 セキュリティ Librahack
15518view 15コメント
14
ぐて~ @gutei
#Librahack 岡崎だけが謎の挙動をするって書いとるねw、同パッケージで。 RT @keikuma: クロールしてる時にサーバが落ちると悲しい。DoSしてる時にサーバが落ちると嬉しい。 - クロールとDoSの違いと業務妨害罪と http://bit.ly/doI6fI #L
ぐて~ @gutei
#librahack Webサーバの利用規約に「スクリプト等による自動アクセスは、業務の妨げになるため行わないこと」と書いてあって…ってようなことを理解出来ないヒトもwebアクセスするんだよねぇ。
ぐて~ @gutei
#librahack iPadな方向に便利なデバイスが多くなる程、webアクセスってのは空気の存在みたいなものになり、アクセス制限を増やすようなことがガラパゴス化的でもあるようにも思うワケで…
ぐて~ @gutei
#librahack 無断リンク禁止教に新宗派、無断クロール禁止教ってのは笑っちゃいけないかもしれないけど笑ったw http://bit.ly/doI6fI リンク禁止には私は反対な考えです。webのナカにいながらwebを否定するような行為だと思うので。
okada basso @okadabasso
資料情報>新着図書>各カテゴリー のページはそこそこ早いよ? 600ms程度。 #librahack
ぐて~ @gutei
#librahack サイトのサイト側都合のメンドクサイ利用規約を守らせたいなら会員制承認機能でログインしないと使えないように汁、とか思ったりもする。全てに良いとは思わないけどねw
ぐて~ @gutei
近所が同パッケみたいなんで蔵書検索したけど画像無しモードとか欲しい&その分テキストで一覧件数増やして欲しい、とか思ってみたり… RT @okadabasso: 資料情報>新着図書>各カテゴリー のページはそこそこ早いよ? 600ms程度。 #librahack
KaRaKe aka DevilMeat @krkdm
@imksoo 故意を判断するにあたって、代替手段の有無も検討せずに違法(キリッと言われても… 敢えて例えるなら、自販機でジュースを何本も買おうとしたら、自販機の故障のせいで出てくるのに時間がかかって、行列になって、それで逮捕ってレベル。 #librahack
okada basso @okadabasso
@gutei ならば自力でクロールして作れば… という事に #librahack
ぐて~ @gutei
ん?…どれのコメントかわかってません(汗 RT @okadabasso: @gutei ならば自力でクロールして作れば… という事に #librahack
ぐて~ @gutei
#librahack ちなみ会員承認制な作りにしてもクロール出来ないってことじゃないですw
ぐて~ @gutei
#librahack クロール、非クロール(手動w)に関わらず、リンク禁止とかリンクはTopページのみとかチマチマメンドクサイ規約山盛りなサイトはメンドクサイってことでw
睦月@インフラ技術…者? @mutsuki99
認証を通るクローラを作っ(ry RT @gutei: #librahack サイトのサイト側都合のメンドクサイ利用規約を守らせたいなら会員制承認機能でログインしないと使えないように汁、とか思ったりもする。全てに良いとは思わないけどねw
ぐて~ @gutei
作れますよw、逆のアクセス拒否も簡単だしw、拒否用の設定機能を作りこめばエンドユーザでも拒否管理が楽w RT @mutsuki99: 認証を通るクローラを作っ(ry RT @gutei: #librahack サイトのサイト側都合のメンドクサイ利用規約を守らせたいなら会員制承認
睦月@インフラ技術…者? @mutsuki99
実際のとこ、http だと文字列操作だけできればなんでもできちゃうから、クローラだって正規のブラウザと言えますしね。お行儀の悪さは IE で http 同時接続数変えるのと大差ないし。 RT @gutei: 作れますよw、逆のアクセス... #librahack
mzkh @hkzm
1秒ウェイトじゃなくて、単位時間あたりのリクエスト数を決めたって書いてありますよ。 RT @keikuma: 「1秒1アクセス」ではないですよ。1アクセス毎に「1秒のウェイト」です。クローラを実装した事がない人は混同するかも知れませんが、... #librahack
睦月@インフラ技術…者? @mutsuki99
サイト運営者側の立場で考えてみると、クローラが PV 数に与える影響は馬鹿に出来ないのかな。あとは著作権問題くらいか。サーバ負荷さえクリアできれば、むしろサービスの利用客としては歓迎できると思うんだけどなぁ。 #librahack
ぐて~ @gutei
#librahack http上でのお約束を守る限りは相手も返事をしてくれますしw、相手のhttpサーバの後ろにいろいろいるからややこしいw、人や警察も含めwww RT @mutsuki99: 実際のとこ、http だと文字列操作だけできればなんでもできちゃうから、クローラだって
ぐて~ @gutei
#librahack 著作権問題とは? RT @mutsuki99: サイト運営者側の立場で考えてみると、クローラが PV 数に与える影響は馬鹿に出来ないのかな。あとは著作権問題くらいか。サーバ負荷さえクリアできれば、むしろサービスの利用客としては歓迎できると思うんだけどなぁ。
睦月@インフラ技術…者? @mutsuki99
ちょっと librahack から話題はずれてしまうのですが、Pixiv の様な著作物を扱っているサービスをスクレイピングされる際、個人利用に留めているかの判断をサイト運営者が行えないのではないかと。RT @gutei: #librahack 著作権問題とは?
J Kassy @kassy1069
被害があっても故意がなければ逮捕されないの?じゃぁ業務上過失致死とかは逮捕されないの?あれは故意は関係ないよ?故意の有無は逮捕要件とは違うよ?あまり間違った知識を広めないで欲しい。 #librahack
ぐて~ @gutei
#librahack 親告罪との違いのことなんじゃ? RT @kassy1069: 被害があっても故意がなければ逮捕されないの?じゃぁ業務上過失致死とかは逮捕されないの?あれは故意は関係ないよ?故意の有無は逮捕要件とは違うよ?あまり間違った知識を広めないで欲しい。 #librah
@inudaisho
連続アクセスしているうちに重くなって1000msは越えるんじゃなかろうか。取得して1秒おいて、ってことしていたら、1800秒程度ではおわらなくなってしまう。本当にタイムウェイトおいてたのか疑わしい。まぁその辺も夜試してみる #librahack
加藤公一(はむかず) @hamukazu
うわわ、みんなRTするなって、タレこまれたらほんとに逮捕されるって!!RT:@hamukazu この程度のクロールは僕もやってるので、逮捕されるかも。家族のことは頼んだぞ(誰に?)http://bit.ly/aLULc3 #librahack
くちだいき @ky37
つまり僕が何が言いたいかっていうと、「そんなに脆弱な図書館のシステムってどうよ?」「やった事はたいした内容じゃない。だけど図書館に迷惑をかけたね」「警察もさ、この内容で逮捕・拘留20日はやりすぎじゃね?」という。不幸な偶然が重なったというか。 #librahack
残りを読む(2500)

コメント

椎路ちひろ @ChihiroShiiji 2010-07-13 16:13:00
7月12日18時16分05秒 以降を追加。
椎路ちひろ @ChihiroShiiji 2010-07-13 17:05:33
最新から2010-07-09 10:25:19までさかのぼって追加
椎路ちひろ @ChihiroShiiji 2010-07-13 17:54:35
2010-07-09 09:16:32までさかのぼって追加
椎路ちひろ @ChihiroShiiji 2010-07-13 18:09:19
最新から2010-07-09 07:46:19まで遡ってまとめた。@Sikushima氏関連の炎上ゾーンで時間当たりのTweet数が異常に多い…。
椎路ちひろ @ChihiroShiiji 2010-07-13 18:23:53
2010-07-09 06:20:35まで遡って追加。
椎路ちひろ @ChihiroShiiji 2010-07-13 18:58:39
2010-07-08 14:40:14 まで遡って追加
椎路ちひろ @ChihiroShiiji 2010-07-13 19:16:53
2010-07-08 以前が検索で取得できないなぁ。取りあえず最新一件追加と重複一件削除。
椎路ちひろ @ChihiroShiiji 2010-07-13 19:26:28
togetterまとめで岡崎中央図書館の件( #librahack )の「24日以降分」 更新。7/814時~最新までを追加。
椎路ちひろ @ChihiroShiiji 2010-07-14 09:59:45
2010-07-14 09:44:31まで新規Tweetを追加。
椎路ちひろ @ChihiroShiiji 2010-07-14 10:06:25
…岡崎図書館の件、今日の分を集め終わったら次のリストを作らないと、すでに編集に困るほど長い。日付で範囲指定して検索できればなー。
椎路ちひろ @ChihiroShiiji 2010-07-15 02:07:18
14日分まで追加完了。15日以降は別リストに。
椎路ちひろ @ChihiroShiiji 2010-07-15 03:30:15
検索でたどれなくて漏れていた6/27-7/8のTweetを追加。
ログインして広告を非表示にする
ログインして広告を非表示にする