岡崎市中央図書館向けクローラ作成者が逮捕・不起訴の件(Vol.1 - 6月24日以降分)
- ChihiroShiiji
- 23646
- 0
- 22
- 0
#Librahack 岡崎だけが謎の挙動をするって書いとるねw、同パッケージで。 RT @keikuma: クロールしてる時にサーバが落ちると悲しい。DoSしてる時にサーバが落ちると嬉しい。 - クロールとDoSの違いと業務妨害罪と http://bit.ly/doI6fI #L
2010-06-24 11:23:04#librahack Webサーバの利用規約に「スクリプト等による自動アクセスは、業務の妨げになるため行わないこと」と書いてあって…ってようなことを理解出来ないヒトもwebアクセスするんだよねぇ。
2010-06-24 11:29:45#librahack iPadな方向に便利なデバイスが多くなる程、webアクセスってのは空気の存在みたいなものになり、アクセス制限を増やすようなことがガラパゴス化的でもあるようにも思うワケで…
2010-06-24 11:31:38#librahack 無断リンク禁止教に新宗派、無断クロール禁止教ってのは笑っちゃいけないかもしれないけど笑ったw http://bit.ly/doI6fI リンク禁止には私は反対な考えです。webのナカにいながらwebを否定するような行為だと思うので。
2010-06-24 11:34:12#librahack サイトのサイト側都合のメンドクサイ利用規約を守らせたいなら会員制承認機能でログインしないと使えないように汁、とか思ったりもする。全てに良いとは思わないけどねw
2010-06-24 11:41:13近所が同パッケみたいなんで蔵書検索したけど画像無しモードとか欲しい&その分テキストで一覧件数増やして欲しい、とか思ってみたり… RT @okadabasso: 資料情報>新着図書>各カテゴリー のページはそこそこ早いよ? 600ms程度。 #librahack
2010-06-24 11:42:45@imksoo 故意を判断するにあたって、代替手段の有無も検討せずに違法(キリッと言われても… 敢えて例えるなら、自販機でジュースを何本も買おうとしたら、自販機の故障のせいで出てくるのに時間がかかって、行列になって、それで逮捕ってレベル。 #librahack
2010-06-24 11:44:40ん?…どれのコメントかわかってません(汗 RT @okadabasso: @gutei ならば自力でクロールして作れば… という事に #librahack
2010-06-24 11:49:07#librahack クロール、非クロール(手動w)に関わらず、リンク禁止とかリンクはTopページのみとかチマチマメンドクサイ規約山盛りなサイトはメンドクサイってことでw
2010-06-24 11:50:52認証を通るクローラを作っ(ry RT @gutei: #librahack サイトのサイト側都合のメンドクサイ利用規約を守らせたいなら会員制承認機能でログインしないと使えないように汁、とか思ったりもする。全てに良いとは思わないけどねw
2010-06-24 12:16:34作れますよw、逆のアクセス拒否も簡単だしw、拒否用の設定機能を作りこめばエンドユーザでも拒否管理が楽w RT @mutsuki99: 認証を通るクローラを作っ(ry RT @gutei: #librahack サイトのサイト側都合のメンドクサイ利用規約を守らせたいなら会員制承認
2010-06-24 12:20:10実際のとこ、http だと文字列操作だけできればなんでもできちゃうから、クローラだって正規のブラウザと言えますしね。お行儀の悪さは IE で http 同時接続数変えるのと大差ないし。 RT @gutei: 作れますよw、逆のアクセス... #librahack
2010-06-24 12:26:491秒ウェイトじゃなくて、単位時間あたりのリクエスト数を決めたって書いてありますよ。 RT @keikuma: 「1秒1アクセス」ではないですよ。1アクセス毎に「1秒のウェイト」です。クローラを実装した事がない人は混同するかも知れませんが、... #librahack
2010-06-24 12:27:53サイト運営者側の立場で考えてみると、クローラが PV 数に与える影響は馬鹿に出来ないのかな。あとは著作権問題くらいか。サーバ負荷さえクリアできれば、むしろサービスの利用客としては歓迎できると思うんだけどなぁ。 #librahack
2010-06-24 12:38:30#librahack http上でのお約束を守る限りは相手も返事をしてくれますしw、相手のhttpサーバの後ろにいろいろいるからややこしいw、人や警察も含めwww RT @mutsuki99: 実際のとこ、http だと文字列操作だけできればなんでもできちゃうから、クローラだって
2010-06-24 12:41:34#librahack 著作権問題とは? RT @mutsuki99: サイト運営者側の立場で考えてみると、クローラが PV 数に与える影響は馬鹿に出来ないのかな。あとは著作権問題くらいか。サーバ負荷さえクリアできれば、むしろサービスの利用客としては歓迎できると思うんだけどなぁ。
2010-06-24 12:45:22ちょっと librahack から話題はずれてしまうのですが、Pixiv の様な著作物を扱っているサービスをスクレイピングされる際、個人利用に留めているかの判断をサイト運営者が行えないのではないかと。RT @gutei: #librahack 著作権問題とは?
2010-06-24 12:55:12被害があっても故意がなければ逮捕されないの?じゃぁ業務上過失致死とかは逮捕されないの?あれは故意は関係ないよ?故意の有無は逮捕要件とは違うよ?あまり間違った知識を広めないで欲しい。 #librahack
2010-06-24 12:57:01#librahack 親告罪との違いのことなんじゃ? RT @kassy1069: 被害があっても故意がなければ逮捕されないの?じゃぁ業務上過失致死とかは逮捕されないの?あれは故意は関係ないよ?故意の有無は逮捕要件とは違うよ?あまり間違った知識を広めないで欲しい。 #librah
2010-06-24 13:04:22連続アクセスしているうちに重くなって1000msは越えるんじゃなかろうか。取得して1秒おいて、ってことしていたら、1800秒程度ではおわらなくなってしまう。本当にタイムウェイトおいてたのか疑わしい。まぁその辺も夜試してみる #librahack
2010-06-24 13:45:06うわわ、みんなRTするなって、タレこまれたらほんとに逮捕されるって!!RT:@hamukazu この程度のクロールは僕もやってるので、逮捕されるかも。家族のことは頼んだぞ(誰に?)http://bit.ly/aLULc3 #librahack
2010-06-24 14:11:07つまり僕が何が言いたいかっていうと、「そんなに脆弱な図書館のシステムってどうよ?」「やった事はたいした内容じゃない。だけど図書館に迷惑をかけたね」「警察もさ、この内容で逮捕・拘留20日はやりすぎじゃね?」という。不幸な偶然が重なったというか。 #librahack
2010-06-24 14:13:47