岡崎市中央図書館向けクローラ作成者が逮捕・不起訴の件(Vol.1 - 6月24日以降分)

「岡崎市中央図書館に1秒間に1回アクセスしたら逮捕されたけど不起訴になった件について」 http://togetter.com/li/30698 上記のリストが長くなったので24日以降分のリストを新規に作りました。 続きを読む
14
ぐて~ @gutei

#Librahack 岡崎だけが謎の挙動をするって書いとるねw、同パッケージで。 RT @keikuma: クロールしてる時にサーバが落ちると悲しい。DoSしてる時にサーバが落ちると嬉しい。 - クロールとDoSの違いと業務妨害罪と http://bit.ly/doI6fI #L

2010-06-24 11:23:04
ぐて~ @gutei

#librahack Webサーバの利用規約に「スクリプト等による自動アクセスは、業務の妨げになるため行わないこと」と書いてあって…ってようなことを理解出来ないヒトもwebアクセスするんだよねぇ。

2010-06-24 11:29:45
ぐて~ @gutei

#librahack iPadな方向に便利なデバイスが多くなる程、webアクセスってのは空気の存在みたいなものになり、アクセス制限を増やすようなことがガラパゴス化的でもあるようにも思うワケで…

2010-06-24 11:31:38
ぐて~ @gutei

#librahack 無断リンク禁止教に新宗派、無断クロール禁止教ってのは笑っちゃいけないかもしれないけど笑ったw http://bit.ly/doI6fI リンク禁止には私は反対な考えです。webのナカにいながらwebを否定するような行為だと思うので。

2010-06-24 11:34:12
okada basso @okadabasso

資料情報>新着図書>各カテゴリー のページはそこそこ早いよ? 600ms程度。 #librahack

2010-06-24 11:37:22
ぐて~ @gutei

#librahack サイトのサイト側都合のメンドクサイ利用規約を守らせたいなら会員制承認機能でログインしないと使えないように汁、とか思ったりもする。全てに良いとは思わないけどねw

2010-06-24 11:41:13
ぐて~ @gutei

近所が同パッケみたいなんで蔵書検索したけど画像無しモードとか欲しい&その分テキストで一覧件数増やして欲しい、とか思ってみたり… RT @okadabasso: 資料情報>新着図書>各カテゴリー のページはそこそこ早いよ? 600ms程度。 #librahack

2010-06-24 11:42:45
KaRaKe aka DevilMeat @krkdm

@imksoo 故意を判断するにあたって、代替手段の有無も検討せずに違法(キリッと言われても… 敢えて例えるなら、自販機でジュースを何本も買おうとしたら、自販機の故障のせいで出てくるのに時間がかかって、行列になって、それで逮捕ってレベル。 #librahack

2010-06-24 11:44:40
okada basso @okadabasso

@gutei ならば自力でクロールして作れば… という事に #librahack

2010-06-24 11:45:33
ぐて~ @gutei

ん?…どれのコメントかわかってません(汗 RT @okadabasso: @gutei ならば自力でクロールして作れば… という事に #librahack

2010-06-24 11:49:07
ぐて~ @gutei

#librahack ちなみ会員承認制な作りにしてもクロール出来ないってことじゃないですw

2010-06-24 11:49:59
ぐて~ @gutei

#librahack クロール、非クロール(手動w)に関わらず、リンク禁止とかリンクはTopページのみとかチマチマメンドクサイ規約山盛りなサイトはメンドクサイってことでw

2010-06-24 11:50:52
睦月@多分 SRE @mutsuki99

認証を通るクローラを作っ(ry RT @gutei: #librahack サイトのサイト側都合のメンドクサイ利用規約を守らせたいなら会員制承認機能でログインしないと使えないように汁、とか思ったりもする。全てに良いとは思わないけどねw

2010-06-24 12:16:34
ぐて~ @gutei

作れますよw、逆のアクセス拒否も簡単だしw、拒否用の設定機能を作りこめばエンドユーザでも拒否管理が楽w RT @mutsuki99: 認証を通るクローラを作っ(ry RT @gutei: #librahack サイトのサイト側都合のメンドクサイ利用規約を守らせたいなら会員制承認

2010-06-24 12:20:10
睦月@多分 SRE @mutsuki99

実際のとこ、http だと文字列操作だけできればなんでもできちゃうから、クローラだって正規のブラウザと言えますしね。お行儀の悪さは IE で http 同時接続数変えるのと大差ないし。 RT @gutei: 作れますよw、逆のアクセス... #librahack

2010-06-24 12:26:49
mzkh @hkzm

1秒ウェイトじゃなくて、単位時間あたりのリクエスト数を決めたって書いてありますよ。 RT @keikuma: 「1秒1アクセス」ではないですよ。1アクセス毎に「1秒のウェイト」です。クローラを実装した事がない人は混同するかも知れませんが、... #librahack

2010-06-24 12:27:53
睦月@多分 SRE @mutsuki99

サイト運営者側の立場で考えてみると、クローラが PV 数に与える影響は馬鹿に出来ないのかな。あとは著作権問題くらいか。サーバ負荷さえクリアできれば、むしろサービスの利用客としては歓迎できると思うんだけどなぁ。 #librahack

2010-06-24 12:38:30
ぐて~ @gutei

#librahack http上でのお約束を守る限りは相手も返事をしてくれますしw、相手のhttpサーバの後ろにいろいろいるからややこしいw、人や警察も含めwww RT @mutsuki99: 実際のとこ、http だと文字列操作だけできればなんでもできちゃうから、クローラだって

2010-06-24 12:41:34
ぐて~ @gutei

#librahack 著作権問題とは? RT @mutsuki99: サイト運営者側の立場で考えてみると、クローラが PV 数に与える影響は馬鹿に出来ないのかな。あとは著作権問題くらいか。サーバ負荷さえクリアできれば、むしろサービスの利用客としては歓迎できると思うんだけどなぁ。

2010-06-24 12:45:22
睦月@多分 SRE @mutsuki99

ちょっと librahack から話題はずれてしまうのですが、Pixiv の様な著作物を扱っているサービスをスクレイピングされる際、個人利用に留めているかの判断をサイト運営者が行えないのではないかと。RT @gutei: #librahack 著作権問題とは?

2010-06-24 12:55:12
J Kassy @kassy1069

被害があっても故意がなければ逮捕されないの?じゃぁ業務上過失致死とかは逮捕されないの?あれは故意は関係ないよ?故意の有無は逮捕要件とは違うよ?あまり間違った知識を広めないで欲しい。 #librahack

2010-06-24 12:57:01
ぐて~ @gutei

#librahack 親告罪との違いのことなんじゃ? RT @kassy1069: 被害があっても故意がなければ逮捕されないの?じゃぁ業務上過失致死とかは逮捕されないの?あれは故意は関係ないよ?故意の有無は逮捕要件とは違うよ?あまり間違った知識を広めないで欲しい。 #librah

2010-06-24 13:04:22
@inudaisho

連続アクセスしているうちに重くなって1000msは越えるんじゃなかろうか。取得して1秒おいて、ってことしていたら、1800秒程度ではおわらなくなってしまう。本当にタイムウェイトおいてたのか疑わしい。まぁその辺も夜試してみる #librahack

2010-06-24 13:45:06
加藤公一(はむかず) @hamukazu

うわわ、みんなRTするなって、タレこまれたらほんとに逮捕されるって!!RT:@hamukazu この程度のクロールは僕もやってるので、逮捕されるかも。家族のことは頼んだぞ(誰に?)http://bit.ly/aLULc3 #librahack

2010-06-24 14:11:07
くちだいき @ky37

つまり僕が何が言いたいかっていうと、「そんなに脆弱な図書館のシステムってどうよ?」「やった事はたいした内容じゃない。だけど図書館に迷惑をかけたね」「警察もさ、この内容で逮捕・拘留20日はやりすぎじゃね?」という。不幸な偶然が重なったというか。 #librahack

2010-06-24 14:13:47
1 ・・ 101 次へ