岡崎市中央図書館向けクローラの件落ち穂拾い

主にこのまとめ作成時点で、blog等にあまりまとめられていない「事実関係」中心に抜粋。枝葉は切り落とす方向で。 ・librahack氏の証言:アクセスの実際と逮捕状況の補足 ・岡崎市中央図書館の証言 ・その他の図書館の証言など ・岡崎サーバの性能&岡崎プログラムの実装検証 続きを読む
16
前へ 1 ・・ 7 8
Hiromitsu Takagi @HiromitsuTakagi

…対応をしてもらった結果ではないだろうか。なにしろ広告塔になってもらっているのだから。 http://www.mdis.co.jp/case/city-okazaki/200908.html @gutei実験から1.5GBを割当れば1000本までいける計算。#librahack

2010-08-01 00:27:08
Hiromitsu Takagi @HiromitsuTakagi

@bakera ページビューかは定かでありませんでした。TosCode指定のリンクもDB検索になるので、それも含めて「検索」と言っている可能性もあり。業者が言っていることをリピートしているだけと推察すれば、logの行数ではないかと推察。Web又はDBの。 #librahack

2010-08-01 00:44:41
Hiromitsu Takagi @HiromitsuTakagi

@gutei 業務系とWeb系でDBが独立のようですが、館内PCがどちらかは不明。仮にそう(館内PCが常時使用)だとすると10〜20本分ですかね。なぜASPセッションでも絞る必要があるのか(DB接続の上限でなく)謎でしたが、館内PC用の確保説ですか。なるほど。#librahack

2010-08-01 00:54:48
Hiromitsu Takagi @HiromitsuTakagi

@gutei つまり、さきほどの推計について「10分に1万6千人がOK」ということですね。再度計算すると結論はこうなります。三菱電機のWebアプリ性能は、一般的なWebアプリ性能の32倍低性能。(1人1訪問で5クリックの想定) #librahack

2010-08-01 02:30:58
Hiromitsu Takagi @HiromitsuTakagi

岡崎で800まで許容セッション数を増やしていたとすると、低性能は4倍程度ということになります(1人1訪問平均5クリック想定)。検索エンジンのロボットが来た際には(全てが新セッションとなるので)その5倍、20倍の低性能という計算になります。 #librahack

2010-08-01 02:48:18
Hiromitsu Takagi @HiromitsuTakagi

@gutei 岡崎ではその時点でセッション数上限のことを知らなかった可能性があるように思います。私が電話で話を聞いたときにはそういう話は出ませんでした。日ごろから類似の不具合が起きていなかったか尋ねたときも起きていないという認識でした。上限が800くらいに… #librahack

2010-08-01 12:09:00
Hiromitsu Takagi @HiromitsuTakagi

…上限が800くらいに増やされていると、他の100設定の図書館(人口規模はほぼ同じ)と違って、尽くされる事態が起きにくくなるためと思われます。しかし、robots.txtはあるので過去には何かあったはず。聞いてみたところ前任者以前のことはわからないとのこと。 #librahack

2010-08-01 12:15:00
Hiromitsu Takagi @HiromitsuTakagi

私の現在の推測。岡崎でも数年前にロボットが来て止まる不具合が起きた。その際に/robots.txtを置き、Oracleのメモリを増やして?セッション数制限を緩和した。こういった対処は日々場当たり的に行われている「調整」で、後任に伝えられることはなかった。… #librahack

2010-08-01 12:23:13
Hiromitsu Takagi @HiromitsuTakagi

…そして2010年3月、その上限を超える事態が起きたが、担当者には初めての事態だったので非番の警察官になんとなく相談した。(その後、愛知県警本部が勝手に刑事事件として立件を進めた。)一方、同じ人口規模の自治体の別の図書館では、… #librahack

2010-08-01 12:27:44
Hiromitsu Takagi @HiromitsuTakagi

…は、3年ほど前から不具合発生。業者は、DB接続のエラーを回避するためASPセッションで100に絞った。現在の担当者も「100に絞った」という業者の説明を認識している。robots.txtはなぜか置かれていないため、現在もときどき同様の不具合が起きるが、… #librahack

2010-08-01 12:32:24
Hiromitsu Takagi @HiromitsuTakagi

…が、サーバ増強を計画して予算要求中なので不具合は我慢。もし岡崎がここと同じ状況であったなら、警察官に相談するという発想には至らなかったかもしれない。サーバ増強を早くするとか、業者に調整でなんとかならないか相談するとか。 #librahack

2010-08-01 12:36:15
Hiromitsu Takagi @HiromitsuTakagi

なぜ自治体ごとに回避策がちぐはぐなのか。地域が異なるため別のSEが対処していて、その調整ノウハウが組織で把握されなかったか、欠陥が原因であることが認識されなかったために各現場に応じた調整で対処すればよいこととされた。あるいは、サーバ増強を自ら選択し… #librahack

2010-08-01 12:47:31
Hiromitsu Takagi @HiromitsuTakagi

…サーバ増強を自ら選択しつつある自治体については、あえて不具合対処を積極的には行わないようサボタージュすることが社の利益につながるとみられているために、対処が異なっているという可能性も考えられる。 #librahack

2010-08-01 12:50:31
Hiromitsu Takagi @HiromitsuTakagi

@aro_take 図書館に聞いた話では遅くて使いにくいそうですし、これまでの推定では不経済で拡張性のないシステムですし、事実として不具合多発なので信頼性もありません。「高度なセキュリティ」は単に暗号化アルゴリズムにMISTYを使っているというだけでしょう。 #librahack

2010-08-01 13:00:46
Hiromitsu Takagi @HiromitsuTakagi

@gutei ハードウェアの増強は全く効果ありません。なぜなら自ら制限を課して低性能に抑えているのだからです。(ただし、Oracleのメモリを増やして?上限を数倍まで引き上げることが可能なことに担当SEが気づいた場合は別です。) #librahack

2010-08-01 13:08:09
Hiromitsu Takagi @HiromitsuTakagi

@aro_take ある図書館に聞いたときには、「セッションを切っている」という表現がありました。担当者は業者の説明をリピートしているだけなので、何のことかと質しても不明でした。自動的な仕掛けになっているようです。しかし復帰まで4、5分かかるとのことでした。 #librahack

2010-08-01 13:11:28
Hiromitsu Takagi @HiromitsuTakagi

@akira_kd 単にアプリが極端に低性能なためです。今日tweetしたように、100セッションに絞っている某図書館では、当該システムは一般Webアプリに比して概ね32倍低性能、特にクローラに対しては160倍低性能という計算。岡崎では同4倍、20倍と推定。 #librahack

2010-08-01 23:25:44
前へ 1 ・・ 7 8