岡崎の図書館の一件で文殊の知恵?@ついったー

岡崎市立図書館の一件について,それぞれが知っている知識をもちよってグダグダ話しました
20
yuki @yuki_o

@arukakan 図書館のあの話題自己解決した?もしまだなら一から俺の持てる情報で説明するんだけど,そのかわりプログラムのはなしほとんどわからん俺に http://d.hatena.ne.jp/Sikushima/20100621/1277104805 を解説してくれない?w

2010-06-22 18:44:44
yuki @yuki_o

@arukakan もちろん夜の作業になると思う.それでもよかったら….

2010-06-22 18:45:07
さぎにゃんX @arukakan

@yuki_o 夜の作業…ゴクリ(゚д゚) は、おいといて、専門の人から説明してもらえるとありがたいれす。 [たけのこ]

2010-06-22 18:47:24
さぎにゃんX @arukakan

@yuki_o ところでお前見たことない顔やけど誰や。 [たけのこ]

2010-06-22 18:47:49
yuki @yuki_o

@arukakan 俺だよ俺!!(九人目)ツッコミが多すぎてかなしいw  うん,俺も勉強中なのでひょっとしたら間違ったこと言うかもしれないけど,すくなくともきちんと歴史踏まえた話はできるはずー.というわけで,じゃあ夜にでも頼む!開始時間とかは適当でいいよなw

2010-06-22 18:54:03
さぎにゃんX @arukakan

@yuki_o 要素は2つ。 1. HDD読み込みよりメモリからの読み込みの方が速い 2. 検索とインデックス付の問題。1.は分かるだろうから2をまず説明する。 [たけのこ]

2010-06-22 18:59:36
さぎにゃんX @arukakan

@yuki_o 2.は要するに整理の問題で、リストを上からだーっと読んで行って探すっていう安直な事をすると、最悪全部探さないと見つけらんない。(例えば名簿から渡辺さんを探すのに、安藤、井上…と見て行くのはムダ)だから利用しやすい形に予めしておく。 [たけのこ]

2010-06-22 19:01:20
yuki @yuki_o

@arukakan ふむふむ,索引を作っておくのね

2010-06-22 19:02:07
さぎにゃんX @arukakan

@yuki_o 1.及びもうちょっと専門的な理由から、最近ではDBを直接叩かない。サーバ起動時にメモリに読み込む。この時ついでに2.で言ったような形に整理しておく。あのページには、例の図書館ではこの工夫を華麗にスルーしているおよそ考えにくいクソ仕様だと書いてある。 [たけのこ]

2010-06-22 19:04:16
さぎにゃんX @arukakan

@yuki_o で、クソ仕様乙って思った技術者がまともな実装をしようとした。そのためにはデータ抜き出しが必要で、一応負荷をかけないよう気を使いながらDLしたが、想像以上に糞だったから落ちてしまった。そしたら糞実装を棚に上げてサーバ落とされたニダ!って言われた、と。 [たけのこ]

2010-06-22 19:07:02
yuki @yuki_o

@arukakan なるほど,図書館の規模にもよるんだけど,たとえば著者,タイトル,出版社,請求記号(背表紙のあのシールの番号)等々,図書館を回す上で必要なデータ量というのは,それほど現代の技術的には問題ない程度にメモリに展開できる量と考えていいのかな?

2010-06-22 19:07:09
さぎにゃんX @arukakan

@yuki_o このページには800MBって書いてあるけど、それを鵜呑みにすると全部メモリに乗るよ。俺のiMacでも4GBあるし真っ当なサーバならもっと多いはず。ただ予算のついてない図書館で老朽化してるようなサーバだとわからんね。 [たけのこ]

2010-06-22 19:11:16
シュレディンガーのナツさん @natsu_san

当たり屋サーバww RT @arukakan: 例の図書館のサーバ、実装がクソでそもそも激重だったのを容疑者のせいにしたというネタが流れてきた。本当だったら当たり屋みたいなサーバだな怖い。俺もアクセスしたらサーバ落ちるプログラムとか書いてみようかしら。

2010-06-22 19:11:46
さぎにゃんX @arukakan

@yuki_o 図書館の索引って、基本的にテキストデータでしょ?いくら多かろうが所詮テキストなんてたいした事ない。動画なら別だけど最近のマシンならなんとでもなるよ。 [たけのこ]

2010-06-22 19:12:23
シュレディンガーのナツさん @natsu_san

まあ、図書館のDBシステムが糞なのはよくあることこと。そろそろ図情の授業でDBチューニングとか教える時期だろうか…

2010-06-22 19:13:41
yuki @yuki_o

@arukakan なるほど.岡崎市のは比較的新しい,ここ数年にできた図書館なのでサーバの能力としては,メモリに乗るのは間違いなさそうだね.

2010-06-22 19:13:48
yuki @yuki_o

@arukakan うん,基本テキスト.最近は書影(本の画像)をひっぱってくるのもあるけれど,通常の公共図書館だと持ってないので,テキストオンリーだね.カーリルといった話題になったサービスはAmazonから引っ張ってきたりしてるらしい…

2010-06-22 19:14:39
さぎにゃんX @arukakan

@yuki_o 誤解のないように言っとくと、検索するときメモリに乗せるのはファイルパスだけでいいからね。 [たけのこ]

2010-06-22 19:14:39
シュレディンガーのナツさん @natsu_san

古い図書館のシステムとか、入れたはいいけどその後評価できるひとがいなくて予算通せるひともいなくて絶賛放置プレイ。そのあいだに着々とデータは増えてゆき…とかありそうだな。場当たり的にメモリとかHDDとか増やしても載ってるシステムが時代遅れではどうしようもない、的な。

2010-06-22 19:16:14
yuki @yuki_o

@arukakan なるほどなるほど.パスのところは早いメモリで処理しておいて,実際に読みに行く段はHDDをあさってもいい…と.で,あの岡崎の実装は,どいつもこいつもHDDにのってたって解釈でいいのかな?

2010-06-22 19:17:35
シュレディンガーのナツさん @natsu_san

…ん?と思ったら例の図書館って結構新しいの??

2010-06-22 19:19:39
さぎにゃんX @arukakan

@yuki_o それはちょっと実際にシステム見てみないと分からないけど、君の貼ったサイトの人は無整理のデータがHDD上にあるとしか考えられない位遅いと思ってるのは間違いない。 [たけのこ]

2010-06-22 19:19:42
yuki @yuki_o

@natsu_san 新しいよ.平成20年オープンだもの

2010-06-22 19:21:17
yuki @yuki_o

@arukakan ありがとう.今から俺のターンやるよw いいかなー

2010-06-22 19:22:03
yuki @yuki_o

@arukakan まず「図書館の自由」ってなんぞやの話から.まず,この部分は俺は何度か断言するけど,俺が断言するところは俺が勉強中のところだということは押さえておいて(笑) 人間一知半解なほうが断言するからね(笑)

2010-06-22 19:22:44