Code4Lib JAPANカンファレンス2015 2日目 #c4ljp

12
前へ 1 2 ・・ 20 次へ
Code4Lib JAPAN @code4libjp

つかいかた.まずスキーマ定義.Pythonで書いている. #c4ljp

2015-09-06 10:01:18
heppoko_lib @heppoko_lib

Google Big Queryによるログ、スクレイピング結果等の分析:Pythonでスキーマ定義を組んでいる。Google Big Queryに各図書館のスクレイピングサーバーのログデータを集約している。 #c4ljp

2015-09-06 10:03:19
heppoko_lib @heppoko_lib

ログ集約用スキーマ定義:各図書館の情報、該当資料の所蔵情報、貸出状態、処理成功フラグ等。カーリルがスクレイピングしている全国の図書館の5億2千万冊分のデータが入っている。 #c4ljp

2015-09-06 10:05:50
heppoko_lib @heppoko_lib

多摩ラストワンプロジェクト:2015年1~3月、図書館30館にスクレイピングをかけまくった。具体的にはNDLのOAI-PMHをJSONに変換。当初4ヶ月程度かかった→4週間ぐらいになったらしい。なおNII OpenSearchのJSON変換は1時間程度でできる。 #c4ljp

2015-09-06 10:08:42
swimlibrarian @swimlibrarian

多摩ラストワンプロジェクトの最大の難航ポイントは、NDLの書誌データをOAI-PMHで取ってくるところ。4ヶ月くらいかかった。最近速くなって4週間くらいになったらしい NIIの書誌データはOpensearch経由で1時間くらいで取れる #c4ljp

2015-09-06 10:09:22
heppoko_lib @heppoko_lib

多摩ラストワンプロジェクト:26館分の情報が取れた。各資料の自治体数ごとの冊数集計。 #c4ljp

2015-09-06 10:09:58
heppoko_lib @heppoko_lib

解析の結果、日本の最速OPACは長野県白馬村であることが分かっている。ちなみに山中湖村は実質4位。村がむちゃくちゃ強い! #c4ljp

2015-09-06 10:10:43
heppoko_lib @heppoko_lib

遅ればせながら……吉本さんの発表スライドはこちら→ slides.com/ryuuji_y/deck-… #c4ljp

2015-09-06 10:11:09
heppoko_lib @heppoko_lib

おまけ「絶歌」所蔵図書館の推移。カーリルに所蔵検索殺到。同書のISBNで所蔵確認した日付から、所蔵最速図書館を検出。最速は横須賀市立中央図書館であった。 #c4ljp

2015-09-06 10:12:57
heppoko_lib @heppoko_lib

「火花」と「絶歌」の所蔵図書館数推移もクエリーから集計し、グラフ化した(スライド参照) #c4ljp

2015-09-06 10:13:59
Masao Takaku @tmasao

#c4ljp カーリルで村立図書館OPACの応答が早いというのは、所蔵が少ないからなのか、それとも利用者が少ないからなのか…。

2015-09-06 10:14:25
heppoko_lib @heppoko_lib

個人情報等一切入っていない。あくまでカーリルが各図書館のシステムからスクレイピングしたデータである。皆で「遊べる」。 #c4ljp

2015-09-06 10:15:07
swimlibrarian @swimlibrarian

日本で最速のOPACは長野県白馬村。山中湖情報創造館は4位。村が強い。 (システム調達の時には仕様書に「白馬村並みに」とか書いたらww) 都道府県立図書館OPACの平均回答時間は17秒。 #c4ljp

2015-09-06 10:16:03
Code4Lib JAPAN @code4libjp

「ウィキペディアを介してまちと図書館をつなぐ試み『ウィキペディア・タウン』」(小林巌生) #c4ljp

2015-09-06 10:16:29
heppoko_lib @heppoko_lib

会場質疑。 質問:joinなどは使えるのか 吉本さん:サブクエリーが使える。 質問:集計した元データに対して課金されているのか? 吉本さん:そのとおり。 #c4ljp

2015-09-06 10:16:34
heppoko_lib @heppoko_lib

プレゼンテーション2件目:「ウィキペディアを介してまちと図書館をつなぐ試み『ウィキペディア・タウン』」(小林巌生) #c4ljp

2015-09-06 10:16:55
Code4Lib JAPAN @code4libjp

(Mac接続時はリフレッシュレートを 60HMzにするとよいようです) #c4ljp

2015-09-06 10:18:19
swimlibrarian @swimlibrarian

その他、ある本の所蔵率変化など、ログデータを追うと分析できる。非常に安い料金で。 #c4ljp

2015-09-06 10:18:29
heppoko_lib @heppoko_lib

小林厳生さんは昨日の基調講演スピーカーの小林龍生さんのご子息です。 #c4ljp

2015-09-06 10:18:34
Kiyonori Nagasaki @KiyonoriNagasak

マックのノートをプロジェクトに接続したら表示が上下にずれていた。そこで会場で数人が「リフレッシュレート」とつぶやき、無事に正常接続された。「リフレッシュレート」を覚えておくのは重要なのかも? #c4ljp

2015-09-06 10:19:16
heppoko_lib @heppoko_lib

小林さん( @iwao ):最近は主にオープンデータへの取り組みに携わっている。 #c4ljp

2015-09-06 10:19:28
Code4Lib JAPAN @code4libjp

wikipedia townとは?英モンマス発祥.観光施策の一種と考えている.世界初のウィキペディアタウン. #c4ljp

2015-09-06 10:20:24
swimlibrarian @swimlibrarian

#c4ljp データサンプルをwikiにあげておいた。遊べるデータなのでいじってもらえたら。 wiki.code4lib.jp/wiki/C4ljp2015… (「図書館の大規模データ処理に「Google BigQuery」を使ってみよう」(吉本 龍司))

2015-09-06 10:20:41
heppoko_lib @heppoko_lib

Wikipediaタウンとは?:英国モンマス発祥。ガーディアン紙にWikipediaタウンの記事掲載。モンマスでは街ぐるみで、博物館等文化機関のスタッフ等が関与して、街のあらゆる場所に街のWikipediaページのQRコードを掲示するなどの活動を行った。 #c4ljp

2015-09-06 10:21:01
前へ 1 2 ・・ 20 次へ