ウィキデータを始めよう! on Social Hack Day の自分用メモまとめ

ウィキデータを始めよう! on Social Hack Dayに@librarius_Iが参加して自分用に作ったメモ書きのまとめです。
3
Fukuji IMAI @librarius_ust

4時限目はウィキペディアタウンとウィキデータの話題。 #wikidata0525

2019-05-25 15:34:30
Fukuji IMAI @librarius_ust

ウィキメディア財団の説明。ウィキペディアタウンの取り組みと成果の説明。 #wikidata0525

2019-05-25 15:38:51
Fukuji IMAI @librarius_ust

ウィキペディア街道の取り組み。旧街道沿いの名所旧跡などの歴史・文化情報をウィキペディア上に掲載して世界に発信している。ウィキペディアタウンにおいて一緒にウィキデータの編集を行うようになった。 #wikidata0525

2019-05-25 15:40:37
Fukuji IMAI @librarius_ust

infoboxに書き込むとともにwikidataをつくる作業を進めた。ウィキデータだけを書こうとすると大変であるので,ウィキペディアタウンでウィキペディアの更新とウィキデータの更新を同時に行うことで整備が進むのではないか。 #wikidata0525

2019-05-25 15:42:59
Fukuji IMAI @librarius_ust

ウィキペディアタウンでのウィキデータの入力手順1)項目が存在するか確認,2)なければ新規作成,3)文を入力,4)識別子を入力,5)ウィキペディアの記事へのリンクを入力で進めている。 #wikidata0525

2019-05-25 15:44:50
Fukuji IMAI @librarius_ust

ウィキペディアと違って,ウィキデータはタイトルを変更することができるので,タイトル決定のハードルが低くなる。またラベルも重複が許されている(Q以後の番号で識別)ので,新規記事のハードルが低い。 #wikidata0525

2019-05-25 15:46:49
Fukuji IMAI @librarius_ust

ウィキデータのプロパティは個人が新規につくることが難しいので,既存のものから選び,無いようであればプロパティの提案をする→議論が始まる(英語でやりとり)→合議が取れたら設定されるという流れ。 #wikidata0525

2019-05-25 15:48:54
Fukuji IMAI @librarius_ust

ウィキペディア街道では,あらかじめ使うプロパティを先回りして用意して(スタッフで候補を考えて)おいた。参加者はそれを選び進めていくことが出来てスムーズだった。/情報源の設定はウィキデータの方が面倒である。書籍はFRBRのモデルに従って登録する必要がある。 #wikidata0525

2019-05-25 15:52:05
Fukuji IMAI @librarius_ust

情報源の書籍はFRBRに基づいて書く必要があるため,煩雑になりやすい。これが出典として書籍が広がらない原因ではないか。 #wikidata0525

2019-05-25 15:54:09
Fukuji IMAI @librarius_ust

ウィキペディアは著作物,ウィキデータはCC0というライセンスの違いがある。notablityについての考え方の違いもある。 #wikidata0525

2019-05-25 15:58:40
Fukuji IMAI @librarius_ust

5時間目「SPARQLとWDQS」。ザックリと説明する。構造化データをどう使うか。5つぐらいの方法がある。その中でSPARQLエンドポイントを説明する。APIの口。プログラムから使うときに指定する。 #wikidata0525

2019-05-25 16:18:37
Fukuji IMAI @librarius_ust

WQS=Wikidata Query Service query.wikidata.org クエリ・ヘルパーをいじるだけで既存クエリの応用が可能となる。 #wikidata0525

2019-05-25 16:20:12
Fukuji IMAI @librarius_ust

WQSのページにはサンプルが充実している。SPARQLをwikidataとして独自拡張してラベル検索拡張,位置情報検索拡張,コメントでデフォルトのView指定をしているなどの拡張が行われている。 #wikidata0525

2019-05-25 16:21:59
Fukuji IMAI @librarius_ust

SPARQLはSQLと似ているが,WHERE文以降がグラフデータの検索式になっているので,SQLと違うので難しく感じるかも知れない。また普通にデータを取ってくると100言語とかを集めてしまうので,優先順位を決めるラベルの拡張が行われていたりする。 #wikidata0525

2019-05-25 16:25:54
Fukuji IMAI @librarius_ust

実際のSPARQL記述例。/主語が変数。分類について上下関係があり,湖だけでなく,下位の湖(火山湖)も取ってこれるようにするために,正規表現ですべてマッチさせつつ,最後が湖の概念で終わるような検索をしている。 #wikidata0525

2019-05-25 16:30:47
Fukuji IMAI @librarius_ust

SPARQLのコードの例続き/「?」が変数,OPTIONALはもしあったらという条件になる。 #wikidata0525

2019-05-25 16:31:58
Fukuji IMAI @librarius_ust

リンクトデータ・インターフェースで使う場合は,prefixで指定するディレクトリ名がウェブブラウザで見るときの/wiki/ではなく,/entity/となるので,注意が必要。 #wikidata0525

2019-05-25 16:36:18
Fukuji IMAI @librarius_ust

WDQSを使う演習。例が充実しているので,見て欲しい。 #wikidata0525

2019-05-25 16:39:20
Fukuji IMAI @librarius_ust

6時限目「応用事例紹介」。例:ウィキデータで法人番号を振っておくと,wikipediaのinfoboxで自動的に表示される。 #wikidata0525

2019-05-25 17:13:14
Fukuji IMAI @librarius_ust

ビートルズのウィキペディアの記事例:典拠管理に使える。normdatenのテンプレート。twitterのIDなど事実の情報はどんどん登録しておけば,テンプレートで使用できるようになってくる。 #wikidata0525

2019-05-25 17:15:28
Fukuji IMAI @librarius_ust

Open Street Mapとの連携。"Code for 選挙"の例。Library of Congressはwikidataに登録してマッシュアップする事例をつくっている。 #wikidata0525

2019-05-25 17:20:22
Fukuji IMAI @librarius_ust

"Missing Date of Death"の取り組み。Wikipediaで掲載されていても,言語ごとに没年月日が異なるなどの場合にその矛盾を表示して調査しやすくしているプロジェクト。 #wikidata0525

2019-05-25 17:23:11
Fukuji IMAI @librarius_ust

scholiaの学術情報データベース。研究者や論文の情報をwikidataに登録しようとするプロジェクト。 #wikidata0525

2019-05-25 17:24:01
Fukuji IMAI @librarius_ust

質疑応答:ウィキデータを一般の人に入れてもらうモチベーションとは? /分野によるモチベーション,自分が少し入力すれば全体に反映されていくなどはあるのでは。 #wikidata0525

2019-05-25 17:49:00