GBIFワークショップ「生物多様性情報の標準化と利便性」ツイートまとめ
GBIFワークショップはじまります。ハッシュタグいるかな? (@ 国立科学博物館 in 台東区, 東京都) swarmapp.com/c/5Gy7iPh65iT
2017-12-09 13:00:34今日はこれ。 GBIFワークショップ 「生物多様性情報の標準化と利便性」 gbif.jp/v2/sp/activiti… pic.twitter.com/3VujdZ51KR
2017-12-09 13:01:552017年 GBIFワークショップ 21世紀の生物多様性研究(通算第12回)「生物多様性情報の標準化と利便性」 gbif.jp/v2/activities/…
2017-12-09 13:02:51趣旨説明。世界の生物多様性情報を集約する国際組織「地球規模生物多様性情報機構(GBIF)」と、日本の活動主体であるGBIF日本ノード(JBIF)、日本の自然史系博物館の標本情報などを集約する「サイエンスミュージアムネット(S-Net)」の紹介。 #JBIF
2017-12-09 13:11:50ダーウィンコア。「いつ、どこに、どんな生物がいたか」を記述する。採集年月日、採集者などの項目を持っている。項目名をそろえることでデータを組み合わせて解析しやすい。検索もしやすい。 #JBIF
2017-12-09 13:18:30大野・水沼「ダーウィンコア入門」生物多様性情報における基本項目名の標準であるダーウィン・コアの紹介。Darwin Coreの定義はこちら rs.tdwg.org/dwc/ #JBIF
2017-12-09 13:20:23標本ラベルに書かれた情報をダーウィンコアでかいてみる。標本ラベルには「いつ、どこに、どんな生物が」という情報が書かれている。標本番号、学名、性別、和名(これはダーウィンコアにはない)、採集場所、採集年月日、採集者が項目にある。 #jbif
2017-12-09 13:21:12にた項目をまとめてクラスとしてまとめている。レコード管理クラス、オカレンスクラス(どんなものが、どのように記録されたか。個体数や標本のID,標本タイプなど) #JBIF
2017-12-09 13:24:09イベントクラス(調査地ID,イベント(採集)発生日時、採集方法)、位置クラス(標本採集地、観察地の位置。国名や緯度経度、標高など) #jbif
2017-12-09 13:25:22例えば国名が統制されておらず記述がまちまちの場合、検索性の低下だけでなくデータ数を過小評価してしまうことになる。地名は統制語彙を使用されたい。 #jbif
2017-12-09 13:27:33でもそれだと統制語彙をユーザーが知らないといけないから、システム側でラッパー(上にかぶせるもの)があるとよいなぁ。Americaと入れたら、自動でUSですよね、と候補に出すか直してしまうか。(統制語彙がUSかどうかはここではあくまで例) #JBIF
2017-12-09 13:28:56統制語彙自体の定義はされていませんが、利用が奨励されています。 terms.tdwg.org/wiki/dwc:count… twitter.com/tzhaya/status/…
2017-12-09 13:29:03Darwin coreのスキーマはちゃんとしてるんだけど、GBIF(必ずしもJBIFではなく)の実データは、日本国内の植物標本記録を見る限り、まあ提供館毎にザラザラな印象です。特に採集地(位置情報)関係。#JBIF
2017-12-09 13:30:19ダーウィンコア形式でデータを記述すれば標本ラベルのデータがGBIFに搭載できる!このようにして作成したデータをオカレンスデータ(在データ)という。オカレンスデータをまとめたものがデータセット。データセット自身の情報をメタデータという。 #jbif
2017-12-09 13:31:04ライフサイエンスだと文献検索にPubMedというのを使うが、MeSHという検索用キーワード集があって、Entry Termというこの用語が来たら統制語彙に直しますというのも用意されている #jbif
2017-12-09 13:31:35(「メタデータ」というと図書館の人的には標本に対するラベルデータもメタデータに聞こえるけれど「在データ」とあえて読んで区別しているのは理由があるのでしょうか) #jbif
2017-12-09 13:33:11少なくとも標本のラベルデータは、測定機器で得られた個別のデータと同様に、生データの一つのレコードとみなします。データは、複数の標本情報レコードをまとめた「データセット」の形で管理され、データセットに関する情報を「メタデータ」として管理する、とみなすことが慣例となっています。 twitter.com/tzhaya/status/…
2017-12-09 13:38:20ただし、標本データにも、生データ的な性格の項目、メタデータ的な性格の項目が混在してます。licenseやrightsHolderなど、Dublin Coreから借りている用語もあります。たとえば rs.tdwg.org/dwc/terms/inde… #JBIF
2017-12-09 13:44:14