OPDSのメタデータにヨミを入れるためにはどうすべきか の議論のまとめ

このまとめから、標記の議論に関する部分だけをぬきだしました ここ数日のOPDSに関するTweet http://togetter.com/li/261888 続きを読む
opds metadata
2153view 0コメント
2
Ryoji @ryojin3
@kzakza @lost_and_found OPSDってメタデータのカナ表記ができないと聞いたことがあるのですが、解決済みなんでしょうか。スキーマという意味では近刊のONIXの他に雑誌のPRISM(IDEAlliance、IDPFとリエゾン)もありますね。
ろす@湯豆腐 @lost_and_found
@ryojin3 当然読みのためのデフォルト要素はありませんがXMLなので拡張可能というあたりはEPUBと同じですね。 @kzakza
kazuhiro ando(かざかざ) @kzakza
@lost_and_found @ryojin3 ヨミをいれるならば、DC-NDLやONIX日本仕様などの語彙を利用して拡張する必要があります(ONIX日本仕様が拡張に使えるかわかりませが・・・。名前空間ない?)。OPDSで入力できるメタ項目ってかなり簡易なんですよね。
kazuhiro ando(かざかざ) @kzakza
@lost_and_found @ryojin3 台湾では拡張していないのか、気になるところです。どう拡張しているのか、そういう情報は今のところ、見つかってません。
Ryoji @ryojin3
@kzakza @lost_and_found DC-NDLの部分利用はいいですね。ONIX日本仕様、ざっと見てみたら名前空間指定してないですね。フローは国際準拠だと聞いたことがあります。
村田 真 @muratamakoto
@kzakza EDItEURのONIXは、HTMLのrubyを使って読み情報を入れるという方針で出来ています。ただし、JPO 近刊情報センターのONIX http://t.co/u4KY792g は日本独自拡張です。
村田 真 @muratamakoto
@kzakza @lost_and_found @ryojin3 OPDSは、Atomがベースで、あちらにも読みは入ってませんよね?私が気付いていないといけなかったのかも。やるのなら、AtomごとIETFで直す。
kazuhiro ando(かざかざ) @kzakza
@muratamakoto 本家のONIXでヨミをいれることを想定しているのですね。それは存じませんでした。ruby要素使うのですのですか。ちょっと見てみます。
村田 真 @muratamakoto
オフィス文書フォーマットOOXML(OPC)では、「読み」を入れる方法はない。オフィス文書フォーマットODFでは、「読み」を入れる方法は規格にはなく、実装依存の方法が用いられている。
kazuhiro ando(かざかざ) @kzakza
@muratamakoto @lost_and_found @ryojin3 OPDSにはヨミについて特に規定してませんが、あの仕様の書き方だと必須項目等々とAtomとDCTERMSの項目がバッティングする場合はAtomを優先せよとかいてある程度です。(続く)
kazuhiro ando(かざかざ) @kzakza
@muratamakoto @lost_and_found @ryojin3 (続き)OPDSに限って言えば、OPDSのメタ項目がAtomに縛られているわけではないと思います。
kazuhiro ando(かざかざ) @kzakza
メタ項目にHTMLのruby要素を使うのか。どんな感じだろう。
村田 真 @muratamakoto
@kzakza @lost_and_found @ryojin3 縛られてはいないかも知れませんが、Atomで決めているタイトル等の読みだけをOPDSで決めるのはやはり変ですね。どうAtomを直すべきか簡単に合意はとれますか?ONIXと同じようにrubyでやるのならすでに可能?
ろす@湯豆腐 @lost_and_found
@muratamakoto Atomは拡張可能なシンプルさが美点だとも思いますし、そこまで切り込むと時間が掛かりそうな気がします。読み情報が欲しいと考える一握りの人たちの間で拡張方法を共通化できれば十分ではないでしょうか。 @kzakza @ryojin3
ろす@湯豆腐 @lost_and_found
@muratamakoto OPDSは配信が主眼であり、モバイルでも受信できる軽さも重要です(詳細に記述することもできますが)。ONIXのようにメタデータのマスターとして活用する類のものではないと思います。@kzakza @ryojin3
村田 真 @muratamakoto
@lost_and_found @kzakza @ryojin3 そう、atom+opdsはonixより遥かに軽いでしようね。
Ryoji @ryojin3
@lost_and_found 概ね同意ですが、配信にはタイトル・著者名・出版社名、及びこれらの読みは最低限必要かと思います。その意味でAtomを見直すのもありかと。現状の仕様で対応可能なら問題ありません。@muratamakoto @kzakza
ろす@湯豆腐 @lost_and_found
@ryojin3 タイトルを読みで検索してヒットした本をダウンロードするシナリオを考えてみます。ユーザが検索ワードを入力すると、アグリゲータがOpenSeach記述文書に従って検索エンジンに問い合わせ、結果をOPDSで受信します。 @muratamakoto @kzakza
ろす@湯豆腐 @lost_and_found
@ryojin3 この場合、検索エンジンのDBに読み情報があり、該当する出版物を探せることは重要ですが、出力されるOPDSに読みが含まれていようがいまいがどちらでもよいのではないですか。 @muratamakoto @kzakza
村田 真 @muratamakoto
@lost_and_found @kzakza @ryojin3 結局、日本で使う実装を作る人達に受け入れて貰おうとすると、どうせ手間はかかりますよ。なお、中国、香港、台湾は、一つの漢字に読みが一つしかないらしく、日本のようにこの件にこだわってはいません。
村田 真 @muratamakoto
文書のメタデータの話をしているので29500-1ではなく29500-2です。 RT @_sww_: @muratamakoto ISO/IEC 29500-1 18.4.6 rph は「読み」ではないのですか? 文脈を私が間違っているかも知れませんが。 *Tw*
村田 真 @muratamakoto
@lost_and_found そういうシナリオはもちろんあるでしょうが、OPDSで出されたカタログを集積し、その中から探すという検索はどうします?
ろす@湯豆腐 @lost_and_found
@muratamakoto おっしゃるとおりクローラを介してのカタログ再構築には対応できませんね。
Ryoji @ryojin3
@lost_and_found 昨年台湾で聞いた学校等の機関をつないだ話を国内B2Bに置き換え、版元や取次、書店をつなぐのに最低限必要なコンテンツ管理のためのデータセットという観点で考えていました。ユースケースはいろいろありそうですね。@muratamakoto @kzakza
村田 真 @muratamakoto
@lost_and_found おそらく解は三通りしかないです。まず、読み用の要素を別に一セット用意するというやつ(DC-NDLもこれのはず)。もう二つは、HTML rubyを使うのとUnicodeのrubyを使う。前者は、過去の経験だと国際へ持っていくと嫌われまくり。
残りを読む(40)

コメント

ログインして広告を非表示にする
ログインして広告を非表示にする