オープンデータ☆5段階を誰がどこまで昇るのか

三重大・奥村先生@h_okumuraのご要望により作成いたしました。 “5つ星オープンデータ” http://t.co/1oXRKXcI
8226view 6コメント
28

ちょっと宣伝・・・

ただの |ωΦ)ฅです @emacat_bot
【市民測定ネット】みんなのデータサイト、★ロゴ・キャラクター募集 !★ 全国の放射能測定室をネットワーク化することによって、測定技術の向上や精度を維持して、行政のデータでは挙がってこない食材の測定や、全国の汚染度の把握を目指すものです。 http://t.co/I7RGW5Wi

ここから本題です!

楠 正憲 @masanork
ODFやOOXMLはXMLに入るんだろうか?それともExcelとかって扱いになるのかな / “5つ星オープンデータ” http://t.co/1oXRKXcI
楠 正憲 @masanork
ExcelよりCSVやXMLの方が嬉しいと貶す人々は何を使ってデータを加工してるんだろう?ピポットテーブルとかデータが欠落して困りそうなものだが。真っ当なOOXMLはCSVはもとより生XMLよりも便利だぞ / “オープンデータは「…” http://t.co/1GoMhAJ7
楠 正憲 @masanork
Tim-Berners Leeが懲りずにSemantic Webを推奨してるのは学者として実に誠実な態度だと尊敬するが、XHTMLが死んでHTML5が生き残りSSL証明書の偽造をGoogleが発見する時代に正義は勝つのだろうか。だいたいRDFってみんなどう読み書きしてるんだろう?
楠 正憲 @masanork
だいたいOpenなData Formatが大事だからと大騒ぎしてJTC1 SC34でOOXMLの標準化をしたんじゃなかったのか?5☆データでLevel 4やらLevel 5を目指すのは大いに結構だがRDFって利用者が容易に更新可能なの?Semantic Webの二の舞になりそうな
楠 正憲 @masanork
いいたいのはこういうことだ。適切に入力されたXLSXは五つ星の要件を満たしRDFよりずっと機械も人間も扱い易い。リアルタイムにデータを流すならRestfulにJSONでやった方が早いしXMLなんて冗長だ。世の中「銀の弾丸」はないしSemantic Webと同じ轍は避けるべき
Haruhiko Okumura @h_okumura
5つ星オープンデータ http://t.co/kRPaDUoo わかりやすい。1★CC0で公開。2★PDFじゃなくExcelで。3★ExcelじゃなくCSVで。←ここまでで当面は十分。4★以上は難易度高い
楠 正憲 @masanork
イントラ上でExcelとSharepointとのODataによる連携とか利用者に最も分かりやすいLinked Dataを実現してるのに普通のExcelユーザーはよく管理されたODataプロバイダーに接続する機会がないしOffice WebAppとかもっと頑張った方が良さそう
楠 正憲 @masanork
鳴かず飛ばずだったRDFがRSSで一旦は復活したけど、その後ATOMが出てきたりRSS 0.91からRDFを捨てたのって結局のところ普通の設計者は自己記述的な形式美に実装上の価値を見出せなかったのではないか?RDFを超簡単かつ自在に扱える処理系って出たのかな
楠 正憲 @masanork
もちろんWeb上にデータを置いたところガラガラっとボットでアクセスして手元に溜め込みゴリゴリって分析する使途であればディープリンクの先にあるExcelより公開されたURLを持つRDFがいい。ところがこれも地理情報とか扱い始めると同期と世代管理をどうするか課題
Tomoharu Sato @higetomo
@masanork たぶん、オープンデータ提供前に行政から試みで公開された統計データが、ほとんどExcelだけだったらしい。それに対して統計処理できる素養をお持ちの方々から、センスがないとか云々言われて、少し迷走しただけではないでしょうか。
楠 正憲 @masanork
データカタログはCKANであれZopeとか他のCMSであれ構わないんだけど、日々更新されるデータで使う場合って同期や世代管理をサポートしてるんだっけ?リンクしてるんだから持ち主とかの単位でXMLファイルにしたのをgithubで公開してリンクを貼ればいいのかな
楠 正憲 @masanork
@higetomo 実際のところ世の中でSPSSとか扱える学者とVBAとか扱える事務派遣のおねーさんとかCOMを操れるWindowsプログラマーとの間で知識が分断してて簡単にOffice文書のデータ構造にアクセスできることが知られずOOXML仕様書8000ページも読めんわ的な
楠 正憲 @masanork
うわーOpenData METIで公開されるExcelってOOXMLではなくバイナリフォーマットなんだな。前職でOSS政策に振り回された身としては、何でODFなりOOXMLを使わないんだろう?あんだけオープンなフォーマットを旗振りしてたのに!と思わなくもない
Haruhiko Okumura @h_okumura
何でCSVを… RT @masanork: うわーOpenData METIで公開されるExcelってOOXMLではなくバイナリフォーマットなんだな。前職でOSS政策に振り回された身としては、何でODFなりOOXMLを使わないんだろう?あんだけオープンなフォーマットを旗振りして…
楠 正憲 @masanork
@h_okumura 震災の際に変換いただいた放射線量データなんかは簡単な2次元配列だからCSVで出すのが正解ですが、Excelを使ってる事務官が単にファイルをCSVで保存すると悲しいことが起こるしデータラベルとかn次元のデータ構造はXLSXの方が残しやすい
楠 正憲 @masanork
10年前Microsoftに入って最初にやったデモがServices for UNIX上で動く潮の満ち引き計算の結果をIISでWebサービスAPIに吐き出し、Officeのアドオンからそれを呼び出してグラフ化する仕事だったなぁと 遠い目
楠 正憲 @masanork
きっとExcelを貶してCSVやXMLこそオープンといってる先生方は大学事務や役所のExcelテンプレ罫線帳票を泣きながら埋めることはあってもデータソースの呼び出しとかピポットテーブルとかVBAとかWSHからCOMを叩くといった面白い遊びはしてないような気が
楠 正憲 @masanork
まだ若かりし頃に銀行SI案件で泣きながら電子請求書のパーサーをSAXで実装した苦い思い出があるのでXMLと聞くと身構えてしまうのだが、昔と違って最近はパーサーも賢くなって処理系から透過的に扱いやすくなったし、でもRDFってベタなXMLよりもまどろっこしい印象
楠 正憲 @masanork
@taitoku 方眼紙的なのが必要な際はVisioを使ってましたね、前職では。そういえばExcel for Mac 2013のテンプレートで方眼紙が最初に出てきて非常に驚いたんですが、あれが日本語版だけか英語版にもあるのか超気になってます
marchellino @marchellino_y
@masanork OfficeをCOM経由で利用されてる方が少ないのは、Adobe CSの自動化作戦をたくさん紹介されている古籏一浩さんのような方がいらっしゃらないからかも。。です。 http://t.co/67JklCfE
楠 正憲 @masanork
結局のところExcelがいろいろ間違った使われ方をされるのはVisiCalc以来の惰性だし、計算機上の変数を画面上の表に模したUXが社会から受け入れられて30年以上経っても超えるUXが現れない訳だ。そこで正しく表を書ける人のリテラシーで正しく機械判読可能データを入力できるのかな?
楠 正憲 @masanork
RDFとかURIとかXMLスキーマとかDublin Coreやら文字のエンコーディングとか全く理解できない普通の人々が表であればデータをつくれるってすごいことだと思うんだよね。そこに構造やメタデータを与えて空白とか無駄を省くってのは道具の役割にしないと回らぬ
残りを読む(37)

コメント

ピロリU @PiroriU 2013年2月6日
VBAとかWSHとかって誰得(^q^)
MASUDA Kooiti @masuda_ko_1 2013年2月6日
「Exce形式l」と書いてしまったのは「Excel形式」の単なる書きまちがいです。失礼しました。けっして、人が読めば意味の推測がつくが機械可読でない例をわざわざ作ったわけではありません。
Tsuyoshi CHO @tsuyoshi_cho 2013年2月7日
複数用意がいいかな、とっかかりやすいとかいじりやすいという意味でOOXMLとかODFなんかもあってもいいかもなと。
MASUDA Kooiti @masuda_ko_1 2013年2月7日
今の役所の仕事の流れを前提とした短期的な話と、仕事の流れをこう変えることが望ましいという話は分けたほうがよさそうですね。短期的には外注あるいは研究者が整理したものを役所が確認して公認プロダクトにするのが現実的か?
MASUDA Kooiti @masuda_ko_1 2013年2月7日
xlsxのサブセットで、仕様書が30ページぐらいで、それを見て学生が解読プログラムを書けるぐらいのものが定義できて、それに適合しているかどうかチェックするツールがそろっているならば、魅力的なフォーマットだと思います。
ログインして広告を非表示にする
ログインして広告を非表示にする