オープンデータ☆5段階を誰がどこまで昇るのか

三重大・奥村先生@h_okumuraのご要望により作成いたしました。 “5つ星オープンデータ” http://t.co/1oXRKXcI
29

ちょっと宣伝・・・

ただの |ωΦ)ฅです🐾 @emacat_bot

【市民測定ネット】みんなのデータサイト、★ロゴ・キャラクター募集 !★ 全国の放射能測定室をネットワーク化することによって、測定技術の向上や精度を維持して、行政のデータでは挙がってこない食材の測定や、全国の汚染度の把握を目指すものです。 http://t.co/I7RGW5Wi

2013-02-04 21:37:05

ここから本題です!

Masanori Kusunoki / 楠 正憲 @masanork

ODFやOOXMLはXMLに入るんだろうか?それともExcelとかって扱いになるのかな / “5つ星オープンデータ” http://t.co/1oXRKXcI

2013-02-05 14:09:57
Masanori Kusunoki / 楠 正憲 @masanork

ExcelよりCSVやXMLの方が嬉しいと貶す人々は何を使ってデータを加工してるんだろう?ピポットテーブルとかデータが欠落して困りそうなものだが。真っ当なOOXMLはCSVはもとより生XMLよりも便利だぞ / “オープンデータは「…” http://t.co/1GoMhAJ7

2013-02-05 15:43:00
Masanori Kusunoki / 楠 正憲 @masanork

Tim-Berners Leeが懲りずにSemantic Webを推奨してるのは学者として実に誠実な態度だと尊敬するが、XHTMLが死んでHTML5が生き残りSSL証明書の偽造をGoogleが発見する時代に正義は勝つのだろうか。だいたいRDFってみんなどう読み書きしてるんだろう?

2013-02-05 15:45:30
Masanori Kusunoki / 楠 正憲 @masanork

だいたいOpenなData Formatが大事だからと大騒ぎしてJTC1 SC34でOOXMLの標準化をしたんじゃなかったのか?5☆データでLevel 4やらLevel 5を目指すのは大いに結構だがRDFって利用者が容易に更新可能なの?Semantic Webの二の舞になりそうな

2013-02-05 15:51:52
Masanori Kusunoki / 楠 正憲 @masanork

いいたいのはこういうことだ。適切に入力されたXLSXは五つ星の要件を満たしRDFよりずっと機械も人間も扱い易い。リアルタイムにデータを流すならRestfulにJSONでやった方が早いしXMLなんて冗長だ。世の中「銀の弾丸」はないしSemantic Webと同じ轍は避けるべき

2013-02-05 15:56:53
Haruhiko Okumura @h_okumura

5つ星オープンデータ http://t.co/kRPaDUoo わかりやすい。1★CC0で公開。2★PDFじゃなくExcelで。3★ExcelじゃなくCSVで。←ここまでで当面は十分。4★以上は難易度高い

2013-02-05 15:59:34
Masanori Kusunoki / 楠 正憲 @masanork

イントラ上でExcelとSharepointとのODataによる連携とか利用者に最も分かりやすいLinked Dataを実現してるのに普通のExcelユーザーはよく管理されたODataプロバイダーに接続する機会がないしOffice WebAppとかもっと頑張った方が良さそう

2013-02-05 16:03:37
Masanori Kusunoki / 楠 正憲 @masanork

鳴かず飛ばずだったRDFがRSSで一旦は復活したけど、その後ATOMが出てきたりRSS 0.91からRDFを捨てたのって結局のところ普通の設計者は自己記述的な形式美に実装上の価値を見出せなかったのではないか?RDFを超簡単かつ自在に扱える処理系って出たのかな

2013-02-05 16:09:06
Masanori Kusunoki / 楠 正憲 @masanork

もちろんWeb上にデータを置いたところガラガラっとボットでアクセスして手元に溜め込みゴリゴリって分析する使途であればディープリンクの先にあるExcelより公開されたURLを持つRDFがいい。ところがこれも地理情報とか扱い始めると同期と世代管理をどうするか課題

2013-02-05 16:13:34
Tomoharu Sato @higetomo

@masanork たぶん、オープンデータ提供前に行政から試みで公開された統計データが、ほとんどExcelだけだったらしい。それに対して統計処理できる素養をお持ちの方々から、センスがないとか云々言われて、少し迷走しただけではないでしょうか。

2013-02-05 16:15:20
Masanori Kusunoki / 楠 正憲 @masanork

データカタログはCKANであれZopeとか他のCMSであれ構わないんだけど、日々更新されるデータで使う場合って同期や世代管理をサポートしてるんだっけ?リンクしてるんだから持ち主とかの単位でXMLファイルにしたのをgithubで公開してリンクを貼ればいいのかな

2013-02-05 16:17:11
Masanori Kusunoki / 楠 正憲 @masanork

@higetomo 実際のところ世の中でSPSSとか扱える学者とVBAとか扱える事務派遣のおねーさんとかCOMを操れるWindowsプログラマーとの間で知識が分断してて簡単にOffice文書のデータ構造にアクセスできることが知られずOOXML仕様書8000ページも読めんわ的な

2013-02-05 16:23:05
Masanori Kusunoki / 楠 正憲 @masanork

うわーOpenData METIで公開されるExcelってOOXMLではなくバイナリフォーマットなんだな。前職でOSS政策に振り回された身としては、何でODFなりOOXMLを使わないんだろう?あんだけオープンなフォーマットを旗振りしてたのに!と思わなくもない

2013-02-05 16:27:54
Haruhiko Okumura @h_okumura

何でCSVを… RT @masanork: うわーOpenData METIで公開されるExcelってOOXMLではなくバイナリフォーマットなんだな。前職でOSS政策に振り回された身としては、何でODFなりOOXMLを使わないんだろう?あんだけオープンなフォーマットを旗振りして…

2013-02-05 16:31:28
Masanori Kusunoki / 楠 正憲 @masanork

@h_okumura 震災の際に変換いただいた放射線量データなんかは簡単な2次元配列だからCSVで出すのが正解ですが、Excelを使ってる事務官が単にファイルをCSVで保存すると悲しいことが起こるしデータラベルとかn次元のデータ構造はXLSXの方が残しやすい

2013-02-05 16:35:32
Masanori Kusunoki / 楠 正憲 @masanork

10年前Microsoftに入って最初にやったデモがServices for UNIX上で動く潮の満ち引き計算の結果をIISでWebサービスAPIに吐き出し、Officeのアドオンからそれを呼び出してグラフ化する仕事だったなぁと 遠い目

2013-02-05 16:39:13
Masanori Kusunoki / 楠 正憲 @masanork

きっとExcelを貶してCSVやXMLこそオープンといってる先生方は大学事務や役所のExcelテンプレ罫線帳票を泣きながら埋めることはあってもデータソースの呼び出しとかピポットテーブルとかVBAとかWSHからCOMを叩くといった面白い遊びはしてないような気が

2013-02-05 16:44:53
Masanori Kusunoki / 楠 正憲 @masanork

まだ若かりし頃に銀行SI案件で泣きながら電子請求書のパーサーをSAXで実装した苦い思い出があるのでXMLと聞くと身構えてしまうのだが、昔と違って最近はパーサーも賢くなって処理系から透過的に扱いやすくなったし、でもRDFってベタなXMLよりもまどろっこしい印象

2013-02-05 16:52:03
Masanori Kusunoki / 楠 正憲 @masanork

@taitoku 方眼紙的なのが必要な際はVisioを使ってましたね、前職では。そういえばExcel for Mac 2013のテンプレートで方眼紙が最初に出てきて非常に驚いたんですが、あれが日本語版だけか英語版にもあるのか超気になってます

2013-02-05 16:58:43
marchellino @marchellino_y

@masanork OfficeをCOM経由で利用されてる方が少ないのは、Adobe CSの自動化作戦をたくさん紹介されている古籏一浩さんのような方がいらっしゃらないからかも。。です。 http://t.co/67JklCfE

2013-02-05 16:59:51
Masanori Kusunoki / 楠 正憲 @masanork

結局のところExcelがいろいろ間違った使われ方をされるのはVisiCalc以来の惰性だし、計算機上の変数を画面上の表に模したUXが社会から受け入れられて30年以上経っても超えるUXが現れない訳だ。そこで正しく表を書ける人のリテラシーで正しく機械判読可能データを入力できるのかな?

2013-02-05 17:10:23
Masanori Kusunoki / 楠 正憲 @masanork

RDFとかURIとかXMLスキーマとかDublin Coreやら文字のエンコーディングとか全く理解できない普通の人々が表であればデータをつくれるってすごいことだと思うんだよね。そこに構造やメタデータを与えて空白とか無駄を省くってのは道具の役割にしないと回らぬ

2013-02-05 17:14:16