2014年6月12日

【妄想】ある組織での文書公開の流れ

政府関連機関を想定したけど、ある程度以上の規模の組織は、だいたいこんなもんなんじゃない? 実際の手続きを知りたいなら、自分で聞いたらいいと思うよ。内部事情だから教えてくれるか分からないけど。
1
夢乃 @iamdreamers

まだ税金の無駄〜とか説明責任が〜とか言ってるのね・・・こんなのに拘ったり、こんなものの説明をいちいちやるほうがずっと税金の無駄遣いだよ。 >tgetter.com/li/678240

2014-06-12 18:02:30
夢乃 @iamdreamers

政府内での文書の作成からWeb公開までを想像してみようか。実際どうなっているか知らないけど。知ったところでどうしようもないので、あえて聞いて確認する気はない。知りたい人は自分で問い合わせるなりしてね。

2014-06-12 18:03:01
夢乃 @iamdreamers

公開する文書は、多分フォーマットがPDF形式に決められているんじゃないかと思う。文書の種類によって違っているかもしれない。これが一番使い勝手がいいと思うし。(参照する側の使い勝手ね)

2014-06-12 18:03:26
夢乃 @iamdreamers

まず、文書の作成担当がWordなりPowerPointなりで元の文書を作成する。

2014-06-12 18:03:52
夢乃 @iamdreamers

この文書を、上司が承認する。内容のチェックとか誤字がないか、とか。誤字は、Wordとかのスペルチェック機能の結果を出させて、それを見るだけかもしれない。

2014-06-12 18:04:16
夢乃 @iamdreamers

こうして出来上がった文書を、変換ツールを使ってPDFに変換する。おそらく、変換専用のPCとか用意してあって、ボタン一発で変換できるんじゃなかろうか。変換時の設定ミスとかを避けるために。

2014-06-12 18:04:40
夢乃 @iamdreamers

ここで、再度文書の確認。公開するのは元文書でなく変換したら文書なんだから、最終チェックは必要だね。もしかしたら、変換ツールを信用して、チェックを省いているかもしれないけど。

2014-06-12 18:05:18
夢乃 @iamdreamers

こうして、公開して問題なし、と確認された文書を、文書担当はWeb公開準備用の共用サーバに保存して、公開するようにWeb担当に連絡する。ここで、担当者が変わるわけ。

2014-06-12 18:06:04
夢乃 @iamdreamers

Web担当者は、インデックスジェネレーターを使って公開するページ用のインデックスページを作成する。共用サーバに保存されたドキュメントからタイトル部分を読み取り、HTMLを自動生成するわけね。文書がPDFなら、ここでOCRによる読み取りを行う。

2014-06-12 18:06:32
夢乃 @iamdreamers

で、確認が入る。インデックス文字列が変なこと(文字化けとか)になってないか、とか、インデックスと文書のタイトルが合っているか、とか、きちんとリンクが貼られているか、とか。

2014-06-12 18:07:31
夢乃 @iamdreamers

確認が済んだら、ここでも上長に承認してもらって、共用サーバから公開サーバへと追加された文書ファイルや更新されたインデックスページをコピーする、と。これで公開される。

2014-06-12 18:08:05
夢乃 @iamdreamers

と、こんな感じでシステム化されているんじゃないかなぁ。インデックスの文字が、漢字とカタカナが間違っていないか、とか、PDFをOCRにかけたとき誤認識しないか、なんてチェックをやるのは無駄だと思うなぁ。人間が見て確認できればいいんだもの。

2014-06-12 18:09:24
夢乃 @iamdreamers

これが、どっかの企業のCM用文書だったりしたら、検索エンジンにかかりやすいように工夫する、とかやるかもしれないけど、政府関係機関の公開資料でそこまでやって欲しいとは思わないなぁ。税金の無駄だもの。

2014-06-12 18:10:13
夢乃 @iamdreamers

インデックス作成を元文書でやればいい、と思うかもしれないけど、それはやめた方がいいと思うなぁ。文書担当からWeb担当に処理が移る時に渡す文書は必要最小限の方がミスが少ないし、ミスってやり直しになったらそれこそ税金の無駄遣い。

2014-06-12 18:11:54
夢乃 @iamdreamers

文書担当は各部署にいるだろうけど、Web担当はそれよりは集約されているだろうから、文書担当がインデックスページまで作ればいい、ってのも却下。纏められるところは纏めた方が効率がいい。

2014-06-12 18:12:23
夢乃 @iamdreamers

それに、カタカナと漢字を間違ったとして、誰が困る?少なくとも、「検索逃れだ〜」とか「情報隠蔽だ〜」と騒いでいる人の中には困っている人はいないんじゃないかな。(困っている人がいたらごめんなさい)

2014-06-12 18:13:17
夢乃 @iamdreamers

というわけで、「原子力」(げんしりょく)が「原子カ」(げんしか)になったのはタダの結果論であって、特段の意味はないと思うよ。

2014-06-12 18:14:09
夢乃 @iamdreamers

あと、最初に言ったようにこの処理の流れは私の想像だから、実際にこの通りかどうかは知らないよ。(←無責任(^^))

2014-06-12 18:14:46

関連まとめ

まとめ 「"原子力(りょく)"ではなく"原子カ(か)"で検索すると出てくるpdf資料が「検索避けの隠蔽工作か!?」と一部で話題。 最初のリンクの誤字は誤読み取り資料からのコピペですかね。 44844 pv 735 23 users 377
まとめ 原子カ(カタカナのカ)で検索して驚いた しだいに問題点と原因が分かってきました。コメントをする人は書き込む前に、この解説文も含めて最後まで読んでください。まとめでは特に最後の6個が大事です。 パソコンを使ってワードやパワーポイントで作った資料をPFDに変換する時には、編集だけを不可にして、文字コピーを可にしたPDFデータにすればいいのに、日本政府と電力会社が公開しているPDFは意図的に文字コピー不可にしていることが原因です。 文字コピー不可のPDFは、画像データのようになってしまい、Googleが文字を抽出できないのでOCR処理で文字を認識するため、インデックス抽出で文字化けが起きます。特に原子力関係の情報は国民への周知のための重要な情報公開であり、しかも政府と電力会社は一般の会社や個人サイトとは違うのだからパソコンで作成した資料をPDFに変.. 29895 pv 632 167 users 296
まとめ なぜストロンチウムはス卜口ンチウムになったのか 「原子力」("力"は漢字)が「原子カ」("カ"はカタカナ)に、ストロンチウム("トロ"はカタカナ)が、ス卜口ンチウム("卜"は漢字の"ボク"、"口"は漢字の"クチ")になってるPDFがたくさん発見された。それはなぜそうなったのか。および改善するには? 13671 pv 98 15 users 12
まとめ 検索ワードが「原子カ」(げんしか)だからといって、検索逃れや情報隠蔽などといった批判は、見当違いも甚だしい 別に検索サイトから検索できるようにする義務なんてないんだから。 1365 pv 15 1 user 1

コメント

珍獣先輩 @you_gou 2014年6月14日
もっと余裕の無いところだと担当者がwordまたはexcelで作成→上司がチェック→「よし、PDFにして広報担当部署に渡せ」→wordかexcelでPDFに出力し広報担当部署に社内メールで投げる→広報担当が最低限の校正と見てくれだけチェック→そのまま自社HPに掲載という流れ。どことは申しませんが前身が親方日の丸と揶揄されていたところです。
0