原子カ(カタカナのカ)で検索して驚いた

しだいに問題点と原因が分かってきました。コメントをする人は書き込む前に、この解説文も含めて最後まで読んでください。まとめでは特に最後の6個が大事です。 パソコンを使ってワードやパワーポイントで作った資料をPFDに変換する時には、編集だけを不可にして、文字コピーを可にしたPDFデータにすればいいのに、日本政府と電力会社が公開しているPDFは意図的に文字コピー不可にしていることが原因です。 続きを読む
61
KOIKE Ryûta @PeaceMark51k

ストロンチウム ス卜口ンチウム 後者(国の原子力規制委員会のHP内の会議資料へのリンク)は、「ト」と「ロ」にカタカナではなく、漢字の「卜(ぼく)」と「口(くち)」が用いられている。一体何がしたいのか(普通に考えると検索逃れ) nsr.go.jp/committee/yuus…

2014-06-08 08:57:22
中山幹夫🐾 @nakayamamikio

本当だ! @PeaceMark51k ストロンチウム ス卜口ンチウム 後者(国の原子力規制委員会のHP内の会議資料へのリンク)は、「ト」と「ロ」にカタカナではなく、漢字の「卜(ぼく)」と「口(くち)」が用いられている。一体何がしたい… nsr.go.jp/committee/yuus…

2014-06-08 13:03:39
中山幹夫🐾 @nakayamamikio

たしかにカタカナの代わりに漢字で書いても簡単には分からないのがたくさんある。「ト」を漢字の「卜(ぼく)」、「ロ」を漢字の「口(くち)」、「ニ」を漢数字の「二」、「カ」を漢字の「力(ちから)」などなど。これって小学生の遊びとしてならば、結構面白い。

2014-06-08 14:13:12
Takao yohey @takaoyohey

本当だね。確かに検索する際に『東京電(力)←漢字』と『東京電(カ)←カナ』では出てくる内容が違う。因みに、左の写真は、力を漢字で検索。右は、カをカナで検索。コレは意図的でしかないが、おそらく隠したい内容は、カナの方にあると思ってる。 pic.twitter.com/7DMb50Y4Ur

2014-06-08 15:54:58
拡大
中山幹夫🐾 @nakayamamikio

これはすごい!大事な(=隠したい)情報は『電りょく』でなくて『電か』にあるのか! @Takaoyohey 検索する際に『東京電(力)←漢字』と『東京電(カ)←カナ』では出てくる内容が違う。左は、力を漢字で検索。右は、カをカナで検索。 pic.twitter.com/AxmyPOuzRN

2014-06-08 17:09:15
拡大
Ai Horikawa @ailyn100

うわ!ほんとだ!!原子力も、原子カで作ってるんだ(-ω-;)“@nakayamamikio: これはすごい!大事な(=隠したい)情報は『電りょく』でなくて『電か』にあるのか! @Takaoyohey 検索する際に『東京電(力)←漢字』と『東京電(カ)←カナ』では出てくる内容が違う

2014-06-08 17:30:02
中山幹夫🐾 @nakayamamikio

原子カ(カタカナのカ)で検索して驚いた。情報公開は義務なのに電力会社は原子力(ちから)でなくて意図的に多くの情報でカタカナのカを利用して検索逃れ。東京電力は東京電カ(←カタカナ)。似た漢字やカタカナと漢字で似た形は多いから、きっと他にも沢山やってる。

2014-06-08 18:12:41
中山幹夫🐾 @nakayamamikio

特にPDFがひどいが検索エンジンやOCRの問題だけと思えない。例えば原子カ(カタカナ)のGoogle検索一番上の中部電力『原子カ安全推進協会取り組み』の原子カはカタカナ。紙のOCR読取りではなく、パワポ等のPDF化である。自国の文字さえまともに扱えないでICT立国などありえない。

2014-06-08 22:43:05
中山幹夫🐾 @nakayamamikio

1992年大統領選で当選したクリントンと政策チームが多くのコンピュータをホワイトハウスに持ち込み政策決定に活用し始めた8年後の2000年、IT革命を唱える日本の森首相がキーボード練習をする光景は悲しいくらい衝撃的だった。既得権まみれの官僚が牛耳る日本は今もまだ情報後進国のままだ。

2014-06-08 23:22:08
中山幹夫🐾 @nakayamamikio

原子カ(カタカナ)で検索されるだけでなく、検索結果自体がカタカナです。例えば検索結果の一番上の『原子カ安全推進協会』の文字はカタカナのカです。メモ帳やワードにコピペして確認すると確かに漢字ではありません。日本の安全にとって重要な情報で、こんな状態が放置されていることは問題です。

2014-06-09 00:47:33
中山幹夫🐾 @nakayamamikio

原子カ(か)の検索結果一覧をコピペで確認するとカタカナ。PDFの多くは紙をOCRで読み取った物でなくてワードやパワポのPDF変換、しかも周知目的なのに文字のコピー禁止。アドビやグーグルに原因があるとしても政府と電力各社がネット社会で母国語さえまともに扱えないなら日本は情弱国家だ。

2014-06-09 12:21:59
Chihiro Fukazawa @query1000

ブログを更新しました=> イジハピ! : 【第616回】ス卜口ンチウム? 原子カムラのGoogle検索だまし? blog.query1000.com/archives/38552…

2014-06-09 09:31:26
中山幹夫🐾 @nakayamamikio

.@query1000 丁寧な分析ですね。確かに『原子力(ちから)安全推進協会  取り組み』だと安全推進協会サイト、カ(か)だと中電サイト。同一内容ですが別ファイルなので何か違うのでしょうね。なおス卜口ンチウムの問題はサイトの字です。 nsr.go.jp/committee/yuus…

2014-06-09 15:20:19
Chihiro Fukazawa @query1000

@nakayamamikio リツイートありがとうございます。そのサイトの中の字の件は知りませんでした。ご教示ありがとうございます。なんなんでしょうね。そこだけ偽装しても意味ない気がするので、何らかのコピペ事象かも?とも思います。推測の域を出ませんが。。

2014-06-09 15:37:30
中山幹夫🐾 @nakayamamikio

昨日、原子カ(カタカナのカ)で検索して驚いた。他に似た例が沢山あった。調べたら文字をコピペさせないことが要因。保護PDFは検索で正しくインデックスできない。情報公開と周知が目的なのに、検索できない、文字のコピーもできない。隠蔽体質で情弱な政府と電力各社はPDFを差し替えるべきだ。

2014-06-09 18:19:21
中山幹夫🐾 @nakayamamikio

確認方法:『原子力(ちから)安全推進協会 取り組み』で検索すると安全推進協会サイト。カ(カタカナ)で検索すると中電サイト。別ファイルだが同一内容。違いは中電は保護有PDFで文字のコピペ禁止。文字がコピーできないPDFは普通に検索できない。保護有PDFはカ(カタカナ)で検索される。

2014-06-09 19:22:06
中山幹夫🐾 @nakayamamikio

技術情報① 以前からAdobe Acrobat Proを使ってるので知ってるが、PDFの保護は編集の制限の有無、文書内の文字と画像のコピーの有効無効などを細かく設定できる。情報公開で周知目的なら編集だけ制限すればいいのに問題の政府と電力各社のPDFは文字のコピーまで禁止している。

2014-06-09 20:56:38
中山幹夫🐾 @nakayamamikio

技術情報② PDF内の文字のコピーまで禁止したら、ワードで作成してから変換したPDFデータでも、紙をスキャナで読取ったPDFのように、Googleの検索エンジンは文書内の文字を抽出できなくなってしまう。そのためGoogleは画像としてOCR処理で文字認識するので文字化けも起きる。

2014-06-09 21:05:47
中山幹夫🐾 @nakayamamikio

結局、原子カと類似の問題の本質は、もし知っていたなら意図的な検索逃れであり、知らないなら政府官僚と電力各社は情弱だ。 実態は両方に違いない。情報公開なのに文字コピー不可の保護で隠蔽体質。アップするだけで検索も気にせず国民に知らせる気もない。国をリードするどころか怠惰で愚か者だ。

2014-06-09 21:41:55
中山幹夫🐾 @nakayamamikio

政府と電力各社のサイトは、一般の会社や個人のサイトと違う。情報公開の義務があり政府関係は税金を使っている。パソコンで作った資料はPDFの文字のコピーを有効にすべきだ。検索で問題が起きるだけでなく、引用する時に文字を打ち直す必要があり、国民に不便を強いて、情報周知の趣旨に反する。

2014-06-10 09:44:43