- iamdreamers
- 1752
- 0
- 1
- 1
夢乃
@iamdreamers
そもそも論として、政府関係機関だろうと企業だろうと個人だろうと、Webに公開する情報を適切な単語で一般の検索サイトから検索できるようにしておく義務なんて、まったくないわけなのよ。
2014-06-11 17:33:46
夢乃
@iamdreamers
んで、GoogleとかYahoo!とかの一般企業が提供している検索機能っていうのは、それぞれの企業が自分のサイトをポータルとしてユーザに使ってもらえるように、検索機能を提供しているわけ。
2014-06-11 17:34:37
夢乃
@iamdreamers
自分のWeb公開情報がそういう一般の検索サイトの検索結果に表示するように工夫する義務というのは皆無なのね。ビュー数が上がるように検索サイトに表示されるように工夫するってのはあるけど、それは公開する側の都合でしかない。検索されないように工夫するのも一緒。
2014-06-11 17:35:01
夢乃
@iamdreamers
だから、たとえ自分のサイト内に誤字があろうと、それを検索逃れだ、などと文句を言われる謂れはまったくないし、ユーザも文句を言う理由などないのね。誤字そのものに対する文句は別だけど。
2014-06-11 17:35:27
夢乃
@iamdreamers
だから、どっかのWebサイトのページが一般の検索サイトに表示されないからといって、それを「検索逃れだっ」などと言うのは見当違いも甚だしい、とそういうことなのよ。
2014-06-11 17:35:50関連まとめ
まとめ
「"原子力(りょく)"ではなく"原子カ(か)"で検索すると出てくるpdf資料が「検索避けの隠蔽工作か!?」と一部で話題。
最初のリンクの誤字は誤読み取り資料からのコピペですかね。
57380 pv
748
24 users
377
まとめ
原子カ(カタカナのカ)で検索して驚いた
しだいに問題点と原因が分かってきました。コメントをする人は書き込む前に、この解説文も含めて最後まで読んでください。まとめでは特に最後の6個が大事です。
パソコンを使ってワードやパワーポイントで作った資料をPFDに変換する時には、編集だけを不可にして、文字コピーを可にしたPDFデータにすればいいのに、日本政府と電力会社が公開しているPDFは意図的に文字コピー不可にしていることが原因です。
文字コピー不可のPDFは、画像データのようになってしまい、Googleが文字を抽出できないのでOCR処理で文字を認識するため、インデックス抽出で文字化けが起きます。特に原子力関係の情報は国民への周知のための重要な情報公開であり、しかも政府と電力会社は一般の会社や個人サイトとは違うのだからパソコンで作成した資料をPDFに変..
41427 pv
633
167 users
296
まとめ
なぜストロンチウムはス卜口ンチウムになったのか
「原子力」("力"は漢字)が「原子カ」("カ"はカタカナ)に、ストロンチウム("トロ"はカタカナ)が、ス卜口ンチウム("卜"は漢字の"ボク"、"口"は漢字の"クチ")になってるPDFがたくさん発見された。それはなぜそうなったのか。および改善するには?
18303 pv
99
15 users
12