-
mapconcierge
- 61036
- 179
- 407
- 422

河野太郎がマイナンバーカードの住所照合についてデジタル音痴ぶりを如何なく発揮した件 河野大臣『問題は住所が「港区赤坂一丁目2の3」と書く人もいれば、「港区赤坂1-2-3」と書く人もいる…(中略)将来的にはAIの技術を使って表記揺れを判断することがあり得るかもしれない。』… twitter.com/i/web/status/1… pic.twitter.com/aF2jzwtBkN
2023-06-04 22:44:10
住所の正規化って結構難しいぞ。ちゃんとやろうとするとparseして意味の解釈をちゃんとする必要がある。京都の通り名と正式な住所表記の正規化って出来るか?
2023-06-05 19:24:30
別にAIはいらんけど住所の正規化が簡単は嘘 住所正規化したことがあれば京都府京都市下京区東中筋通五条上る天使突抜で頭抱えたことが一度はあるはず twitter.com/akimotothn/sta…
2023-06-05 21:28:16
住所の表記の揺れの解決(正規化)なんて単純なテキスト処理なのでコードは高校生でも書ける。AIなんて当然要らない。こんな恥ずかしいことをよく真顔で堂々と言えるなあ、と感心する。マイナシステムの最大のバグは河野太郎自身。己の無知を早く悟り、国民のために即刻辞任すべき。 twitter.com/kota_sugihara/…
2023-06-05 05:26:25
手書きからの住所の正規化をやったことあるなら、AIが解決してくれるなら是非頼みたい、って言う人が大半じゃないかなぁ。
2023-06-05 23:07:06
郵便番号は都道府県によって、採番の基準がかなり違う印象があった。今もそうなのか分からんが、プログラムで処理する時に、東北とか京都でかなり引っかかった記憶(後者はまあ仕方ない)。 東京23区は整備されまくってて、それ基準に考えたら住所の正規化が簡単そうに思えるかもな。
2023-06-05 23:16:03
@beConjuror サクラエディタでエクセルの列を抽出して、前後のスペースを削除して、全角・半角変換して元の列に収めるなんて作業ありましたね。最新の技術なら住所の正規化ができるとか聞いた。
2023-06-05 23:41:41
@TGlPxWVwrrBohw3 @beConjuror 住所の正規化で困った経験者としては ・住所コードは丁字までしか表せない ・市町村合併や区画整理で、同じ場所なのに2つの住所コードが存在する ・本人が記入した住所が住所コードに存在せず、代表住所コード(市区レベル)+自由記入となる という事が起きます。
2023-06-05 23:48:24
いや?住所の正規化って人間が手書きでルールを書くのだとカバーしきれないケースがそこそこあって、実際のところChatGPTなんかはこういうの得意なので、河野太郎の発言はそんなにおかしくないよ
2023-06-05 23:55:56
住所の正規化(表記の揺れをなくす)のが秒で解決する問題だと思ってる方がむしろ現実を知らんという感じがする
2023-06-05 23:57:52
官公庁サイト「住所の正規化必要やな。せや!WEBのフォームで工夫したろ!」 全 角 強 制 twitter.com/ellnore_pad_26…
2023-06-06 00:28:29
まじでどうやるつもりなの。ガチで。 エンジニアだけど教えて欲しい。 twitter.com/shimihiro_kita…
2023-06-05 23:56:32
補足:ジオコーディングと住所の正規化は別で、ユーザーによる不定形な入力と、ある程度定型な入力での表記ゆれという違いがあり。河野大臣が上げていた例は後者で解決できるものに見えました。入力ミスや、マンション名の揺れとかはルールベースでは難しいですが、かさを減らして残り人力という手も。
2023-06-06 01:35:34
住所の正規化を実際の案件で設計からやった経験からするとAI でも処理しきれるかどうかです なんせ人間ですら判別できない住所入ってたりするからねwww 実在しない住所まであって何でこの住所で審査通したんだよ!ってキレながら作ったわw まぁ例が簡単すぎるから簡単だろうと思うのも無理はない twitter.com/kota_sugihara/…
2023-06-06 02:13:14
住所の表記揺れ処理をやった事ない人が石を投げて良い話じゃない。住所の正規化AIは国家事業として政府が開発して配布すべきレベル… twitter.com/kota_sugihara/…
2023-06-06 02:52:59
住所の正規化、本当に難しいので河野大臣の説明は正しい。例えば、Googleですら「文京区」と「⽂京区」を別物だと認識していて、「⽂京区」で検索すると文京区のWikipediaにはたどり着けないみたいな似て非なる文字の問題もある。 twitter.com/YAMITZKY/statu…
2023-06-06 03:27:19
厚労省の PDF にも「文京区」ならぬ「⽂京区」など... twitter.com/hal_sk/status/…
2020-07-13 12:39:00
住所の正規化はAIでって話なのね 一番近いものをそれとするという戦略が良さげだから納得するところはありますね 住所ってせいぜい3500万件くらいだそうだから、古典的なやり方、適切な枝刈りとそれなりの構文解析的手法で案外いけちゃうかも でもExcelでは無理よなw
2023-06-06 04:32:02