住所の正規化は沼である。

トレンドになっていたので「住所の正規化」「日本の住所のヤバさ」を中心にアーカイブ 一人では大変なので、共同編集者募集中です。 #古橋研究室
59
杉原航太 @kota_sugihara

河野太郎がマイナンバーカードの住所照合についてデジタル音痴ぶりを如何なく発揮した件 河野大臣『問題は住所が「港区赤坂一丁目2の3」と書く人もいれば、「港区赤坂1-2-3」と書く人もいる…(中略)将来的にはAIの技術を使って表記揺れを判断することがあり得るかもしれない。』… twitter.com/i/web/status/1… pic.twitter.com/aF2jzwtBkN

2023-06-04 22:44:10
prioninae @prioninae

住所の正規化って結構難しいぞ。ちゃんとやろうとするとparseして意味の解釈をちゃんとする必要がある。京都の通り名と正式な住所表記の正規化って出来るか?

2023-06-05 19:24:30
飼い猫@バーチャル化け猫 @kaineko

別にAIはいらんけど住所の正規化が簡単は嘘 住所正規化したことがあれば京都府京都市下京区東中筋通五条上る天使突抜で頭抱えたことが一度はあるはず twitter.com/akimotothn/sta…

2023-06-05 21:28:16
ソトン秋元 @AkimotoThn

住所の表記の揺れの解決(正規化)なんて単純なテキスト処理なのでコードは高校生でも書ける。AIなんて当然要らない。こんな恥ずかしいことをよく真顔で堂々と言えるなあ、と感心する。マイナシステムの最大のバグは河野太郎自身。己の無知を早く悟り、国民のために即刻辞任すべき。 twitter.com/kota_sugihara/…

2023-06-05 05:26:25
キラッとれとにゃƕ📶 @letra_update

ken_all問題知らなそう。「住所の正規化」って言って…いや、まずはやってみてほしい。死ぬから。

2023-06-05 22:04:03
hylom @hylom

住所の正規化、定期的に話題になるので皆さん「住所 正規化」でググりましょう、商売でやっているところですら精度約98%とからしいので

2023-06-05 22:07:55
ruichi @ruicc

日本の住所の正規化とか簡単だろ的な話を見てしまったけど、日本の住所の正規化ってそんなに簡単な話だったっけ…

2023-06-05 22:44:21
衛星経由で監視されてるハムスター🐹 @rioriost

手書きからの住所の正規化をやったことあるなら、AIが解決してくれるなら是非頼みたい、って言う人が大半じゃないかなぁ。

2023-06-05 23:07:06
衛星経由で監視されてるハムスター🐹 @rioriost

郵便番号は都道府県によって、採番の基準がかなり違う印象があった。今もそうなのか分からんが、プログラムで処理する時に、東北とか京都でかなり引っかかった記憶(後者はまあ仕方ない)。 東京23区は整備されまくってて、それ基準に考えたら住所の正規化が簡単そうに思えるかもな。

2023-06-05 23:16:03
katahiromz @katahiromz

@beConjuror サクラエディタでエクセルの列を抽出して、前後のスペースを削除して、全角・半角変換して元の列に収めるなんて作業ありましたね。最新の技術なら住所の正規化ができるとか聞いた。

2023-06-05 23:41:41
しろくま@パンダの国 @shirokuman123

@TGlPxWVwrrBohw3 @beConjuror 住所の正規化で困った経験者としては ・住所コードは丁字までしか表せない ・市町村合併や区画整理で、同じ場所なのに2つの住所コードが存在する ・本人が記入した住所が住所コードに存在せず、代表住所コード(市区レベル)+自由記入となる という事が起きます。

2023-06-05 23:48:24
猫村ゐき (Nekomura Wiki) @lll_anna_lll

いや?住所の正規化って人間が手書きでルールを書くのだとカバーしきれないケースがそこそこあって、実際のところChatGPTなんかはこういうの得意なので、河野太郎の発言はそんなにおかしくないよ

2023-06-05 23:55:56
猫村ゐき (Nekomura Wiki) @lll_anna_lll

住所の正規化(表記の揺れをなくす)のが秒で解決する問題だと思ってる方がむしろ現実を知らんという感じがする

2023-06-05 23:57:52
(っ´∀`)っ ゃー @nullpopopo

官公庁サイト「住所の正規化必要やな。せや!WEBのフォームで工夫したろ!」 全 角 強 制 twitter.com/ellnore_pad_26…

2023-06-06 00:28:29
無能なえる(心の声が聞こえます) @ellnore_pad_267

まじでどうやるつもりなの。ガチで。 エンジニアだけど教えて欲しい。 twitter.com/shimihiro_kita…

2023-06-05 23:56:32
sylph01 @s01

住所の正規化が難しいことを逆手に取って届く範囲の表記ゆれでいろんなところに住所登録して漏れた経路を推測可能にするムーブ

2023-06-06 00:35:30
ふせん @fusen74

住所の正規化はもう諦めて、今度から座標表記に改めよう(暴論)

2023-06-06 00:43:28
ABE Masanori @abe_masanori

住所の正規化はねぇ。表記ゆれを統一すればOKではないのが辛いよね。もちろんそれで結構な割合は拾えるけど。

2023-06-06 00:54:02
sake @buy_sake

住所の正規化、チャレンジしたことがあるエンジニアが皆トラウマを抱えてる一方、外野からは確かに簡単に見えるよね、良い燃料

2023-06-06 01:12:31
ypresto @yuya_presto

補足:ジオコーディングと住所の正規化は別で、ユーザーによる不定形な入力と、ある程度定型な入力での表記ゆれという違いがあり。河野大臣が上げていた例は後者で解決できるものに見えました。入力ミスや、マンション名の揺れとかはルールベースでは難しいですが、かさを減らして残り人力という手も。

2023-06-06 01:35:34
Mialceal @mialceal

住所の正規化を実際の案件で設計からやった経験からするとAI でも処理しきれるかどうかです なんせ人間ですら判別できない住所入ってたりするからねwww 実在しない住所まであって何でこの住所で審査通したんだよ!ってキレながら作ったわw まぁ例が簡単すぎるから簡単だろうと思うのも無理はない twitter.com/kota_sugihara/…

2023-06-06 02:13:14
吉村美代 @myonyomu

「住所の正規化」って言葉が曖昧過ぎて燃えてそう。

2023-06-06 02:27:59
rio1024 @n_vagus

住所の表記揺れ処理をやった事ない人が石を投げて良い話じゃない。住所の正規化AIは国家事業として政府が開発して配布すべきレベル… twitter.com/kota_sugihara/…

2023-06-06 02:52:59
🍭 小笠原みつき / JX通信CTO @YAMITZKY

住所の正規化、本当に難しいので河野大臣の説明は正しい。例えば、Googleですら「文京区」と「⽂京区」を別物だと認識していて、「⽂京区」で検索すると文京区のWikipediaにはたどり着けないみたいな似て非なる文字の問題もある。 twitter.com/YAMITZKY/statu…

2023-06-06 03:27:19
🍭 小笠原みつき / JX通信CTO @YAMITZKY

厚労省の PDF にも「文京区」ならぬ「⽂京区」など... twitter.com/hal_sk/status/…

2020-07-13 12:39:00
gram @garamlover

住所の正規化はAIでって話なのね 一番近いものをそれとするという戦略が良さげだから納得するところはありますね 住所ってせいぜい3500万件くらいだそうだから、古典的なやり方、適切な枝刈りとそれなりの構文解析的手法で案外いけちゃうかも でもExcelでは無理よなw

2023-06-06 04:32:02
Mary🦉→⚙1205 @WWVsbG93IFJvc2U

日本すら旅行せずに海外かぶれてキラキラしてると、住所の正規化すら理解できなくなるのか 怖いね

2023-06-06 05:52:40
1 ・・ 114 次へ