住所正規化、みんな悩んでいたんだなぁ

31
ねーじゅ @nomneige

住所の正規化話盛り上がってるなぁ。 昔少し戦ったことあるけど、今言えるのは絶対に踏み入れちゃいけない世界ということ。深淵しかない。割とトラウマ。

2023-06-06 17:38:27
acidhead (SCG003C)Vaccinated 5 times (PPMPP) @acidhead09

住所の正規化(住所クレンジング)は、血反吐を吐きそうなくらい難しい 「やれば自動化できる」と思っている人は、まずは京都市の住所を調べるがいい 私の実家も田舎で、番地に”カタカナ”が入る住所だったため、電話で伝える際に非常に苦労したよ 地域毎に不思議ルールが山のようにあるんよ…

2023-06-06 17:39:53
TANIGUCHI Fumitake @noplans

日本の住所の正規化に本気で取り組んでみたら大変すぎて鼻血が出た。 - Qiita qiita.com/miya0001/items…

2023-06-06 17:41:48
はしもと @hashi_dev

住所の正規化は地獄だから触れてはいけない。なぜなら本当に地獄だから。 京都は絶対に無理だと思うし、人が入力したものだと誤入力も混ざってくるしで、正規化後の住所の正当性を確認する方法がそもそもない。

2023-06-06 17:51:34
さやえん豆 @Saya_End

住所の正規化か、うちの町内だと町名と番地で良いんだろうけどノイズとして古い地名、イロハ区割り、屋号辺りがくっついてる場合もあるな

2023-06-06 17:55:30
青竹 / 麦(穀物P) @aotake91

住所の正規化をより広く捉えて実施するとなると、郵便局が郵便物配達のためにずっと蓄積してきた、配達先特定のための住所対照のようなデータも必要になってきます

2023-06-06 17:59:13
だいづ☆ @dadai_zzz

住所の正規化とか考えただけで頭痛くなりそう

2023-06-06 18:00:24
yutaro @yu_s_1985

住所の正規化なんて簡単ていう人、ITの知識云々じゃなくて単純に実際の住所が簡単なパターンで決まってると思い込んでて実態を知らないだけでしょ

2023-06-06 18:00:39
にゃんこそば🌤データ可視化 @ShinagawaJP

正規表現を全部理解した人が「数字の後の 【の】 をハイフンに置換」してハマるやつだ。 (ノ=゚ロ゚)ノ ⌒┫ > 事例 5 「の」 > こちらも石川県の住所です。「の」までが町名となっているようです。 > 【金沢市天池町2の】 Vol.84 全国の特殊な住所 | MieNaPress mienapress.nsc-idc.jp/mienapress/?p=…

2023-06-06 11:45:00
LegionRegion (レギオンレギオン) @legionregion

住所の正規化問題って想像以上に根深いんだなぁ 個人的には、住所ではないが異口同音が増えてもいいから漢字の読みを正規化して欲しい 呉音・漢音・唐音があって、そこに訓読み、更に湯桶読み・重箱読みがあってナンセンス過ぎるんじゃ

2023-06-06 18:00:43
YT @tomita1000

住所の正規化は難しい どうしても一部は人間の目で判断する仕組みになってしまう

2023-06-06 18:00:56
イシイさん @tomohiko_ishii

住所の正規化ではないけど、市区町村単位での変更以外に、町名、番地の変更が結構な頻度であった記憶が。結局、あれどうしたらよかったんだろうって、今でも思う。

2023-06-06 18:03:32
NAU @revolversix

住所の正規化、番地・番・号と地番が不規則なのしんどい

2023-06-06 18:06:50
豆苗🌱 @to0tyuka

住所の正規化のお話、昔一時期住んでた場所は1900-6と書いて1900番地の6と読むとかそれ系の地名だったからそこらへんもめんどくさいことになりそう なるのか?

2023-06-06 18:07:03