「日本の住所のヤバさ」知れ渡る 正規化・名寄せ問題、Twitterトレンドに

 「日本の住所のヤバさ」が6月7日朝にTwitterトレンドになっている。住所表記の正規化・名寄せがいかに難しいかを解説した、inuroさんのnote記事「とにかく日本の住所のヤバさをもっと知るべきだと思います」がバズっているためだ。

 6月4日のテレビ番組で、マイナンバーカードに記載される住所をめぐり、河野太郎デジタル大臣が「将来的にはAIの技術を使って住所の表記揺れを判断することがあり得るかもしれない」と発言し、住所の正規化についてネットで議論になっていたことがきっかけだ。

 記事は、「日本の住所システムがカオスで、その計算機的な処理がいかに困難か」を解説する内容だ。

 まず、日本にはそもそも、新旧の2つの住所システム(A町1丁目3番2号/A町1234番地)が併存しており、例えば、「浦安市舞浜2」の住所が「舞浜2丁目」「舞浜2番地」の2系統あるケースを紹介。

 さらに、まったく同じ住所表記が異なる複数の建物に付与されているケースや、表記を勘違いして入力するユーザーがいること(「八街市」(やちまたし)を「8街市」にする)——など、住所正規化・名寄せに立ちはだかる多くのハードルを解説している。

 読者からは「確かに大変だ」「想像以上のヤバさ」「無理ゲー」などの感想が届いている。

 また、位置情報サービスを提供するGeoloniaの宮内隆行CEOが2020年にQiitaに書いた記事「日本の住所の正規化に本気で取り組んでみたら大変すぎて鼻血が出た。」をirunoさんは紹介し、「ぜひそちらもご覧になってください」と案内している。
https://news.yahoo.co.jp/articles/b179547f31a96d2469198e5872859bb221aeb4f7
  1. 416 tqaM5wXR0
    >>378
    住所は宅急便や郵便物が届くから舐めている人が多すぎる
    システムは利用者のためのサービスにすぎんのに過信する

    例えばDM送り先をそのまま送ってうっかり違う人に届いたらば
    大変な騒ぎになるのは常なのに構築するのが目標目的になる
    作っておわりじゃねーんだよ 使わせることが目的なのにね…
  2. 421 NApMDyZ80
    >>414
    ○番○号なら住居表示が実施されてると番地なら実施されてないの違い
  3. 423 Lei/ONdX0
    >>272
    なななななななー
  4. 425 NeSv0WUFa
    >>321
    あれはあれで配達の都合で付けてるからなw
    昔の郵便列車の止まる駅順とかで番号ついてたりするし
  5. 428 srMBA3DUa
    外字とかもそうだけど、人がシステムに合わせるべきだよなあ
  6. 431 GWPcRAe40
    外字、誤字、旧字はもう禁止にしていい
  7. 433 adW53p/OH
    土人国なんだねとしか言いようがない

    意味もない戸籍制度
    意味もない住所制度
  8. 435 NeSv0WUFa
    >>367
    闇が深まってて草
  9. 437 iiJhwKkU0
    そのせいでワタナベとサイトウがアホみたいにいっぱいあるからな
  10. 439 iiJhwKkU0
  11. 441 93X6OKyMd
    >>431
    おれ外字だけど正直どっちでもいいわ
    でもあちこちに名前登録してるの全部変えるとかどう考えても無理
  12. 445 adW53p/OH
    >>436
    田舎は大字だろ
    現代の宅地造成や乱開発についていけてるとは思えんが
  13. 448 GWPcRAe40
    >>441
    取扱いとして既に同一の文字として扱うようになってる
    個人が勝手に拘りを持っていたりするだけ
    今までのは別に変更する必要はない今後は使わないとか
    今の文字と見なせばすむだけ
  14. 450 93X6OKyMd
    >>448
    自治体はそうなんだけど民間は違うぞ
    漢字違うから訂正しろって言ってくる
  15. 452 GWPcRAe40
    >>450
    民間なんて相手次第だし
    自分で説明したらいいでしょう
  16. 454 NeSv0WUFa
    >>445
    大字ってその地域で「大字」と書くかどうかでしかなくて仕組みとしては都市部の地番と同じだから
  17. 456 iRKDva9/d
    ⚪︎⚪︎市の後に一丁目っていう町名つく市があるらしいけどこんなん反則だろ
  18. 458 K0wodovn0
    >>457
    読んでるとかじゃなくてシステムを作る時の話だから表記のこと
  19. 460 V8klDlVGa
    >>447
    長野県に友達いるんだが
    一人は 長野県諏訪郡富士見町
    もう一人は
    長野県諏訪郡下諏訪町富士見町

    まあ間違えばしないけどなんだかなあ
  20. 462 j77MgGvw0
    >>68
    そもそも上ル下ル西入ル東入ルは説明であって住所でさえないからな
  21. 464 AsU4MiHm0
    >>458
    01と02表記は00地点でなんの問題が


    やれやれこれだから文系は
    はー(クソデカため息)
  22. 469 K2MgOwqVa
    >>273
    兵庫の播但線に溝口って駅があってそっちが先に開業だからしょうがない
    武蔵溝口で良かったとは思うが国鉄が読めないからこういうのはノを降るとか馬鹿な事やってそれに倣ったのでさらにしょうがない
  23. 474 OYWuDuEC0
    >>9
    日本人アホやん
  24. 479 jhT48O0tp
    住所そのものをグローバルスタンダードに書き換えたほうが早い
  25. 482 zYgELnZy0
    >>481
    イギリスの地名をアメリカは かなり真似てる
  26. 486 Nu5jtesx0
    国が把握してる正しい住所一覧みたいなリストってどっかに落ちてるの?
  27. 490 4kUSZdaR0
    >>127
    石川県人かな
  28. 492 lCw/P9HS0
    半角数字と全角数字別々の住所として登録されるにゃ???
  29. 497 mZg0Rvw00
    年賀状バイトやるとたとえ無茶苦茶住所でもベテラン職員の匠の技で正しく配達されることが理解できると思う
  30. 499 H9dp493Jd
    >>486
    法務局かな
  31. 503 LZ1irsBXa
    >>492
    仕事で店舗の住所データベース化してるけど、半額数字、全角数字、漢数字、漢字の一とハイフンと罫線、頭の頭痛が痛いわ
  32. 505 DjA3K1xz
    嫌なら出てけ
  33. 509 LZ1irsBXa
    >>505
    お城が1つの番地になってたんかな
    姫路は姫路市飾磨区となってても区じゃないのが慣れん
  34. 511 hBJMerKK0
    >>1
    固定資産税とか設定してるのにそんなアバウトな運用なのか
    それこそマイナンバーみたいに定義しなおせばいいのに
  35. 513 AUsD+AhP0
    >>508
    そういうのは元々の大きな敷地が分割再開発されたときに
    地番の振り直しをしてないんだよね
  36. 515 LZ1irsBXa
    >>513
    分譲で分割しまくってるから番号振り直したら12a番地とか147c1番地とか枝番だらけでわけわからんようになるわ
  37. 522 smnGD0/T0
    >>276
    そうそう
    1小路全部同じ住所で表札無いと詰むやつw
  38. 524 uQQfpDGta
    >>68
    マジレスすると、東西に走る道から枝葉的な道路を北方向に曲がるのが「上ル」、
    南方向に曲がるのが「下ル」。
    東入ル西入ルも同様。

    なんで北に向かうのを上ルなのかってーと、多分御所が北側にあったからだな。
  39. 530 MxWtv8Rga
    >>497
    昔の年寄りとか
    「市内〇〇←町名のみ 山田太郎様」
    とかしか書いてねーハガキあったからなw
  40. 532 4ixlmAdR0
    どんな書き方してもグーグルマップ先生はちゃんと同じとこにピン立ててくれるよ?
  41. 534 pLVqPn+60
    >>531
    それはどっちでもよくないだろ
    本人確認書類(住所確認書類)と相違してたらNG
    だから免許証の住所を正しくない表記ゆれに書き換えて住所を微妙に変えるライフハックがある
  42. 536 smnGD0/T0
    >>228
    田舎だとその全部が同じ名字だったりも普通にあるから結局現場で確認するしかないんだよね
  43. 538 K6E8InXar
    絶対わかるのにマンション名書かないと切れてくる局員なんなんだ?
  44. 540 AUsD+AhP0
    >>537
    そりゃもちろん
    同じ住所に複数建物、全部同じ名字なんてところは
    住人の下の名前まで全部把握して凄い速さで仕分けするぞ

    郵メイトやってたころが懐かしい
  45. 543 dfvLWGoc0
    >>540
    らめぇ、恥ずかしい名前が郵メイトさんにバレバレだょぉ(ぴっくんぴっくん
  46. 545 pLVqPn+60
    >>538
    ソース読めよ
    自治体によっては同じ住所に建物詰め込んで建物名で区別しろみたいな運用してんだよ
    あと隣の区画が別住所でも2つ隣が同じ住所とかあるからな? 日本の土地行政を舐めるな
  47. 547 /uMp21C90
    >>378
    解決するのは簡単やろ
    新しく番号を振り直すだけや
    それを本人たちが許すかどうかはまた別の問題だが
  48. 550 YT6OMwee0
    京都野郎の昇る下るだろ
    あれ京都人同士だけでやれよ
  49. 552 MxWtv8Rga
    >>542
    元々は土地の地番(登記簿で使われてる表記:〇〇1234番地みたいなやつ)しかなかった
    ただ分筆合筆繰り返されてたり逆に全然分筆合筆されてなくて同じ地番に何十軒も家が建ってるとか同じ建物の下の土地は細切れの土地が数十筆もあるとか死ぬほどややこしいことになっていた
    ということで60年代に土地の番号じゃなくて建物や住居ごとに識別できるようにつけましょうと「住居表示(〇〇1丁目1番1号ってやつ)」を導入しようとしたんだけど各市町村の導入の仕方や導入地域が死ぬほどバラバラなまま今に至る
  50. 554 U3XTa6jG0
    よく考えたら、番地で細かい位置はコード化してるじゃん
    上位の地名もコード化すればいいだけ。とても簡単
  51. 557 AUsD+AhP0
    >>554
    逆でしょ
    上位は郵便番号でがっちりコード化されてる
    下位のコードが実際の土地建物と不一致してることがある
  52. 561 iiJhwKkU0
    >>532
    グーグルマップは結構住所わからないことがあるから
    ヤフーで調べることもあるな
  53. 564 SlLrORF00
    各地適当に区割りしてるのに正規化なんかできるわけねーだろ
    アホなん?
  54. 566 aBZKveofd
    >>564
    正規化というかデータマイニングで地道にやればいいのにな
    日本がデータサイエンスに弱い理由がわかる
  55. 569 xk0fob0p0
    昔から役所はいい加減だったって事だろ?
    役人が間違えた分だけ漢字に派生が生まれたからな
  56. 571 q/YZibgM0
    >>565
    日本の土地が綺麗に区分けされてると思ったら大間違いだぞ
    地租改正のあと一度も測量なんかやらずにもはや何番に家が建ってるのかわからないようなとこが日本には死ぬほどある
  57. 574 Lbc8wxvLd
    >>571
    綺麗に区分けされてないから不便なのはわかるけど、それは地番とか関係ない話だよね
  58. 576 NApMDyZ80
    >>571
    測量は地籍調査で一応はやってるまだ全部は終わってないが
    田舎の自治体だと完了してるところはある
  59. 579 MxWtv8Rga
    >>576
    昭和26年からやってて進捗半分超えたくらいなの草
    大事業だな
  60. 583 MxWtv8Rga
    >>578
    昔の名残
  61. 585 QhVaJLx8M
    >>569
    昔から弱者を切り捨てればいい話なんだよ
    こんなのも住民の言い分なんか無視してより良い方に勝手に変えられれば今のような雁字搦めにはならなかった
    「この二本線は下のほうが長いんですよね?」→「違う違う上のほうが長いの!(思い込み)」これで名前がものすごい数に
    「国が住所管理しやすいようにこれからの呼び名は統一しやすく変更します」→「わしらが昔から使っとる土地の名を勝手に変えるな!!」住所の二重管理化
  62. 587 MxWtv8Rga
    >>582
    会社の脇のドブ川みたいなところの草刈りをウチなのか隣なのかどこがやるかわからんかったから公図みたらどう見てもドブ川の法面にしか見えないけど市有地(公図には市道と記載)であることが発覚して市にぶん投げたことがあるw
  63. 589 whhBWm100
    >>294
    でも東側の方が地価高いしイメージも良いよね
  64. 591 6W91GVDL0
    >>294
    昔の区画があるところを散歩してみると、欧米で
    いう所の「通り」にかなり近い関係になっている
    ことが多い。

    実はこれでも運用できたんじゃないかな?という
    気はする。
  65. 593 MxWtv8Rga
    >>591
    江戸時代なんかは普通に通り基準で決めてるから町割りがそのまま残ってる都市の中心部は今もそんな感じが残ってたりしますね
  66. 599 U7+yhD0c0
    国民をコード化するよりまず住所をコード化するべきだったのでは
  67. 602 U3J/JvhB0
    >>550
    そうだな、w
    オラクルやSAP信者のように
    現実世界をITに合わせろ、という御託宣ですな
  68. 606 qybEEUQ7d
    >>602
    実運用をITに合わせるのは欧米だと普通だろ
    ジャップはそれができないからSIerとかいうビジネスが成り立ってる
  69. 608 U3J/JvhB0
    >>606
    見てきたような嘘を付き
  70. 610 qybEEUQ7d
    >>608
    実際欧米はパッケージそのまま使うからね
    無能ジャップは業務に合わせてカスタマイズ(笑)するのが好きだけど
  71. 620 rFJh2Ippa
    >>605
    渋谷駅前なんてちょっとの土地がウン万ウン億だから藪蛇すぎるな
    迂闊につついたらとんでもないことになりそう
  72. 622 cbyBuICva
    まったく違う土地の家なのに住所が辺り一帯を指しているところもある。配送業やってる人なんかはどうやって区別つけてるんだろうか
    多分、大昔の基準で大きい土地の中へ一軒家を身勝手に転々と建てて売り払ったってな感じかと。だから市役所区役所の住所登録では同じ住所として登録されてる難解な感じになってるんだろうなと
    本来は住所1、住所1-2と分けなきゃいけないけどお役所仕事でサボってんだろ
  73. 627 rFJh2Ippa
    >>622
    役所というよりは土地持ってる人が適当な管理のまま売っちゃった感じじゃね
    昔だと適当な地主が分筆しないまま1つの土地を私的に区分けして人に貸すとかそこまでは良いにしてもそれを時間経ってからそのまま売るとかあったらしい
  74. 632 NkffsqMT0
    >>112
    まさに話題に出てる門外漢による安直なシステム化妄想
    整合性がない出来ないが何十年も解決してない理由を察しろ
  75. 634 mkAPTgbc0
    >>607
    外国人だろ

    流出させてるのは下請けに外国人を使ってる業者だからな
  76. 637 dfvLWGoc0
    まあGPSとゼンリン地図を使っても、たとえばタワマンの入居者情報とかは載ってなくて
    フロア番号書いてなかったら電話して確認が必要とか
    やっぱり人手の作業が必須だよな
    もちろん情報漏洩防止も重要
  77. 640 rFJh2Ippa
    >>636
    まあ地図上の地番や住所と建物と表札の突き合わせはゼンリンがやってるようなもんだしな
    ただ>>637の通り表札のないタワマンには無力になってしまうがw
  78. 648 YqFnClqa0
    3-◯25-7

    ◯の中は東西南北
    みたいなのもある
  79. 650 0dgs+twu0
    またくだらない理由でいいわけしちゃったねえ
  80. 653 klhZPYCz0
    >>85
    内部的には6桁でやってんじゃないの?
  81. 655 pLVqPn+60
    >>650
    これをくだらないと評価するシステム設計リテラシーの低さが日本国中に蔓延している
    兵站軽視の時代から何も変わらない
  82. 657 tdKW2lqr0
    住所の正規化を本気でやろうとしたら
    「令和の太閤検地」とか言われそうな大改革だわ
  83. 659 0kbTx7Lq0
    >>657
    デジタル庁ってそういう仕事するために作ったんじゃないの?
  84. 662 dfvLWGoc0
    >>640
    いちおう警察も事件対応のために引越しシーズンや家族の出入りがあると調査に来るけどね。
    規模的に個人情報的な扱いになるし
    事件捜査の下資料だから、事件発生後正当な理由があるのでもない限り、一般向け公開はしない
  85. 664 rFJh2Ippa
    >>662
    警察は巡回連絡で連絡票集めるのが仕事だからね
    会社にも来るよ
    郵便もそうだけど結局お上も各組織で調べているんだよな
  86. 667 xLfK86W0a
    >>658
    過去からの郵便物の配達実績をもとに郵便原簿という書類をつくってるけど、たまに番地の分裂なんかで配達不能になることがあって、そのときには送り先と思われる家に住居確認を出してるって話だったと思う。
    これに回答されなかった場合は送り主に郵便を送り返し、送り主が補足情報を足して再投函することをきたいするんだけど、それもしなかった場合はその住所は取り敢えず存在しないことにしておく。
    もしどこかが再度投函したら上記を再度やっていく感じなんだろうな。
  87. 674 mk6Gn53p0
    >>263
    頭おかしなるで
  88. 679 uR7lLA99a
    >>678
    青ヶ島に限った話じゃねーよそれ
  89. 682 zJmsisHW0
    最適化問題の定式化をせずに
    AIに指示すれば答えが出ると思い込んでる人って
    アルゴリズムと計算量とか認知科学とか全くイメージできなくて
    電子計算機をなんでも解答マシンと勘違いしていた1950~60年代の人と同じレベルなんだろうな
  90. 684 uR7lLA99a
    >>683
    どんな田舎育ちだよ
  91. 686 jJYNDU1B0
    >>684
    田舎の住所でいちばんありがちなの
    ○市、○町、字、番地
    のどシンプルタイプ
    丁目とかあるほうがレア
  92. 690 ex7irFw10
    >>294
    四谷の形なんなん
  93. 693 pWz/Egg/0
    >>689
    そもそも効率というものを全く考えない国だからな
  94. 695 frD/NzWC0
    >>191
    なんでそんなバカなことになったんや…
  95. 697 frD/NzWC0
    >>278
    日本には無駄なことが多すぎる
  96. 699 zJmsisHW0
    >>689
    ハッショウ論理の支離滅裂さに憐憫
  97. 704 IX1/VBWK0
    >>49
    地震でズレるんだよなぁ
  98. 706 wm+WyjC00
    全然違う地番を住所にしてるキチガイもいるからな
  99. 708 ENaHstnQa
    >>682
    河野太郎マジでその認識なんだよな。
    なんなら、最近炎上した北九州だかの市議と同レベルでしかないと思う。

    この期に及んで「住所の表記や入力に揺れがあって~」とか言うってことは、
    「Excelにいれて置換すりゃええやろ」くらいの認識レベルで始めたってことだからな。
  100. 710 PGsg95KY0
    >>32
    これは出るけどiOSのクソ変換だと一文字ずつ手入力しないといけないことしょっちゅうだから急いで入力するとこんな感じの誤変換はよくある
  101. 712 2SCupHqc0
    >>708
    つかあいつ何年か前に「次の質問どうぞ」を何度も繰り返して謝罪する羽目になったのに
    最近も所管外ですを何度も繰り返すことやってたんだよな
    Twitterでの発言含めてちょっとおかしい所あるよな
  102. 714 Im1PWwSb0
    >>713
    なにそれ…なにかの名残りとかなの?
  103. 717 j6S/WAkg0
    >>712
    自分の能力を正しく把握できない人間特有の行動
  104. 721 01KEd08L0
    >>5
    郵便局員や配送業者の自助
  105. 723 kURZPImwa
    >>5
    配達業者が何となく「これはここやろ…」て把握してる
  106. 725 JlRdfbsC0
    >>294
    ほええ
  107. 728 jDsWNbmC0
    言われてみれば確かにそうだな、なんとなくでなんとかなるようなところもあるし