コラム

住所正規化(住所クレンジング)とは?
~「住所の表記ゆれ解消」で業務は効率化できる!~

住所は、私たちの日常で最も身近にあるといっても過言ではない「位置情報」です。
例えば郵便や宅配で荷物をどこかに送るにしても、住所を記入することで場所を指定するなど、当たり前のように便利に使用していますよね。一方で、表記ゆれがあることで住所情報を業務でうまく活用できていなかったり、場合によっては業務に滞りを生じさせたりした経験は、皆さんの中でも心当たりがあるのではないでしょうか?

ビジネスにおいて「住所」は重要な資産です。活用できる形に整えることで、業務の効率アップにつなげられます。
ではどのようにして住所の表記ゆれの解消ができるのか、いわゆる「住所正規化」「住所クレンジング」の方法についてご紹介していきます。

目次
● 住所の表記ゆれについて
● 表記ゆれにより発生する問題
● 住所正規化(住所クレンジング)が難しい理由
● 住所正規化(住所クレンジング)の処理手法
● 住所正規化ツール「アドレスクレンジングツール」のご紹介
● アドレスクレンジングツールのシンプルな使用方法
● アドレスクレンジングツールが業務効率を上げる!


住所の表記ゆれについて

改めて、「住所の表記ゆれ」がどのようなものであるかを整理しましょう。
住所の表記ゆれとは、 以下の住所で例えると、「●丁目●番」が何通りにも表せるように同じ住所を指していても表記が一定ではないことを指します。

「●丁目●番」だけならまだ易しい方で、

など「ケ」「ヶ」「が」「ガ」や、「國」「国」などの旧新漢字などの表記ゆれもあります。
昔は手書きの運用が前提だったので支障はありませんでしたが、デジタルが普及した現在では、この表記ゆれが問題になっています。

表記ゆれにより発生する問題

具体的に何が問題になるかというと、
・ 顧客データベースの登録住所に表記ゆれがあり、名寄せができない
・ 同じ住所にも関わらず表記ゆれがあるため、重複してDMを発送してしまった
・ 住所リストを保有しているが、整理しきれず活用できないままになっている
・ 部門ごとに表記ルールがバラバラなので、マスタ化ができない
・ 住所をキーに出自の異なるリストを突合したいが、表記ゆれがあってできない
などがあります。

住所正規化(住所クレンジング)が難しい理由

住所の表記ゆれの是正、住所正規化や住所クレンジングと呼ばれる処理の難しさの理由のひとつに、日本の住所が自然言語に由来することがあげられます。

自然言語とは人間が意思疎通のために日常的に用いる、文化・地理・歴史的背景をもって発展してきた言語を指します。いわゆる日本語や英語などのことです。
自然言語の対義になるのが人工言語です。例えばプログラミング言語がこれにあてはまります。プログラミング言語は正確に定義された記号と規則の仕組みから成り立ち、そこから外れたものは言語として認識されない厳密なルールがあります。逆にそのルールを理解していれば、誰もが同じ成果を得ることができます。

自然言語は先に述べた通り文化・地理・歴史的背景をもって発展してきたという特性を持つため、同じ国内でも山ひとつ越えればルールが変わるといったことが起こります。

方言もそのひとつと言えるでしょう。限られたコミュニティ内のルール、ミクロレベルで言えば家族間でしか通じない言い回しなどはみなさん心当たりがあるのではないでしょうか。

住所にそこまでミクロな事例はあてはまりませんが、住所正規化処理の難しさは、この自然言語の「ローカルルールの多さ=一定のルールにあてはめられない」点にあります。特に日本の住所は「ひらがな」「カタカナ」「漢字」「英数字」「記号」の組み合わせから成り、そこに手書き登録時のあいまいさも加わって事情をより一層複雑にしています。 昨今活用が著しいAIでも、現時点では対応しきれないのが実情です。

住所正規化(住所クレンジング)の処理手法

ではどうやって住所正規化、住所クレンジングを実現するかというと「正解となる住所リストと照合する」手法をとることになります。
「正規化したい住所」と「正解となる住所」を照合していきながら、「ケ」「ヶ」「が」「ガ」などの大小文字や旧新漢字のゆれを補正し、階層ごとに住所を分割整理することで、住所の表記ゆれを是正することができます。

つまり、住所正規化の精度はどれだけ正解を保有しているか、すなわち住所辞書の収録件数に大きく依存します。

住所正規化ツール「アドレスクレンジングツール」のご紹介

住所正規化アプリケーション「アドレスクレンジングツール」は、業界トップクラスの約4500万件を収録した住所辞書と照合することで、特殊な住所にも対応します。

京都市内の「通り名」表記をはじめ、北海道の「〇線〇号」、東北地方の「地割」など日本独特の住所事情の対応を海外企業のサービスは不得手としていることが多い中、マップルには日本の住所に対して長年蓄積したノウハウがあります。
文字列だけの正規化ではできない、精度の高い住所正規化が可能です。

アドレスクレンジングツールのシンプルな使用方法

物件リスト(CSV)を取り込んだら、ウィザードに従ってアプリケーションにインポートし、住所辞書と照合して正規化をおこないます。
その後、出力ウィザードに従って正規化した住所をエクスポートするだけ、と使用方法はいたってシンプルです。

オフラインで動作可能であるため、例えば個人情報等の機密性の高いデータに対しても、安全に住所正規化をおこなうことができます。 また、APIのようなセッション課金ではなく、アプリケーション提供なので使用毎の料金を気にせずお使いいただけます。

アドレスクレンジングツールが業務効率をあげる!

アドレスクレンジングツールでは、
・ 表記ゆれ、重複やご住所のクリーニング
・ リスト同士を住所をキーにマッチング
・ 住所を階層別に分割整理
といったことができます。詳しくはこちらでご紹介していますので、あわせてご覧ください。
住所クリーニングやマッチングのみならず、住所分割ツールとしてもご使用いただけるのは、ひとつのポイントです。

これを機に、ぜひ社内に眠る住所データのチェックと整備を行い、使える資産としてはいかがでしょう?現状の業務の効率や改善につながることが期待できます。そして、アドレスクレンジングツールなら、住所データベースのクリーニングにも住所分割にもご利用いただけますので、是非ご導入をご検討ください。

こちらのコラムも
おすすめです

住所の表記ゆれ解消による取引先のインボイス対応チェック
~住所の表記ゆれの対応事例解説~

公益法人リストとアドレスクレンジングツールを使った詳しい方法をご案内しています


関連製品

COLUMN一覧へ