日本郵便が提供する郵便番号データの形式に、新しく「1レコード1行、UTF-8形式」の「utf_all.csv」が追加された事がわかりました(窓の杜)。
郵便番号のデータ利活用の観点から2023年6月更新分より新たな形式でのデータが追加されたとのこと。
以下のような特徴を持っています。
- 読み仮名データは全角カタカナ
- 1郵便番号データに対し、1行で町域名を記載(従来は全角となっている町域名の文字数が38文字を超える場合、また、半角カタカナとなっている町域名のフリガナが76文字を超える場合には、複数レコードに分割)。
- UTF-8形式で記載
- 都道府県別のデータはなし。
まだ、「以下に掲載がない場合」といった補足説明は残っているものの、今後フラグに置き換えることが検討されている模様。
従来の「KEN_ALL.CSV」と比較すると、プログラム側でがんばる必要がなくなるため、開発者から歓迎の声があがっています。