郵便番号データの再構成行き詰まり
京都の通名のカナ表記落ちの修正で行き詰り、今までの手順の見直しが必要になりました。
再度見直すと、ローマ字版でスペースで区切られた町域データが、一部分離されていないものが見つかり、この点の見直しを進めようとしましたが、現行のアルゴリズムではカナ表記の分離が出来ないデータが500件近くに上ることが判明。
解決するには、ローマ字をカナに置き換えるしかないかというところまで追いつめられています。
WEBで探すと、大抵のサンプルは見つかるのですが、さすがにローマ字をカナに変換するサンプルプログラムは見つからず、手詰まり、行き詰まりの状態です。
発想を変えて、ローマ字表記でデータを再構成しようかと悩み中です。
« 自転車の出張修理できる方を募ります | トップページ | 今年も火鉢に火が入りました。 »
「郵便番号データの住所入力データ化」カテゴリの記事
- 郵便番号データの住所入力データ化取り止め(2016.06.27)
- マージ済みデータで一部欠落と勘違いしました(2016.06.26)
- 改めて「**一円」を検証(2016.06.24)
- **の次に番地がくる場合の扱い(2016.06.23)
- ビルデータの扱い変更(2016.06.22)
コメント