やっと町域の読み仮名分離完成
30,000件中10件ほどだったのですが、スペースで区切られた町域の読み仮名(スペースなし)を正確に分離できていないことが判り、修正を進めていました。
ようやく、全件正しく分離できるところまで、修正が完了しました。
とはいっても、現状のデータでとの前提付です。
他に急ぎでやらなければいけない事が溜まってしまっているので、郵便番号データの住所データ化は10日間ほど作業中断です。
サイトの更新もしないといけないのですが、それも急ぎの作業が終了後になります。
問題が起きていたのは、ローマ字表記の読み仮名に"O O"、"O U"が含まれるデータです。
殆どの問題は、"O O"、"O U"を含まないレコードを使うことで回避できたのですが、
"O O"、"O U"を含むレコードしか使えないデータも有り、特例的な対応をしています。
今後についても、"O O"、"O U"を含むレコードしか使えないデータが発生した場合、特例的な対応を追加する必要が有ります。
そのあたりは、サイト更新時に明記するようにいたします。
« 塗装剥がれ タッチアップ | トップページ | 残りはひとつ »
「郵便番号データの住所入力データ化」カテゴリの記事
- 郵便番号データの住所入力データ化取り止め(2016.06.27)
- マージ済みデータで一部欠落と勘違いしました(2016.06.26)
- 改めて「**一円」を検証(2016.06.24)
- **の次に番地がくる場合の扱い(2016.06.23)
- ビルデータの扱い変更(2016.06.22)
コメント