住所データの扱いは難しい-2
昨日の記事で、「ローマ字版では、町域データが削られていました。」と書きましたが、ローマ字版には、まだカナ版にない特徴がありました。
ローマ字版では、市と区、郡と町村の間にスペースが入っています。
町域のデータにも、字が含まれる場合スペースが入っています。
カナ版ではスペースが無く、市と区、郡と町村、字のデータの分割が非常に面倒です。
カナ版の町域データをローマ字版の町域データに移して、その後レコードが分割された町域データをマージし、更に必要なデータへの加工作業をするようです。
カナ版とローマ字版の連結クエリーを作って、ローマ字版の町域データの入れ替え(更新)をするためには、重複の無いデータを列を作成する必要があります。
郵便番号、市区町村と、町域データの左から12文字を組み合わせ、重複の無いデータを作ろうとしたのですが、
この4行だけどうしても重複します、
実際に、隣り合う地域で、古いと読み方の町域と新しい読み方の町域が存在しているようです。
幸い、マージしなければいけない町域データは持っていませんので、この4行を除いて町域データを入れ替える方法を検討します。
また、方針を変えなければいけません。
カナのデータとローマ字データでは、データの件数が32件異なっていました。
ローマ字の方が件数が少ないです。
これでは、やはり、カナ版を主にして、市町村、町域、ローマ字のデータをカナ版に入れる方法を検討しなければいけません。
« リヤホイルセンター確認治具 | トップページ | 明日もう一度のお伺いです。 »
「VB.net 業務管理」カテゴリの記事
- Accessフォームで住所→郵便番号変換(2016.06.05)
- 郵便番号は入りませんでした。(2016.05.30)
- 住所→郵便番号変換(2016.05.24)
- BlueTooth USBアダプタ その後(2016.02.12)
- VBAに戻ります。(2015.05.03)
「郵便番号データの住所入力データ化」カテゴリの記事
- 郵便番号データの住所入力データ化取り止め(2016.06.27)
- マージ済みデータで一部欠落と勘違いしました(2016.06.26)
- 改めて「**一円」を検証(2016.06.24)
- **の次に番地がくる場合の扱い(2016.06.23)
- ビルデータの扱い変更(2016.06.22)
コメント