« リヤホイルセンター確認治具 | トップページ | 明日もう一度のお伺いです。 »

2014年11月 5日 (水)

住所データの扱いは難しい-2

昨日の記事で、「ローマ字版では、町域データが削られていました。」と書きましたが、ローマ字版には、まだカナ版にない特徴がありました。Photo

ローマ字版では、市と区、郡と町村の間にスペースが入っています。
町域のデータにも、字が含まれる場合スペースが入っています。

カナ版ではスペースが無く、市と区、郡と町村、字のデータの分割が非常に面倒です。

カナ版の町域データをローマ字版の町域データに移して、その後レコードが分割された町域データをマージし、更に必要なデータへの加工作業をするようです。

カナ版とローマ字版の連結クエリーを作って、ローマ字版の町域データの入れ替え(更新)をするためには、重複の無いデータを列を作成する必要があります。
郵便番号、市区町村と、町域データの左から12文字を組み合わせ、重複の無いデータを作ろうとしたのですが、

この4行だけどうしても重複します、
Photo_2
実際に、隣り合う地域で、古いと読み方の町域と新しい読み方の町域が存在しているようです。

幸い、マージしなければいけない町域データは持っていませんので、この4行を除いて町域データを入れ替える方法を検討します。

また、方針を変えなければいけません。
カナのデータとローマ字データでは、データの件数が32件異なっていました。
Kensu
ローマ字の方が件数が少ないです。
これでは、やはり、カナ版を主にして、市町村、町域、ローマ字のデータをカナ版に入れる方法を検討しなければいけません。

« リヤホイルセンター確認治具 | トップページ | 明日もう一度のお伺いです。 »

VB.net 業務管理」カテゴリの記事

郵便番号データの住所入力データ化」カテゴリの記事

コメント

コメントを書く

(ウェブ上には掲載しません)

トラックバック


この記事へのトラックバック一覧です: 住所データの扱いは難しい-2:

« リヤホイルセンター確認治具 | トップページ | 明日もう一度のお伺いです。 »

スライムパンク防止剤被害

川越市周辺の自転車屋MAP

埼玉県内出張修理店情報

自転車出張修理のブログ

ブログランキング

カテゴリー

無料ブログはココログ