複数の名簿の重複を調べる手順

  
※まだ書きかけです。すみません。
※間違ってたらすみません。
※メモ書きなので、自分でも意味不明な箇所も多いです。ごめんなさい。
  

  
A、B、C、3つの名簿がある場合など。

=============================

(01)まずは、A、B、C、3つの名簿の「それぞれ」の「中」「自体」に、名前(漢字)でダブりがないかをチェック。

・ピボットで簡単にチェックできる。
・各名簿に、「連番」の列を作り、連番を振る。
・顧客IDではやらない。(表のなかに顧客IDの列があったとしても、あえてやらない。)
「Excelデータ」は、「勝手に・かつ・自由すぎるほど自由に書き換えができてしまうため、
また、現時点で、「顧客IDの割り当て自体」が「間違っている」ケースもあるため。
・名前でグループ化して、ドリルスルーで「住所01」や「電話番号」などをチェック。
(実際の名簿では、
住所に、「愛知県」や「名古屋市」「町」等々の文字列が、
「あったり無かったりする」ので、
単純な重複チェックは無理だから。)

粗いチェックでかまわない。
顧客IDの割り当てミスは、「あきらかにミス」というものだけチェックすればいい。
顧客物件マスタにて、わかる範囲内で。

あまりにもダブり件数が多いものは、少し考える。
ただ、手削除のほうがプログラムをつくりよりも早そうだったら、手削除で行く。

=============================

(02)A、B、C、3つの名簿に、「名簿フラグ」の列を新設。

値として、名簿の名前をそれぞれの全行にセット。
「総合連番」の列を作成し、ユニークな連番を全行に付ける。

=============================

(03)AとB、あるいは、AとC、あるいは、ABC全部、を縦に結合し、ピボットで「名前の漢字」で重複状況を見る。

グループ化された件数が20~30件以内なら、各名簿に顧客IDを振りなおさなくてもよい。
そのまま重複分をどこかの名簿から消せばいい。
「名簿フラグ」や「総合連番」から、削除する行を特定する。

逆に、50以上、100件とか、あるなら、顧客IDを振る作業をする。

A、B、C、の名簿のうち、ダブりの少ない名簿は手修正で行丸ごとを削除したほうがいい。
そのほうが効率的。顧客IDは割り当てない。

=============================

(04)どうしても件数が多い場合(100件を超える場合)は、顧客IDをわりあてる。
そのほうが「繰り返しのチェック」が「短時間にできる」ため。
顧客IDを割り当てるのは、そこそこ時間がかかるけど、
でも、何回も「チェックの再現」ができるので、件数が多い場合は、
顧客IDがあったほうがいい。

顧客IDの割り当て方は、
「顧客IDのないリストに顧客IDをつける方法02-02.xls」
を参考にする。
mdbファイル(顧客データベース)も使う。

=============================

(05)「ダブりを消した」、と思った仕上がった「A、B、C、3つの名簿」を再度、たて結合。

・「総合連番02」の列を作成し、ピボットで名前の漢字で重複が無いかチェック。
件数自体は減ってはいると思うので、手修正で不要なレコードを削除しても構わない。

=============================

(06)顧客IDを割り当てた場合は、再度「IDの割り当てミス」が無いかチェックする。

=============================

(07)名簿の氏名が、顧客データベースの顧客の「家族」の場合もある。
その場合、住所や電話番号は同じなら、家族とみなして、
顧客データベースのIDを割り当てる。

=============================