
很多原因都可能导致数据重复,比如用户创建了系统中已经存在的联系人,或是导入过程中没有发现的重复数据,或是人们填表提交自己的信息时却没有发现自己已经在联系人名单里了(可能是名字写法不一样,或是用了不同的电子邮件地址)。
慈善通配备有重复数据匹配规则,可以在新联系人创建时自动运行,也可以在任何时候手动运行来查找重复数据。你还可以根据自己的需要配置这些规则。
要查看去冗余规则,在导航菜单前往:管理 > 发现并合并重复联系人。就会显示下屏:

屏幕上显示的是一个去除所有重复个人联系人的流程范例:
1.
首先使用精确的规则查找重复记录:点击第三行的“使用规则”链接
(联系人类型:个人,级别:精确)。
2.
选择“全部联系人”或某个群组。
3.
点击“继续”。
4.
如果找到了重复记录,合并或删除重复联系人。
5.
现在使用模糊规则再找出那些精确规则下遗漏的重复记录:点击第四行的“使用规则”链接(联系人类型:个人,级别:模糊)。
6.
选择“全部联系人”或某个群组。
7.
点击“继续”。
8.
如果找到了重复记录,合并或删除重复联系人。
慈善通有两类去冗余规则:
l
精确:这类规则着重避免错误匹配,因此使用相对严格的条件。也正因如此,有时可能遗漏一些其实是重复的记录。
系统在导入数据时,自动调用精确规则来查找重复数据,而不需要用户的指令。这个时候采用精确规则,是因为待到将来,与再去重新分开两个被误合并的记录相比,找出此时没有发现的重复数据要容易许多。
一个精确规则的例子是,只有同时满足三个条件才算匹配:同样的email地址、名、姓。这条规则会让Mike Tael 和Michael Tael同时存在于数据库中,因为它们只符合了两个条件:姓和email地址,而不是名、姓、email地址。
当一个新的联系人通过在线登记,包括活动、会员、捐赠、个人信息页面等,或通过慈善通的编程接口(API)被创建时,系统也自动调用默认的精确规则。
l
模糊:这类规则对匹配的定义相对宽泛,希望这样可以尽可能多地发现可能的重复数据。
在用户能够用自己的判断力来判断匹配是否准确的情况下,可以使用模糊规则。也就是说,一个范围较大的可能匹配的结果是被允许的也是有用的。
通过慈善通用户界面添加或编辑联系人时,系统自动调用默认的模糊规则(当联系人通过数据透视图,API,或导入功能而添加或编辑时,自动调用的是默认的精确规则),来检查可能的重复数据。当扫描数据库寻找可能的重复记录时,你或许也想使用模糊规则。
要确定两个联系人是否相同,可以指定最多五个字段供慈善通检查。你也可以设置一个长度值,来指定要比较一个字段中的多少字符。例如,为“名“字段设置长度 2,那么“Mike”与“Michael”就会互相匹配而被当作重复数据,因为它们的前 2 个字符相同。但是如果长度设为 3,“Mike”和“Michael”就不匹配了,因此会被当作不同的联系人而接受。若长度设定值为空,就会对字段值的全长作比较。
系统还为每个字段赋予一个权重,用来标识这个字段在整个匹配中的相对重要性。当某个字段发生匹配时,根据规则这个字段的权重就被加到总权重上。所有字段检查完毕后,如果总权重等于或大于规则设定的阀值,这个联系人就被标识为疑似重复。
运用规则并合并重复联系人
对每一个字段,可以选择是让原始数据显示在右侧(不要勾选中间栏的勾选框),还是使用重复联系人的数据(勾选这个框)。对email地址或电话号码,你可以决定将原始记录和重复记录的数据尽皆保留(将中间栏的勾选框和右边栏的“添加”都选上),从而复制重复记录的数据。注意,有关的分类标签、群组及活动数据(包括活动出席、捐赠,等等)将在原始记录已有数据之外同时出现,而不是将其覆盖。一般说来,在合并后将各自的分类标签、群组和活动都保存,会比较安全。
若是在搜索结果中发现了重复记录,可以很容易地直接从搜索结果中将其合并,而不需要专门经过“查找与合并重复联系人”过程。这是一个对日常工作流干扰最少的极好的数据清理方法。
1.
从搜索结果中,点击每个记录左边的选项框,选择重复记录。
2. 从“- 更多操作 –”菜单选择“合并联系人”。
3. 点击“继续”。