Arbutus官网(中国)
当前位置: 主页 > 资源中心 > 文档 >

Arbutus-函数解析对比功能

时间:2015-07-06 15:19来源:未知 作者:admin 点击:
在Arbutus数据分析中,对于字符、日期、数值型的对比,一般有三个函数应用较多,分别是DIFFERENCE\NEAR\SIMILAR,根据不同的应用场景,可以分别选择不同的函数进行应用,具体如下。

DIFFERENCE( )

DIFFERENCE() 会对2个字符串 (C1 和 C2)进行对比,并且返还1个正整数值为差异值结果。
 
函数格式
DIFFERENCE(C1, C2 <,F>)
C1 C2为进行对比的字符串,F为关闭精确匹配,如大小写区分等,默认情况下,若不输入F,则该函数执行精确匹配。
示例
DIFF('abc', 'abcd') = 1
DIFF('abcdef', bcdefg') = 2
DIFF('abcd', 'efghij') = 6
DIFF('abcd', 'abcd') = 0
DIFF('abc', 'DBE') = 3
DIFF('abc', 'DBE', F) = 2
 
注意:Difference函数是有后一个字段的每一个字符,与第一个字段每一个字符进行逐位比较。
 

NEAR( )

NEAR( )函数在2个域之间进行一个模糊对比,来判断Field1与Feild2的差值是否小于等于所设置的阀值,若小于等于阀值则为Ture,大于阀值则为False。Near函数可以被用于数值、字符或日期之间的值对比。
  对于数值域,差值需要被指定为0或者一个正数,near会将2个数值的差值与阀值进行比较。
  对于日期域,差值需指定为0或者一个表示天数的正数。对于时、分、秒的对比,差异阀值必须是一个表示一个整天的分数的表达式,大部分情况下会使用已经过去的时间格式,near会将2个日期相差的天数或者时分秒数和阀值进行对比。
 
  对于字符域,差异阀值必须是0或者一个正整数,near函数会利用最佳字符串比对法则进行比对。
函数格式
NEAR(field1,field2,difference)
备注: Field1 或Field2 可以为表达式或实际值
示例
NEAR(1093,1079,50) = T
NEAR(“JANE”,“JAMES”,2) = T
NEAR(“JANE”,“JAMES”,1) = F
NEAR(‘20110130‘,‘20110215‘,10) = F
NEAR(‘10:25:42‘,‘11:19:30‘,‘e01‘)=T
NEAR(‘10:25:42‘,‘11:50:30‘,‘e01‘)=F
注意:Near函数对比时区分大小写,在字符对比上,和Similar函数相近,日期和数值对比时,差异值为相差的值。
 

SIMILAR( )

SIMILAR( ) 支持日期、字符、数值形式的2个域之间的模糊对比,并返还逻辑判断。Similar在对比数值和日期形式的域或值时,先将它们转化为字符型,然后进行对比,输出结果。
 
函数格式
SIMILAR(field1,field2,difference)
field1和field2分别为2个域,difference为设定的差异阀值
若2个域之间的差异值小于等于“difference”设置的差异阀值,则返还为“真”,反之则为“假”。
备注:如果未设置difference则默认为1
备注: Field1 或Field2 可以为表达式或实际值
 
 
示例
SIMILAR(1093.00,1079.00,1) = F
SIMILAR(1093.00,1079.00,2) = T
SIMILAR(‘20110130‘,‘20110215‘,2) = F
SIMILAR(‘20110130‘,‘20110215‘,3) = T
SIMILAR("I1093","11079",1) = F
SIMILAR("I1093","11079",2) = T
SIMILAR("123 Main St.","123 MAIN ST",0) = T
 
注意:Similar函数进行对比时,先将日期和数值转化为字符,再进行对比,且该函数在对比时不区分大小写。 (责任编辑:admin)
------分隔线----------------------------