一种用于实体匹配的方法及系统

    公开(公告)号:CN104866625B

    公开(公告)日:2018-08-17

    申请号:CN201510329196.3

    申请日:2015-06-15

    Inventor: 李直旭 杨强 蒋俊

    Abstract: 本申请提供了一种用于实体匹配的方法及系统,该方法包括:根据两个待处理实体的属性值分布分别确定各自的属性区分度;根据所述两个待处理实体的非主属性的值计算得到所述两个待处理实体的属性相似度;将所述属性区分度和所述属性相似度加权求和得到所述两个待处理实体的实体相似度;将所述实体相似度与相似度阈值进行对比,判断所述两个待处理实体的相似性。该方法能够通过利用非主属性的值以及属性分布求得实体相似度,进而进行实体匹配,较好的识别出相同的实体,节约了时间提高了效率。

    一种基于质量控制的数据填充方法及系统

    公开(公告)号:CN104881487B

    公开(公告)日:2018-08-17

    申请号:CN201510304863.2

    申请日:2015-06-04

    Abstract: 本申请公开了一种基于质量控制的数据填充方法,根据数据库中的已有数据确定空缺数据,构建数据库的数据依赖关系并确定数据依赖关系的依赖可信度,根据已有数据和数据依赖关系确定空缺数据中的可推断数据和至少一组不可推断数据,并根据预设规则从至少一组不可推断数据中确定一组待检索数据,根据已有数据和数据依赖关系推断可推断数据并根据依赖可信度计算推断可信度,推断可信度大于预设阈值时填充可推断数据,从外部资源中检索待检索数据并根据依赖可信度计算检索可信度,检索可信度大于预设阈值时填充待检索数据。推断和检索交替执行能在较小的开销下保证较高的填充准确率,且考虑了数据依赖关系的依赖可信度能够使填充的数据的可信度较高。

    一种数据填充方法及系统

    公开(公告)号:CN104850658B

    公开(公告)日:2018-08-17

    申请号:CN201510305681.7

    申请日:2015-06-04

    Abstract: 本申请公开了一种数据填充方法,根据数据库中的已有数据确定所述数据库的空缺数据,并构建所述数据库中所有数据之间的数据依赖关系,重复执行以下步骤,直至所述数据库的空缺数据被填充完毕:根据所述数据库中的已有数据和所述数据依赖关系确定所述数据库的空缺数据中的可推断数据和至少一组不可推断数据,并根据预设规则从所述至少一组不可推断数据中确定一组待检索数据,根据所述数据库中的已有数据和所述数据依赖关系推断并填充所述可推断数据,从所述数据库的外部资源中检索并填充所述待检索数据。这样,通过推断和检索的交替执行,高效且高质量地实现数据集中空缺数据的填充,可以实现在较小的系统开销下获得较高的数据填充准确率。

    一种用于实体匹配的方法及系统

    公开(公告)号:CN105045863B

    公开(公告)日:2018-09-28

    申请号:CN201510407893.6

    申请日:2015-07-13

    Inventor: 李直旭 杨强 蒋俊

    Abstract: 本申请提供了一种用于实体匹配的方法及系统,该方法包括:将待匹配实例对从预先训练的决策树的根节点对应的属性开始进行访问,获取所述待匹配实例对的各属性的属性相似度和置信度;利用所述属性相似度和所述置信度,结合调整系数计算并输出所述待匹配实例对的实体相似度;将所述实体相似度与预设实体相似度阈值进行对比,判断所述待匹配实例对的相似性;其中,所述决策树是利用由已知的匹配实体组成的实例对中共同的非主属性集合和/或主属性集合训练获得。该方法通过利用已知的实例对中两个实体共同的非主属性集合和/或主属性集合训练获得决策树,在进行实体匹配的过程中考虑了非主属性的作用,提高了实体匹配的准确率和召回率。

    一种空间众包中隐私保护的任务分配方法

    公开(公告)号:CN109033865B

    公开(公告)日:2021-10-01

    申请号:CN201810637636.5

    申请日:2018-06-20

    Applicant: 苏州大学

    Abstract: 本发明公开了一种空间众包中隐私保护的任务分配方法,涉及三方实体,包括空间众包平台、代理商和工人,使用基于匿名的数据收集协议,将用户数据安全地发送给空间众包平台;使用基于反向拍卖的任务分配算法来帮助空间众包平台生成任务分配和奖励报酬方案,并且保证用户的诚实性。通过上述方式,本发明提供的空间众包中隐私保护的任务分配方法,使用基于匿名的数据收集协议来保证工人位置数据的安全性,使用基于反向拍卖的任务分配算法来保证工人的诚实性,是基于半可信的模型,有着高安全性、高效性的优点,在空间众包领域有着极其光明的应用前景。

    一种基于社交网络的去中心化矩阵分解的兴趣点推荐方法

    公开(公告)号:CN110008402B

    公开(公告)日:2021-09-03

    申请号:CN201910131400.9

    申请日:2019-02-22

    Applicant: 苏州大学

    Abstract: 本发明公开了一种基于社交网络的去中心化矩阵分解的兴趣点推荐方法,包括:(1)将用户浏览兴趣点的签到数据存储在每个用户自己的用户端;(2)用户在自己的用户端训练模型。通过上述方式,本发明基于社交网络的去中心化矩阵分解的兴趣点推荐方法通过将用户对兴趣点的签到数据保存在自己的用户端,并且在用户端进行矩阵分解模型的训练,解决了集中式矩阵分解模型存储和计算资源浪费的问题,不存在用户个人隐私泄露的风险,从而实现了保护隐私、提高安全系数的功能,在基于社交网络的去中心化矩阵分解的兴趣点推荐方法的普及上有着广泛的市场前景。

    一种基于卷积神经网络的中文车牌识别方法

    公开(公告)号:CN106096602A

    公开(公告)日:2016-11-09

    申请号:CN201610445168.2

    申请日:2016-06-21

    Applicant: 苏州大学

    CPC classification number: G06K9/2054 G06K9/3258 G06K9/6269 G06K2209/01

    Abstract: 本发明公开了一种基于卷积神经网络的中文车牌识别方法,S1:车牌定位,将颜色模板匹配算法和轮廓查找算法相结合,定位出车牌;S2:字符分割,将灰度化后的车牌矩形块,二值化、闭操作、取轮廓后,可以得到外接矩形,从而截取出字符图块;S3:卷积神经网络的设计和训练,其中,卷积神经网络设置为10层结构;S4:字符识别,使用S3中预先训练好的卷积神经网络,作为分类器,将要识别的字符输入,得到分类结果和其置信率。通过上述方式,本发明提供的基于卷积神经网络的中文车牌识别方法,具有准确率极高、普适性极强、处理时间很短等优点,在现代智能交通系统、停车场管理、高速公路收费站等场景上有着广泛的应用前景。

    一种基于格的位置隐私保护方法

    公开(公告)号:CN105610898A

    公开(公告)日:2016-05-25

    申请号:CN201510850772.9

    申请日:2015-11-30

    Applicant: 苏州大学

    CPC classification number: H04L67/18 H04L63/0428 H04L67/16

    Abstract: 本发明公开了一种基于格的位置隐私保护方法,包括如下步骤:(1)预处理阶段,所述LS端根据POI数据库构建索引结构;(2)所述User端利用OT Extension协议访问网格P;(3)所述User端利用OT Extension协议访问网格Q。通过上述方式,本发明基于格的位置隐私保护方法安全高效,能够保证在百万数据点上用户查询的秒级反馈。基于位置服务的广泛应用,使得本发明基于格的位置隐私保护方法具有广泛的市场前景,同时,本发明基于格的位置隐私保护方法对位置隐私保护的进一步推广和研究有着重要意义。

    一种保护隐私的时间序列相似度计算方法

    公开(公告)号:CN105138923A

    公开(公告)日:2015-12-09

    申请号:CN201510486712.3

    申请日:2015-08-11

    Applicant: 苏州大学

    CPC classification number: G06F21/60 G06K9/6203

    Abstract: 本发明公开了一种保护隐私的时间序列相似度计算方法,包括以下操作步骤:S1:将参与双方进行分组为第一参与方和第二参与方,并对第一参与方和第二参与方分别赋予相应的第一时间序列和第二时间序列,同时,在所述第一时间序列中设置有n个k维序列点,所述第二时间序列中设置有m个k维序列点;S2:令第一参与方和第二参与方利用同态加密方式计算欧式距离平方值;S3:令第一参与方和第二参与方实现欧式距离平方值的秘密共享;S4:将第一参与方和第二参与方的相似度结果进行计算。通过上述方式,本发明能够提供一种保护隐私的时间序列相似度计算方法,具有安全性高,适应性强等优点,在保护隐私的时间序列相似度计算的普及上有着广泛的市场前景。

    一种数据填充方法及系统

    公开(公告)号:CN104850658A

    公开(公告)日:2015-08-19

    申请号:CN201510305681.7

    申请日:2015-06-04

    CPC classification number: G06F17/30303 G06F17/30595

    Abstract: 本申请公开了一种数据填充方法,根据数据库中的已有数据确定所述数据库的空缺数据,并构建所述数据库中所有数据之间的数据依赖关系,重复执行以下步骤,直至所述数据库的空缺数据被填充完毕:根据所述数据库中的已有数据和所述数据依赖关系确定所述数据库的空缺数据中的可推断数据和至少一组不可推断数据,并根据预设规则从所述至少一组不可推断数据中确定一组待检索数据,根据所述数据库中的已有数据和所述数据依赖关系推断并填充所述可推断数据,从所述数据库的外部资源中检索并填充所述待检索数据。这样,通过推断和检索的交替执行,高效且高质量地实现数据集中空缺数据的填充,可以实现在较小的系统开销下获得较高的数据填充准确率。

Patent Agency Ranking