分布式多源异构数据场景下的基础统计指标获取方法

    公开(公告)号:CN111552720B

    公开(公告)日:2023-05-02

    申请号:CN202010339568.1

    申请日:2020-04-26

    Inventor: 杨静 赵欣 赵卓

    Abstract: 本发明提供一种分布式多源异构数据场景下的基础统计指标获取方法,包括以下步骤:S1:在中心计算端和各个数据源端构建计算模块与通信模块;S2:各个所述数据源端根据所述中心计算端的请求调用所述计算模块得到参数值,并将所述参数值通过所述通信模块返回所述中心计算端,从而得到基础统计指标。本发明提供一种分布式多源异构数据场景下的基础统计指标获取方法,中心计算端和各个数据源端之间只需要交换少量数据值,避免将数据源端所有的数据全部发送至中心计算端,大大节约了计算时间以及通讯带宽,实现在多源异构数据场景下的基础统计指标高效获取,同时保护了各个数据源端的数据隐私。

    一种基于具名图的知识图谱时间演化方法

    公开(公告)号:CN107463649A

    公开(公告)日:2017-12-12

    申请号:CN201710620086.1

    申请日:2017-07-26

    CPC classification number: G06F16/367

    Abstract: 本发明提供一种基于具名图的知识图谱时间演化方法,该方法首先,根据需要划分好不同的时间段或时间点。然后,通过具名图来为知识图谱中原有的“三元组”加入一个具名图,向不同具名图添加“三元组”和它所对应的时间,得到一个携带时间描述的“四元组”,格式为( -> -> ,{time})。知识图谱就可以根据读取不同的图来展示不同时空里的同一“三元组”,实现时空演化效果。

    基于信息聚合的全球企业科研基金资助信息半自动查找法

    公开(公告)号:CN113987325B

    公开(公告)日:2024-12-03

    申请号:CN202111290847.4

    申请日:2021-11-02

    Abstract: 本发明提供一种基于信息聚合的全球企业科研基金资助信息半自动查找法,该方法将企业科研资助基金信息进行聚合提取关键词,有效改善企业科研资助信息高度分散和无序化的问题,能高效检索得到有效企业科研资助信息;基于信息聚合,在检索词输入,数据源,结果返回这三方面通过信息聚合技术对企业科研基金信息查找与返回,三重保障,得到高度聚合的企业科研资助信息;解决了企业科研资助信息收录边界问题,可以明确根据爬取的结果检查收录状况;多数据源全方位聚合全球企业科研资助基金信息资源,使得全球科研资助信息更加完善。

    一种基于众包模式的多语种文本标注语料库搭建方法

    公开(公告)号:CN114564584A

    公开(公告)日:2022-05-31

    申请号:CN202210193209.9

    申请日:2022-02-28

    Abstract: 本发明提供一种基于众包模式的多语种文本标注语料库搭建方法,属于智能信息处理技术领域。该方法包括以下步骤:第一,获取文本数据,接着对对所述文本数据进行分类、预处理;将预处理后的文本数据导入生语料库,构成生语料库。第二,对语料标注者进行测验,并根据其标注的质量进行评分;接着对生语料库进行标注。第三,经过专家审查,提供标注语料库。与现有技术相比,本发明的有益效果为:本发明的方法通过对语料进行一系列预处理,并对语料状态进行管理,减少垃圾信息的干扰,提高了语料库质量。

    分布式多源异构数据场景下的基础统计指标获取方法

    公开(公告)号:CN111552720A

    公开(公告)日:2020-08-18

    申请号:CN202010339568.1

    申请日:2020-04-26

    Inventor: 杨静 赵欣 赵卓

    Abstract: 本发明提供一种分布式多源异构数据场景下的基础统计指标获取方法,包括以下步骤:S1:在中心计算端和各个数据源端构建计算模块与通信模块;S2:各个所述数据源端根据所述中心计算端的请求调用所述计算模块得到参数值,并将所述参数值通过所述通信模块返回所述中心计算端,从而得到基础统计指标。本发明提供一种分布式多源异构数据场景下的基础统计指标获取方法,中心计算端和各个数据源端之间只需要交换少量数据值,避免将数据源端所有的数据全部发送至中心计算端,大大节约了计算时间以及通讯带宽,实现在多源异构数据场景下的基础统计指标高效获取,同时保护了各个数据源端的数据隐私。

    基于信息聚合的全球企业科研基金资助信息半自动查找法

    公开(公告)号:CN113987325A

    公开(公告)日:2022-01-28

    申请号:CN202111290847.4

    申请日:2021-11-02

    Abstract: 本发明提供一种基于信息聚合的全球企业科研基金资助信息半自动查找法,该方法将企业科研资助基金信息进行聚合提取关键词,有效改善企业科研资助信息高度分散和无序化的问题,能高效检索得到有效企业科研资助信息;基于信息聚合,在检索词输入,数据源,结果返回这三方面通过信息聚合技术对企业科研基金信息查找与返回,三重保障,得到高度聚合的企业科研资助信息;解决了企业科研资助信息收录边界问题,可以明确根据爬取的结果检查收录状况;多数据源全方位聚合全球企业科研资助基金信息资源,使得全球科研资助信息更加完善。

Patent Agency Ranking