面向多源异构数据融合的数据源选择方法

    公开(公告)号:CN111309755B

    公开(公告)日:2021-10-01

    申请号:CN202010091175.3

    申请日:2020-02-13

    Abstract: 面向多源异构数据融合的数据源选择方法,属于大数据分析技术领域。解决了现有大数据分析采用人工采集的方式,存在分析效率低且存在大量的资源浪费的问题。基于异构数据源集合实现,建立数据分析任务目标数据集的属性集在属性集A中随机抽取了一个目标属性作为搜索属性,在数据源中搜索获得数据源集合P;将数据源集合P中每个元素Pi均构建为一个集合{Pi},构成集合T;计算集合T中每个子集合的分数;获取分数最大的子集合Tmax;判断集合Tmax的属性是否包含所有目标属性,若是,再判断是否包含多余的属性,包含多余属性进行重新选择,若是不包含所有目标属性,继续搜索,利用计算目标数据源集合的判别函数值,若函数值变大则继续搜索,否则停止搜索获得目标数据源集合。

    机器学习模型超参数的调优方法

    公开(公告)号:CN111553482A

    公开(公告)日:2020-08-18

    申请号:CN202010276428.4

    申请日:2020-04-09

    Inventor: 王宏志 王春楠

    Abstract: 机器学习模型超参数的调优方法,本发明涉及超参数的调优方法。本发明的目的是为了解决现有超参数优化调优方法准确率低、效率慢,费用高的问题。过程为:一、构建已知经验信息;从ΛPN中随机选取N/2个超参数配置进行评估,并将评估信息存入ExpInfo中;二、将已知经验信息转化为分类数据集;三、从所有超参数中挑选出关键超参数;四、利用KeyPars推测出Num组最优超参数配置;五、评估ExpNew中的超参数配置并更新已知经验信息;六、重复执行二至五t次,最后输出已知经验信息中最佳的超参数配置推荐给用户。本发明用于超参数的调优领域。

    面向多源异构数据融合的数据源选择方法

    公开(公告)号:CN111309755A

    公开(公告)日:2020-06-19

    申请号:CN202010091175.3

    申请日:2020-02-13

    Abstract: 面向多源异构数据融合的数据源选择方法,属于大数据分析技术领域。解决了现有大数据分析采用人工采集的方式,存在分析效率低且存在大量的资源浪费的问题。基于异构数据源集合实现,建立数据分析任务目标数据集的属性集在属性集A中随机抽取了一个目标属性作为搜索属性,在数据源中搜索获得数据源集合P;将数据源集合P中每个元素Pi均构建为一个集合{Pi},构成集合T;计算集合T中每个子集合的分数;获取分数最大的子集合Tmax;判断集合Tmax的属性是否包含所有目标属性,若是,再判断是否包含多余的属性,包含多余属性进行重新选择,若是不包含所有目标属性,继续搜索,利用计算目标数据源集合的判别函数值,若函数值变大则继续搜索,否则停止搜索获得目标数据源集合。

    一种网络特征社区查找方法

    公开(公告)号:CN111274498A

    公开(公告)日:2020-06-12

    申请号:CN202010075210.2

    申请日:2020-01-22

    Abstract: 一种网络特征社区查找方法,属于网络社区构建技术领域。解决了现有升级版的社区搜索和特征社区查找存在的效率低且适应性差的问题。本发明根据真实的社区的内部结构特征和外部结构特征,建立社区节点的内部连结密度评估函数;建立社区节点的外部连结密度评估函数;对待搜索的网络社区的属性和给定属性之间的相关度进行量化,建立网络社区的属性相关性评估函数;对社区节点的内部连结密度评估函数、社区节点的外部连结密度评估函数和量化的待搜索的网络社区的属性和给定属性相关度的函数进行融合,获取函数RACSF;利用NSS节点选择策略和弹性ISC循环终止条件对函数RACSF进行优化,获取目标社区结构的最优解为最终查找的特征社区。本发明适用于网络特征的查找使用。

    一种网络特征社区查找方法

    公开(公告)号:CN111274498B

    公开(公告)日:2023-06-23

    申请号:CN202010075210.2

    申请日:2020-01-22

    Abstract: 一种网络特征社区查找方法,属于网络社区构建技术领域。解决了现有升级版的社区搜索和特征社区查找存在的效率低且适应性差的问题。本发明根据真实的社区的内部结构特征和外部结构特征,建立社区节点的内部连结密度评估函数;建立社区节点的外部连结密度评估函数;对待搜索的网络社区的属性和给定属性之间的相关度进行量化,建立网络社区的属性相关性评估函数;对社区节点的内部连结密度评估函数、社区节点的外部连结密度评估函数和量化的待搜索的网络社区的属性和给定属性相关度的函数进行融合,获取函数RACSF;利用NSS节点选择策略和弹性ISC循环终止条件对函数RACSF进行优化,获取目标社区结构的最优解为最终查找的特征社区。本发明适用于网络特征的查找使用。

    基于自动机器学习技术的摘要生成系统及方法

    公开(公告)号:CN115169327A

    公开(公告)日:2022-10-11

    申请号:CN202210897321.0

    申请日:2022-07-28

    Abstract: 基于自动机器学习技术的摘要生成系统及方法,具体涉及利用自动机器学习技术自动生成文本摘要的系统及方法,为解决摘要生成方法不能同时兼顾摘要的有效性和时效性,也不能针对文本的各种特征属性自动选择效果好的摘要方法,导致摘要内容好坏不定的问题,系统依次包括获取模块、生成模块、输出模块;生成模块依次包括分句模块、清洗模块、词嵌入模块、句子嵌入模块、摘要句评定模块。方法先获取文本集及对应的摘要;建立自动机器学习模型,将文本集输入自动机器学习模型内利用自动机器学习技术进行训练,输出所述每个文本的摘要,得到训练好的模型;将待生成摘要的文本输入训练好的自动机器学习模型内,输出所述文本的摘要。属于摘要生成领域。

Patent Agency Ranking