文本引导分子生成方法、装置及存储介质

    公开(公告)号:CN118230805A

    公开(公告)日:2024-06-21

    申请号:CN202410178684.8

    申请日:2024-02-11

    Abstract: 本申请实施例提供一种文本引导分子生成方法、装置及存储介质,所述方法包括:确定分子描述语言的语言表征向量;将所述语言表征向量输入至训练后的第一扩散语言模型中,获取所述训练后的第一扩散语言模型输出的初始分子;将所述初始分子输入至训练后的第二扩散语言模型中,获取所述训练后的第二扩散语言模型输出的目标分子。本申请实施例提供的文本引导分子生成方法、装置及存储介质,通过第一扩散语言模型和第二扩散语言模型这两阶段的扩散过程分别捕捉文本的语义描述和修正生成分子的语法错误,从而生成目标分子,能够提高生成分子的准确率。

    用于混合表格文本证据的事实验证方法、装置及存储介质

    公开(公告)号:CN118230340A

    公开(公告)日:2024-06-21

    申请号:CN202410178548.9

    申请日:2024-02-09

    Abstract: 本申请实施例提供一种用于混合表格文本证据的事实验证方法、装置及存储介质,所述方法包括:获取证据数据,所述证据数据包括表格证据数据和文本证据数据;基于预训练语言模型和关系图网络模型获取目标图节点表示矩阵;基于所述证据数据和注意力机制对所述目标图节点表示矩阵进行聚合,获取事实验证结果。本申请实施例提供的用于混合表格文本证据的事实验证方法、装置及存储介质,通过运用图神经网络方法结合预训练语言模型挖掘证据和断言以及证据和证据之间的关联,利用证据级别的信息聚合和注意力机制辅助模型区分有效和无效证据,可以提高模型基于证据进行事实验证的准确性。

    基于时序元学习的动态知识图谱预测方法和装置

    公开(公告)号:CN116108195A

    公开(公告)日:2023-05-12

    申请号:CN202211551913.3

    申请日:2022-12-05

    Abstract: 本申请公开了一种基于时序元学习的动态知识图谱预测方法和装置,其中方法包括:获取多个历史时刻对应的知识图谱;将所述多个历史时刻对应的知识图谱输入至知识图谱预测模型,得到所述知识图谱预测模型输出的当前时刻对应的知识图谱的预测结果;所述知识图谱预测模型是基于多个在时序上相互关联的元学习任务对基模型进行训练后得到的;各个元学习任务中的支持集和查询集是基于相邻历史时刻对应的知识图谱确定的。本申请提供的方法和装置,提高了知识图谱预测模型对于动态知识图谱中时序元知识的学习能力,提高了知识图谱预测模型对于未知实体或者未知关系的预测能力,提高了动态知识图谱用于事件预测的准确性。

    分布式可视化系统及方法

    公开(公告)号:CN107864074A

    公开(公告)日:2018-03-30

    申请号:CN201711416354.4

    申请日:2017-12-22

    Inventor: 王亮 吴书 白平

    CPC classification number: H04L43/045 G06F3/0484 G06F3/0486 G06F2203/04806

    Abstract: 一种分布式可视化系统,包括:一总控制器,用于将用户的操作转换成相应的指令,并将所述指令中与各显示终端相关的第一指令分别输出至与该显示终端相连的子服务器;多个子服务器,一端与所述总服务器相连,以及另一端与多个显示终端一一连接,各子服务器用于根据所述第一指令确定第二指令;以及多个显示终端,用于根据各第二指令执行相应的操作,以及显示所述操作的操作结果。本发明尤其适合大数据的可视化,能够将一个可视化任务拆分成多个子任务,避免了更新部分数据时需要刷新整个大屏的弊端,此外,也能同时执行多个独立的可视化任务,使得可视化的数据相互独立,也提高了数据展示的灵活度和加载速度。

    基于动态表达学习的不实信息检测方法和装置

    公开(公告)号:CN106910013A

    公开(公告)日:2017-06-30

    申请号:CN201710085225.5

    申请日:2017-02-16

    CPC classification number: G06Q10/063 G06Q50/01 H04L63/12 H04L63/302 H04L63/306

    Abstract: 本发明公开一种基于动态表达学习的不实信息检测方法,包括以下步骤:获取待检测信息;利用预先建立的检测模型对所述待检测信息进行检测;输出检测结果;其中,检测模型如下建立:步骤S1,首先建模联合表示用户信息和该用户行为信息的某一事件的动态行为表达式;用户信息包含用户的特征和用户可信度,行为信息包含行为类型;步骤S2,一个事件由不同信息组成,结合步骤S1中的所述动态行为表达式,最终得出事件可信度检测表达式;步骤S3,运用时间特征矩阵来取得在信息传播过程中用户动态行为特征连步骤S4,生成用户特征表达;步骤S5,利用配对学习法估算检测模型参数。

    用户属性推断模型的训练方法、推断方法和电子设备

    公开(公告)号:CN115796282A

    公开(公告)日:2023-03-14

    申请号:CN202211494136.3

    申请日:2022-11-25

    Abstract: 本申请提供一种用户属性推断模型的训练方法、推断方法和电子设备,涉及人工智能和深度学习技术领域。该方法包括:获取多个用户各自的推文内容样本,以及各用户对应的属性标签;基于多个用户各自的推文内容样本,构建多个用户对应的用户关系图;分别对多个用户各自的推文内容样本进行编码,得到多个用户各自对应的初始编码特征;将多个用户各自对应的初始编码特征和用户关系图输入至初始用户属性推断模型中,得到各用户对应的预测属性;根据各用户对应的预测属性和属性标签,对初始用户属性推断模型进行更新,以得到训练后的用户属性推断模型,解决了现有技术中如何对未知用户属性进行推断的问题,且提高了推断结果的准确度。

    基于卷积神经网络的显著信息检测方法及装置

    公开(公告)号:CN106844765B

    公开(公告)日:2019-12-20

    申请号:CN201710098500.7

    申请日:2017-02-22

    Abstract: 本发明公开了一种基于卷积神经网络的显著信息检测方法及装置。所述方法包括:对于所爬取的数据集,确定每个事件发展各个阶段的时间分布,并确定时间节点;对于每一个事件,根据所确定的时间节点将所述事件样本对应的所有的事件信息分成若干份,将每一个时间阶段内事件信息的文本内容拼接成一个段落,生成段落数据集;根据段落的分布表达算法学习所述段落数据集中每个段落的无监督表达向量;对于一个事件,将每个段落的无监督表达向量输入到深度卷积神经网络模型,利用多层卷积操作得到事件各个阶段的低层到高层的表达,通过k最大池化操作提取事件各个阶段的关键特征,最后通过一个全连接层对输入的信息进行不实信息的分类。

    一种数据特征选择和预测方法及装置

    公开(公告)号:CN106777891A

    公开(公告)日:2017-05-31

    申请号:CN201611043691.9

    申请日:2016-11-21

    Inventor: 吴书 王亮 谭铁牛

    CPC classification number: G06F19/32

    Abstract: 本发明公开了数据特征选择和预测方法及装置。方法包括:步骤S1、采集用户信息和对应的血压观测数据,形成数据集,并从所述数据集中剔除异常值点;步骤S2、从所述数据集中的用户信息中提取用户特征;步骤S3、从所述数据集中的血压观测数据提取血压特征;步骤S4、将所提取的用户特征和血压特征进行归一化处理,处理结果作为训练样本形成训练集,利用所述训练集中的训练样本输入至支持向量机模型和/或梯度迭代决策树模型之中,训练得到预测模型。本发明利用医学知识指导数据的清洗和特征工程选取工作,有效提升模型的准确性。

    一种基于多视角数据和循环网络构建序列预测模型的方法

    公开(公告)号:CN106600347A

    公开(公告)日:2017-04-26

    申请号:CN201710041240.X

    申请日:2017-01-17

    Abstract: 本发明公开了一种基于多视角数据和循环网络的序列预测方法,其包括:获取多个用户在不同时刻购买的多个物品的数据,并对数据进行预处理;对所述预处理后的数据进行组合获取物品表达,将各用户物品表达按购买时间排序,形成用户序列;将当前用户序列送到循环网络模型的输入端进行训练;所述循环网络的处理端建立当前用户的表达,输出端计算当前用户对物品的偏好值;更新所述循环网络模型参数;将下一用户序列送到循环网络的输入端进行训练,直至所有用户序列都训练一次称为一次迭代;每次迭代更新全部偏好值的和,迭代多次,直至偏好值的和达到极大值或极小值,迭代结束。

    一种基于时序数据的推荐系统攻击检测方法

    公开(公告)号:CN103678709B

    公开(公告)日:2017-02-22

    申请号:CN201310746814.5

    申请日:2013-12-30

    Inventor: 王亮 吴书 王保兴

    Abstract: 本发明公开了一种基于时序数据的推荐系统攻击检测方法,包括:利用用户-项目偏好程度数据集和频繁项集挖掘技术,得到用户组和项目组;为每对用户组和项目组计算组偏好程度值比例特征;将项目组中各项目的所有偏好程度按操作时间形成时序的偏好程度数据;为每对的用户组和项目组计算组偏好程度时间间隔特征;为用户组计算组平均熵特征;为每一用户组,选择其对应最大的组偏好程度值比例特征和最大的组偏好程度时间间隔特征,并依次利用上述三种特征对用户组进行排序,得到三个有序的用户组序列;综合所述三个有序的用户组序列,得到一个整体有序的用户组序列,从而得到最可能的攻击用户组;通过组偏好程度值比例特征得到最有可能的目标项目组。

Patent Agency Ranking