一种智能体训练方法、装置、存储介质及电子设备

    公开(公告)号:CN117235531A

    公开(公告)日:2023-12-15

    申请号:CN202311470747.9

    申请日:2023-11-07

    Applicant: 吉林大学

    Abstract: 本申请公开了一种智能体训练方法、装置、存储介质及电子设备,其中方法包括:获取智能体在当前预设时长接收到的更新优势信号,基于更新优势信号更新智能体的动作网络,获取基于智能体执行动作网络中的动作数据所产生的环境业务数据,基于动作业务分布评估获取动作网络对应的动作业务数据,基于环境业务数据和动作业务数据,获取动作网络对应的混合业务数据,基于混合业务数据对智能体对应的第一状态网络进行状态更新得到第二状态网络,基于第二状态网络确定目标优势信号。采用本申请,通过使用有限的样本对智能体的各动作数据进行考虑,进而在减少计算量的同时对获取的优势信号更加准确,达到降低样本的采集复杂度,提高智能体的训练效率。

    文本聚类方法、装置、电子设备和计算机可读存储介质

    公开(公告)号:CN116150360A

    公开(公告)日:2023-05-23

    申请号:CN202211653394.1

    申请日:2022-12-21

    Applicant: 吉林大学

    Inventor: 程博 李熙铭 常毅

    Abstract: 本申请通过提供一种文本聚类方法、装置、电子设备和计算机可读存储介质,基于用以表示各训练文本的全文语义对应的锚词,得到与锚词相应的锚词模型特征,避免额外嘈杂特征的引入,之后,基于锚词模型特征得到各训练文本的第一聚类结果和第二聚类结果,并基于各第一聚类结果与各第二聚类结果分别确定多个训练文本的自训练目标函数,以及确定自训练目标函数的自训练目标值;最后基于自训练目标值更新文本聚类模型,直到文本聚类模型收敛,将收敛后的文本聚类模型应用于文本聚类,经过不断训练直到收敛的文本聚类模型的准确性和稳定性均在不断提高,并且避免了文本聚类的准确率受到额外嘈杂特征的影响。

    智能决策模型的训练方法、装置、设备以及存储介质

    公开(公告)号:CN115648204A

    公开(公告)日:2023-01-31

    申请号:CN202211172621.9

    申请日:2022-09-26

    Applicant: 吉林大学

    Abstract: 本申请公开了一种智能决策模型的训练方法、装置、设备以及存储介质,属于计算机技术领域。通过本申请实施例提供的技术方案,获取了机器人在目标环境中采集到的外部信息,将外部信息输入智能决策模型,由智能决策模型的分布式执行者模型输出多个动作分支,该多个动作分支均是在获取到该外部信息的情况下,该机器人在该目标环境中可能执行的动作。基于外部信息和该多个动作分支,确定各个动作分支的奖励值分布,也即是对多个动作分支均进行了评价。基于多个动作分支的奖励值分布,进行奖励聚合确定混合奖励和集成奖励。基于所述混合奖励和所述集成奖励以及外部信息对该智能决策模型进行训练,能够达到较为稳定的训练效果。

    模型训练方法、装置、存储介质及电子设备

    公开(公告)号:CN113384875A

    公开(公告)日:2021-09-14

    申请号:CN202110695182.9

    申请日:2021-06-22

    Applicant: 吉林大学

    Abstract: 本申请公开了一种模型训练方法、装置、存储介质及电子设备,属于计算机技术领域。所述模型训练方法包括:计算所述状态信息和所述动作信息对应的状态特征和预测动作信息,所述状态特征包括实际状态特征、预测状态特征和固定状态特征,通过模型基于所述实际状态特征、所述预测状态特征、所述预测动作信息和所述固定状态特征计算学习目标,所述模型至少包括特征模块、前向模块、反向模块和目标模块,基于所述学习目标确定所述模型中的所述特征模块、所述前向模块和所述反向模块对应的训练参数。本申请可以避免噪声电视问题,加强模型的探索能力。

    基于图神经网络的特征识别方法、装置、存储介质及终端

    公开(公告)号:CN112819103A

    公开(公告)日:2021-05-18

    申请号:CN202110242585.8

    申请日:2021-03-04

    Applicant: 吉林大学

    Inventor: 黄强 田原 常毅

    Abstract: 本申请实施例公开了一种基于图神经网络的特征识别方法、装置、存储介质及终端,属于计算机技术领域。方法包括:终端确定目标节点对应的至少一个邻居节点,将目标节点与至少一个邻居节点各自对应的M个特征的值输入到预设的图神经网络模型,得到目标节点与至少一个邻居节点各自对应的预测值,基于预训练的非线性特征选择模型对目标节点与至少一个邻居节点各自对应的M个特征的值及预测值进行处理,得到目标节点中的M个特征各自对应的权重值,基于目标节点中的M个特征各自对应的权重值,从M个特征中确定至少一个关键特征,实现了对图神经网络处理的过程的解释,提高了识别图神经网络模型处理过程中关键决策特征的精准度。

    基于注意力机制和多层级特征融合的实体抽取方法与装置

    公开(公告)号:CN111914097A

    公开(公告)日:2020-11-10

    申请号:CN202010667644.1

    申请日:2020-07-13

    Applicant: 吉林大学

    Abstract: 本申请实施例公开了一种基于注意力机制和多层级特征融合的实体抽取方法与装置,属于计算机技术领域。方法包括:服务器获取待抽取实体的文本数据,并将其转换成字符序列和词序列后,输入到嵌入表示层得到字符嵌入向量组和词嵌入向量组,基于注意力机制和特征提取层对字符嵌入向量组和词嵌入向量组进行特征提取得到全局字符特征和全局词特征,以及对字符嵌入向量组和词嵌入向量组进行特征提取得到局部字符特征和局部词特征,将得到的各个特征输入至特征融合层进行特征融合处理得到多层级融合特征,基于序列标注层对多层级融合特征进行标签标注处理得到类别标注序列,并抽取命名实体,可实现对文本数据资源进行充分挖掘,提升实体抽取的性能。

    网络构建方法、装置、存储介质及电子设备

    公开(公告)号:CN110417594A

    公开(公告)日:2019-11-05

    申请号:CN201910689017.5

    申请日:2019-07-29

    Applicant: 吉林大学

    Inventor: 李玉 常毅 王英

    Abstract: 本发明提供了一种网络构建方法、装置、存储介质及电子设备,构建节点的族群归属度模型;构建节点的高阶关联关系模型;构建节点的族群归属度表示和节点高阶关联关系之间的关系模型;融合所述族群归属度模型、所述高阶关联关系模型及所述族群归属度表示和节点高阶关联关系之间的关系模型,构建统一模型;根据所述统一模型,生成网络中节点的向量表示。本发明使用族群信息对节点表示进行指导和优化,实现在保留高阶关联关系的同时利用族群信息,挖掘网络中的信息,生成更优的网络中节点的向量表示数据。

Patent Agency Ranking