一种面向科技信息文本的文本摘要生成方法及系统

    公开(公告)号:CN112214996A

    公开(公告)日:2021-01-12

    申请号:CN202011089609.2

    申请日:2020-10-13

    Abstract: 本发明公开了一种面向科技信息文本的文本摘要生成方法及系统,包括:S1、对待处理的科技信息文本进行实体识别和关系抽取,得到科技信息文本中所包含的实体及三元组;S2、判断科技信息文本是否为长文本,若是,则转至步骤S3;否则,将科技信息文本与实体及三元组进行融合构成模型输入信息,转至步骤S4;S3、基于科技信息文本的行文结构,并结合实体及三元组,确定科技信息文本中各个句子的影响力,并从科技信息文本中获取影响力最高的K个句子构成关键句群,将关键句群与实体及三元组进行融合构成模型输入信息;S4、将模型输入信息输入到预训练好的序列到序列模型中,得到文本摘要。所生成的摘要精确度高、可读性强,质量好。

    一种个性化商品推荐方法

    公开(公告)号:CN109903138A

    公开(公告)日:2019-06-18

    申请号:CN201910151051.7

    申请日:2019-02-28

    Abstract: 本发明涉及一种个性化商品推荐方法,包括:接收用户的商品搜索指令;若用户已被分类,计算用户偏好的多维平均标签信息,用户的推荐模型基于多维平均标签信息计算第一多维属性信息,计算第一多维属性信息与商品类别中每个商品的第二多维属性信息的距离,将距离较小的商品推给用户;否则,基于多个商品的第二多维属性信息,计算第一多维平均属性信息,基于第一多维平均属性信息及各类用户的推荐模型,确定适用于该用户的推荐模型。本发明提供的推荐方法,首先对用户聚类,且利用多维的商品标签信息和商品属性信息,使得推荐准确率高;另外,当用户为新用户时,通过注意力迁移学习,利用已有推荐模型形成新用户的推荐模型,以解决冷启动问题。

    一种个性化商品推荐方法

    公开(公告)号:CN109903138B

    公开(公告)日:2021-05-18

    申请号:CN201910151051.7

    申请日:2019-02-28

    Abstract: 本发明涉及一种个性化商品推荐方法,包括:接收用户的商品搜索指令;若用户已被分类,计算用户偏好的多维平均标签信息,用户的推荐模型基于多维平均标签信息计算第一多维属性信息,计算第一多维属性信息与商品类别中每个商品的第二多维属性信息的距离,将距离较小的商品推给用户;否则,基于多个商品的第二多维属性信息,计算第一多维平均属性信息,基于第一多维平均属性信息及各类用户的推荐模型,确定适用于该用户的推荐模型。本发明提供的推荐方法,首先对用户聚类,且利用多维的商品标签信息和商品属性信息,使得推荐准确率高;另外,当用户为新用户时,通过注意力迁移学习,利用已有推荐模型形成新用户的推荐模型,以解决冷启动问题。

    一种面向科技信息文本的文本摘要生成方法及系统

    公开(公告)号:CN112214996B

    公开(公告)日:2024-06-04

    申请号:CN202011089609.2

    申请日:2020-10-13

    Abstract: 本发明公开了一种面向科技信息文本的文本摘要生成方法及系统,包括:S1、对待处理的科技信息文本进行实体识别和关系抽取,得到科技信息文本中所包含的实体及三元组;S2、判断科技信息文本是否为长文本,若是,则转至步骤S3;否则,将科技信息文本与实体及三元组进行融合构成模型输入信息,转至步骤S4;S3、基于科技信息文本的行文结构,并结合实体及三元组,确定科技信息文本中各个句子的影响力,并从科技信息文本中获取影响力最高的K个句子构成关键句群,将关键句群与实体及三元组进行融合构成模型输入信息;S4、将模型输入信息输入到预训练好的序列到序列模型中,得到文本摘要。所生成的摘要精确度高、可读性强,质量好。

    一种科技文本命名实体识别方法
    5.
    发明公开

    公开(公告)号:CN112395879A

    公开(公告)日:2021-02-23

    申请号:CN202011244352.3

    申请日:2020-11-10

    Abstract: 本发明属于文本关键信息抽取领域,具体为一种科技文本命名实体识别方法,包括:采用实体识别标注模型对目标领域科技文本进行实体识别标注;其中该模型训练方法为:将目标领域的标注样本和源领域的部分样本输入源领域标注模型,分别得到目标领域和源领域的深层特征向量,计算该两个向量间的MMD;基于MMD调整源领域标注模型参数;采用新的源领域标注模型为目标领域每个未标注样本预测伪标签,将目标领域的标注样本和带伪标签的样本按比例混合并输入新的源领域标注模型,再次计算MMD,重复上述直至MMD最小,得到实体识别标注模型。本发明是面向多领域、多范围文本的基于迁移学习的命名实体识别,有效解决深度学习对特定领域少量数据学习能力不足的问题。

    一种图像识别系统及其训练方法、图像识别方法

    公开(公告)号:CN119810838A

    公开(公告)日:2025-04-11

    申请号:CN202411869689.1

    申请日:2024-12-18

    Abstract: 本发明属于图像识别相关技术领域,其公开了一种图像识别系统及其训练方法、图像识别方法,该系统中:粗粒度场景感知模块识别出与输入图像最相关的场景;细粒度目标感知模块基于粗粒度场景感知模块所提供的信息计算各特征点与最相关场景下各目标的相似度得分;编码模块具有多分支自注意力计算单元,多分支注意力计算单元基于相似度得分将显著性特征点加入同一个自注意力分支,形成多分支自注意力图像编码,着重对所加入的显著性特征进行编码计算;解码模块对编码特征进行解码,识别输入图像中的目标。通过以上系统,可以降低编码器的计算复杂度,提高重点目标的特征提取能力,减少不同类别目标和图像背景区域的干扰,加快图像处理速度。

    一种小样本图像检测模型的训练方法和图像检测方法

    公开(公告)号:CN119649136A

    公开(公告)日:2025-03-18

    申请号:CN202411800077.7

    申请日:2024-12-09

    Abstract: 本发明公开了一种小样本图像检测模型的训练方法和图像检测方法,属于深度学习技术领域,所述基类训练方法包括:利用支持图像集、已打标的查询图像和类中各个目标类别训练原始图像检测模型直至总损失达到收敛,得到基类图像检测模型;将支持特征和目标类别的语义嵌入输入变分自编码器,相比于特定类的支持特征和重构特征,VAE中间过程的潜在向量包含了更多类原型的一般特征;从分布中采样具有包含语义信息的潜在向量并将其与查询特征进行特征聚合,从而使估计的新类中心更接近真实的类中心;此外以VAE中的重构损失、KL散度、分类损失、回归损失以及语义一致性损失构成总损失,可以较大程度地提升训练精度。

    一种科技信息文本分类方法

    公开(公告)号:CN112199501A

    公开(公告)日:2021-01-08

    申请号:CN202011090173.9

    申请日:2020-10-13

    Abstract: 本发明属于文本分类技术领域,具体涉及一种科技信息文本分类方法,包括:基于每个待分类的科技信息文本的文本特征,对该科技信息文本进行粗粒度弱分类,若分类结果不准确,对该科技信息文本粗粒度强分类,得到粗粒度类别;对文本抽取高层语义信息特征,并采用粗粒度类别辅助粗粒度类别对应的细粒度分类器来基于高层语义信息特征对文本进行细粒度弱分类,若分类结果不准确,采用细粒度强分类器,最终得到该文本的细粒度类别,细粒度强分类器为采用科技文本数据微调已在海量文本数据中训练的深度神经网络模型所得。本发明基于多粒度组合优化进行文本分类,将分类任务进行分解,通过强化简单的子任务性能,高效地提升文本分类任务的准确率和性能。

    一种基于监督的跨模态检索方法、装置、设备及介质

    公开(公告)号:CN112148916B

    公开(公告)日:2024-12-13

    申请号:CN202011044741.1

    申请日:2020-09-28

    Abstract: 本发明公开了一种基于监督的跨模态检索方法、装置、设备及介质,方法包括:对图像模态和文本模态的训练样本数据进行特征提取;将提取的图像数据特征和文本数据特征映射至公共表示空间;分别计算标签空间的损失、公共表示空间中各个模态内和不同模态间的损失、以及图像和文本模态间的不变性损失,并加以不同的权重,得到检索模型的损失函数;通过最小化损失函数来优化检索模型的参数;将目标检索数据利用优化后的检索模型映射到公共表示空间,计算目标检索数据与图文数据集中数据之间的相似度,得到对应的检索排序结果。如此,保留了不同语义数据样本的判别性以及原始数据的语义信息,能更有效地计算跨模态数据间的相关性,具有更高的检索准确率。

Patent Agency Ranking