Patent search ap:("哈尔滨工业大学") AND inv:"秦兵" Page 5

41.

发明公开
基于检索增强生成的舆情报告生成方法审中-实审

公开(公告)号：CN119476219A

公开(公告)日：2025-02-18

申请号：CN202411625388.4

申请日：2024-11-14

Applicant: 哈尔滨工业大学

Inventor： 赵妍妍 , 刘宇晟 , 秦兵

IPC: G06F40/166 , G06F16/953 , G06F16/9538 , G06F16/951 , G06F16/34 , G06F18/22 , G06F16/353 , G06N20/00 , G06Q50/00

Abstract: 基于检索增强生成的舆情报告生成方法，涉及人工智能技术领域，针对现有方法生成舆情报告时效性差的问题，本申请可应用于分析社交媒体平台中近期热点话题的舆论情况，通过爬虫或各网站提供的API收集大量的新闻、评论数据，使用大语言模型对收集的新闻进行摘要以及对评论进行立场检测。随后利用大语言模型生成舆情报告。本申请生成的舆情报告时效性强。

42.

发明公开
一种用于复杂事件理解的动态假设验证方法及装置审中-实审

公开(公告)号：CN119088903A

公开(公告)日：2024-12-06

申请号：CN202411150973.3

申请日：2024-08-21

Applicant: 哈尔滨工业大学

Inventor： 丁效 , 蔡碧波 , 付凯 , 刘挺 , 秦兵

IPC: G06F16/33 , G06F40/194 , G06F40/258 , G06F18/214 , G06N5/04

Abstract: 本发明公开了一种用于复杂事件理解的动态假设验证方法及装置，属于自然语言处理技术领域。方法包括以下步骤：S1、采集并标注数据集；S2、构建动态多视角思维代理框架，采用所述数据集对所述动态多视角思维代理框架进行训练，并基于训练后的所述动态多视角思维代理框架对用户关于复杂事件的查询生成综合答案。本发明通过提出一种新颖的动态多视角思维代理框架使语言模型能够主动提出并动态调整假设，通过检索和推理过程验证假设，并最终综合出全面的解决方案。

43.

发明公开
基于大语言模型的医学知识问答系统构建方法及系统审中-实审

公开(公告)号：CN118568221A

公开(公告)日：2024-08-30

申请号：CN202410639259.4

申请日：2024-05-22

Applicant: 哈尔滨工业大学

Inventor： 赵森栋 , 李子健 , 王昊淳 , 强泽文 , 秦兵 , 刘挺

IPC: G06F16/332 , G06F16/36 , G06F18/214 , G16H50/70

Abstract: 基于大语言模型的医学知识问答系统构建方法及系统，本发明涉及计算机技术领域，特别是医学知识问答系统构建方法及系统。本发明的目的是为了解决现有针对医学的大语言模型生成的医学回答准确性低、可靠性差的问题。过程为：构建医学实体抽取模型的训练集；构建医学实体抽取模型；获得训练好的医学实体抽取模型；构建医学实体属性抽取模型的训练集；构建医学实体属性抽取模型；获得训练好的医学实体属性抽取模型；构建医学回答生成模型的训练集；构建医学回答生成模型；获得训练好的医学回答生成模型；基于训练好的医学实体抽取模型、训练好的医学实体属性抽取模型、训练好的医学回答生成模型，对待测医学问题进行处理，输出医学回答。

44.

发明公开
用于视觉语言模型的自适应标记与注意力剪枝方法审中-实审

公开(公告)号：CN117787342A

公开(公告)日：2024-03-29

申请号：CN202311823159.9

申请日：2023-12-27

Applicant: 哈尔滨工业大学 , 度小满科技(北京)有限公司

Inventor： 刘铭 , 王禹鑫 , 汪泽堃 , 单黎平 , 杨青 , 许冬亮 , 秦兵

IPC: G06N3/0455 , G06N3/0499 , G06N3/082 , G06N3/084 , G06N3/096 , G06N3/0985 , G06F18/22

Abstract: 用于视觉语言模型的自适应标记与注意力剪枝方法，涉及数据处理技术领域。本发明是为了解决现有视觉语言模型加速方法处理后的视觉语言模型性能差，最终导致视觉语言模型在处理图像文本匹配时准确率低的问题。本发明包括：获取图像序列和文本序列，将图像序列和文本序列组成原始数据集，将原始数据集划分为训练集、测试集；将修剪器加入到预训练好的主干模型中获得剪枝模型，利用训练集对剪枝模型进行训练，获得训练好的剪枝模型；所述剪枝模型包括：单模态编码器、加入修剪器的跨模态编码器；利用测试集对训练好的剪枝模型进行测试，获得最终的剪枝模型。本发明用于修剪视觉语言模型冗余标记和注意力头。

45.

发明公开
一种基于因果事件抽取模型的因果事件抽取方法审中-实审

公开(公告)号：CN116431789A

公开(公告)日：2023-07-14

申请号：CN202310419495.0

申请日：2023-04-19

Applicant: 哈尔滨工业大学

Inventor： 丁效 , 秦兵 , 刘挺 , 徐焕琛 , 高靖龙

IPC: G06F16/332 , G06F16/33 , G06F16/36 , G06F16/35 , G06F40/30 , G06N3/0455 , G06N3/08

Abstract: 本发明公开了一种基于因果事件抽取模型的因果事件抽取方法，包括以下步骤：基于事件抽取以及因果关系识别两个子任务，构建因果事件抽取模型；获取待输入语句；基于预训练语言模型，对待输入语句进行编码，基于序列标注解码器，对编码的待输入语句进行解码，抽取存在因果关联的事件；基于因果事件抽取模型，构建初始背景图；将事件插入到初始背景图，获得更新背景图；采用图神经网络，对更新背景图，进行编码以及更新，获得抽取的事件的表示；基于分类器以及抽取的事件的表示，获得事件之间的因果关系，实现因果事件的抽取。对不同因果事件对的句子的实验结果证明了本发明的方法抽取复杂因果关系的能力。

46.

发明公开
基于多关系图模型的多模态对话问答生成方法审中-实审

公开(公告)号：CN115712709A

公开(公告)日：2023-02-24

申请号：CN202211451009.5

申请日：2022-11-18

Applicant: 哈尔滨工业大学 , 招商银行股份有限公司

Inventor： 吕姚嘉 , 朱文轩 , 刘铭 , 徐洁馨 , 李秋霞 , 秦兵

IPC: G06F16/332 , H04N21/44 , G06F40/35

Abstract: 基于多关系图模型的多模态对话问答生成方法，涉及一种多模态对话问答生成方法。本发明为了解决现有的多模态对话系统仅考虑场景序列化信息而导致现有模型效果一般的问题。本发明首先将视频序列化切分为多个视频片段，对于每个片段获取该片段的色彩特征、光流特征和音频特征，并拼接起来，再加入位置信息和模态信息得到各个视频片段的序列表示；将每个视频片段视作顶点，构建基于全联通关系的视频图并输入图卷积神经网络，得到视频隐藏层序列以及与原视频序列的融合表示；然后利用相似的方式处理基于视听场景标题和对话历史对应的词向量得到各自对应的文本隐藏层序列以及与原文本序列的融合表示；最后利用神经网络模型生成回答。

47.

发明公开
一种多模态多粒度实体识别系统及实体识别方法有权

公开(公告)号：CN115545018A

公开(公告)日：2022-12-30

申请号：CN202211263174.8

申请日：2022-10-14

Applicant: 人民网股份有限公司 , 哈尔滨工业大学

Inventor： 赵森栋 , 蔡沐祯 , 秦兵

IPC: G06F40/279

Abstract: 一种多模态多粒度实体识别系统及实体识别方法，本发明涉及实体识别系统及实体识别方法。本发明的目的是为了解决当前多模态实体抽取模型中缺少对细粒度图文匹配的建模，导致部分实体识别错误，实体识别准确率低的问题。系统包括：训练集获取模块用于获取训练集；实体识别模型构建模块用于构建实体识别模型；实体识别模型包括多模态多粒度实体识别模型、VGTR模型和CLIP模型；实体识别模型训练模块用于得到训练好的实体识别模型；预测模块用于将待测的匹配图片和文本输入训练好的实体识别模型中的多模态多粒度实体识别模型中，输出标注序列，获得待测的匹配图片和文本中的实体。本发明用于新闻、医疗、军事、农业实体识别领域。

48.

发明公开
一种基于预训练语言模型的文本生成方法有权

公开(公告)号：CN114510924A

公开(公告)日：2022-05-17

申请号：CN202210133050.1

申请日：2022-02-14

Applicant: 哈尔滨工业大学

Inventor： 冯骁骋 , 秦兵 , 顾宇轩 , 刘挺 , 马思成

IPC: G06F40/216 , G06F40/289 , G06F40/30 , G06F16/35

Abstract: 一种基于预训练语言模型的文本生成方法，它属于自然语言处理技术领域。本发明解决了现有加权解码的可控生成方法无法在保证生成文本质量的前提下达到理想风格强度的问题。本发明提出了能够动态调节控制器权重的加权解码框架，该框架使用了一个规整模块，能够根据当前解码位置的语言模型信息对控制器的行为进行约束。如果当前解码位置不适合生成包含目标风格的词语时，规整模块会抑制控制器并使其失效；如果当前解码位置可以生成与目标风格相关的词语时，规整模块会增强控制器并确保在该解码位置生成的词语包含目标风格。本发明方法可以应用于可控文本生成。

49.

发明公开
长句压缩方法及相关装置审中-实审

公开(公告)号：CN114444466A

公开(公告)日：2022-05-06

申请号：CN202011196905.2

申请日：2020-10-31

Applicant: 华为技术有限公司 , 哈尔滨工业大学

Inventor： 冯骁骋 , 秦兵 , 刘挺 , 肖腾朝 , 冷立学 , 陈开济 , 张庆龙

IPC: G06F40/211 , G06F40/284 , G06F40/30

Abstract: 本申请实施例公开了一种长句压缩方法，本申请实施例方法包括：数据处理设备获取原始长句后，根据BERT模型处理原始长句，得到BERT长句，其中BERT长句的内容和原始长句的内容一一对应，BERT长句的内容利用BERT模型中的多层数据，数据处理设备通过预置算法处理该BERT长句，得到压缩后的目标长句，根据本申请实施例提供的技术方案，对原始长句进行压缩时，利用BERT模型中的多层数据，提高了压缩后目标长句的准确率。

50.

发明授权
一种基于预训练的结构化数据生成文本的方法有权

公开(公告)号：CN110609986B

公开(公告)日：2022-04-05

申请号：CN201910940399.4

申请日：2019-09-30

Applicant: 哈尔滨工业大学

Inventor： 冯骁骋 , 秦兵 , 刘挺 , 陈昱宇

IPC: G06F40/126 , G06F40/18 , G06F40/205 , G06N3/04 , G06N3/08

Abstract: 一种基于预训练的结构化数据生成文本的方法，本发明涉及结构化数据生成文本方法。本发明的目的是为了解决在结构化数据生成文本上，现有模型对表格数据进行建模时，没有考虑数据之间的内在隐含关系，导致文本生成准确率低的问题。过程为：一、随机MASK掉若干个三元组中一个三元组中的一个数据，用@代替；根据表格中数据间具有的计算序列关系得到表征@隐去的计算序列；二、得到表格中同一行的所有记录均值池化后的行向量；三、得到预训练模型，保留预训练模型的参数；四：得到表格行向量；五：验证步骤三的预训练模型；六：得到对表格中同一行的所有记录进行均值池化后的行向量；七：得到表格中数据代表的信息。本发明用于生成文本领域。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification