-
公开(公告)号:CN119361126A
公开(公告)日:2025-01-24
申请号:CN202411492394.7
申请日:2024-10-24
Applicant: 哈尔滨工业大学
Abstract: 一种利用病历信息进行肝胆胰疾病智能化辅助诊疗的病历智能体系统,本发明涉及病历智能体系统,属于医学信息处理领域。本发明的目的是为了解决现有技术系统对病历信息挖掘不够充分,没有利用好各个类型的数据,以及整体推理过程的不可见使得系统可解释性差的问题。系统包括:数据处理模块、数值类型肝胆胰疾病分类模块、自然语言类型肝胆胰疾病分类模块、影像检查数据类型肝胆胰疾病分类模块、整合模块、证据判断模块;数值类型肝胆胰疾病分类模块用于获取数值类型肝胆胰疾病分类结果;自然语言类型肝胆胰疾病分类模块用于获取自然语言类型肝胆胰疾病分类结果;影像检查数据类型肝胆胰疾病分类模块用于获取影像检查类型肝胆胰疾病分类结果。
-
公开(公告)号:CN119322824A
公开(公告)日:2025-01-17
申请号:CN202410564432.9
申请日:2024-05-09
Applicant: 哈尔滨工业大学
IPC: G06F16/3329 , G06F16/334 , G06N5/022 , G06F40/194
Abstract: 本发明属于自然语言处理中的人机对话技术领域,具体涉及一种开放域对话领域以知识为中心的回复筛选方法及其系统。步骤1、利用现有的对话数据以及百科知识数据构建所需训练数据,构造伪数据算法;步骤2、利用步骤1构造的训练集对BERT模型进行三阶段训练;步骤3、在测试时,使用步骤2三阶段的得分之和作为最终评分。本发明用以解决现有非结构化知识增强方法存在的知识筛选准确率低以及知识筛选结果与筛选到的回复不一致的问题。
-
公开(公告)号:CN112052318B
公开(公告)日:2024-11-08
申请号:CN202010840252.0
申请日:2020-08-18
Applicant: 腾讯科技(深圳)有限公司 , 哈尔滨工业大学
IPC: G06F16/332 , G06F40/30
Abstract: 本申请公开了一种语义识别方法、装置、计算机设备和存储介质,可基于人工智能技术实现语义识别,通过语义识别模型可提取第一用户输入信息样本的文本特征信息,从而识别该样本的预测语义信息,基于该样本的标签和预测语义信息调整语义识别模型的参数;通过调整后的语义识别模型提取第二用户输入信息样本的文本特征信息,从而识别该样本的预测语义信息;基于该样本的标签和预测语义信息再调整语义识别模型的参数,得到训练完成的语义识别模型;基于该语义识别模型对目标用户输入信息进行语义识别得到语义信息,其中,第一用户输入信息样本无需人工标注,可降低对人工标注的依赖,而采用第二用户输入信息样本对模型进行训练,可提升语义识别准确性。
-
公开(公告)号:CN118551797A
公开(公告)日:2024-08-27
申请号:CN202410564150.9
申请日:2024-05-08
Applicant: 哈尔滨工业大学
IPC: G06N3/006
Abstract: 本发明提出奖励引导的自动越狱提示生成方法。该方法包括步骤1:初始化种子池,采集互联网上流传的越狱提示作为初始种子;步骤2:演化得到新提示,所述步骤2包含种子提示选择和演化两个环节;选择分数最高的种子,通过演化方法基于选中种子得到新的越狱提示;步骤3:评估新提示攻击效果。所述方法采用搜索的方式进行攻击充分利用了已有的越狱提示,具备攻击成功率高、效率高的优点,此外本发明引入奖励模型作为指导信号、提示融合作为演化方法进一步提高了算法的性能。
-
公开(公告)号:CN115203236B
公开(公告)日:2023-05-12
申请号:CN202210836518.3
申请日:2022-07-15
Applicant: 哈尔滨工业大学
IPC: G06F16/242
Abstract: 基于模板检索的文本到SQL生成方法,涉及数据处理技术领域,针对现有技术中针对长度较长的SQL语句解码速度慢的问题,由于非自回归模型的并行性带来时间性能提升的同时,也存在一些缺陷,无法在生成阶段观察到目标序列的上下文信息,因此本申请通过模板检索和多次迭代生成,弥补了非自回归模型的不足,本申请的技术方案对于结构复杂,长度较长的SQL语句,解码速度较传统方式提升了50%以上。本申请技术方案的模板库具有可扩展性,易于迁移,且具有较快的生成速度。
-
公开(公告)号:CN115391608A
公开(公告)日:2022-11-25
申请号:CN202211013667.6
申请日:2022-08-23
Applicant: 哈尔滨工业大学
Abstract: 一种图到图结构的自动标注转换方法,涉及自然语言处理技术领域,针对现有技术中通过人工进行标注规范转换准确率低的问题,本申请通过简单有效的线性变换将源解析器中的核心参数适配到目标解析器中,并继承源解析器中的所有其他参数。图到图线性变换方法能充分继承源标准规范的信息并将其迁移到目标规范,因此本申请能有效避免人工规则和大量平行语料的限制,大幅提升图结构转换的准确率以及获得高质量的图结构标注数据。在少量平行语料帮助下,本申请的方法可以取得比现有的各种基线模型更好的效果。
-
公开(公告)号:CN114398500B
公开(公告)日:2022-09-09
申请号:CN202210112341.2
申请日:2022-01-29
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于图增强预训练模型的事件预测方法,包括:获取事件序列,对事件序列进行预训练获得若干个编码向量,并对若干个编码向量进行聚合,获得事件序列的表示向量;基于事件序列的表示向量,获取事件序列中任两个事件的邻接关系;获取事理图谱,基于事理图谱获取事件的逻辑关系;基于任两个事件的邻接关系和事件的逻辑关系完成事件预测。采用事理图谱作为模型学习事件间关系模式的知识库,事理图谱是描述事件及其逻辑关系的图谱,其知识将为事件预测任务提供有力支撑,将预训练语言模型与图结构信息预测进行融合,既能利用预训练模型中的丰富语言学知识,充分理解各个事件的语义,能通过学习事理图谱结构变量实现图结构信息的预测。
-
公开(公告)号:CN113326352A
公开(公告)日:2021-08-31
申请号:CN202110675339.1
申请日:2021-06-18
Applicant: 哈尔滨工业大学
Abstract: 本发明公开一种基于异构事件图的子事件关系识别方法,包括以下步骤:采集文本,提取文本中的事件,识别事件连接,基于事件和事件连接建立异构初始事件图,转换异构初始事件图,构建异构事件图;基于预训练语言模型BERT,获得异构事件图中每个节点的节点表示,基于节点表示,获得异构事件图的输入特征;对异构事件图中每个节点创建混合跳邻域集,进行信息传播和聚合,获得异构图注意力机制模型;将待测事件对输入异构图注意力机制模型,预测待测事件对的子事件关系。本发明通过混合多种距离邻居的特征表示,聚合来自不同类型的邻居的信息,捕获输入事件对之间的潜在的上下位关系,提高利用异构事件图预测子事件关系的准确性。
-
公开(公告)号:CN111651983B
公开(公告)日:2021-06-18
申请号:CN202010397785.6
申请日:2020-05-12
Applicant: 哈尔滨工业大学
IPC: G06F40/284 , G06N3/04 , G06N3/08
Abstract: 一种基于自训练与噪声模型的因果事件抽取方法,本发明涉及因果事件抽取的方法。本发明的目的是解决现有基于深度学习模型的因果事件抽取方法在有标注数据不足的领域或场景中效果有限的问题。过程为:一、收集已标注的目标领域文本;二、计算一个向量表示;三、计算出概率最大的标签序列;四、训练三中的模型,并对二中的模型进行微调;五、得到大量自标注数据;六、为每个单词计算一个向量表示,计算单词序列生成每个可能的标签序列的概率;七、计算自标注文本中每个单词的噪声矩阵;八、得到由单词序列生成自标注标签序列的概率;九、使用一中有标注数据与五中自标注数据共同训练二、三、六、七中的整体模型。本发明用于因果事件抽取领域。
-
公开(公告)号:CN111400489A
公开(公告)日:2020-07-10
申请号:CN202010269479.4
申请日:2020-04-08
Applicant: 科大讯飞股份有限公司 , 哈尔滨工业大学
IPC: G06F16/34
Abstract: 本发明实施例提供一种对话文本摘要生成方法、装置、电子设备和存储介质,其中方法包括:确定对话文本;将所述对话文本中每一发言人对应的分句输入至对话文本摘要模型中,得到所述对话文本摘要模型输出的所述对话文本对应的摘要;所述对话文本摘要模型用于确定所述对话文本中每一发言人的先验发言人特征表示,并基于所述对话文本中每一发言人对应的分句和先验发言人特征表示,生成所述对话文本对应的摘要;所述对话文本摘要模型是基于样本对话文本中每一发言人对应的样本分句,以及所述样本对话文本的样本摘要训练得到的。本发明实施例提供的对话文本摘要生成方法、装置、电子设备和存储介质,提高了对话文本摘要生成的准确性。
-
-
-
-
-
-
-
-
-