-
公开(公告)号:CN118551851A
公开(公告)日:2024-08-27
申请号:CN202410447644.9
申请日:2024-04-15
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06N5/045 , G06F16/332 , G06F16/36 , G06F16/33 , G06F40/35 , G06N5/022 , G06N3/0455 , G06N3/082
Abstract: 本发明提供了一种基于分治智能体的回答质量评估方法及系统,所述方法包括将复杂问题文本及对应的回答文本输入问答拆分单元,以获得语义独立的子问答对;通过检索智能体获取所述子问答对相关的领域知识和评分标准;利用文本提示融合子问答对、领域知识及相关评分标准,输入到大模型以生成子问答对的评估解释;融合各子问答对的评估过程,生成完整问答对的评估逻辑和评估结果。本发明的核心是采用分治的思想对问答对语义匹配过程进行合理分解和合并,高效融入外部知识,有效实现逻辑可控的可解释评估过程。本发明能够准确匹配问答语义、有效利用领域知识、逻辑可控的生成可解释评估过程,从而提高问答评估系统的可解释性,促进评估系统落地和应用。
-
公开(公告)号:CN118446211A
公开(公告)日:2024-08-06
申请号:CN202410502905.2
申请日:2024-04-24
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F40/284 , G06F40/289 , G06Q40/06 , G06N20/00
Abstract: 本发明公开了一种基于大语言模型的交易指令解析方法、系统及介质,该方法包括:输入包含多组投资交易指令的原始文本,使用指令组拆分语言模型对输入的原始文本进行指令组拆分,得到没有交叉依赖指令要素的独立指令组列表;对于独立指令组列表中的每个独立指令组,构建交易指令识别提示语句,输入交易指令识别大模型,生成对应的多条交易指令组成的交易指令列表;对于所得到的交易指令列表中的每条交易指令,与交易业务知识库进行匹配验证,修正与补全对应指令要素,输出修正与补全后的最终交易指令。本发明能准确地理解交易指令,降低人力成本,提高工作效率,完善投资指令的后处理成果,实现业务逻辑上的规则校验与匹配。
-
公开(公告)号:CN119092046A
公开(公告)日:2024-12-06
申请号:CN202411085702.4
申请日:2024-08-08
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) , 中山大学附属第八医院(深圳福田)
Abstract: 本发明提供了一种基于大语言模型的手术操作记录自动编码方法及系统,输入手术操作记录;对手术操作记录进行模态分类,根据不同模态采用不同的预先处理方式,统一处理为文本模态;根据输入的手术操作记录对应的术种,构建证据引导的手术编码自动抽取的提示语句;将处理后的文本送入可关联证据的手术记录自动编码大语言模型,大语言模型提取并输出文本中蕴含的标准手术操作名称;根据制定的映射字典,获取大语言模型生成的标准手术操作名词对应的代码。利用大语言模型语言能力强大的特点,大大降低了训练成本和二次训练的成本,仅需少量的训练数据便可使模型达到可实用水平,提高手术操作记录编码工作的效率和准确性。
-
公开(公告)号:CN118334670A
公开(公告)日:2024-07-12
申请号:CN202311723322.4
申请日:2024-06-11
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V30/148 , G06V30/19
Abstract: 本发明公开了一种印章内容识别方法、系统及介质,该方法包括:获取带有印章的图片,对图片中的印章进行检测定位,得到印章在图像中的位置坐标和类别;根据印章的位置坐标裁剪出印章的图像区域,得到由多边形坐标列表表示的印章内容区域;对多边形坐标进行排序,对印章类别为圆形和椭圆形的印章内容区域,执行基于圆弧曲线的印章内容区域矫正算法,将圆形或椭圆形的印章内容区域矫正成矩形,得到矫正后的印章内容区域;对印章内容区域,执行印章内容识别算法,输出印章的文字内容。本发明能够有效解决印章内容识别问题,完成合同或发票等主体对象名称与印章内容的对比校验,能够节省大量的人工成本,提升企业的办公效率。
-
公开(公告)号:CN116580411B
公开(公告)日:2023-10-20
申请号:CN202310843671.3
申请日:2023-07-11
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明公开了一种基于指令的文档图像处理方法及系统,所述方法包括:获取文档图像,并将所述文档图像输入至文档图像编码模型获得文档图像视觉特征;获取文档处理操作指令,并将所述文档处理操作指令输入至文档处理指令解析模型得到简单操作指令序列;将所述简单操作指令序列输入至文档处理指令编码模型,得到文档指令语义特征;将所述文档图像视觉特征和所述文档指令语义特征输入至文档多模态大模型,得到图像变换操作序列和模态输出内容;获取文档处理修订指令,基于所述文档处理修订指令完成所述文档图像处理。本发明通过深入理解文档格式和内容,有效与用户进行交互,通过解析用户指令,准确完成定制化文档操作,并根据用户反馈进行迭代修订。
-
公开(公告)号:CN116881436A
公开(公告)日:2023-10-13
申请号:CN202311004772.8
申请日:2023-08-09
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) , 中国人民解放军总医院第一医学中心
IPC: G06F16/335 , G06F16/33 , G06F16/36 , G06F16/31 , G06N5/022
Abstract: 本发明提供的基于知识图谱的文献检索方法、系统、终端及存储介质,具体涉及医疗大数据处理技术领域,本方案通过对查询语句进行实体和关系抽取,构建实体集合和关系集合;训练字向量模型并对未登记词进行模糊匹配,获得查询语句中的候选词,并提取出匹配度最高的候选词加入实体集合;基于实体集合和关系集合,生成三元组;基于目标领域知识图谱和目标领域文献,获取三元组对应的文献索引;根据关联度对文献索引排序,根据排序列表输出检索结果。该方案从查询语句的实体、关系、值和未登记字等多个角度进行定位和扩展,能够筛选出与查询语句关联程度最高的文献,实现了对目标领域文献的精确且高效地检索。
-
公开(公告)号:CN115391569A
公开(公告)日:2022-11-25
申请号:CN202211325252.2
申请日:2022-10-27
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F16/36 , G06F40/295 , G06Q50/04
Abstract: 本发明公开了一种从研报自动构建产业链图谱的方法及相关设备。方法包括:载入面向研报的产业链图谱模式;获取原始研报文档集合,分别对原始研报集合中的每一个原始研报文本进行预处理,得到目标文本;采用实体关系同步抽取模型同时抽取句子序列中的目标三元组和目标独立实体;采用指标属性抽取模型抽取含有指标描述的句子序列中的目标属性对;将获取到的一个或多个所述目标属性对与初始第二三元组进行匹配对齐,得到目标第二三元组;将目标第一三元组和目标第二三元组添加到目标产业链图谱。本发明提供的从研报自动构建产业链图谱的方法能有效应对复杂情境下通过研报文本自动化构建大规模产业链图谱的需求,降低人力损耗与时间成本。
-
公开(公告)号:CN111243572A
公开(公告)日:2020-06-05
申请号:CN202010035558.9
申请日:2020-01-14
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供了一种基于说话人博弈的多人语音转换方法,包括以下步骤:训练时,首先使用常用的音频处理工具(如Librosa等)对所有说话人的语音数据进行声学特征的抽取,然后采用以下步骤进行模型训练:(1)鉴别器主要分为编码层和判别层,使用多层CNN堆叠的鉴别器的编码层逐步下采样得到当前声学特征输入的语义信息表示,并作为鉴别器的判别层的输入。本发明还提供了一种基于说话人博弈的多人语音转换系统。本发明的有益效果是:可直接建模转换关系,在充分考虑了说话人数量较多情况下捕捉说话人音色信息的难点,以多说话人博弈建模语音转换关系,可提供更加稳定、性能更好的转换效果。
-
公开(公告)号:CN119943247A
公开(公告)日:2025-05-06
申请号:CN202510444039.0
申请日:2025-04-10
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明公开了一种手术操作记录自动编码方法与系统,包括:获取并进行病人的手术操作记录预处理;选择AI编码功能,基于手术编码模型生成手术编码结果及其对应的证据片段;对编码结果以及其在证据交互模块中对应的证据片段进行审核,并对多编、错编和漏编的编码结果及证据片段进行错误纠正,标记错误原因;对证据片段的顺序进行手工调整;对典型手术操作记录进行收藏,并描述收藏理由;将编码结果及证据片段、审核后的编码结果及证据片段、收藏的手术操作记录和收藏理由保存在数据库模块中。本发明可减少人工编码负担,提升医保结算效率,同时通过持续学习优化模型性能。
-
公开(公告)号:CN119723599A
公开(公告)日:2025-03-28
申请号:CN202411558280.8
申请日:2024-11-04
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本申请提供了一种基于多模态大模型的图片金融指令解析方法及相关装置。方法包括:S1,输入包含投资交易指令的原始文档图片,使用光学字符识别模型对原始文档图片进行文本识别,得到文本块列表;S2,针对文本块列表,构建图片交易指令解析提示语句和位置信息向量,并将图片交易指令解析提示语句和位置信息向量输入图片交易指令解析大模型,由图片交易指令解析大模型输出对应的交易指令列表,交易指令列表包含图片中所有的交易指令;S3,针对交易指令列表,与交易业务知识库进行比对和验证,根据业务规则补充附属要素,以及根据文本特征修正因光学字符识别错误导致的文本错误要素;S4,输出经过上述处理步骤后的完整交易指令。
-
-
-
-
-
-
-
-
-