-
公开(公告)号:CN119809701A
公开(公告)日:2025-04-11
申请号:CN202510289812.0
申请日:2025-03-12
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06Q30/0202 , G06Q40/04 , G06N3/084 , G06F16/22 , G06F16/2458
Abstract: 本发明公开了一种债券自动定价方法及系统,包括:运行债券表示计算模型,打开债券向量数据库;对新成交债券交易数据进行预处理,得到预处理后的近期新成交债券交易数据,更新债券表示计算模型和债券向量数据库;将预处理后的待预测债券输入债券表示计算模型,得到待预测债券表示向量;构建待预测债券的动态对比库;将待预测债券表示向量和动态对比库输入相似券计算模块,得到与待预测债券对应的相似券有序列表,输入定价模块,得到待预测债券的定价。本发明实现了基于深度学习的债券自动定价以及相似债券自动推荐,提高了债券定价的准确性和效率。给没有经验的交易员或者投资经理提供一个债券的参考价格,提高债券定价市场的智能化与精准化。
-
公开(公告)号:CN118553433A
公开(公告)日:2024-08-27
申请号:CN202410647051.7
申请日:2024-05-23
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) , 中国医学科学院北京协和医院
Abstract: 本发明提供了一种疾病诊疗因果知识图谱构建方法及装置,所述方法包括:载入以患者为中心的疾病诊疗知识图谱,所述知识图谱包括:疾病层,患者属性层,症状、检查及治疗层;从疾病诊疗知识图谱中抽取疾病诊断因果关系链候选数据集;从疾病诊疗知识图谱中抽取治疗决策因果关系链候选数据集;从疾病诊断因果关系链候选数据集中挖掘疾病诊断因果关系链;从治疗决策因果关系链候选数据集中挖掘治疗决策因果关系链;合并疾病诊断因果关系链与治疗决策因果关系链,以患者属性子集为中心构建并输出疾病诊疗因果知识图谱。本发明能够充分利用医疗数据库中结构化、半结构化病历知识,自动学习患者病历知识实体间的因果性关系,提升辅助诊断效率。
-
公开(公告)号:CN116580411A
公开(公告)日:2023-08-11
申请号:CN202310843671.3
申请日:2023-07-11
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明公开了一种基于指令的文档图像处理方法及系统,所述方法包括:获取文档图像,并将所述文档图像输入至文档图像编码模型获得文档图像视觉特征;获取文档处理操作指令,并将所述文档处理操作指令输入至文档处理指令解析模型得到简单操作指令序列;将所述简单操作指令序列输入至文档处理指令编码模型,得到文档指令语义特征;将所述文档图像视觉特征和所述文档指令语义特征输入至文档多模态大模型,得到图像变换操作序列和模态输出内容;获取文档处理修订指令,基于所述文档处理修订指令完成所述文档图像处理。本发明通过深入理解文档格式和内容,有效与用户进行交互,通过解析用户指令,准确完成定制化文档操作,并根据用户反馈进行迭代修订。
-
公开(公告)号:CN113033210A
公开(公告)日:2021-06-25
申请号:CN202110596995.2
申请日:2021-05-31
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F40/295 , G06F40/242 , G06F40/216 , G06K9/62 , G16H70/40
Abstract: 本发明公开了一种基于社交媒体数据分析的药物潜在副作用挖掘方法,所述方法包括:获取社交媒体的药物评论数据并对所述药物评论数据进行数据预处理,得到药物评论预处理数据,再基于经过训练的BERT语言模型识别所述药物评论预处理数据的药物副作用实体;基于排序的实体标准化方式将所述药物副作用实体映射到标准副作用概念词典,得到初始药物副作用概念;根据所述初始药物副作用概念和官方报告药物副作用概念,得到潜在药物副作用概念。本发明实施例通过上述方法通过对广大民众最真实的用药体验进行分析,可以得到药物更加全面的潜在副作用信息。
-
公开(公告)号:CN117894029A
公开(公告)日:2024-04-16
申请号:CN202311863158.7
申请日:2023-12-29
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06V30/412 , G06V30/414 , G06V30/19
Abstract: 本发明公开了一种文档表格自动检测方法,首先根据输入文件类别调用PDF解析器或者OCR模块从文档页中抽取文本块及其属性;其次对文本块进行预处理,结合其位置信息获得特征向量;将文本块特征向量输入二维文本位置编码器,获得蕴含全局信息的文本表示向量;利用文本表示向量对文本块进行分类,输出对应的表格边界类别;通过启发式算法,对分类为表格内文本的文本块进行聚合,生成候选表格区域;最后利用表格边界类别,对候选表格区域进行进一步切分,输出最终表格区域边界。相对于现有技术,本发明能准确、稳定地检测出文档中表格所在位置。
-
公开(公告)号:CN115391569B
公开(公告)日:2023-03-24
申请号:CN202211325252.2
申请日:2022-10-27
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F16/36 , G06F40/295 , G06Q50/04
Abstract: 本发明公开了一种从研报自动构建产业链图谱的方法及相关设备。方法包括:载入面向研报的产业链图谱模式;获取原始研报文档集合,分别对原始研报集合中的每一个原始研报文本进行预处理,得到目标文本;采用实体关系同步抽取模型同时抽取句子序列中的目标三元组和目标独立实体;采用指标属性抽取模型抽取含有指标描述的句子序列中的目标属性对;将获取到的一个或多个所述目标属性对与初始第二三元组进行匹配对齐,得到目标第二三元组;将目标第一三元组和目标第二三元组添加到目标产业链图谱。本发明提供的从研报自动构建产业链图谱的方法能有效应对复杂情境下通过研报文本自动化构建大规模产业链图谱的需求,降低人力损耗与时间成本。
-
公开(公告)号:CN111243572B
公开(公告)日:2022-09-06
申请号:CN202010035558.9
申请日:2020-01-14
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供了一种基于说话人博弈的多人语音转换方法,包括以下步骤:训练时,首先使用常用的音频处理工具(如Librosa等)对所有说话人的语音数据进行声学特征的抽取,然后采用以下步骤进行模型训练:(1)鉴别器主要分为编码层和判别层,使用多层CNN堆叠的鉴别器的编码层逐步下采样得到当前声学特征输入的语义信息表示,并作为鉴别器的判别层的输入。本发明还提供了一种基于说话人博弈的多人语音转换系统。本发明的有益效果是:可直接建模转换关系,在充分考虑了说话人数量较多情况下捕捉说话人音色信息的难点,以多说话人博弈建模语音转换关系,可提供更加稳定、性能更好的转换效果。
-
公开(公告)号:CN113918743A
公开(公告)日:2022-01-11
申请号:CN202111526779.7
申请日:2021-12-15
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F16/51 , G06F16/54 , G06V10/774 , G06V10/764 , G06K9/62
Abstract: 本发明提供了一种面向长尾分布场景下图片分类的模型训练方法,包括:构建第一损失函数,用于加入原型归一化以及角域上与类别数量相关的带有边界的交叉熵分类损失;构建第二损失函数,使得各个类别的原型分散的更加均匀的,与类别数量相关最小角度最大化的正则项损失;构建第三损失函数,用于帮助模型有效训练的特征向量模长大小的正则化损失;将第一损失函数、第二损失函数、第三损失函数组合起来得到最终的损失函数Loss。本发明的有益效果是:本发明可以避免训练数据不均衡带来的模型先验偏差的问题以及进一步提升模型在测试集上的泛化性,从而在长尾分布场景下提升图片分类准确率。
-
公开(公告)号:CN113033154B
公开(公告)日:2021-08-20
申请号:CN202110597702.2
申请日:2021-05-31
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F40/126 , G06F40/242 , G06F40/284 , G06F16/35 , G06K9/62 , G16H70/00
Abstract: 本发明公开了一种基于阅读理解的医学概念编码方法、装置及存储介质,通过将临床医疗文本中的医学概念的编码任务转换为阅读理解任务,将临床医疗文本当做阅读理解中的文章,将若干个标准医学术语作为阅读理解中的选项,通过比较选项与选项之间的相关性以及选项与文本之间的相关性,在所述若干个标准医学术语中确定与所述临床医疗文本最相符的目标标准医学术语,并根据所述目标标准医学术语确定所述临床医疗文本的医学编码。本发明可以实现计算机自动为临床医疗文本中的医学概念进行自动编码,解决了现有技术中采用人工编码的方法将临床医疗文本中的医学概念手动映射为医学术语编码,不仅成本高昂、效率有限而且准确性不高的问题。
-
公开(公告)号:CN120012715A
公开(公告)日:2025-05-16
申请号:CN202411887436.7
申请日:2024-12-20
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) , 中山大学附属第八医院(深圳福田)
IPC: G06F40/126 , G06F40/58 , G06N3/096 , G16H10/60
Abstract: 本发明提供了一种基于大语言模型迁移学习的ICD自动编码的方法及系统,包括:输入低资源语言的电子病历数据,使用大语言模型,识别待编码文本的类型;基于待编码的内容,构建多语言ICD自动编码指令;使用语言迁移ICD自动编码大模型,对待编码内容进行ICD自动编码,输出I CD编码结果;基于低资源语言的编码规则,对输出的ICD编码结果进行验证与对齐,输出最终编码结果。本发明利用大语言模型的多语言能力,对于低资源语言环境下获取人工标注数据较难的ICD自动编码任务,有效减少了人工标注工作量、降低大语言模型在I CD编码任务上的落地成本。
-
-
-
-
-
-
-
-
-