-
公开(公告)号:CN119943045A
公开(公告)日:2025-05-06
申请号:CN202510085183.X
申请日:2025-01-20
Applicant: 中水北方勘测设计研究有限责任公司
IPC: G10L15/22 , G06F16/3329 , G06N5/04 , G06N5/022 , G06T13/40 , G06F9/50 , G10L15/18 , G10L15/187 , G10L15/04 , G10L15/26 , G10L13/06
Abstract: 本发明涉及数字人技术领域,公开了一种数字人语音交互优化方法及系统,通过预训练的语音识别模型获取用户的实时语音流,得到实时语音流的文字识别结果;将文字识别结果输入预训练的大语言模型,生成回答文本;将回答文本通过预训练的语音合成模型合成回答语音流;根据语音识别模型的识别延迟判断是否需要添加语气词;根据当前对话的上下文通过预训练的上下文感知模型选择目标语气词,并将目标语气词插入回答语音流的最前端,得到更新后的回答语音流;将回答语音流通过音频输出模块进行实时播放,实现数字人的语音交互。本发明能够降低用户对延迟的感知,提升系统的响应速度,使得语音交互更加自然、流畅,提升用户使用体验。
-
公开(公告)号:CN120087329A
公开(公告)日:2025-06-03
申请号:CN202510207457.8
申请日:2025-02-25
Applicant: 中水北方勘测设计研究有限责任公司
IPC: G06F40/12 , G06F40/151
Abstract: 本发明涉及数据处理技术领域,公开了一种基于结构理解的文档解析向量化方法及装置,方法包括:获取待解析文档;基于待解析文档的文档格式采用目标解析工具和/或目标解析参数解析待解析文档,得到解析结果;将解析结果整理为至少一组JSON数据体;将JSON数据体转换为向量化数据;其中,待解析文档包括至少两种文档格式,不同的文档格式对应不同的目标解析工具和/或目标解析参数,文档格式至少包括DOC和PDF。基于上述方案,能够将所有的解析结果统一转换为统一的JSON数据体,再转换为向量化数据,便于后续的数据处理、分析和机器学习应用,并且使得得到的解析结果最优。
-
公开(公告)号:CN119829814A
公开(公告)日:2025-04-15
申请号:CN202510097188.4
申请日:2025-01-22
Applicant: 中水北方勘测设计研究有限责任公司
IPC: G06F16/9038 , G06F16/903 , G06F40/30 , G06F16/338 , G06F16/334 , G06F16/901
Abstract: 本发明涉及信息检索技术领域,公开了一种聚合多维度检索策略的检索方法。发明进行检索时,获取用户输入的检索词;基于所述检索词,分别使用各检索策略进行检索,获得各检索策略的检索结果;将所述检索词,输入语义判断模型,得到检索策略权重调整参数;根据所述检索策略权重调整参数进行计算,获得各检索策略的最终权重;根据所述各检索策略的最终权重,对所述各检索策略的检索结果进行排序,得到最终的检索结果。通过使用语义判断模型准确获得的检索策略权重调整参数,针对用户检索词的语义特征,动态调整全文检索、向量化检索和图数据库检索的权重,确保在不同查询场景下都能获得最优的检索结果。
-
-