-
公开(公告)号:CN117973337B
公开(公告)日:2024-10-11
申请号:CN202410102694.3
申请日:2024-01-24
Applicant: 中国科学院自动化研究所
IPC: G06F40/18 , G06V30/413 , G06V30/414
Abstract: 本发明提供一种表格重建方法、装置、电子设备及存储介质,应用于图像处理技术领域。该方法包括:获取表格图像;提取所述表格图像的图像特征,并根据所述图像特征确定所述表格图像的单元格类别、单元格坐标以及单元格像素掩码;根据所述单元格坐标和所述单元格像素掩码进行网格线重建得到第一表格,根据所述单元格类别对所述第一表格进行单元格合并得到第二表格;其中,所述单元格类别包括空白单元格、基础单元格以及合并单元格。
-
公开(公告)号:CN117764071A
公开(公告)日:2024-03-26
申请号:CN202311521798.X
申请日:2023-11-15
Applicant: 中国科学院自动化研究所
IPC: G06F40/295 , G06F18/22 , G06F40/216
Abstract: 本发明提供一种可控文本生成方法、装置、电子设备及存储介质,应用于自然语言处理技术领域。该方法包括:获取输入文本;确定与所述输入文本关联的至少一个知识文本;分别对所述至少一个知识文本中的每个知识文本指代消解处理,得到知识修改文本,所述指代消解处理用于将所述知识文本中的实体词更新为事实性更强的实体词;基于所述输入文本和所述知识修改文本生成可控文本。
-
公开(公告)号:CN117332273A
公开(公告)日:2024-01-02
申请号:CN202311324549.1
申请日:2023-10-13
Applicant: 中国科学院自动化研究所
IPC: G06F18/214 , G06F18/23213 , G06F18/25 , G06N3/0464 , G06N3/0455 , G06N3/0442 , G06N3/084 , G06F40/30 , G06F40/58 , G10L15/26 , G06N3/048
Abstract: 本发明提供一种语音翻译模型训练方法、装置、电子设备及存储介质,应用于自然语言处理技术领域。该方法包括:获取源语言语音数据;确定所述源语言语音数据的语义表征信息和声学表征信息,并将所述语义表征信息和所述声学表征信息进行融合处理,得到语音表征序列;基于所述语音表征序列对语音翻译模型进行训练;其中,所述语义表征信息用于指示所述源语言语音数据的语义特征,所述声学表征信息用于指示所述源语言语音数据的声学特征。
-
公开(公告)号:CN117149987A
公开(公告)日:2023-12-01
申请号:CN202311426764.2
申请日:2023-10-31
Applicant: 中国科学院自动化研究所
IPC: G06F16/332 , G06F18/22 , G06F18/214 , G06F40/35 , G06F40/211 , G06F40/242
Abstract: 本发明属于自然语言处理技术领域,提供了一种多语言对话状态追踪模型的训练方法及装置,该多语言对话状态追踪模型的训练方法包括:获取源语言数据;基于多语词典对多个对话上下文信息进行语码转换,得到语码转换对话上下文信息;以语码转换对话上下文信息为训练样本,以第一函数为训练损失函数,对多语言训练模型进行多任务联合训练,得到多语言对话状态追踪模型。本发明所述方法通过设计多种微调任务,能够构建有效的多语言生成式对话状态追踪模型,使得模型具备对不同语言对话上下文的理解能力,提高了多语言对话状态追踪性能。
-
公开(公告)号:CN112800782B
公开(公告)日:2023-10-03
申请号:CN202110127939.4
申请日:2021-01-29
Applicant: 中国科学院自动化研究所
IPC: G06F40/58 , G06F40/30 , G06F40/126 , G06N3/0499 , G06N3/084
Abstract: 本发明属于机器翻译领域,具体涉及一种融合文本语义特征的语音翻译方法、系统、设备,旨在解决现有语音翻译方法难以融合不同模态之间的信息,无法充分利用语音识别和机器翻译领域的数据,导致翻译性能较差的问题。本发明方法包括获取待翻译的源语言语音数据;提取源语言语音数据对应的语音特征序列;并获取各语音特征对应的声学表征;将声学表征的隐向量映射到源语言词表,并通过softmax函数得到语音特征序列每个时刻被识别为源语言词表中的词语的概率;对声学表征进行过滤处理,并通过第二编码器得到过滤后的声学特征对应的语义表征;基于语义表征,通过解码器得到源语言语音数据对应的目标语言翻译文本。本发明提高了语音翻译的性能。
-
公开(公告)号:CN108959351B
公开(公告)日:2022-11-08
申请号:CN201810377825.3
申请日:2018-04-25
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明属于自然语言处理技术领域,具体提供一种中文篇章关系的分类方法及装置。旨在解决传统管道系统方法中错误传递的问题。本发明的中文篇章关系的分类方法包括将中文篇章中的句子进行句对的分布式表示,得到第一句对分布式表示向量;计算记忆单元与第一句对分布式表示向量的相似度和权重,得到第一句对分布式表示向量的记忆信息;将第一句对分布式表示向量与记忆信息进行线性组合生成第二句对分布式表示向量;对第二句对分布式表示向量进行分类,得到中文篇章的关系分类结果。本发明的方法通过深度学习网络得到句子内部的语义和结构抽象特征,可以获得优越性能的篇章分类效果。
-
公开(公告)号:CN111445542B
公开(公告)日:2022-07-29
申请号:CN202010246799.8
申请日:2020-03-31
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于脑机接口技术领域,具体涉及一种基于弹性突触门的跨受试者神经解码系统、方法、装置,旨在解决在特定受试者上独立训练的神经解码在跨受试者解码时准确率较低的问题。本系统包括:预处理模块,配置为获取待解码的功能性核磁共振图像并进行预处理,得到预处理图像;解码模块,配置为通过基于弹性突触门的解码模型对所述预处理图像进行解码,得到在采集功能性核磁共振图像时受试者受到的刺激的向量表示;其中,基于弹性突触门的解码模型基于多层前向神经网络构建。本发明提高了基于功能性核磁共振成像的神经解码在跨受试者解码时的准确率。
-
公开(公告)号:CN114118104A
公开(公告)日:2022-03-01
申请号:CN202111199951.2
申请日:2021-10-14
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种基于知识图谱的神经机器翻译方法、装置、设备及介质,该方法包括:获取原始双语平行语句对,根据原始双语平行语句对提取单词和短语翻译对,得到对应的种子实体翻译对;获取源语言知识图谱和目标语言知识图谱,根据种子实体翻译对、源语言知识图谱和目标语言知识图谱,构建对应的向量空间;获取到待翻译实体集合时,根据向量空间对待翻译实体集合进行推断,得到对应的待翻译实体翻译对;计算种子实体翻译对和待翻译实体翻译对的距离,根据距离得到包含待翻译实体翻译对的伪双语平行句对。本发明通过将知识图谱融合到神经机器翻译中,利用知识图谱中丰富的实体知识提升了神经机器翻译的实体翻译准确率。
-
公开(公告)号:CN112800782A
公开(公告)日:2021-05-14
申请号:CN202110127939.4
申请日:2021-01-29
Applicant: 中国科学院自动化研究所
IPC: G06F40/58 , G06F40/30 , G06F40/126 , G06N3/08
Abstract: 本发明属于机器翻译领域,具体涉及一种融合文本语义特征的语音翻译方法、系统、设备,旨在解决现有语音翻译方法难以融合不同模态之间的信息,无法充分利用语音识别和机器翻译领域的数据,导致翻译性能较差的问题。本发明方法包括获取待翻译的源语言语音数据;提取源语言语音数据对应的语音特征序列;并获取各语音特征对应的声学表征;将声学表征的隐向量映射到源语言词表,并通过softmax函数得到语音特征序列每个时刻被识别为源语言词表中的词语的概率;对声学表征进行过滤处理,并通过第二编码器得到过滤后的声学特征对应的语义表征;基于语义表征,通过解码器得到源语言语音数据对应的目标语言翻译文本。本发明提高了语音翻译的性能。
-
公开(公告)号:CN109783704B
公开(公告)日:2021-02-02
申请号:CN201910005704.0
申请日:2019-01-03
Applicant: 中国科学院自动化研究所 , 出门问问信息科技有限公司
IPC: G06F16/9032
Abstract: 本发明属于人机对话技术领域,具体涉及一种人机混合的应答方法、系统、装置,旨在为了解决现有人机应答方法无法实现在线学习的问题。本发明方法包括:对当前对话上下文Ct进行编码,得到第一表征向量E(Ct);基于对话任务下的候选回复语句,并进行编码后得到第二表征向量基于第一表征向量E(Ct)、第二表征向量通过不确定性估计方法获取候选回复语句能够正确回复用户提问的置信度,置信度大于设定阈值则选择置信度对应的候选回复语句进行应答输出,否则获取通过人机交互设备录入的回复语句或选定的候选回复语句进行应答输出,并基于应答输出后得到的全部对话语句进行上述步骤中的参数优化。本发明保证了输出的应答语句具有足够的置信度,实现了对话模型的在线学习更新。
-
-
-
-
-
-
-
-
-