-
公开(公告)号:CN104657350A
公开(公告)日:2015-05-27
申请号:CN201510096518.4
申请日:2015-03-04
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供的融合隐式语义特征的短文本哈希学习方法,包括:将训练文本通过哈希损失函数进行降维二值化生成低维二值码;从训练文本中获取词特征和位置特征,根据词特征和位置特征通过查表获取对应的词向量和位置向量;将词向量和位置向量通过卷积神经网络模型进行耦合,得到训练文本的隐式语义特征;将低维二值码进行训练得到更新的卷积神经网络模型;利用更新的卷积神经网络模型对训练文本进行编码生成语义哈希码,并将查询文本通过卷积神经网络模型对语义哈希码进行映射生成查询文本的哈希码;查询文本的哈希码在二值汉明空间中对语义哈希码进行匹配,得到查询文本的语义相似文本。本发明可以获得查询文本的语义相似文本。
-
公开(公告)号:CN104408153A
公开(公告)日:2015-03-11
申请号:CN201410729347.X
申请日:2014-12-03
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
CPC classification number: G06F17/30628 , G06F17/30663
Abstract: 本发明公开了一种基于多粒度主题模型的短文本哈希学习方法,采用外部大规模语料库训练候选主题模型,可依据数据集类型选择最优的多粒度主题特征,并赋予权重,由该方法选择出来的多粒度主题模型有较好的区分度,在构建稀疏短文本间相似语义关联的同时有助于哈希函数学习;本发明方法采用了两种基于多主题模型的哈希学习策略,分别为多粒度主题特征融合、哈希码学习同哈希函数训练相独立的学习方法,以及多粒度主题特征独立、哈希码学习同哈希函数训练相耦合的学习方法,较基于单粒度主题特征方法,在精度和召回率等多项测评指标上均有大幅度提升。
-
公开(公告)号:CN113035225B
公开(公告)日:2023-02-28
申请号:CN201911252373.7
申请日:2019-12-09
Applicant: 中国科学院自动化研究所
IPC: G10L21/0272 , G10L25/30 , G10L17/18 , H04N21/44
Abstract: 本发明实施例涉及一种视觉声纹辅助的语音分离方法和装置,所述方法包括:对采集到的混合语音数据进行音频处理,得到该混合语音数据的隐层表示;对采集到的目标对象的视频数据进行视频处理,得到该视频数据的隐层表示;所述视频数据与所述混合语音数据在时间维度上对齐;基于所述视频数据的隐层表示,确定目标对象的身份信息;基于所述混合语音数据的隐层表示、视频数据的隐层表示和身份信息,从所述混合语音数据中分离出所述目标对象的语音数据。由此,可以实现混合语音数据中分离出目标对象的语音数据。
-
公开(公告)号:CN114064864A
公开(公告)日:2022-02-18
申请号:CN202110854064.8
申请日:2021-07-27
Applicant: 中国科学院自动化研究所
IPC: G06F16/332 , G06F16/33 , G06F16/36 , G06F40/126 , G06F40/30
Abstract: 本发明实施例涉及一种智能问答方法、装置、设备及存储介质,利用两种上下文感知变换为对话情景中的单词表示融入上下文信息;将对话情景与知识库语义信息分开存储;通过记忆网络对用户当前语句进行理解,并激活了当前的对话生成任务;工作记忆动态的控制长时记忆的“激活”,从长时记忆中读取当前任务相关的内容到短时存储中,然后基于启发式策略逐个词地生成当前回复。本发明能够将对话情景与知识库语义信息分开存储,并通过记忆推理的方式利用这两种存储的信息,可以高效地利用外部知识库信息,极大地提升了任务型对话生成的性能。
-
公开(公告)号:CN108109619B
公开(公告)日:2021-07-06
申请号:CN201711127669.7
申请日:2017-11-15
Applicant: 中国科学院自动化研究所
IPC: G10L15/22 , G10L19/00 , G10L21/0208 , G10L21/0272 , G10L25/30
Abstract: 本发明属于语音分离技术领域,具体涉及基于记忆和注意力模型的听觉选择方法和装置。旨在解决现有技术中监督标签的排列、说话人混叠数目不确定以及记忆单元维度固定的问题。本发明提供一种基于记忆和注意力模型的听觉选择方法,包括将原始语音信号编码为时频矩阵,对时频矩阵进行编码和变换,将其转化为语音向量,利用长时记忆单元存储说话人以及其对应的语音向量,获取目标说话人的语音向量,通过注意力选择模型从原始语音信号中分离出目标语音。本发明提供的方法能够不需要固定或者指定说话人的数目,从原始语音信号中分离出目标语音。
-
公开(公告)号:CN113035225A
公开(公告)日:2021-06-25
申请号:CN201911252373.7
申请日:2019-12-09
Applicant: 中国科学院自动化研究所
IPC: G10L21/0272 , G10L25/30 , G10L17/18 , H04N21/44
Abstract: 本发明实施例涉及一种视觉声纹辅助的语音分离方法和装置,所述方法包括:对采集到的混合语音数据进行音频处理,得到该混合语音数据的隐层表示;对采集到的目标对象的视频数据进行视频处理,得到该视频数据的隐层表示;所述视频数据与所述混合语音数据在时间维度上对齐;基于所述视频数据的隐层表示,确定目标对象的身份信息;基于所述混合语音数据的隐层表示、视频数据的隐层表示和身份信息,从所述混合语音数据中分离出所述目标对象的语音数据。由此,可以实现混合语音数据中分离出目标对象的语音数据。
-
公开(公告)号:CN112215912B
公开(公告)日:2021-06-22
申请号:CN202011093264.8
申请日:2020-10-13
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于数据处理领域,具体涉及了一种基于动态视觉传感器的显著性图生成系统、方法和装置,旨在解决的问题。本发明包括:通过动态视觉传感器获取事件数据,并通过目标检测网络中的每个神经元将DVS事件数据和从相互关联的神经元获取的信息进行累加缓存,每隔预设的时间通过激活函数获取神经元膜电位,并根据神经元膜电位与预设的饱和阈值的大小关系输出脉冲信号,前一时刻的膜电位u(t0)经过衰减与当前接收的激励进行累加,结果用于脉冲信号和膜电位更新判断。本发明使得目标检测网络阵列生成的显著性图排除了冗余的背景信息,提高了目标检测的可信度和精确度,避免出现误判。
-
公开(公告)号:CN108109619A
公开(公告)日:2018-06-01
申请号:CN201711127669.7
申请日:2017-11-15
Applicant: 中国科学院自动化研究所
IPC: G10L15/22 , G10L19/00 , G10L21/0208 , G10L21/0272 , G10L25/30
Abstract: 本发明属于语音分离技术领域,具体涉及基于记忆和注意力模型的听觉选择方法和装置。旨在解决现有技术中监督标签的排列、说话人混叠数目不确定以及记忆单元维度固定的问题。本发明提供一种基于记忆和注意力模型的听觉选择方法,包括将原始语音信号编码为时频矩阵,对时频矩阵进行编码和变换,将其转化为语音向量,利用长时记忆单元存储说话人以及其对应的语音向量,获取目标说话人的语音向量,通过注意力选择模型从原始语音信号中分离出目标语音。本发明提供的方法能够不需要固定或者指定说话人的数目,从原始语音信号中分离出目标语音。
-
公开(公告)号:CN104915448B
公开(公告)日:2018-03-27
申请号:CN201510372795.3
申请日:2015-06-30
Applicant: 中国科学院自动化研究所
Abstract: 一种基于层次卷积网络的实体与段落链接方法,包括:利用卷积神经网络通过词向量化表示转化成句子向量化表示;利用句子向量化表示再次经过卷积神经网络并考虑所述句子次序信息得到段落向量化表示;句子向量化表示和段落向量化表示通过Softmax输出,借助已有实体作为监督信息进行所述卷积神经网络模型的训练;同时,考虑段落语义向量特征与实体语义向量特征之间的pair‑wise相似度信息进一步改善卷积神经网络模型的训练;给定一个测试描述段落,利用训练好的神经网络模型进行深层语义特征抽取得到测试段落的向量化表示,然后基于此语义表示经过Softmax输出可直接链接到目标实体上。
-
公开(公告)号:CN104915386A
公开(公告)日:2015-09-16
申请号:CN201510270028.1
申请日:2015-05-25
Applicant: 中国科学院自动化研究所
CPC classification number: G06F17/30705 , G06F17/2785
Abstract: 本发明公开了一种基于深度语义特征学习的短文本聚类方法,包括:通过传统的特征降维在局部信息保存的约束下对原始特征进行降维表示,并对得到的低维实值向量进行二值化,做为卷积神经网络结构的监督信息进行误差反向传播训练模型;采用外部大规模语料无监督训练词向量,并对文本中每个词按词序进行向量化表示,做为卷积神经网络结构的初始化输入特征学习文本的隐式语义特征;得到深度语义特征表示后,采用传统的K均值算法对文本进行聚类。本发明的方法不需要额外的自然语言处理等专业知识,设计简单且可学习深度的语义特征,并且,学习到的语义特征具有无偏性,可更有效地达到较好的聚类性能。
-
-
-
-
-
-
-
-
-