-
公开(公告)号:CN119295751A
公开(公告)日:2025-01-10
申请号:CN202411415480.8
申请日:2024-10-11
Applicant: 嘉兴恒创电力设计研究院有限公司 , 清华大学
IPC: G06V10/26 , G06V20/70 , G06V20/10 , G06V10/40 , G06V10/80 , G06V10/82 , G06N3/0464 , G06V10/764
Abstract: 本申请涉及一种遥感图像的语义分割方法、装置、电子设备及存储介质。包括:对已获取的遥感图像数据集进行预处理,并利用预设的模型框架对预处理后的遥感图像数据集进行特征提取和融合,得到每个像素的融合后的特征,其中,预设的模型框架包括Mamba2编码器和CNN解码器;利用预设的分类网络对每个像素的融合后的特征进行分类,确定每个像素所对应的遥感图像的语义类别。由此,通过结合先进的模型Mamba2模型和卷积神经网络CNN,能够有效处理和分割各种尺度和复杂度的遥感图像,解决了现有技术在处理大尺寸图像时计算成本过高、处理复杂的依赖关系时受限于训练数据的不足和泛化能力的问题,从而提供更加准确的地物分类和语义信息。
-
公开(公告)号:CN119168183A
公开(公告)日:2024-12-20
申请号:CN202411415482.7
申请日:2024-10-11
Applicant: 嘉兴恒创电力设计研究院有限公司 , 清华大学
IPC: G06Q10/047 , G06Q30/0201 , G06F16/29 , G06Q10/0639 , G06V10/764 , G06N5/01 , G06N20/20 , G06N3/006 , G06N3/126 , G06Q50/06 , G06F17/16
Abstract: 本申请涉及输电线工程技术领域,特别涉及一种输电线选线方法、装置、设备及介质,其中,方法包括:获取目标区域的多源地理信息;对多源地理信息进行分类处理得到目标分类结果,根据目标分类结果计算目标区域中每条输电线路径的路径地理综合成本值权重;将每条路径的路径地理综合成本值权重输入选线模型,选线模型输出目标区域的目标输电线路径,其中,选线模型基于目标灰狼算法进行选线,目标灰狼算法为引入遗传算法的交叉和变异操作的灰狼算法。由此,解决了现有技术中输电线规划成本高、效率低、精度差且主观性强等问题。
-
公开(公告)号:CN108694950B
公开(公告)日:2021-10-01
申请号:CN201810465602.2
申请日:2018-05-16
Applicant: 清华大学
Abstract: 本发明提出一种基于深度混合模型的说话人确认方法,属于声纹识别、模式识别与机器学习技术领域。该方法首先获取目标说话人的训练语音数据并进行预处理,得到训练语音数据的梅尔倒谱特征集;对梅尔倒谱特征集建立第0层高斯混合模型并求导,得到一阶导数集;然后依次建立第一层高斯混合模型、第二层高斯混合模型,直至建立建立第S层高斯混合模型,将所有高斯混合模型组合得到说话人的深度混合模型;然后获取测试语音数据并提取梅尔倒谱特征集,建立测试语音数据的深度混合模型;计算两个模型的相似度:若相似度小于等于阈值,则测试语音数据属于目标说话人。本发明不仅考虑数据自身分布,还考虑数据的导数分布,提升说话人确认的准确性。
-
公开(公告)号:CN107481723A
公开(公告)日:2017-12-15
申请号:CN201710751356.2
申请日:2017-08-28
Applicant: 清华大学
Abstract: 本发明提出一种用于声纹识别的信道匹配方法及其装置,属于语音识别和语音通信领域。本发明方法首先采集语音数据,根据要模拟的通信模式对语音数据进行语音编码得到压缩语音数据;随后根据相应通信模式下信道模拟的误码率对压缩语音数据进行误码操作,得到信道模拟语音数据;最后对该语音数据进行语音解码操作,得到相应通信模式下的语音。本发明装置包括:语音采集及读取模块、语音编码模块、信道误码模拟模块、语音解码模块和数据存储模块。本发明可模拟固话、VOIP网络电话、微信电话、QQ电话、2G、3G、4G等语音通信过程,从而得到与测试语音信道条件相同的训练语音,有效解决了信道失配问题,适用于声纹识别的应用需求。
-
公开(公告)号:CN106898355A
公开(公告)日:2017-06-27
申请号:CN201710031899.7
申请日:2017-01-17
Applicant: 清华大学
Abstract: 本发明提出一种基于二次建模的说话人识别方法,属于声纹识别、模式识别与机器学习领域。该方法在模型训练阶段,获取待识别说话人的训练语音数据并预处理;根据训练语音数据训练得到第一个DNN模型;利用第一个DNN模型,对训练语音数据进行识别,提取易混语音数据;根据易混语音数据训练得到第二个DNN模型;在说话人识别阶段,获取待识别语音数据并预处理;利用第一个DNN模型对待识别语音数据进行识别,若识别概率大于设定阈值,则得到说话人识别结果;否则通过第二个DNN模型对待识别语音数据进行第二次识别,得到说话人识别结果。本发明通过建立两个DNN模型,同时考虑说话人宏观特征和微观特征,有效提高说话人识别的准确率。
-
公开(公告)号:CN101894548A
公开(公告)日:2010-11-24
申请号:CN201010207237.9
申请日:2010-06-23
Applicant: 清华大学
Abstract: 本发明的实施例提出了一种用于语种识别的建模方法,包括输入语音数据,对语音数据预处理得到特征序列,将特征矢量映射为超矢量,对超矢量进行投影补偿,通过支持向量机算法建立训练语种模型;对待测语音采用上述步骤得到待测超矢量,对待测超矢量进行投影补偿,利用语种模型对所述待测超矢量打分,识别待测语音的语言种类。本发明实施例还提出了一种用于语种识别的建模装置包括语音预处理模块、特征提取模块、多坐标系原点选择模块、特征矢量映射模块、子空间提取模块、子空间投影补偿模块、训练模块和识别模块。根据本发明实施例提供的方法及装置,去除高维统计量中对识别无效的信息,提高语种识别的正确率,降低在集成电路上的运算复杂度。
-
公开(公告)号:CN114492440B
公开(公告)日:2024-10-15
申请号:CN202210016537.1
申请日:2022-01-07
Applicant: 清华大学
IPC: G06F40/295 , G06F40/242 , G06N3/0464 , G06N3/0895 , G06N3/049
Abstract: 本申请涉及命名体识别技术领域,特别涉及一种利用字典知识的命名体识别方法、装置、电子设备及介质,其中,方法包括:获取文本中文本数据的上下文表示;利用实体词典匹配文本的匹配实体,获取匹配实体的隐向量表示;以及基于上下文表示和隐向量表示获取文本联合实体的表示和实体联合上下文的表示,生成命名体识别结果。由此,解决了在识别命名体时通常需要大量的领域知识及人工标注,且严重依赖标注句子来训练命名体识别模型等问题,通过采用多种模型来得到文本的单词的上下文表示并使用双向门控循环单元对匹配实体进行单词级建模从而得到该实体的表示,通过文本和实体的表示联合学习,提升了命名体识别的性能。
-
公开(公告)号:CN116484020A
公开(公告)日:2023-07-25
申请号:CN202310450112.6
申请日:2023-04-24
Applicant: 清华大学
IPC: G06F16/36 , G06F40/30 , G06F40/295 , G06F40/211 , G06N3/04 , G06N3/08
Abstract: 本申请涉及知识图谱技术领域,特别涉及一种融合拓扑和语义信息的知识图谱表征方法及装置,其中,方法包括:获取实体描述文本的第一向量表示和实体召回文本的第二向量表示,联合第一向量表示与第二向量表示进行对比学习,并联合实体描述文本的第一向量表示与知识图谱的嵌入式表示进行距离向量模型的学习,得到知识图谱表征结果。本申请实施例可以通过建模知识的语义信息,设计基于真实文本的语义表征对比学习任务和基于知识图谱关联的拓扑表征对比学习任务,以获得知识图谱表征结果,从而实现语义信息与拓扑信息的融合,保障了知识图谱的表征效果,提高了图谱表征针对不同知识图谱及场景的适应性,更加可靠实用。
-
公开(公告)号:CN116401357A
公开(公告)日:2023-07-07
申请号:CN202310337398.7
申请日:2023-03-31
Applicant: 清华大学
IPC: G06F16/335 , G06F40/194 , G06F18/22 , G06F18/25 , G06N3/0464 , G06N3/0499 , G06N3/0455 , G06N3/048 , G06N3/08
Abstract: 本申请涉及文档检索技术领域,特别涉及一种基于跨模态互注意力机制的多模态文档检索方法及装置,其中,方法包括:建模文档的多模态表示,基于多模态互注意力机制得到目标文档感知的多模态文档表示,融合文档的自注意力向量化表示和多模态增强向量化表示,得到文档的多模态增强统一表示,计算目标文档和至少一个候选文档相关性分数并进行排序,检索到相关的文档。本申请实施例可以基于跨模态互注意力机制,通过获取文档多模态增强的统一表示,计算相关性分数以检索获得匹配文档,从而实现了文档多模态信息的充分利用,增强了文档各模态间的相关性,进而提升了文档检索结果的匹配度,使检索结果更加准确可靠。
-
公开(公告)号:CN115620918A
公开(公告)日:2023-01-17
申请号:CN202211317843.5
申请日:2022-10-26
Applicant: 清华大学
Abstract: 本申请涉及一种基于历史病历关联挖掘的病历智能检索方法及装置,其中,方法包括:基于构建的病历模型对于候选病历和患者的历史病历进行建模,构建病历的向量化表示;基于候选感知的自注意力机制、候选感知的卷积神经网络、候选感知的注意力池化机制,融合候选病历和患者的历史病历,建模患者历史病历的向量化表示;基于候选病历的向量化表示和患者历史病历的向量化表示,计算候选病历的匹配结果,检索相关的候选病历。本申请实施例可以融合当前患者诊疗历史和候选病历,将用于匹配的候选病历整合到患者历史病历建模中,以实现候选病历与患者的准确匹配,提高检索的准确性和适用性。
-
-
-
-
-
-
-
-
-