-
公开(公告)号:CN113821605B
公开(公告)日:2024-05-14
申请号:CN202111187682.8
申请日:2021-10-12
Applicant: 广州汇智通信技术有限公司
IPC: G06F16/33 , G06F16/31 , G06F16/35 , G06F40/126 , G06F40/14 , G06F40/194 , G06F40/211 , G06F40/253 , G06F40/295 , G06F40/30 , G06N7/01
Abstract: 本申请公开了一种事件抽取方法,该方法包括:对目标文本进行分析,得到目标文本对应的分词结果、词性标注结果和命名实体结果;对所述分词结果进行依存句法分析,得到句法树;根据所述句法树和所述词性标注结果,识别触发词,得到触发词列表;根据所述触发词列表、所述句法树和所述命名实体结果,得到论元及论元角色;根据所述触发词列表,确定事件类型。可见,本申请能够根据词性标注结果、所述命名实体结果和由所述分词结果得到的所述句法树,得到目标文本的事件抽取结果。目标文本的事件抽取结果,就是目标文本的关键信息,用户通过所述目标文本的关键信息就可以知道所述目标文本的主要内容,从而帮助用户高效地从海量文本数据中获取所需知识。
-
公开(公告)号:CN116564279A
公开(公告)日:2023-08-08
申请号:CN202310612970.6
申请日:2023-05-26
Applicant: 广州汇智通信技术有限公司
Abstract: 本申请公开了一种语音关键词识别方法、装置及相关设备,该方法包括:提取待识别语音的梅尔频率倒谱系数MFCC特征,并将所述MFCC特征输入关键词模型,得到所述待识别语音的识别结果,所述识别结果包括所述待识别语音中包含的各关键词以及每一关键词在所述待识别语音中的定位信息;其中,所述关键词模型包括预设的自注意力网络,所述关键词模型为利用增强后的小语种语音样本对所述自注意力网络进行训练而得到的。经过对有限的小语种语音样本的增强处理,实现了小语种语音样本在多个维度下的扩充,减少了标注成本的同时,缩短了获取足够多小语种语音样本的时间,以便于快速开发相应语音关键音识别应用。
-
公开(公告)号:CN115186652A
公开(公告)日:2022-10-14
申请号:CN202210820489.1
申请日:2022-07-13
Applicant: 广州汇智通信技术有限公司
IPC: G06F40/211 , G06F40/258 , G06F16/33 , G06F16/35 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种文本主题分类方法、装置、设备及存储介质,包括:获取用户输入的信息文本,信息文本包含至少一个文本主题;确定与至少一个文本主题对应的一级标签;确定预定义主题的锚定词,根据锚定词对每一文本主题下的句子进行聚类,得到每一文本主题下的多个聚类结果;根据信息文本与每一文本主题之间的相关性,确定每一文本主题下的每一聚类结果在信息文本的任一句段中的概率分布;依据每一文本主题下的每一聚类结果在信息文本的任一句段中的概率分布,将每一文本主题下概率最高的聚类结果作为每一文本主题下的二级标签,以相关性转换为概率分布的方式表征信息文本与文本主题之间的关联度,故而可控性和可解释性较好,使聚类结果更加切实。
-
公开(公告)号:CN113821605A
公开(公告)日:2021-12-21
申请号:CN202111187682.8
申请日:2021-10-12
Applicant: 广州汇智通信技术有限公司
IPC: G06F16/33 , G06F16/31 , G06F16/35 , G06F40/126 , G06F40/14 , G06F40/194 , G06F40/211 , G06F40/253 , G06F40/295 , G06F40/30 , G06N7/00
Abstract: 本申请公开了一种事件抽取方法,该方法包括:对目标文本进行分析,得到目标文本对应的分词结果、词性标注结果和命名实体结果;对所述分词结果进行依存句法分析,得到句法树;根据所述句法树和所述词性标注结果,识别触发词,得到触发词列表;根据所述触发词列表、所述句法树和所述命名实体结果,得到论元及论元角色;根据所述触发词列表,确定事件类型。可见,本申请能够根据词性标注结果、所述命名实体结果和由所述分词结果得到的所述句法树,得到目标文本的事件抽取结果。目标文本的事件抽取结果,就是目标文本的关键信息,用户通过所述目标文本的关键信息就可以知道所述目标文本的主要内容,从而帮助用户高效地从海量文本数据中获取所需知识。
-
-
-