-
公开(公告)号:CN101118538B
公开(公告)日:2010-12-15
申请号:CN200710121868.7
申请日:2007-09-17
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种中文命名实体中特征词项的识别方法,包括:对待识别的命名实体进行分词操作,得到候选命名实体;对候选命名实体进行初步处理,得到第一计算结果;根据候选命名实体和第一计算结果建立词典,根据第一计算结果建立词境词典;所述词典和所述词境词典统称为词典库;参考词典库,对第一计算结果多次做复合处理,每一次复合处理后,根据处理结果扩充词典库,在下一次复合处理时,所参考的词典库为扩充后的词典库;根据多次复合处理后的结果得到所识别的特征词项。本发明还提供了一种中文命名实体中特征词项的识别系统。本发明无需借助上下文,即可实现对中文命名实体中特征词项的识别和理解,提高了自然语言理解和信息检索的准确率。
-
公开(公告)号:CN101499277A
公开(公告)日:2009-08-05
申请号:CN200810117244.2
申请日:2008-07-25
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种服务智能导航方法,包括:对用户所提出查询语句的分词结果进行基于元数据的文法匹配;根据分词结果找出相匹配的词模模式,得到所述相匹配的词模模式所在的服务分类;将分词结果与描述性信息或业务性信息进行匹配查找,得到第一候选服务分类列表;对只有一个候选服务分类的第一候选服务分类列表,从唯一的候选服务分类中获取服务并返回给用户,若候选服务分类大于或等于两个,则对查询语句中的未登录串进行模糊理解,得到第二候选服务分类列表;根据第一候选服务分类列表与第二候选服务分类列表作融合操作,得到公共的候选服务分类,若其唯一,则返回服务给用户,若所述公共的候选服务分类不存在或多于一个,则导航失败。
-
公开(公告)号:CN114266244A
公开(公告)日:2022-04-01
申请号:CN202111610175.0
申请日:2021-12-27
Applicant: 中国科学院计算技术研究所
IPC: G06F40/232 , G06F40/268 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种生成用于单字错别字识别模型的训练集的方法,包括:S1、获取语料库,对语料库中的各语句进行分词处理和词性标注,得到多个原始分词序列,每个原始分词序列包括多个分词项以及每个分词项的词性;S2、基于原始分词序列构建各分词项的标签,得到标签序列,其中初始的标签值指示每个分词项对应的文字是正确文字;S3、将相应原始分词序列中一个为单字的分词项替换为与相应单字相似的错误单字,得到带错字分词序列,并更改相应标签序列中单字被替换的分词项对应的标签值以指示其对应的单字为错误文字;S4、重复步骤S3,构建包括多个样本的训练集,每个样本包括分词序列及对应的标签序列,分词序列为原始分词序列或者带错字分词序列。
-
公开(公告)号:CN101499277B
公开(公告)日:2011-05-04
申请号:CN200810117244.2
申请日:2008-07-25
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供一种服务智能导航方法,包括:对用户所提出查询语句的分词结果进行基于元数据的文法匹配;根据分词结果找出相匹配的词模模式,得到所述相匹配的词模模式所在的服务分类;将分词结果与描述性信息或业务性信息进行匹配查找,得到第一候选服务分类列表;对只有一个候选服务分类的第一候选服务分类列表,从唯一的候选服务分类中获取服务并返回给用户,若候选服务分类大于或等于两个,则对查询语句中的未登录串进行模糊理解,得到第二候选服务分类列表;根据第一候选服务分类列表与第二候选服务分类列表作融合操作,得到公共的候选服务分类,若其唯一,则返回服务给用户,若所述公共的候选服务分类不存在或多于一个,则导航失败。
-
公开(公告)号:CN101847140A
公开(公告)日:2010-09-29
申请号:CN200910080812.0
申请日:2009-03-23
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种错别字符处理方法和系统。该方法包括:步骤A1,根据错别字符训练集库,为训练集中每个正确字符建立其对应的错别字符集合;步骤B1,在含错别字符的大规模语料库中,分别找出包含所述正确字符和错别字符的短语或词组;步骤C1,找出正确字符和错别字符的对应关系,建立词组对或者短语对;步骤D1,优化所述词组对或者短语对,将所述词组对或者短语对中重复表述的词组对或者短语对筛选掉,得到所述正确字符相应的错别字符的词组对或者短语对;步骤E1,将所述正确字符相应的错别字符的词组对或者短语对加入到所述正确字符的错别字符词典。其能够识别错别字符词组或者短语,并建立错别字符词典,从而提高错别字符词典的生成效率。
-
公开(公告)号:CN101650797A
公开(公告)日:2010-02-17
申请号:CN200910092088.3
申请日:2009-09-14
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种移动客服知识库系统及其工作方法。该系统包括登录模块,用于验证登录信息,在系统用户通过身份验证后,进入移动客服知识库系统;还包括:管理维度选择模块,用于选择预查看业务所在的管理维度;业务加载模块,用于根据所述选择的管理维度进入不同入口,加载不同的业务树,并呈树状结构显示;业务数据管理模块,用于知识库编辑人员对与业务相关的数据进行管理;句型管理模块,用于实现对与问题相关的句型进行管理;答案管理模块,用于将知识库编辑人员编辑的答案按照预设的层次进行自动归类和管理。其通过定义知识库中知识的结构,方便系统用户维护、查询并支持自然语言解析功能。
-
公开(公告)号:CN1266633C
公开(公告)日:2006-07-26
申请号:CN02160272.7
申请日:2002-12-31
Applicant: 中国科学院计算技术研究所
Abstract: 一种语音查询中的辨音方法,包括步骤:利用现有语音识别接口对语音进行识别,在识别后,还包括步骤:确定用户可定制的知识查询语言;形成基于知识的辨音模型;基于知识、查询语言和辨音模型的快速辨音算法。本发明对于外在的环境和条件要求不高,一部电话或一个手机就可以在机场、车里、家里、饭店或者外出郊游时,对知识进行实时地语音查询和学习,极大地方便了用户的使用。
-
公开(公告)号:CN1466367A
公开(公告)日:2004-01-07
申请号:CN02140287.6
申请日:2002-07-03
Applicant: 中国科学院计算技术研究所
CPC classification number: Y02A10/46
Abstract: 一种通用的移动人知交互系统,包括:自然语言输入装置,任意地发出知识查询短消息;短消息发送接收模块,将获得的查询信息翻译为普通格式,并将翻以后的知识查询传送给NKI智能查询和推理系统;NKI智能查询和推理系统,将执行结果以短消息的方式使用自然语言返回给自然语言输入装置。本发明的自然语言查询与传统的目录查询、关键词查询相比,更加贴近人类的天性,更自然,人机交流更加人性化。更重要的是可以避免陷入信息泛滥的沼泽,使信息查询更加方便、快速和精确。自然语言的知识界面的载体可以有很多,可以通过网络、电话、手机、PDA等等。
-
公开(公告)号:CN104714938B
公开(公告)日:2017-12-29
申请号:CN201310683961.2
申请日:2013-12-12
Applicant: 联想(北京)有限公司 , 中国科学院计算技术研究所
Abstract: 本发明公开了一种信息处理方法,应用于一电子设备中,所述电子设备能够获得一垃圾信息样本数据库,当所述电子设备接收到一信息时,所述方法包括:通过第一预定规则判断所述信息是否为垃圾信息;当通过所述第一预定规则判断所述信息不是垃圾信息时,将所述信息与所述垃圾信息样本数据库中的垃圾信息样本进行匹配,判断匹配结果是否满足第二预定规则;当匹配不成功时,通过第三预定规则判断所述信息是否为垃圾信息。通过该方法,消除了现有技术中垃圾信息过滤精度有限的技术问题,实现了提高垃圾信息过滤准确性的技术效果。
-
公开(公告)号:CN104714939B
公开(公告)日:2017-09-29
申请号:CN201310685298.X
申请日:2013-12-13
Applicant: 联想(北京)有限公司 , 中国科学院计算技术研究所
IPC: G06F17/27
Abstract: 本发明公开了一种信息处理方法,用以提高确定出的无关语的准确性。该方法包括:在至少一个初始信息中,确定M个第一标识信息和N个第二标识信息;分别根据每个第一标识信息按预定规则进行搜索,获得相应的M’搜索信息组,且所述M’搜索信息组中包含的至少一个搜索信息构成第一信息集合;分别根据每个第二标识信息在所述待处理信息中进行扩展,获得相应的N’个扩展信息组,所述N个扩展信息组中包含的至少一个扩展信息构成第二信息集合;将所述第一信息集合、所述第二信息集合与所述初始信息集合进行合并,获得包含至少一个更新信息的更新信息集合。本发明还公开了相应的电子设备。
-
-
-
-
-
-
-
-
-