-
公开(公告)号:CN116414974A
公开(公告)日:2023-07-11
申请号:CN202111623468.2
申请日:2021-12-28
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F16/35 , G06F18/241 , G06F18/25 , G06N3/0464 , G06N3/0442 , G06N3/045 , G06N3/08
Abstract: 本发明提供了一种短文本分类方法及装置,属于人工智能领域。短文本分类方法,包括:根据所处的业务阶段和训练数据集的样本数量确定模型组合,所述模型组合包括至少一个神经网络模型;对所述模型组合中的模型进行训练;将待处理文本输入训练后的所述模型组合,输出分类结果。本发明的技术方案能够对短文本准确进行分类。
-
公开(公告)号:CN114817486A
公开(公告)日:2022-07-29
申请号:CN202110081332.7
申请日:2021-01-21
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
Inventor: 胡珉
IPC: G06F16/332 , G06F16/33 , G06F16/338
Abstract: 本发明提供一种交互方法、装置及电子设备,涉及人工智能技术领域,其中,交互方法包括:接收输入的第一信息,所述第一信息包括图片、视频或者语音中的至少一项;确定所述第一信息包含的信息内容,对所述第一信息包含的信息内容进行解析,得到融合特征;采用自然语言处理算法对所述融合特征进行识别处理,得到所述第一信息对应的答案,输出所述答案。本发明实施例能够提高交互体验。
-
公开(公告)号:CN112949255A
公开(公告)日:2021-06-11
申请号:CN201911267701.0
申请日:2019-12-11
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司 , 清华大学
IPC: G06F40/126 , G06F40/284 , G06F40/30 , G06F40/247
Abstract: 本发明提供一种词向量训练方法及装置,该方法包括:对单词的初始化词向量的进行预训练,得到预训练词向量;使用语义融合的释义自编码器对所述预训练词向量进行训练,得到目标词向量;其中,所述语义融合的释义自编码器融合所述单词的语义关系和所述单词的词典释义;本发明实施例在语义融合的释义自编码器中融合语义关系和词典释义,显著提高词向量对语义相似性的建模能力;使用该语义融合的释义自编码器训练得到的目标词向量具有很强的普适性,且该词向量训练方法还具有训练时间短、资源消耗少等优势。
-
公开(公告)号:CN111401064A
公开(公告)日:2020-07-10
申请号:CN201910000943.7
申请日:2019-01-02
Applicant: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC: G06F40/295
Abstract: 本发明提供一种命名实体识别方法、装置及终端设备,该命名实体识别方法包括:获取待识别数据;对所述待识别数据进行预处理,获得待识别数据的字符向量;将所述字符向量输入至预先训练的基于字的命名实体识别模型中,输出表示待识别数据的命名实体信息的识别结果;根据识别结果,确定所述待识别数据的命名实体;所述命名实体识别模型的训练特征向量包括训练数据的实体边界特征向量,用于提取训练数据的特征时,将同一命名实体的多个字符特征归一为相应命名实体的特征,以基于归一后的命名实体的特征进行模型参数训练。本发明的实施例,可以解决现有基于字的命名实体识别模型存在的实体边界问题,从而提高模型性能,提高命名实体识别时的准确率。
-
公开(公告)号:CN105451069B
公开(公告)日:2019-06-21
申请号:CN201410438696.6
申请日:2014-08-29
Applicant: 中国移动通信集团公司
Inventor: 胡珉
IPC: H04N21/435 , H04N21/472
Abstract: 本发明实施例公开了一种搜索电视节目的方法及装置,该方法包括:对电视台信息和/或节目信息建立索引,其中,所述电视台信息的索引内容包括以下一项或多项:电视台名称、时间段、描述标签,所述节目信息的索引内容包括以下一项或多项:节目名称、时间段、描述标签,获取用户输入信息;对所述用户输入信息进行分析,获取搜索关键词;根据所述搜索关键词搜索电视台信息和/或节目信息,并展示搜索结果。通过本发明实施例,能够实现用户对具体节目内容的搜索,从而提高搜索效率,提升用户体验。
-
公开(公告)号:CN106897960A
公开(公告)日:2017-06-27
申请号:CN201510959173.0
申请日:2015-12-18
Applicant: 中国移动通信集团公司
CPC classification number: G06Q50/30 , G06K9/6267
Abstract: 本发明实施例公开了一种分类信息获取方法,所述方法包括:获取预设周期内用户的业务流量数据;其中,所述用户的业务流量数据包括用户的每个业务的流量信息;对所述用户的业务流量数据进行排序处理,并基于所述排序处理的结果得到所述用户的分类标签信息。本发明实施例还同时公开了一种分类信息获取装置。
-
公开(公告)号:CN105451069A
公开(公告)日:2016-03-30
申请号:CN201410438696.6
申请日:2014-08-29
Applicant: 中国移动通信集团公司
Inventor: 胡珉
IPC: H04N21/435 , H04N21/472
Abstract: 本发明实施例公开了一种搜索电视节目的方法及装置,该方法包括:对电视台信息和/或节目信息建立索引,其中,所述电视台信息的索引内容包括以下一项或多项:电视台名称、时间段、描述标签,所述节目信息的索引内容包括以下一项或多项:节目名称、时间段、描述标签,获取用户输入信息;对所述用户输入信息进行分析,获取搜索关键词;根据所述搜索关键词搜索电视台信息和/或节目信息,并展示搜索结果。通过本发明实施例,能够实现用户对具体节目内容的搜索,从而提高搜索效率,提升用户体验。
-
公开(公告)号:CN102955810B
公开(公告)日:2015-12-02
申请号:CN201110249270.2
申请日:2011-08-26
Applicant: 中国移动通信集团公司
IPC: G06F17/30
Abstract: 本发明公开了一种网页分类方法和设备,该方法利用现有URL类别库中的记录,建立虚拟的层级URL,并对层级URL的类别进行预测。当需要对待分类网页进行分类时,根据待分类网页的URL查询URL类别库;如果未查询到匹配的URL,则根据该URL的上层URL查询URL类别库,并在查询到匹配的URL时,根据查询到的URL的预测类别确定待分类网页的类别。在本发明中,提高了网页分类的效率和成功率。
-
公开(公告)号:CN102955810A
公开(公告)日:2013-03-06
申请号:CN201110249270.2
申请日:2011-08-26
Applicant: 中国移动通信集团公司
IPC: G06F17/30
Abstract: 本发明公开了一种网页分类方法和设备,该方法利用现有URL类别库中的记录,建立虚拟的层级URL,并对层级URL的类别进行预测。当需要对待分类网页进行分类时,根据待分类网页的URL查询URL类别库;如果未查询到匹配的URL,则根据该URL的上层URL查询URL类别库,并在查询到匹配的URL时,根据查询到的URL的预测类别确定待分类网页的类别。在本发明中,提高了网页分类的效率和成功率。
-
公开(公告)号:CN101989281B
公开(公告)日:2012-06-27
申请号:CN200910089176.8
申请日:2009-08-03
Applicant: 中国移动通信集团公司
IPC: G06F17/30
Abstract: 本发明公开了一种聚类方法,用以解决现有技术提供的检索结果聚类方法难以生成可读性较好的聚类标签的缺陷,该方法包括:根据预设的选取策略,从待聚类的各个文档中选取第一候选字串集合;针对第一候选字串集合中的各字串,根据与该字串相关的参数,从第一候选字串集合中选取第二候选字串,所述与该字串相关的参数为该字串出现在待聚类的所有文档中的总次数、该字串出现在指定文档中的总次数、该字串包含的字符个数以及待聚类的文档中包含该各字串的文档个数中的至少一个参数;将第二候选字串确定为对所述待聚类的各个文档进行聚类的聚类标签,并将待聚类的各个文档分别归类到与所述聚类标签对应的簇中。本发明还公开了一种聚类装置。
-
-
-
-
-
-
-
-
-