-
公开(公告)号:CN109408795A
公开(公告)日:2019-03-01
申请号:CN201710708318.9
申请日:2017-08-17
Applicant: 中国移动通信集团公司 , 中移(苏州)软件技术有限公司
Abstract: 本发明实施例公开了一种文本识别方法,所述方法包括:获取待识别文本,并对所述待识别文本进行编码处理,得到第一文本指纹;识别所述第一文本指纹所属的类别得到识别结果;若所述识别结果为可识别类别,对所述待识别文本进行类别分析得到所述待识别文本的反馈类别;根据所述识别结果与所述反馈类别,更新所述第一文本指纹对应的预设文本指纹库。本发明实施例同时还公开了一种文本识别设备、计算机可读存储介质和装置。
-
公开(公告)号:CN108062300A
公开(公告)日:2018-05-22
申请号:CN201610981654.6
申请日:2016-11-08
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团公司
IPC: G06F17/27
Abstract: 本发明公开了一种基于中文文本进行情感倾向分析的方法,包括:获取待测的中文本文,对所述中文文本中进行文本预处理得到所述中文文本中的指定文本;根据情感词典对所述指定文本进行情感分析得到第一情感特征值,并根据训练模型中的语料特征词典对所述指定文本进行情感分析得到第二情感特征值;根据所述第一情感特征值和所述第二情感特征值得到特征集合,将所述特征集合作为随机森林RF训练模型的输入特征向量进行情感预测,得到所述中文文本的情感倾向。本发明公开了一种基于中文文本进行情感倾向分析的装置。
-
公开(公告)号:CN109408795B
公开(公告)日:2022-04-15
申请号:CN201710708318.9
申请日:2017-08-17
Applicant: 中国移动通信集团公司 , 中移(苏州)软件技术有限公司
IPC: G06F40/279 , H04W4/14
Abstract: 本发明实施例公开了一种文本识别方法,所述方法包括:获取待识别文本,并对所述待识别文本进行编码处理,得到第一文本指纹;识别所述第一文本指纹所属的类别得到识别结果;若所述识别结果为可识别类别,对所述待识别文本进行类别分析得到所述待识别文本的反馈类别;根据所述识别结果与所述反馈类别,更新所述第一文本指纹对应的预设文本指纹库。本发明实施例同时还公开了一种文本识别设备、计算机可读存储介质和装置。
-
公开(公告)号:CN114662481B
公开(公告)日:2024-11-26
申请号:CN202011537728.X
申请日:2020-12-23
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
Inventor: 杨希
IPC: G06F40/279 , G06N3/08
Abstract: 本发明提供了一种事件抽取方法、事件抽取网络的训练方法及装置。该方法包括:将单一事件的自然语言文本的文本输入事件抽取网络,得到所述事件抽取网络输出的所述单一事件内多个子事件的标签,其中,一个所述子事件对应于一个标签,不同子事件的标签互不冲突;合并多个所述子事件的标签所描述的事件论元和事件角色,得到所述单一事件的事件识别信息,提高了事件抽取的准确率。
-
公开(公告)号:CN112434126A
公开(公告)日:2021-03-02
申请号:CN201910731275.5
申请日:2019-08-08
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/33 , G06F16/338 , G06F16/9535 , G06F16/9536 , G06Q50/00 , G06F16/951
Abstract: 本发明实施例公开了一种信息处理方法、装置、设备和存储介质,该方法包括:抽取待分析语段中的至少两个候选热词;基于贝叶斯平均法计算各个所述候选热词的第一热度;基于牛顿冷却定律计算各个所述候选热词的第二热度;将同一候选热词的第一热度和第二热度进行加权计算,得到对应候选热词的综合热度;根据各个候选热词的综合热度,对所述待分析语段中的至少两个候选热词进行排序,根据设定的排序次序从所述排序结果中确定所述待分析语段中的热词。本发明实施例通过对网络信息进行分析,准确地计算各词条的热度,以挖掘热词。
-
公开(公告)号:CN111950277A
公开(公告)日:2020-11-17
申请号:CN201910365293.6
申请日:2019-04-30
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/295
Abstract: 本发明公开了一种商情实体确定方法、装置和计算机可读存储介质,包括:获取目标文本;基于预设的商情实体识别模型识别所述目标文本,获得识别结果;所述识别结果表征所述目标文本包含的商情实体;所述商情实体识别模型基于时间卷积神经网络和条件随机场生成。本发明提供了基于时间卷积神经网络和条件随机场生成的商情实体识别模型,可以节约训练时间,提高模型训练的效率。
-
公开(公告)号:CN118378633A
公开(公告)日:2024-07-23
申请号:CN202410480796.9
申请日:2024-04-22
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/35 , G06F16/332 , G06F16/33 , G06N5/04
Abstract: 本申请提供一种模型训练方法、装置、设备、存储介质及程序产品,涉及人工智能领域,包括:获取包括第一图像和第一图像的提示词文本的第一训练数据集;利用第一图像编码器对第一图像进行编码,得到第一视觉标记特征;利用第一文本编码器对提示词文本进行编码,得到第一文本标记特征;与同一个目标对象相关的第一文本标记特征和第一视觉标记特征对齐;根据第一视觉标记特征和第一文本标记特征,对与提示词文本对应的原始语言指令进行位置信息增强,获得增强语言指令;利用增强语言指令和经过线性层编码的第一视觉标记特征,训练LLM,得到多模态对话模型,多模态对话模型用于针对多模态的输入信息进行推理问答。本方案不依赖其他目标检测模型。
-
公开(公告)号:CN111859963B
公开(公告)日:2024-06-11
申请号:CN201910277533.7
申请日:2019-04-08
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/295 , G06N3/045 , G06N3/0464 , G06N3/0442 , G06N3/084
Abstract: 本发明实施例公开了一种命名实体识别方法、设备、装置和计算机可读存储介质,该方法包括:将文本中的词语映射为向量;对所述向量进行处理,得到所述文本中词语的上下文表示;确定出与所述上下文表示相关的标签转移关系,根据所确定的标签转移关系,为所述文本中词语确定出标签序列。如此,在本发明实施例中,可以确定出与上下文信息相关的标签转移关系;这种动态地确定标签转移关系的方式,可以根据不同的上下文对标签的跳转进行更细致的建模,有助于优化标签跳转以及路径选择,进而可以提高推断标签序列的准确性和可靠性。
-
公开(公告)号:CN111859079B
公开(公告)日:2023-08-15
申请号:CN201910363713.7
申请日:2019-04-30
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/953 , G06F16/9538 , G06F16/33 , G06F40/289 , G06F40/30
Abstract: 本发明实施例公开了一种信息搜索方法、装置、计算机设备及存储介质,应用于计算机技术领域,所述信息搜索方法包括:获取第一关键词;查询信息库获得与所述第一关键词满足相似度条件的第一信息;提取所述第一信息中的关键字段;将所述关键字段与所述第一关键词进行语义匹配,得到匹配结果;基于所述匹配结果,返回搜索结果。所述信息搜索方法能够在查询到与所述第一关键词满足相似度条件的第一信息的基础上,还会将所述第一关键词与第一信息中的关键字段进行语义匹配,得到最终的匹配结果,使得搜索得到的信息更加准确。
-
公开(公告)号:CN112434126B
公开(公告)日:2022-12-13
申请号:CN201910731275.5
申请日:2019-08-08
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/33 , G06F16/338 , G06F16/9535 , G06F16/9536 , G06Q50/00 , G06F16/951
Abstract: 本发明实施例公开了一种信息处理方法、装置、设备和存储介质,该方法包括:抽取待分析语段中的至少两个候选热词;基于贝叶斯平均法计算各个所述候选热词的第一热度;基于牛顿冷却定律计算各个所述候选热词的第二热度;将同一候选热词的第一热度和第二热度进行加权计算,得到对应候选热词的综合热度;根据各个候选热词的综合热度,对所述待分析语段中的至少两个候选热词进行排序,根据设定的排序次序从所述排序结果中确定所述待分析语段中的热词。本发明实施例通过对网络信息进行分析,准确地计算各词条的热度,以挖掘热词。
-
-
-
-
-
-
-
-
-