-
公开(公告)号:CN114662481B
公开(公告)日:2024-11-26
申请号:CN202011537728.X
申请日:2020-12-23
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
Inventor: 杨希
IPC: G06F40/279 , G06N3/08
Abstract: 本发明提供了一种事件抽取方法、事件抽取网络的训练方法及装置。该方法包括:将单一事件的自然语言文本的文本输入事件抽取网络,得到所述事件抽取网络输出的所述单一事件内多个子事件的标签,其中,一个所述子事件对应于一个标签,不同子事件的标签互不冲突;合并多个所述子事件的标签所描述的事件论元和事件角色,得到所述单一事件的事件识别信息,提高了事件抽取的准确率。
-
公开(公告)号:CN112434126A
公开(公告)日:2021-03-02
申请号:CN201910731275.5
申请日:2019-08-08
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/33 , G06F16/338 , G06F16/9535 , G06F16/9536 , G06Q50/00 , G06F16/951
Abstract: 本发明实施例公开了一种信息处理方法、装置、设备和存储介质,该方法包括:抽取待分析语段中的至少两个候选热词;基于贝叶斯平均法计算各个所述候选热词的第一热度;基于牛顿冷却定律计算各个所述候选热词的第二热度;将同一候选热词的第一热度和第二热度进行加权计算,得到对应候选热词的综合热度;根据各个候选热词的综合热度,对所述待分析语段中的至少两个候选热词进行排序,根据设定的排序次序从所述排序结果中确定所述待分析语段中的热词。本发明实施例通过对网络信息进行分析,准确地计算各词条的热度,以挖掘热词。
-
公开(公告)号:CN111950277A
公开(公告)日:2020-11-17
申请号:CN201910365293.6
申请日:2019-04-30
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/295
Abstract: 本发明公开了一种商情实体确定方法、装置和计算机可读存储介质,包括:获取目标文本;基于预设的商情实体识别模型识别所述目标文本,获得识别结果;所述识别结果表征所述目标文本包含的商情实体;所述商情实体识别模型基于时间卷积神经网络和条件随机场生成。本发明提供了基于时间卷积神经网络和条件随机场生成的商情实体识别模型,可以节约训练时间,提高模型训练的效率。
-
公开(公告)号:CN118378633A
公开(公告)日:2024-07-23
申请号:CN202410480796.9
申请日:2024-04-22
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/35 , G06F16/332 , G06F16/33 , G06N5/04
Abstract: 本申请提供一种模型训练方法、装置、设备、存储介质及程序产品,涉及人工智能领域,包括:获取包括第一图像和第一图像的提示词文本的第一训练数据集;利用第一图像编码器对第一图像进行编码,得到第一视觉标记特征;利用第一文本编码器对提示词文本进行编码,得到第一文本标记特征;与同一个目标对象相关的第一文本标记特征和第一视觉标记特征对齐;根据第一视觉标记特征和第一文本标记特征,对与提示词文本对应的原始语言指令进行位置信息增强,获得增强语言指令;利用增强语言指令和经过线性层编码的第一视觉标记特征,训练LLM,得到多模态对话模型,多模态对话模型用于针对多模态的输入信息进行推理问答。本方案不依赖其他目标检测模型。
-
公开(公告)号:CN111859963B
公开(公告)日:2024-06-11
申请号:CN201910277533.7
申请日:2019-04-08
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/295 , G06N3/045 , G06N3/0464 , G06N3/0442 , G06N3/084
Abstract: 本发明实施例公开了一种命名实体识别方法、设备、装置和计算机可读存储介质,该方法包括:将文本中的词语映射为向量;对所述向量进行处理,得到所述文本中词语的上下文表示;确定出与所述上下文表示相关的标签转移关系,根据所确定的标签转移关系,为所述文本中词语确定出标签序列。如此,在本发明实施例中,可以确定出与上下文信息相关的标签转移关系;这种动态地确定标签转移关系的方式,可以根据不同的上下文对标签的跳转进行更细致的建模,有助于优化标签跳转以及路径选择,进而可以提高推断标签序列的准确性和可靠性。
-
公开(公告)号:CN111859079B
公开(公告)日:2023-08-15
申请号:CN201910363713.7
申请日:2019-04-30
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/953 , G06F16/9538 , G06F16/33 , G06F40/289 , G06F40/30
Abstract: 本发明实施例公开了一种信息搜索方法、装置、计算机设备及存储介质,应用于计算机技术领域,所述信息搜索方法包括:获取第一关键词;查询信息库获得与所述第一关键词满足相似度条件的第一信息;提取所述第一信息中的关键字段;将所述关键字段与所述第一关键词进行语义匹配,得到匹配结果;基于所述匹配结果,返回搜索结果。所述信息搜索方法能够在查询到与所述第一关键词满足相似度条件的第一信息的基础上,还会将所述第一关键词与第一信息中的关键字段进行语义匹配,得到最终的匹配结果,使得搜索得到的信息更加准确。
-
公开(公告)号:CN112434126B
公开(公告)日:2022-12-13
申请号:CN201910731275.5
申请日:2019-08-08
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/33 , G06F16/338 , G06F16/9535 , G06F16/9536 , G06Q50/00 , G06F16/951
Abstract: 本发明实施例公开了一种信息处理方法、装置、设备和存储介质,该方法包括:抽取待分析语段中的至少两个候选热词;基于贝叶斯平均法计算各个所述候选热词的第一热度;基于牛顿冷却定律计算各个所述候选热词的第二热度;将同一候选热词的第一热度和第二热度进行加权计算,得到对应候选热词的综合热度;根据各个候选热词的综合热度,对所述待分析语段中的至少两个候选热词进行排序,根据设定的排序次序从所述排序结果中确定所述待分析语段中的热词。本发明实施例通过对网络信息进行分析,准确地计算各词条的热度,以挖掘热词。
-
公开(公告)号:CN112836516A
公开(公告)日:2021-05-25
申请号:CN201911168156.X
申请日:2019-11-25
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F40/30 , G06F40/211 , G06F16/901 , G06K9/62
Abstract: 本发明实施例公开了一种语义分析方法,该方法包括:对预设树库中的树结构进行标记处理,获得带有长距离投射标记树结构的第一待训练语料;采用句子成分分析法对所述第一待训练语料进行建模,获得成分句法分析模型;所述成分句法分析模型用于获得第二待训练语料;采用依存句法分析法对所述第二待训练语料进行建模,获得依存句法分析模型;基于所述成分句法分析模型和所述依存句法分析模型对输入语句进行分析,获得所述输入语句的语义分析结果。通过该方法,避免了无法实现精准的语义分析的问题,有效提升了语义分析的准确率。本发明实施例还公开了一种语义分析装置、终端及存储介质。
-
公开(公告)号:CN119025674A
公开(公告)日:2024-11-26
申请号:CN202410994764.0
申请日:2024-07-24
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/35 , G06F18/24 , G06F18/22 , G06N3/0455 , G06N3/08
Abstract: 本申请提供一种文本分类模型的训练方法、文本分类方法及相关设备,所述文本分类模型包括编码器和解码器,所述方法包括:获取训练数据集,所述训练数据集包括训练文本、所述训练文本对应的第一标签和所述第一标签对应的标签扩充信息,所述标签扩充信息为对所述第一标签内容的描述信息;对所述文本分类模型进行训练,得到目标文本分类模型。本申请通过对文本分类模型中的编码器和解码器利用训练文本、训练文本对应的第一标签和第一标签对应的标签扩充信息进行训练,得到目标文本分类模型,从而提高了对文本的分类效率。
-
公开(公告)号:CN116795977A
公开(公告)日:2023-09-22
申请号:CN202211035755.6
申请日:2022-08-26
Applicant: 中移(苏州)软件技术有限公司 , 中国移动通信集团有限公司
Abstract: 本发明实施例公开了一种数据处理方法、装置、设备和计算机可读存储介质。该方法包括:获取日志数据集;将日志数据集与预设日志模板库进行匹配,得到匹配度;根据匹配度,确定日志聚类结果。通过构建日志模板库对大规模数据进行聚合操作,得到匹配度,提高了日志聚类结果的准确性和灵活性。在收到报警信息之后,根据日志聚类结果和预设多标签分类模型,确定日志聚类结果对应的故障预测信息,无需运维人员根据自身技术和业务进行经验化的问题估计,提高了故障定位的效率。
-
-
-
-
-
-
-
-
-