一种长文本实体识别方法、装置、计算机设备及介质

    公开(公告)号:CN116702787A

    公开(公告)日:2023-09-05

    申请号:CN202310981548.8

    申请日:2023-08-07

    Abstract: 本发明涉及数据处理技术领域,尤其涉及一种长文本实体识别方法、装置、计算机设备及介质,方法包括:获取N个长文本数据作为训练样本,每个长文本数据的实体内容均有标注实体类型;将每个长文本数据截取为M个文段;将每个长文本数据的M个文段输入改进的Roberta模型中进行训练,得到识别模型,改进的Roberta模型包括编码层、加性注意力层以及分类层,编码层用于对每个文段进行编码,得到每个文段的编码信息,加性注意力层用于基于每个文段的编码信息,得到每个文段的编码矩阵,使得每个文段的编码矩阵包含当前文段的编码信息和之前文段的编码信息;获取待识别文本,并基于该识别模型,得到待识别文本的实体内容及实体类别;提高了长文本实体识别的准确性。

    一种提升大型设备周转率的机器学习模型建立方法

    公开(公告)号:CN115545630A

    公开(公告)日:2022-12-30

    申请号:CN202210765685.3

    申请日:2022-07-01

    Abstract: 本发明公开了一种提升大型设备周转率的机器学习模型建立方法,属于机器学习模型建立技术领域,解决了市场上盾构机等大型设备和工程项目之间自动进行精准匹配的信息产品缺少的问题;包括:通过分类用训练数据训练智能提取分类模型,完成项目类信息数据和设备类信息数据的提取、分类和汇总,建立信息数据库,通过匹配用训练数据训练数据匹配模型完成对项目类信息数据和设备类信息数据的分类匹配,完成数据匹配模型的训练后,根据评估标准,检查数据匹配模型的实用性,实用性达标后,将信息数据库输入数据匹配模型进行实际应用;本发明实现了自动寻求盾构机等大型设备和工程项目之间的最高匹配度,从而提高了盾构机等大型设备的周转使用率。

Patent Agency Ranking