-
公开(公告)号:CN114510932A
公开(公告)日:2022-05-17
申请号:CN202210110831.9
申请日:2022-01-29
Applicant: 珠海高凌信息科技股份有限公司
IPC: G06F40/279 , G06F40/30 , G06V10/22 , G06V30/40
Abstract: 本发明提出一种自然语言处理方法、电子设备、存储介质,能够提升处理模型对多模态自然语言的处理效率,其中方法包括:获取待识别数据;解析待识别数据,生成数据识别元素与元素位置信息;将数据识别元素、元素位置信息、与待识别数据对应的模态类型嵌入向量进行整合,形成组合识别序列;通过自然语言识别模型对组合识别序列进行识别,得到识别结果。本发明中的自然语言处理方法,将最初获取的待识别数据解析转化为易于处理的数据识别元素与元素位置信息,再将数据识别元素、元素位置信息、与待识别数据对应的模态类型嵌入向量进行整合生成组合识别序列供自然语言识别模型进行识别,进一步提升了对多模态自然语言的处理识别效率。
-
公开(公告)号:CN115759717A
公开(公告)日:2023-03-07
申请号:CN202211383611.X
申请日:2022-11-07
Applicant: 珠海高凌信息科技股份有限公司
IPC: G06Q10/0633 , G06F30/27 , G06N20/00 , G06N5/04
Abstract: 本申请公开了一种大数据分析建模处理方法、装置和存储介质,本申请的方法包括构建分析模型;编辑所述分析模型的输入、输出和特征处理流程;编辑所述分析模型的机器学习模型推理序列;运行所述分析模型的Spark任务,获得运行结果。本申请部署和生成任务时无需编程实现,可针对任务的处理流程和输入输出进行灵活组合,可组合多个模型进行并行或串行处理,实现了大数据的分布式、动态伸缩和跨平台的分析建模。
-
公开(公告)号:CN116304071A
公开(公告)日:2023-06-23
申请号:CN202211323446.9
申请日:2022-10-27
Applicant: 珠海高凌信息科技股份有限公司
IPC: G06F16/36 , G06F16/35 , G06F16/951 , G06F40/289
Abstract: 本申请公开了互联网有害事件的检测方法、装置和存储介质,本申请构造或更新关键词知识图谱,并将知识图谱划分为若干子图;利用聚类算法将文档聚类到有害事件中;通过更新每个有害事件,将每个有害事件插入到有害故事树中,或者根据有害事件创建一个新的有害故事树,实现了移动互联网和互联网中的有害内容检测和分类,目的是从海量的网页及文档数据中发现有害事件,以在线方式以合理的有害故事树组织有害事件;提出了一种基于知识图谱的两层网页文档聚类算法,从大量的网页文本或网页相关新闻中提取有害事件,在新的网页及文档数据到达后,使用在线算法将事件组织成故事树,在有害事件提取方面比传统基于关键词的恶算法更有效。
-
公开(公告)号:CN115422943A
公开(公告)日:2022-12-02
申请号:CN202210938216.7
申请日:2022-08-05
Applicant: 珠海高凌信息科技股份有限公司
IPC: G06F40/30 , G06F40/242 , G06N3/04 , G06F16/35
Abstract: 本申请公开了基于深度学习的自然语言情感处理方法、装置和存储介质,本申请对原始通信文本进行预处理,得不同中文语料对应的不同序列;采用BERT‑MLF模型对预处理后的中文语料序列进行特征提取,获得隐藏层输出,隐藏层输出包括每个序列对应的语义特征和最大池化后的方面特征;利用语义特征和方面特征进行BERT‑MLF模型的训练和测试;采用LSTM网络对语义特征和方面特征进行深度特征提取,获得每个序列的深层语义特征;将深层语义特征经过全连接层,再进入Softmax分类器进行分类,进行模型的训练和测试。本申请减少了模型训练所需的有标签的数据量、所需时间和计算资源,具有更好的适应性,能在短时间内生成可靠的深度学习模型,提高了系统的实用价值。
-
-
-