实体识别方法、装置、设备及存储介质

    公开(公告)号:CN114861661A

    公开(公告)日:2022-08-05

    申请号:CN202110077227.6

    申请日:2021-01-20

    Abstract: 本申请涉及一种实体识别方法、装置、设备及存储介质。该方法包括获取非法集资线索数据;确定与非法集资线索数据对应的字向量序列;利用预先训练得到的BiLSTM‑CRF模型对字向量序列进行推理,得到与非法集资线索数据对应的标签序列;从标签序列中提取属于实体标签的目标标签,并将目标标签对应的数据作为非法集资线索数据中的非法集资线索实体。可见,采用本申请的技术方案实现了对非法集资线索实体的自动识别,不仅识别效率高,且可以做到实时识别。

    一种基于联邦图神经网络的多语种社交事件检测方法

    公开(公告)号:CN113076422B

    公开(公告)日:2022-06-03

    申请号:CN202110406469.5

    申请日:2021-04-15

    Abstract: 本发明涉及社交事件检测技术领域,且公开了一种基于联邦图神经网络的多语种社交事件检测方法,包括以下步骤:S1:提取消息,将社交信息中的消息提取出来,然后将和消息有关的消息也提取出来当作异构图中的节点;S2:添加节点边,根据社交信息添加节点之间的边;S3:预训练阶段,使用图神经网络学习消息的表征,对消息图进行初始化并且初始化模型。本发明将社会信息中丰富的语义和结构信息融合在一起,以获取更多的知识,能够应对持续的社交检测事件,并使用动态社交流扩展其知识,可以实现不同语言模态数据环境下高准确性的事件检测,有效缓解了少样本的小语种事件检测难题。

    一种互联网网站相似度分析方法、装置以及可读存储介质

    公开(公告)号:CN113378090A

    公开(公告)日:2021-09-10

    申请号:CN202110445408.X

    申请日:2021-04-23

    Abstract: 本发明公开了一种互联网网站相似度分析方法、装置以及可读存储介质,方法包括:从多个未分类的互联网网站中提取文本特征词;将各个未分类的互联网网站的文本特征词分别输入预先获取到的孪生网络编码工具,得到各个未分类的互联网网站的文本向量序列,其中:所述孪生网络编码工具是从训练好的孪生网络中的输入层至权值共享循环神经网络层进行迁移得到,且所述孪生网络的训练是基于从多个已分类的互联网网站中提取的文本特征词实现;将各个未分类的互联网网站的文本向量序列组成的矩阵进行降维处理得到低维弱相关矩阵;对低维弱相关矩阵进行聚类分析,根据聚类分析结果获取所述多个未分类的互联网网站的相似度情况,从而实现互联网网站相似度分析。

    一种基于联邦图神经网络的多语种社交事件检测方法

    公开(公告)号:CN113076422A

    公开(公告)日:2021-07-06

    申请号:CN202110406469.5

    申请日:2021-04-15

    Abstract: 本发明涉及社交事件检测技术领域,且公开了一种基于联邦图神经网络的多语种社交事件检测方法,包括以下步骤:S1:提取消息,将社交信息中的消息提取出来,然后将和消息有关的消息也提取出来当作异构图中的节点;S2:添加节点边,根据社交信息添加节点之间的边;S3:预训练阶段,使用图神经网络学习消息的表征,对消息图进行初始化并且初始化模型。本发明将社会信息中丰富的语义和结构信息融合在一起,以获取更多的知识,能够应对持续的社交检测事件,并使用动态社交流扩展其知识,可以实现不同语言模态数据环境下高准确性的事件检测,有效缓解了少样本的小语种事件检测难题。

Patent Agency Ranking