结合网络拓扑和商业属性的ICT供应链关键节点识别方法

    公开(公告)号:CN112288495A

    公开(公告)日:2021-01-29

    申请号:CN202011238426.2

    申请日:2020-11-09

    Abstract: 本发明涉及结合网络拓扑和商业属性的ICT供应链关键节点识别方法,属于自然语言处理与机器学习领域。主要为了解决ICT供应链网络节点关键性受到节点本身商业属性和在网络中的拓扑结构的双重影响的问题。本发明首先,利用doc2vec从句子嵌入得到ICT供应链网络供应商节点公司类型、登记状态、住所和经营范围的向量表示,并将注册资本进行归一化,将这四种商业属性的向量和注册资本归一化的数值拼接得到融合五种商业属性的句子向量S1;其次利用Deepwalk算法得到ICT供应链网络节点拓扑嵌入向量S2;最后向量S1和S2进行拼接,并通过线性分类实现ICT供应链网络关键节点识别。在ICT供应链网络的供应商节点信息数据集上实验,结果表明本发明能达到较好的分类效果,准确率达71.4%。

    多注意力机制跨度级小样本命名实体识别方法

    公开(公告)号:CN115659978A

    公开(公告)日:2023-01-31

    申请号:CN202211331584.1

    申请日:2022-10-28

    Abstract: 本发明涉及多注意力机制跨度级小样本命名实体识别方法,属于自然语言处理领域。本发明首先对句子进行跨度枚举并通过BERT编码器编码生成跨度连贯性表示;其次,提出跨度内注意力机制关注重要字符信息,引入跨度间注意力机制关注与目标跨度相关度高的其他跨度;然后,利用跨度边界注意力机制关注支持集中实体跨度边界共有特征,利用实例级跨度注意力机制关注与查询集样本跨度相关度高的支持集样本跨度,生成实体类别原型;最后,通过计算支持集和查询集间距离进行实体类别预测。本发明能够改善token级基于度量元学习方法中的语义截断问题,有效提升小样本命名实体识别任务的准确率。

Patent Agency Ranking