一种海量文本相似度计算方法、系统、装置及存储介质

    公开(公告)号:CN117290460A

    公开(公告)日:2023-12-26

    申请号:CN202311576057.1

    申请日:2023-11-24

    Inventor: 孙琦 魏东晓 于通

    Abstract: 本发明提出的一种海量文本相似度计算方法、系统、装置及存储介质,属于文本识别技术领域。所述方法包括:进行词袋持久化,加载词袋并构建用于存放文档索引的AC树;对待检测文档进行预处理;利用重要特征排除待检测文档中的不相关文档;根据文档索引,搜索对应文档,采用多特征融合的相似度计算方法,识别出待检测文档的相似文档及相似度值。本发明综合考虑了文本字面相似度和语义相似度,能够保证相似文档计算的准确性,同时能够有效的在海量文本中快速检索出相似文档。

    一种基于网络节点表征的未知设备识别方法及系统

    公开(公告)号:CN115174450A

    公开(公告)日:2022-10-11

    申请号:CN202210785308.6

    申请日:2022-07-05

    Abstract: 本发明公开一种基于网络节点表征的未知设备识别方法及系统,包括:获取未知设备的网络数据,对网络数据构建网络节点初始表征和网络节点连接图;对网络节点连接图和网络节点初始表征进行社群探测,对得到的社群进行编码;对网络数据进行网络节点PR值和网络节点出入度的计算;将编码后的社群、网络节点PR值和网络节点出入度与网络节点初始表征进行特征融合,得到网络节点表征;根据网络节点表征对未知设备进行识别,得到设备类型。对流量日志等网络数据,挖掘网络节点间的共现关系,结合社群探测方法为网络节点表征增加社群信息,同时引入网络节点PR值和网络节点出入度作为网络节点嵌入的额外特征,实现对大规模复杂网络中未知设备识别。

    一种基于网络节点表征的未知设备识别方法及系统

    公开(公告)号:CN115174450B

    公开(公告)日:2023-10-03

    申请号:CN202210785308.6

    申请日:2022-07-05

    Abstract: 本发明公开一种基于网络节点表征的未知设备识别方法及系统,包括:获取未知设备的网络数据,对网络数据构建网络节点初始表征和网络节点连接图;对网络节点连接图和网络节点初始表征进行社群探测,对得到的社群进行编码;对网络数据进行网络节点PR值和网络节点出入度的计算;将编码后的社群、网络节点PR值和网络节点出入度与网络节点初始表征进行特征融合,得到网络节点表征;根据网络节点表征对未知设备进行识别,得到设备类型。对流量日志等网络数据,挖掘网络节点间的共现关系,结合社群探测方法为网络节点表征增加社群信息,同时引入网络节点PR值和网络节点出入度作为网络节点嵌入的额外特征,实现对大规模复杂网络中未知设备识别。

Patent Agency Ranking