-
公开(公告)号:CN117290460A
公开(公告)日:2023-12-26
申请号:CN202311576057.1
申请日:2023-11-24
Applicant: 中孚信息股份有限公司
Abstract: 本发明提出的一种海量文本相似度计算方法、系统、装置及存储介质,属于文本识别技术领域。所述方法包括:进行词袋持久化,加载词袋并构建用于存放文档索引的AC树;对待检测文档进行预处理;利用重要特征排除待检测文档中的不相关文档;根据文档索引,搜索对应文档,采用多特征融合的相似度计算方法,识别出待检测文档的相似文档及相似度值。本发明综合考虑了文本字面相似度和语义相似度,能够保证相似文档计算的准确性,同时能够有效的在海量文本中快速检索出相似文档。
-
公开(公告)号:CN115174450A
公开(公告)日:2022-10-11
申请号:CN202210785308.6
申请日:2022-07-05
Applicant: 中孚信息股份有限公司
Abstract: 本发明公开一种基于网络节点表征的未知设备识别方法及系统,包括:获取未知设备的网络数据,对网络数据构建网络节点初始表征和网络节点连接图;对网络节点连接图和网络节点初始表征进行社群探测,对得到的社群进行编码;对网络数据进行网络节点PR值和网络节点出入度的计算;将编码后的社群、网络节点PR值和网络节点出入度与网络节点初始表征进行特征融合,得到网络节点表征;根据网络节点表征对未知设备进行识别,得到设备类型。对流量日志等网络数据,挖掘网络节点间的共现关系,结合社群探测方法为网络节点表征增加社群信息,同时引入网络节点PR值和网络节点出入度作为网络节点嵌入的额外特征,实现对大规模复杂网络中未知设备识别。
-
公开(公告)号:CN115174450B
公开(公告)日:2023-10-03
申请号:CN202210785308.6
申请日:2022-07-05
Applicant: 中孚信息股份有限公司
Abstract: 本发明公开一种基于网络节点表征的未知设备识别方法及系统,包括:获取未知设备的网络数据,对网络数据构建网络节点初始表征和网络节点连接图;对网络节点连接图和网络节点初始表征进行社群探测,对得到的社群进行编码;对网络数据进行网络节点PR值和网络节点出入度的计算;将编码后的社群、网络节点PR值和网络节点出入度与网络节点初始表征进行特征融合,得到网络节点表征;根据网络节点表征对未知设备进行识别,得到设备类型。对流量日志等网络数据,挖掘网络节点间的共现关系,结合社群探测方法为网络节点表征增加社群信息,同时引入网络节点PR值和网络节点出入度作为网络节点嵌入的额外特征,实现对大规模复杂网络中未知设备识别。
-
-