-
公开(公告)号:CN114817485B
公开(公告)日:2024-09-06
申请号:CN202110078586.3
申请日:2021-01-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/332 , G06F16/35 , G06F18/241
Abstract: 本发明实施例涉及一种非法集资线索识别方法、装置、电子设备及存储介质,所述方法包括:获取多个待进行非法集资线索识别的目标文本数据;基于预设的线索特征规则库从多个所述目标文本数据中确定疑似非法集资线索数据;将所述疑似非法集资线索数据输入至至少一个已训练的非法集资线索分类模型,得到至少一个预测参数;依据所述疑似非法集资线索数据与所述疑似非法集资线索数据对应的至少一个所述预测参数构建非法集资线索数据库。由此,可以提高从海量互联网数据中筛选非法集资线索数据的效率,以及提高最终筛选出的非法集资线索数据的准确性、全面性。
-
公开(公告)号:CN116561335A
公开(公告)日:2023-08-08
申请号:CN202310403733.9
申请日:2023-04-14
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/36 , G06F16/901 , G06F16/35 , G06F40/211
Abstract: 本发明实施例涉及一种图谱构建方法、装置、电子设备及存储介质,所述方法包括:从预设的产业数据库中确定与目标产业匹配的产业数据;根据所述产业数据确定产业链图谱中各实体之间的上下位关系;获取所述目标产业的企业信息;根据所述上下位关系及所述企业信息,构建所述目标产业的产业链图谱。由此,可以实现准确确定产业链图谱中各实体之间的上下位关系,避免需要人工大量的查阅产业资料,简化操作流程,提升了产业链图谱生成的便利性,一定程度上解决了人工构建可能不全面的问题。
-
公开(公告)号:CN116561334A
公开(公告)日:2023-08-08
申请号:CN202310403556.4
申请日:2023-04-14
Applicant: 国家计算机网络与信息安全管理中心 , 长城计算机软件与系统有限公司
IPC: G06F16/36 , G06F16/31 , G06N3/0464 , G06F18/22 , G06N3/084
Abstract: 本发明实施例涉及一种关系抽取方法、装置、图谱构建方法及存储介质,所述方法包括:确定预设实体库中各实体之间的关系,所述关系为所述实体库中技术与技术之间的关系,和/或所述实体库中技术与企业之间的关系;根据所述实体库中所述实体之间的关系,建立邻接矩阵;基于所述邻接矩阵,构建与所述实体对应的图卷积网络;利用所述图卷积网络抽取所述实体库中各实体之间的关系。由此,可以实现确定预设实体库中各实体之间的关系,根据实体之间的关系建立邻接矩阵,进而构建与实体对应的图卷积网络,以实现基于图卷积网络简单、便捷地确定各个实体之间的关系,提高效率,提升用户体验。
-
公开(公告)号:CN114861661A
公开(公告)日:2022-08-05
申请号:CN202110077227.6
申请日:2021-01-20
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/295 , G06N3/04 , G06N3/08 , G06Q40/00
Abstract: 本申请涉及一种实体识别方法、装置、设备及存储介质。该方法包括获取非法集资线索数据;确定与非法集资线索数据对应的字向量序列;利用预先训练得到的BiLSTM‑CRF模型对字向量序列进行推理,得到与非法集资线索数据对应的标签序列;从标签序列中提取属于实体标签的目标标签,并将目标标签对应的数据作为非法集资线索数据中的非法集资线索实体。可见,采用本申请的技术方案实现了对非法集资线索实体的自动识别,不仅识别效率高,且可以做到实时识别。
-
公开(公告)号:CN113076422B
公开(公告)日:2022-06-03
申请号:CN202110406469.5
申请日:2021-04-15
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及社交事件检测技术领域,且公开了一种基于联邦图神经网络的多语种社交事件检测方法,包括以下步骤:S1:提取消息,将社交信息中的消息提取出来,然后将和消息有关的消息也提取出来当作异构图中的节点;S2:添加节点边,根据社交信息添加节点之间的边;S3:预训练阶段,使用图神经网络学习消息的表征,对消息图进行初始化并且初始化模型。本发明将社会信息中丰富的语义和结构信息融合在一起,以获取更多的知识,能够应对持续的社交检测事件,并使用动态社交流扩展其知识,可以实现不同语言模态数据环境下高准确性的事件检测,有效缓解了少样本的小语种事件检测难题。
-
公开(公告)号:CN113076422A
公开(公告)日:2021-07-06
申请号:CN202110406469.5
申请日:2021-04-15
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及社交事件检测技术领域,且公开了一种基于联邦图神经网络的多语种社交事件检测方法,包括以下步骤:S1:提取消息,将社交信息中的消息提取出来,然后将和消息有关的消息也提取出来当作异构图中的节点;S2:添加节点边,根据社交信息添加节点之间的边;S3:预训练阶段,使用图神经网络学习消息的表征,对消息图进行初始化并且初始化模型。本发明将社会信息中丰富的语义和结构信息融合在一起,以获取更多的知识,能够应对持续的社交检测事件,并使用动态社交流扩展其知识,可以实现不同语言模态数据环境下高准确性的事件检测,有效缓解了少样本的小语种事件检测难题。
-
公开(公告)号:CN107038260B
公开(公告)日:2020-03-10
申请号:CN201710390469.4
申请日:2017-05-27
Applicant: 国家计算机网络与信息安全管理中心 , 北京赛思信安技术股份有限公司
IPC: G06F16/215 , G06F16/23 , G06F16/2457 , G06F16/25
Abstract: 本发明公开了一种可保持titan实时数据一致性的高效并行加载方法,属于大数据处理领域;首先,将titan划分为7个并行工作的模块,清洗规则管理模块实时更新过滤规则;数据接收模块接收pieceOfData放入queue1中;数据清洗模块过滤合格数据放入queue2中;ID转换模块与高速索引模块交互,判断当前pieceOfData中的两个点与titan ID的对应关系是否存在与图数据库中;如果是,将titan内部ID属性与ID值替换点保存到pieceOfDataT中,放入到queue4中;否则,将未加载的点放入HashSet中,并将对应的pieceOfData放入queue3中;剩余数据加载模块多线程并行将pieceOfDataT加载到titan中;点加载模块负责将HashSet中点加入titan,将点与titan ID的对应关系加入高速索引模块。本发明每个模块独自或交互完成部分功能,从而实现整体上加载效率的提升。
-
公开(公告)号:CN104077343B
公开(公告)日:2018-08-24
申请号:CN201310739486.6
申请日:2013-12-26
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明提供了一种哈希表元素失效删除方法,解决哈希表失效元素及时删除的问题。该方法通过为每个哈希桶提供超时时间Tbucket,为每个关键码提供超时时间Tkey,两个时间粒度进行不同元素插入、查询时,更新每个关键码值Tkey,并将最新访问的关键码值放置到哈希桶最优先访问的位置上,在此过程中,根据哈希桶超时时间Tbucket设定,检查哈希桶上具有相同哈希值的关键码,如果元素超时,即删除失效元素,同时根据哈希桶扫描策略,检查哈希表其他哈希桶元素上的其他关键码值,并删除因超时失效的元素。
-
公开(公告)号:CN107066450A
公开(公告)日:2017-08-18
申请号:CN201710391483.6
申请日:2017-05-27
Applicant: 国家计算机网络与信息安全管理中心 , 北京赛思信安技术股份有限公司
Abstract: 本发明公开了一种基于学习的即时通信会话切分技术与方法,属于大数据分析领域;将即时通信会话用户两两划分为一组,并将每组的会话话单明细进行分类和基于时间排序;会话切分为:依次选取相邻两条话单R1和R2,计算时间间隔Δt,文本内容相似度Δsim和距离值F(R1,R2);如果F(R1,R2)
-
公开(公告)号:CN113505221B
公开(公告)日:2024-03-12
申请号:CN202010214386.1
申请日:2020-03-24
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司 , 国科智安(北京)科技有限公司
IPC: G06F16/35 , G06F18/2411 , G06Q30/018
Abstract: 本发明公开了一种企业虚假宣传风险识别方法、设备和存储介质。该方法包括:在目标企业对应的多个企业舆情文本中,提取疑似风险文本;在每个疑似风险文本中提取对应种类的风险特征,形成每个疑似风险文本对应的风险特征向量;将多个疑似风险文本分别对应的风险特征向量顺次输入预先训练的风险识别模型,使风险识别模型对每个疑似风险文本进行识别,并将识别为存在虚假宣传风险的疑似风险文本确定为风险文本;根据确定出的所有风险文本的信息,确定目标企业对应的虚假宣传风险强度值;如果虚假宣传风险强度值大于预设的风险阈值,则确定目标企业存在虚假宣传风险。本发明可以避免人工匹配规则的局限性,提升了虚假宣传风险识别的准确性。
-
-
-
-
-
-
-
-
-