-
公开(公告)号:CN116561244A
公开(公告)日:2023-08-08
申请号:CN202310403811.5
申请日:2023-04-14
Applicant: 国家计算机网络与信息安全管理中心 , 长城计算机软件与系统有限公司
IPC: G06F16/31 , G06F16/35 , G06F40/289 , G06F16/36 , G06F18/214 , G06F18/24 , G06F40/30 , G06N3/0499 , G06N3/0895
Abstract: 本发明实施例涉及一种目标关系的识别方法及装置,所述方法包括:获取目标关系对应的训练数据集和检测数据集;根据上下句预测和掩码预测对联合模型进行模型预训练,得到训练好的联合抽取预训练模型;将所述训练数据集输入到所述联合抽取预训练模型中进行模型训练,得到训练好的联合抽取模型;将所述检测数据集输入到所述联合抽取模型中进行数据抽取处理,得到检测抽取结果;根据所述检测抽取结果确定所述检测数据集对应目标关系的识别结果。通过将检测数据集输入到训练好的联合抽取模型中,实现数据抽取,得到检测抽取结果,将在抽取到的检测抽取结果进行判断分析,确定所述检测数据集的识别结果;由本方案,可以实现企业关系、资本谱系或实体关系的快速识别的技术效果。
-
公开(公告)号:CN116092102A
公开(公告)日:2023-05-09
申请号:CN202211714858.5
申请日:2022-12-27
Applicant: 国家计算机网络与信息安全管理中心 , 长城计算机软件与系统有限公司
IPC: G06V30/412 , G06V30/413 , G06V30/18 , G06V30/162 , G06V30/148 , G06V30/19 , G06V10/44 , G06V10/26 , G06V10/28 , G06V10/48 , G06V10/764 , G06V10/82 , G06N3/044 , G06N3/08
Abstract: 本发明公开了一种包含文本信息的结构图的处理方法,所述方法包括:基于包含文本信息的结构图的线段组成进行轮廓检测;根据检测出的轮廓拟合出几何多边形;基于所述结构图中文本框的特征条件,从所述几何多边形中过滤掉不符合所述特征条件的形状,得到边框。本发明能够从包含有文本信息的结构图中高效、准确地提取出边框。
-
公开(公告)号:CN115827871A
公开(公告)日:2023-03-21
申请号:CN202211690035.3
申请日:2022-12-27
Applicant: 国家计算机网络与信息安全管理中心 , 长城计算机软件与系统有限公司
IPC: G06F16/35 , G06N3/08 , G06F18/241 , G06N3/0464
Abstract: 本发明提供了一种互联网企业分类的方法和装置,其中该方法包括:S1:获取互联网企业的多维度数据,并对所述多维度数据预处理以生成长文本数据;S2:将所述长文本数据输入基于Transformer编码器的Bert网络模型进行处理;S3:将经过处理后的数据送入分类器来对所述互联网企业进行分类。本发明的方案基于在Transformer架构的深度神经网络中进行自动特征组合学习,能够对互联网企业准确进行行业分类,并能够极大提升互联网企业行业分类的准确率。本发明的方案能够快速将海量企业多维度信息进行识别,无需人工干预。本发明的方案基于大语料预训练模型加下游任务微调的方案能灵活应用在不同场景中海量企业的快速分类。
-
公开(公告)号:CN116561334A
公开(公告)日:2023-08-08
申请号:CN202310403556.4
申请日:2023-04-14
Applicant: 国家计算机网络与信息安全管理中心 , 长城计算机软件与系统有限公司
IPC: G06F16/36 , G06F16/31 , G06N3/0464 , G06F18/22 , G06N3/084
Abstract: 本发明实施例涉及一种关系抽取方法、装置、图谱构建方法及存储介质,所述方法包括:确定预设实体库中各实体之间的关系,所述关系为所述实体库中技术与技术之间的关系,和/或所述实体库中技术与企业之间的关系;根据所述实体库中所述实体之间的关系,建立邻接矩阵;基于所述邻接矩阵,构建与所述实体对应的图卷积网络;利用所述图卷积网络抽取所述实体库中各实体之间的关系。由此,可以实现确定预设实体库中各实体之间的关系,根据实体之间的关系建立邻接矩阵,进而构建与实体对应的图卷积网络,以实现基于图卷积网络简单、便捷地确定各个实体之间的关系,提高效率,提升用户体验。
-
公开(公告)号:CN118965192A
公开(公告)日:2024-11-15
申请号:CN202410924472.X
申请日:2024-07-11
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/2431 , G06F18/25 , G06N3/0455 , G06N3/0499 , G06N3/098 , G06F16/958
Abstract: 本公开提供一种基于多模态融合学习的生成式AI服务网站识别方法。输入人工智能生成服务网站的原始的多维度多模态信息,通过多模态特征提取模型将所述多维度信息转化为人工智能服务网站的文本、图片、代码三种特征向量,将所述三种特征向量输入多模态特征融合识别模型,输出人工智能生成服务网站是否提供人工智能服务的判别结果。本发明通过将网站的文本、图像和代码模态的特征融合实现更加准确的人工智能生成服务网站识别,以提高模型在新兴、多样化网站数据上的泛化性能,增强网站识别与分类模型泛化能力和适应性,突破单一数据类型进行分类的局限性,提高分类系统的泛化能力,使其能够适应不断变化和多样化的人工智能生成式网站内容。
-
公开(公告)号:CN118656490A
公开(公告)日:2024-09-17
申请号:CN202410629623.9
申请日:2024-05-21
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F40/30 , G06N3/0455 , G06N5/04
Abstract: 本发明涉及一种文本分类方法、装置、设备和存储介质,文本分类方法包括:获取待处理文本,待处理文本包含对于目标事件的目标观点;将大模型运用到特定文本分类任务上,在该分类任务的目标立场下对待处理文本进行分类处理,确定目标事件的事件类别,且大模型还是基于少数据量的数据集上训练的,准确率也很高,同时在分类任务的基础上,提出了多任务间的自我校验的可解释优化任务,确定反应目标观点情感倾向的可解释的倾向信息;使用二分类模型对可解释的倾向信息进行语义分析,审核大模型的分类准确性,确定反应目标观点情感倾向的倾向类别;根据倾向类别和事件类别,确定待处理文本的目标类别,有效提高了文本分类的准确性。
-
公开(公告)号:CN111538836B
公开(公告)日:2024-02-02
申请号:CN202010321249.8
申请日:2020-04-22
Applicant: 哈尔滨工业大学(威海) , 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/951 , G06F40/284 , G06F18/2431
Abstract: 本发明涉及一种识别文本类广告中金融广告的方法,其解决了现有广告分析模型无法有效识别金融广告的技术问题,其包括以下步骤:(1)从数据库中获取爬取到的广告文本数据;(2)对步骤(1)的文本数据进行预处理,进行分词以及去除无用信息;(3)将步骤(2)预处理后的文本通过不同的方式表示为计算机可以处理的方式,即文本表示;(4)针对步骤(3)的不同文本表示方式选择合适的分类算法,然后将文本表示的语义信息提炼成类别信息;(5)将步骤(4)中不同文本表示方式表示的分类模型进行整合,获得最终的金融广告识别模型。本发明可广泛应于在文本类广告中识别金融广告的场合。
-
公开(公告)号:CN114819432A
公开(公告)日:2022-07-29
申请号:CN202110065882.X
申请日:2021-01-18
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06Q10/06
Abstract: 本发明实施例涉及一种企业非法集资风险预测方法、装置、电子设备及存储介质,所述方法包括:获取待进行非法集资风险预测的目标企业的企业数据;对所述企业数据进行特征提取,得到所述目标企业的企业特征;将所述企业特征输入至至少一个已训练的非法集资风险预测模型,得到至少一个所述目标企业非法集资的风险概率;根据至少一个所述目标企业非法集资的风险概率确定所述目标企业是否存在非法集资风险。由此,可以提高对企业非法集资风险进行预测的预测结果的准确性。
-
公开(公告)号:CN113076464A
公开(公告)日:2021-07-06
申请号:CN202110392387.X
申请日:2021-04-13
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/953 , G06F16/332 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种基于重构编码异常检测的多通道网络线索发现方法及装置,该方法步骤如下:步骤一、构建面向暗网、telegram、区块链交易网络的正则化多通道网络并进行节点对齐;步骤二、基于多通道图表征重构的特征表示学习的线索检测:该装置包括:多通道网络构建与对齐模块、多通道图表征重构的特征表示学习的线索检测模块。本发明可实现对暗网、国外主流即时通讯工具等多通道的网络进行监测,实现网络异常发现和内容管控,实现针对不良信息发现,或者一些网络异常行为的发现。
-
公开(公告)号:CN110276680B
公开(公告)日:2021-05-07
申请号:CN201910441730.8
申请日:2019-05-24
Applicant: 国家计算机网络与信息安全管理中心 , 北京赛思信安技术股份有限公司
IPC: G06Q40/02
Abstract: 本发明公开了一种应用于互联网金融的真实数据获取方法,涉及国家互联网金融监测领域。首先梳理各网贷机构业务的交易明细数据,进行业务评估;各网贷机构在本地存储一份符合标准的数据,并进行自查,将自查的数据接入国家互联网应急中心。然后各网贷机构通过SDK工具包进行埋点,国家互联网应急中心对各网贷机构实时接入的交易明细数据进行正确性验证,并反馈给网贷机构;同时抽取各网贷机构接入的实时交易数据,按出借和借款业务形成数据流,围绕出借人和借款人两个维度生成披露数据。最后国家互联网应急中心对用户开放数据查验,查验反馈窗口。本发明实现对网贷机构实时接入数据的真实性验证以及进行实时、动态监管的目的。
-
-
-
-
-
-
-
-
-