-
公开(公告)号:CN116089868A
公开(公告)日:2023-05-09
申请号:CN202211462734.2
申请日:2022-11-21
Applicant: 中国科学院自动化研究所 , 天津中科智能识别有限公司
IPC: G06F18/241 , G06F40/30
Abstract: 本发明提供一种文本分类模型的攻击方法、装置、电子设备以及存储介质,涉及人工智能安全技术领域,所述方法包括:获取待分类文本以及预先训练好的目标生成器,所述目标生成器基于第一训练数据对原始生成器进行训练得到,所述原始生成器基于掩码语言模型构建;将所述待分类文本输入至所述目标生成器中,得到所述待分类文本对应的目标错分文本;将所述目标错分文本输出至待攻击分类模型中,得到所述待分类文本对应的目标错分结果,以解决现有技术中对文本分类模型的攻击效率低以及生成的错分文本的语义质量低的技术问题。
-
公开(公告)号:CN115827876A
公开(公告)日:2023-03-21
申请号:CN202310032603.9
申请日:2023-01-10
Applicant: 中国科学院自动化研究所
IPC: G06F16/35 , G06F40/205
Abstract: 本申请提供一种未标注文本的确定方法、装置和电子设备,涉及数据处理技术领域。该方法包括:获取多个未标注文本、多个已标注文本以及多个已标注文本各自的类别标签;分别将多个未标注文本和多个已标注文本输入至文本类别分析模型的特征提取网络中,根据得到的多个未标注文本各自对应的特征向量和多个已标注文本各自对应的特征向量,从多个未标注文本中确定多个候选未标注文本;根据多个候选未标注文本各自对应的类别标签分布熵值,从多个候选未标注文本中确定目标未标注文本,目标未标注文本用于训练文本类别分析模型,可以准确地选择未标注文本,从而提高了训练得到的文本类别分析模型的泛化能力。
-
公开(公告)号:CN114357111A
公开(公告)日:2022-04-15
申请号:CN202111619071.6
申请日:2021-12-27
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种政策关联影响分析方法、装置、电子设备及存储介质,所述方法包括:构建目标异质信息网络,构建预训练语言模型以及构建目标向量运算模型;获取待测政策数据,待测政策数据包括政策要素以及政策要素之间的关联关系,政策要素包括政策内容和政策背景;将待测政策数据映射至目标异质信息网络中,得到包含关联关系的政策要素的节点学习结果;将待测政策数据映射至预训练语言模型中,得到包含政策背景的政策内容的训练学习结果;将节点学习结果和训练学习结果映射至目标向量运算模型中,得到政策关联影响分析结果。本发明信息利用充分、分析结果准确度高。
-
公开(公告)号:CN109978358A
公开(公告)日:2019-07-05
申请号:CN201910202920.4
申请日:2019-03-18
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于机器学习领域,具体涉及了一种基于半监督学习的销售风险点检测方法、系统、装置,旨在解决销售风险点分析效率低、准确率不高、应用场景局限以及大数据环境下难以应用的问题。本发明方法包括:获取数据并构建图数据库;将图数据库中的数据清洗成原始状态;对数据聚类,找出平均轮廓系数接近1时的k值;标记k个聚类数据的特征并设置规则,采用随机森林法分类数据;分析数据之间的相关性,找出风险产品组合;采用知识图谱展示风险点。本发明结合有监督与无监督学习,可以有效地检测出企业可能存在的金融风险并为企业提供建议,优化团队组合,丰富产品搭配。
-
公开(公告)号:CN108304502A
公开(公告)日:2018-07-20
申请号:CN201810044908.0
申请日:2018-01-17
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及一种基于海量新闻数据的快速热点检测方法及系统,所述快速热点检测方法包括:对多个待处理新闻文本进行链式聚类,得到粗聚类集合;基于快速搜索和寻找密度峰值方法,对所述粗聚类集合进行搜索,得到细聚类集合;提取所述细聚类集合中的代表性短语,所述代表性短语为热点词语。本发明可直接对多个待处理新闻文本进行链式聚类,得到粗聚类集合;进一步基于快速搜索和寻找密度峰值方法,进行聚类,从而得到细聚类集合,并从中提取代表性短语,从而可快速捕捉到新闻文本中的热点词语,可提高计算效率和准确性。
-
公开(公告)号:CN107577656A
公开(公告)日:2018-01-12
申请号:CN201710565733.3
申请日:2017-07-12
Applicant: 中国科学院自动化研究所
IPC: G06F17/27
Abstract: 本发明涉及文本隐含语义激活方法及系统,所述激活方法包括:获取待测文本的待测词项信息;根据文本集合知识库及所述待测文本的待测词项信息,确定所述文本集合知识库的词表中每个参考词项的激活系数;所述文本集合知识库包括多个参考词项共同构成的词表、对应各参考词项的参考词向量及参考词频;根据各激活系数,选取对应的参考词项构成待测文本的隐含语义集合;将所述隐含语义集合添加到所述待测文本中进行语义扩充。从而能够准确确定待测文本的隐含信息,准确度高。
-
公开(公告)号:CN103903437A
公开(公告)日:2014-07-02
申请号:CN201410069384.2
申请日:2014-02-27
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种基于视频交通检测数据的机动车出行OD矩阵获取方法,该方法包括:确定OD交通小区;根据视频检测器的安装位置,将视频检测器归属到每一个OD交通小区,并建立视频检测器、视频检测点与相应OD交通小区之间的对应关系;获取研究地理区域中所有视频检测器在待获取OD矩阵的时间区间内的车辆检测数据,并依据视频检测器识别得到的车辆车牌号、通过视频检测点的时刻,获取时间区间内的每日OD矩阵;将时间区间划分为整小时段,比对车辆车牌号和经过车辆检测点的时间,获取每日小时OD矩阵;获取每日高峰小时OD矩阵。本发明方法简单,结果直观,且能够准确定量反映交通小区之间的出行交换量,能为交通规划、交通影响评价提供基础输入数据。
-
公开(公告)号:CN103440235A
公开(公告)日:2013-12-11
申请号:CN201310363414.6
申请日:2013-08-20
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种基于认知结构模型的文本情感类型识别方法及装置,该方法包括:对于输入的海量开源文本,基于通用语义词典和句法依存关系,采用统计方法自动构建情感维度词典;对所构建的情感维度词典进行求精,求精具体包括语义、情感倾向的不一致性处理和非情感词的过滤;基于求精后得到的高质量的情感维度词典,结合情感认知结构模型中情感维度值与情感类型的对应关系,得到相应的情感类型。本发明的上述方案设计思路、可解释性、使用灵活性及有效性上均明显优于已有方法,可用于商务智能、社情舆情、决策评估等领域面向文本的情感分析与识别。
-
公开(公告)号:CN103414792A
公开(公告)日:2013-11-27
申请号:CN201310389369.1
申请日:2013-08-30
Applicant: 中国科学院自动化研究所 , 东莞中国科学院云计算产业技术创新与育成中心
IPC: H04L29/08
Abstract: 本发明公开了一种基于云计算的加式制造资源调度系统及相应的方法,该系统包括:客户端,用于请求加式制造任务,接受来自云操作系统的反馈信息;服务端,用于执行加式制造任务,接收来自云操作系统的加式制造请求,将制得的产品发给收货方;云操作系统,用于协调处理客户端和服务端之间的工作;收货方,用于接收加式制造服务得到的产品。本发明还公开了一种加式制造资源调度方法。本发明基于云计算技术通过计算机远程操控实现对3D打印机的自动装填用料和自动去除模型,根据客户需求对同一地点打印的不同部件进行自动组装,解决了当前以3D打印为代表的加式制造业资源调度优化问题,使3D打印机由单机走向网络化,优化了有限资源利用率。
-
-
-
-
-
-
-
-