-
公开(公告)号:CN112287684A
公开(公告)日:2021-01-29
申请号:CN202011192254.X
申请日:2020-10-30
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/295 , G06F40/30
Abstract: 本发明属于领域,具体涉及了一种融合变体词识别的短文本审核方法及装置,旨在解决如何将变体词识别技术融合到有害文本审核任务中并实现模型自动更新的问题。本发明包括:构建配置词库,基于社交媒体平台获取待审核文本数据,对待审核文本数据进行筛选获得可疑文本数据,并去除无意义信息并计算文本特征向量和统计特征向量,将文本特征向量和统计特征向量进行特征融合通过训练好的基于支持向量机的有害文本分类模型获取有害文本,利用预设的关键词抽取算法获取所述有害文本的敏感词写入配置词库。本发明将变体词识别技术融合到文本特征和统计特征计算进行有害文本审核任务中并实现模型自动更新,提高了文本审核的准确率和更新速度。
-
公开(公告)号:CN110083699B
公开(公告)日:2021-01-12
申请号:CN201910202638.6
申请日:2019-03-18
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/35
Abstract: 本发明提出了一种基于深度神经网络的新闻流行度预测模型训练方法,包括:获取特定主题设定时间段的新闻文章数据,用Pandas进行数据清洗后按照设定时间长度进行顺次分组,获取按时间顺序排列得到新闻流行度序列;依据所述新闻流行度序列,从第一个流行度开始依次按照采样长度为w的连续序列作为输入样本,并采样其之后一期的数据作为输出样本,构建训练样本集;随机从训练样本集中选择训练样本对基于LSTM网络的新闻流行度预测模型进行训练,并采用Pearson相关系数进行关联性分析删除不良的训练样本,循环训练过程至训练结束。本发明可以获得用来对无趋势性、无季节性及非线性新闻流行度进行较高准确率预测的新闻流行度预测模型。
-
公开(公告)号:CN109918584A
公开(公告)日:2019-06-21
申请号:CN201910228791.6
申请日:2019-03-25
Applicant: 中国科学院自动化研究所
IPC: G06F16/9537
Abstract: 本发明属于信息技术及安全技术领域,具体涉及一种比特币交易所地址识别方法、系统、装置,旨在解决基于比特币的交易信息判断输入的地址信息是否为交易所地址的问题,本发明方法包括:获取包括比特币地址标识符、比特币流向数据的待识别交易数据作为输入信息;基于输入信息构建比特币交易网络;利用网络表示学习法获取比特币交易网络中节点的特征向量构成特征空间,进一步通过地址分类器识别输入信息中比特币地址标识符是否为真实的比特币交易所地址。本发明中的地址分类器基于交易数据样本和标签样本训练得到,为基于多个映射函数的分类器模型的组合。本发明依赖资源少,且能直接识别交易所地址,达到较好的识别率。
-
公开(公告)号:CN108804412A
公开(公告)日:2018-11-13
申请号:CN201810331227.2
申请日:2018-04-13
Applicant: 中国科学院自动化研究所
CPC classification number: G06F17/2785 , G06F17/2715 , G06F17/2735 , G06Q50/01
Abstract: 本发明涉及自然语言处理领域,提出了一种基于社会媒体的多层级情感分析方法,旨在解决社会媒体中文章灵活多变,训练数据缺失,难以在有限数据集上取得满意的情感分类效果的问题。该方法包括:获取待进行情感分析的社会媒体的文本信息;对上述文本信息进行情感特征分析,根据情感特征分析结果确定上述文本信息的情感。对于来自社会媒体的文章,从词语和篇章两个层级进行优化处理。在词语层级上,进行泛化情感词抽取,以自动化扩充领域词典;在篇章层级上,设计自学习机制,以自动扩充训练样本。本发明实现了对从词和篇章两个层级切入,对社会媒体情感分析中的情感词典和分析模型进行优化。
-
公开(公告)号:CN107153672A
公开(公告)日:2017-09-12
申请号:CN201710171926.0
申请日:2017-03-22
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及一种基于言语行为理论的用户交互意图识别方法及系统,所述用户交互意图识别方法包括:基于外部知识源构建行为标记语词典;根据所述行为标记语词典,自动标注用户在社交媒体平台上输入的在线文本的意图;利用自动标注语料训练基于特征的分类器对所述在线文本的意图进行分类识别,确定用户的交互意图类别。本发明基于言语行为理论的用户交互意图识别方法通过基于外部知识源构建对应不同意图类别的行为标记语词典,并基于行为标记语词典自动标注扩充语料和基于特征分类识别,能够有效识别社交媒体中的用户交互意图,识别准确度高,可用于商务智能、社情舆情、决策评估等领域的意图分析与识别,应用范围广。
-
公开(公告)号:CN103903437B
公开(公告)日:2016-06-08
申请号:CN201410069384.2
申请日:2014-02-27
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种基于视频交通检测数据的机动车出行OD矩阵获取方法,该方法包括:确定OD交通小区;根据视频检测器的安装位置,将视频检测器归属到每一个OD交通小区,并建立视频检测器、视频检测点与相应OD交通小区之间的对应关系;获取研究地理区域中所有视频检测器在待获取OD矩阵的时间区间内的车辆检测数据,并依据视频检测器识别得到的车辆车牌号、通过视频检测点的时刻,获取时间区间内的每日OD矩阵;将时间区间划分为整小时段,比对车辆车牌号和经过车辆检测点的时间,获取每日小时OD矩阵;获取每日高峰小时OD矩阵。本发明方法简单,结果直观,且能够准确定量反映交通小区之间的出行交换量,能为交通规划、交通影响评价提供基础输入数据。
-
公开(公告)号:CN103810283A
公开(公告)日:2014-05-21
申请号:CN201410058585.2
申请日:2014-02-20
Applicant: 东莞中国科学院云计算产业技术创新与育成中心 , 中国科学院自动化研究所
IPC: G06F17/30
CPC classification number: G06F17/3089
Abstract: 本发明涉及数据采集技术领域,尤其是一种基于用户关联关系的微博数据采集方法。本发明采用网络爬虫的方式对微博平台上包含特定关键词的微博信息进行采集,在采集的过程中以用户之间的关联关系作为微博爬虫的链接,首先根据指定的关键词获取微博爬虫的种子用户,然后通过抓取网页的方式获取用户的微博页面,采集其中包含关键词的微博信息,选取出具有潜力的用户,并同时采集有潜力用户的关联关系以获取微博爬虫的下一级链接,从而实现微博信息的自动搜索与采集。本发明解决了根据关键词在微博平台上自动采集包含该关键词的微博等问题,可用于商务智能、社情舆情、决策评估等领域对特定微博内容的获取。
-
公开(公告)号:CN103353981A
公开(公告)日:2013-10-16
申请号:CN201310326078.8
申请日:2013-07-30
Applicant: 中国科学院自动化研究所 , 东莞中国科学院云计算产业技术创新与育成中心
Abstract: 本发明公开了一种基于RFID/无线网络的火灾逃生云指挥系统,该系统包括:火灾灾情探测及报警系统、RFID标签、RFID移动读写设备、移动终端、中央处理模块、云平台、逃生路线计算模块。本发明还公开了一种利用所述系统进行火灾逃生云指挥的方法。本发明利用移动终端作为指挥终端,使用云计算技术、RFID技术将楼内火灾报警系统、火灾预警、火情及人员定位、逃生路线指示等结合起来,形成一个基于RFID和无线网络的火灾逃生云指挥系统和方法。使用本发明,可实现火灾灾情和人员迅速准确地定位,有效指示人员逃生路线,减少火灾中的恐慌,增大逃生概率,增加生存机会,减小损失,并为消防队员组织营救提供便利。
-
公开(公告)号:CN119808934A
公开(公告)日:2025-04-11
申请号:CN202411666076.8
申请日:2024-11-20
Applicant: 中国科学院自动化研究所
IPC: G06N5/04 , G06N3/0442 , G06Q50/00 , G06N3/042 , G06N3/0464 , G06N3/045 , G06F18/25 , G06F40/16
Abstract: 本发明提供一种基于大模型的社会世界模拟方法、系统以及电子设备,其中,上述方法包括:获取多模态社会事件信息;将社会事件信息输入至基于深度学习模型的事件提示词生成器,得到事件提示词;将事件提示词输入至预训练的多模态大模型,得到社会事件多模态特征;将社会时空信息输入至基于深度学习模型的时空提示词生成器,得到时空提示词;将时空提示词输入至预训练的大语言模型,得到社会事件时空特征;通过预训练的多模态大模型,对社会事件多模态特征与社会事件时空特征进行特征融合,得到事件嵌入向量;将事件嵌入向量对应的推理提示词输入至预训练的大语言模型,得到模拟社会事件集合。通过本发明能够提高社会事件模拟的效率与准确性。
-
公开(公告)号:CN118861842B
公开(公告)日:2024-11-29
申请号:CN202411346062.8
申请日:2024-09-25
Applicant: 中国科学院自动化研究所
IPC: G06F18/2413 , G06F18/2415 , G06F18/214
Abstract: 本公开关于社交机器人账号识别模型的训练方法、识别方法和装置,该方法包括:获取账号特征样本,其中,账号特征样本为文本形式的特征样本;将账号特征样本输入账号识别模型,获得将账号特征样本对应的身份识别为社交机器人账号的目标概率;基于目标概率和真实身份标签,计算损失函数的值;通过根据损失函数的值调整账号识别模型的参数,以对账号识别模型进行训练。这样,由于本公开在进行社交机器人账号识别时,所依据的特征类型更丰富、特征内容更全面、特征数量更多,因此可以保证针对账号的身份作出全面的判断,可以减少误识别现象的出现,进而可以提高社交机器人账号的识别准确性。
-
-
-
-
-
-
-
-
-