-
公开(公告)号:CN113254575B
公开(公告)日:2022-07-22
申请号:CN202110441185.X
申请日:2021-04-23
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于多步证据推理的机器阅读理解方法与系统。本方法的步骤包括:1)将文章P和问题Q输入全局编码器,生成输入字符向量表示U;2)对U进行编码得到输入表示g并输入多步证据推理机;3)多步证据推理机根据g进行推理得到与问题Q相关的的开始证据向量和结束证据向量;4)根据多步证据推理机最终计算得到的与问题Q相关的起始证据向量sT+1、结束证据向量eT+1和问题的表达向量qcls计算问题Q的分值score,当分值score高于设定阈值θ,则判定该问题Q不可回答;否则判定该问题Q存在答案,并抽取从文章P中获取答案的开始位置start‑position和结束位置end‑position。
-
公开(公告)号:CN113254576A
公开(公告)日:2021-08-13
申请号:CN202110453104.8
申请日:2021-04-26
Applicant: 中国科学院信息工程研究所
IPC: G06F16/33 , G06F16/35 , G06F40/211 , G06F40/216 , G06F40/30 , G06N5/02
Abstract: 本发明公开了一种人类行为与情感的预测、溯源方法及装置,对情感、需求和行为三者关联关系进行统一建模,可以从认知的角度通过情感、需求和行动之间的关系来模拟个体活动,实现了情感预测、情感溯源、行为预测及行为溯源四个任务。本发明可以对文本内容进行初步有效的情感预测和溯源以及行为预测和溯源,更好地揭示需求、情感和行为之间的本质关系,有助于研究人员追踪情绪反应和行为的起源,并为分析提供更合理的解释。
-
公开(公告)号:CN110399261B
公开(公告)日:2020-12-18
申请号:CN201910508755.5
申请日:2019-06-13
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于共现图的系统告警聚类分析方法。本方法为:1)利用历史系统告警信息构建通用共现图;根据通用共现图中节点之间的距离将各系统告警信息聚为若干故障簇,并为每一故障簇设置一生命周期;2)对于一新产生的系统告警信息a,计算系统告警信息a与处于生命周期内的各个故障簇之间的距离;当系统告警信息a与一故障簇的距离小于设定阈值时,则将系统告警信息a加入到该故障簇中,否则为该系统告警信息a新建一个故障簇;3)在过去的一设定时间段内如果有新的系统告警信息纳入一故障簇,则维持该故障簇处于生命周期内,否则删除对应的故障簇。本发明能更准确得将有内在联系的系统告警聚到同一故障簇中。
-
公开(公告)号:CN105138580B
公开(公告)日:2018-11-23
申请号:CN201510462971.2
申请日:2015-07-31
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明涉及一种基于阻断连边的网络负面信息影响最小化方法。该方法首先采用有向图表示社交网络中信息的传播,并利用贪婪算法找到该有向图中的k条边,使得当去掉该k条边时负面信息的感染面积最小,其中k为正整数;然后切除该k条边以使负面信息传播的范围最小。本发明通过贪婪算法寻找出可以将恶意信息扩散范围最小的k条边,这k条边远远小于社交网络图的总边数。本发明能够对于恶意信息已经爆发的社交网络进行有效地控制,使恶意信息的传播范围大大降低,所提出的贪婪算法是最接近理论最优解的,远远好于其他启发式算法。
-
公开(公告)号:CN103812872B
公开(公告)日:2016-11-23
申请号:CN201410073426.X
申请日:2014-02-28
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于混合狄利克雷过程的网络水军行为检测方法及系统,其方法为,采集包括用户行为特征和内容特征的原始数据,并对每个维度的原始数据进行量化表示构成用户的历史行为向量,构成待聚类用户数据集;对待聚类用户数据集中的历史行为向量进行聚类,得到至少一个分类用户行为集合;将所有分类用户行为集合中的数据进行转换,对转换后的数据中具有相同用户标识的数据合并,得到序列数据库;模式挖掘模块对序列数据库进行序列模式挖掘,得到分别对应每个分类用户行为集合的至少一个事务序列模式;水军判断模块比较每个事务序列模式,就可以判断出哪个分类用户行为集合是水军账号。本发明很容易分辨出哪一类属于水军账号。
-
公开(公告)号:CN105468681A
公开(公告)日:2016-04-06
申请号:CN201510783824.5
申请日:2015-11-16
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F17/30867 , G06Q50/01
Abstract: 本发明涉及一种基于话题模型的网络负面信息影响最小化方法,包括如下步骤:1)采用有向图表示社交网络中信息的传播,通过话题模型分别计算负面信息的概率分布和每条边上的历史信息的概率分布;2)分别计算负面信息的概率分布和每条边上的历史信息的概率分布的距离,即KL散度d(w,i),其中d表示KL散度的计算结果,w表示历史信息的话题分布,i表示负面信息的话题分布;3)计算和其中b(w)和o(w)分别为中心度和出度入度算法的计算结果,然后从大到小排序,并去掉前k个节点,使负面信息的传播范围最小。本发明对于恶意信息已经爆发的社交网络能进行有效地控制,使负面信息的影响范围大大降低。
-
公开(公告)号:CN103795592A
公开(公告)日:2014-05-14
申请号:CN201410027720.7
申请日:2014-01-21
Applicant: 中国科学院信息工程研究所
IPC: H04L12/26
Abstract: 本发明涉及一种网络水军的检测方法及装置。其中,网络水军的检测方法包括:步骤一,将原始的用户描述信息表示为归一化的用户描述向量,从用户描述向量中筛选出已分类数据,将该已分类数据的a%作为深度信念网络DBN模型的训练数据,将该已分类数据的b%作为DBN模型的检测数据;步骤二,用训练数据训练DBN模型,输出训练得到的DBN模型;步骤三,检验输出DBN模型的收敛性和判定准确率,根据检验结果调整所述步骤一和步骤二中的相关参数,直至所述输出DBN模型达到预设收敛条件或终止条件;步骤四,使用最终DBN模型对网络水军进行检测。本发明的网络水军的检测方法及装置,既提高了网络水军检测算法的收敛性和准确率,又缩短了海量样本数据下的模型训练时间。
-
公开(公告)号:CN116910195A
公开(公告)日:2023-10-20
申请号:CN202310462381.4
申请日:2023-04-26
Applicant: 中国科学院信息工程研究所
IPC: G06F16/332 , G06F16/35 , G06F40/211 , G06F40/30 , G16H80/00
Abstract: 本发明涉及一种层次化细粒度医疗对话标注方法和系统。该方法选取待标注的文本片段,对待标注的文本片段的话语意图进行标注,并采用层级化语义内容标注体系对待标注的文本片段的语义内容进行标注。所述层级化语义内容标注体系包含三个层级:第一层级是对于话语所处的对话阶段的标注;第二层级是关于话语内容对应的信息类别的标注;第三层级是对具体内容的标注。本发明从句法‑语义、对话级‑句子级多角度构建了逻辑清晰的层次化标注体系,同时设置了更加细粒度的槽位信息,针对医疗对话数据的否定语义和条件语义的特点提出了状态和条件的标注标签,形成了综合、全面的标注规范,能够实现更加完善、更加细粒度的语义内容标注。
-
公开(公告)号:CN116738998A
公开(公告)日:2023-09-12
申请号:CN202310462367.4
申请日:2023-04-26
Applicant: 中国科学院信息工程研究所
IPC: G06F40/30 , G06F16/332 , G16H80/00
Abstract: 本发明涉及一种基于Web的医疗对话多粒度语义标注系统和方法。该系统包括文件管理模块、对话展示模块、语句模块和标注模块;所述文件管理模块用于进行文件的管理;所述对话展示模块用于展示对话语句和对应说话者的角色信息;所述语句模块用于显示标注者当前选择的待标注语句及其来源;所述标注模块用于根据设计的标注规范进行标注功能的设置,并采用多层次的标注框架进行标注。本发明针对医疗对话领域的数据特征和应用需求设计开发了高效简洁的标注系统,具备多轮多角色数据展示、多粒度文本自由划选、层次化复杂语义数据标注等功能,对于标注具有更强的规范性和完备性。本发明设计的标注流程能够降低数据标注难度,提高标注效率。
-
公开(公告)号:CN110233938B
公开(公告)日:2020-12-22
申请号:CN201910398052.1
申请日:2019-05-14
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提出一种基于可疑性度量的团伙诈骗电话识别方法,采用无监督的方式,利用电话号码之间的呼叫记录信息,为每个电话号码定义可疑性度量,采用风险等级量化的方式识别团伙诈骗电话。本方法不需引入用户的主观标记结果,不仅能避免主观判断带来的缺陷,还能在较短时间内完成模型训练与线上使用,为用户遭受团体诈骗提供了一种简单、实用的识别方法,有效地缓解了滞后性所带来的问题。
-
-
-
-
-
-
-
-
-