-
公开(公告)号:CN108829818B
公开(公告)日:2021-05-25
申请号:CN201810599385.6
申请日:2018-06-12
Applicant: 中国科学院计算技术研究所
IPC: G06F16/35
Abstract: 本发明提供了一种构建文本分类模型的方法。该方法包括以下步骤:根据文本信息的字、词语和句子的结构特征构建训练样本集,其中,所述训练样本集中的每一条样本数据对应一条文本信息关于词语的特征矩阵A、关于字的特征矩阵B和该条文本信息对应的类别向量O,O的维度与类别数量相同;以所述训练样本集中关于词语的特征矩阵A和关于字的特征矩阵B为输入,以对应的类别向量O为输出,训练深度学习模型,以获得文本分类模型。根据本发明构建的分类模型进行分类,能够提高文本分类的准确率,尤其适用于短文本分类。
-
公开(公告)号:CN107145897A
公开(公告)日:2017-09-08
申请号:CN201710149488.8
申请日:2017-03-14
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于通信时空特征的演变网络特殊群体挖掘方法及系统,涉及通讯单社区发现技术领域,该方法包括步骤1,根据通信数据,获取时间特征数据与空间特征数据,其中所述空间特征数据为产生所述通信数据的地点;步骤2,按照所述时间特征数据与所述空间特征数据及通信关系,构建静态通信网络,并构建与所述静态通信网络相对应的拉普拉斯矩阵,计算矩阵特征向量,并对矩阵特征向量进行聚类,将聚类分为特殊群体和非特殊群体两种类簇,并获取聚类结果;步骤3,根据所述聚类结果,采取投票机制,获取最终特殊群体聚类结果。
-
公开(公告)号:CN108647730B
公开(公告)日:2020-11-24
申请号:CN201810456096.0
申请日:2018-05-14
Applicant: 中国科学院计算技术研究所
IPC: G06K9/62
Abstract: 本发明涉及机器分类领域,特别是一种利用历史交互数据共现进行的无人工参与的属性划分领域。本发明利用互联网长期的交互数据积累,从海量数据中获取信息,根据历史数据中多数人通过一定时间窗口内浏览、点击等交互行为中共同出现的物体、信息等,将这些物体、信息等通过无监督的技术手段进行归类,从而解决物体划分标准不统一、无划分规则或标准时很难划分、人工参与成本高的现有划分的三个难题,帮助需求方节省成本、创造价值的同时解决划分中遇到的问题。
-
公开(公告)号:CN107145897B
公开(公告)日:2020-01-07
申请号:CN201710149488.8
申请日:2017-03-14
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于通信时空特征的演变网络特殊群体挖掘方法及系统,涉及通讯单社区发现技术领域,该方法包括步骤1,根据通信数据,获取时间特征数据与空间特征数据,其中所述空间特征数据为产生所述通信数据的地点;步骤2,按照所述时间特征数据与所述空间特征数据及通信关系,构建静态通信网络,并构建与所述静态通信网络相对应的拉普拉斯矩阵,计算矩阵特征向量,并对矩阵特征向量进行聚类,将聚类分为特殊群体和非特殊群体两种类簇,并获取聚类结果;步骤3,根据所述聚类结果,采取投票机制,获取最终特殊群体聚类结果。
-
公开(公告)号:CN106874499A
公开(公告)日:2017-06-20
申请号:CN201710102264.1
申请日:2017-02-24
Applicant: 中国科学院计算技术研究所
CPC classification number: G06F16/2465 , G06Q10/04 , G06Q10/063112
Abstract: 本发明提出一种基于集合覆盖理论的最佳协同团队构建方法及系统,涉及大数据挖掘技术领域,该方法包括步骤1,获取单个用户未掌握的技能集合、其他用户已掌握的技能集合,将其他用户已掌握的技能合集分别与单个用户未掌握的技能合集进行交集操作,并将结果进行并集操作,生成单个用户的可指导集合;步骤2,构建最佳协同团队,其中若多个其他用户已掌握的技能合集的并集覆盖单个用户未掌握的技能合集,则将多个其他用户组成用户集合,用户集合中用户最少的集合,作为最佳指导组,并与单个用户组成最佳协同团队。
-
公开(公告)号:CN107092651B
公开(公告)日:2020-07-24
申请号:CN201710149470.8
申请日:2017-03-14
Applicant: 中国科学院计算技术研究所
IPC: G06F16/2458
Abstract: 本发明提出一种基于通信网络数据分析的关键人物挖掘方法及系统,该方法包括步骤1,获取通信记录并进行预处理,根据预处理后的通信记录构建有向加权通信网络,根据所述有向加权通信网络构建有权邻接矩阵,并计算权威值与枢纽值;步骤2,根据所述权威值,及所述有向加权通信网络中两节点链接边的权重,计算新权威值与新枢纽值;步骤3,设置异常特征参数α,并根据所述新权威值与所述新枢纽值,计算最终权威值,对所述最终权威值进行最大‑最小规范化,获得关键人物。本发明能够快速有效的获取通信网络中关键人物的信息,缩短关键人物发现时间,减少工作量。
-
公开(公告)号:CN108829818A
公开(公告)日:2018-11-16
申请号:CN201810599385.6
申请日:2018-06-12
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供了一种构建文本分类模型的方法。该方法包括以下步骤:根据文本信息的字、词语和句子的结构特征构建训练样本集,其中,所述训练样本集中的每一条样本数据对应一条文本信息关于词语的特征矩阵A、关于字的特征矩阵B和该条文本信息对应的类别向量O,O的维度与类别数量相同;以所述训练样本集中关于词语的特征矩阵A和关于字的特征矩阵B为输入,以对应的类别向量O为输出,训练深度学习模型,以获得文本分类模型。根据本发明构建的分类模型进行分类,能够提高文本分类的准确率,尤其适用于短文本分类。
-
公开(公告)号:CN108647730A
公开(公告)日:2018-10-12
申请号:CN201810456096.0
申请日:2018-05-14
Applicant: 中国科学院计算技术研究所
IPC: G06K9/62
Abstract: 本发明涉及机器分类领域,特别是一种利用历史交互数据共现进行的无人工参与的属性划分领域。本发明利用互联网长期的交互数据积累,从海量数据中获取信息,根据历史数据中多数人通过一定时间窗口内浏览、点击等交互行为中共同出现的物体、信息等,将这些物体、信息等通过无监督的技术手段进行归类,从而解决物体划分标准不统一、无划分规则或标准时很难划分、人工参与成本高的现有划分的三个难题,帮助需求方节省成本、创造价值的同时解决划分中遇到的问题。
-
公开(公告)号:CN107092651A
公开(公告)日:2017-08-25
申请号:CN201710149470.8
申请日:2017-03-14
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
CPC classification number: G06F16/2465
Abstract: 本发明提出一种基于通信网络数据分析的关键人物挖掘方法及系统,该方法包括步骤1,获取通信记录并进行预处理,根据预处理后的通信记录构建有向加权通信网络,根据所述有向加权通信网络构建有权邻接矩阵,并计算权威值与枢纽值;步骤2,根据所述权威值,及所述有向加权通信网络中两节点链接边的权重,计算新权威值与新枢纽值;步骤3,设置异常特征参数α,并根据所述新权威值与所述新枢纽值,计算最终权威值,对所述最终权威值进行最大‑最小规范化,获得关键人物。本发明能够快速有效的获取通信网络中关键人物的信息,缩短关键人物发现时间,减少工作量。
-
公开(公告)号:CN106960245A
公开(公告)日:2017-07-18
申请号:CN201710102269.4
申请日:2017-02-24
Applicant: 中国科学院计算技术研究所
CPC classification number: G06N5/022 , G06F16/2465 , G06F2216/03 , G06N7/005 , G06Q50/205
Abstract: 本发明提出一种基于认知过程链的个体知识评价方法及系统,该方法包括对数据进行预处理,对预处理后生成的数据集合进行初始化,根据初始化后的数据集合,训练BKT模型,其中所述初始化后的数据集合包括学习者集合、知识点集合以及学习者对应的知识点的应答结果序列;根据所述BKT模型,计算所述初始化后的数据集合中每个知识点的难度系数、每位学习者的认知能力;根据所述学习者对某个知识点的回答序列训练新BKT模型,将所述新BKT模型回代到每一次隐含状态的转移中,获取学习者已经掌握的知识点集合;根据所述难度系数以及所述认知能力构建目标知识集合,根据所述学习者已经掌握的知识点集合与所述目标知识集合计算学习者知识评价得分。
-
-
-
-
-
-
-
-
-