-
公开(公告)号:CN106296420A
公开(公告)日:2017-01-04
申请号:CN201510272423.3
申请日:2015-05-25
Applicant: 中国科学院声学研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及一种社区发现方法,包括:从待发现社区的网络中选取若干个种子节点,由所述种子节点出发进行局部扩张,得到网络中所要发现的社区。本发明的方法只需要从种子节点进行局部扩张,极大地降低了算法复杂度,以便应用于大规模的网络中。
-
公开(公告)号:CN106972967B
公开(公告)日:2020-07-24
申请号:CN201710195501.3
申请日:2017-03-29
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所
Abstract: 本发明提出了一种用于链路预测的深度学习降维方法和装置,该方法,包括:根据各个网络节点在设定时间段内的连接关系,确定每个网络节点的一级连接网络节点和二级连接网络节点;按照设定时长将所述设定时间段划分为多个时间片,并根据所述各个网络节点在每个时间片内的连接关系,确定出在每个时间片内每个网络节点与对应的一级连接网络节点和二级连接网络节点的连接关系;根据在每个时间片内每个网络节点与对应的一级连接网络节点和二级连接网络节点的连接关系,通过深度学习算法模型,对所述各个网络节点进行链路预测。本发明减少输入到深度学习算法模型的数据量,减少学习训练时间并提高链路预测的准确性。
-
公开(公告)号:CN107545508A
公开(公告)日:2018-01-05
申请号:CN201610474035.8
申请日:2016-06-24
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所
IPC: G06Q50/00
Abstract: 本发明提供了一种基于社区结构的集体预测方法,所述方法包括:步骤1)遍历网络V中的每个节点,利用社区模块度指标生成若干个社区,每个节点归属于其中一个社区;步骤2)利用网络V中已知标签的节点自身的特征向量和社区结构向量训练预测模型;步骤3)计算所有未知标签节点的自身特征向量和社区结构向量,输入预测模型获取所有未知标签节点的标签和概率;反复进行该步骤,直至所有未知标签节点的标签不再发生改变,输出所有未知标签节点的最终标签和概率。本发明的方法能够提高社区结构中节点标签的预测的正确率。
-
公开(公告)号:CN106972967A
公开(公告)日:2017-07-21
申请号:CN201710195501.3
申请日:2017-03-29
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院声学研究所
CPC classification number: H04L41/147 , G06N20/00 , G06Q10/04 , H04L41/12
Abstract: 本发明提出了一种用于链路预测的深度学习降维方法和装置,该方法,包括:根据各个网络节点在设定时间段内的连接关系,确定每个网络节点的一级连接网络节点和二级连接网络节点;按照设定时长将所述设定时间段划分为多个时间片,并根据所述各个网络节点在每个时间片内的连接关系,确定出在每个时间片内每个网络节点与对应的一级连接网络节点和二级连接网络节点的连接关系;根据在每个时间片内每个网络节点与对应的一级连接网络节点和二级连接网络节点的连接关系,通过深度学习算法模型,对所述各个网络节点进行链路预测。本发明减少输入到深度学习算法模型的数据量,减少学习训练时间并提高链路预测的准确性。
-
公开(公告)号:CN103309926A
公开(公告)日:2013-09-18
申请号:CN201310078204.2
申请日:2013-03-12
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G06F17/30
Abstract: 本发明提出了基于条件随机场的中英文混合命名实体识别方法及系统,所述方法包含:步骤101)用于将用户的查询语音转换为文本的步骤;步骤102)用于基于有限状态机将文本信息分离为中文单字和英文单词的步骤;步骤103)用于对分离词汇的文本进行特征提取的步骤;步骤104)用于根据特征提取的结果并采用训练的CRF模型对文本进行实体识别,标记出实体类别;其中,所述CRF模型为线性链结构的条件随机场模型。所述步骤102)进一步包含:步骤102-1)对中英文进行字符分离;步骤102-2)用有限状态机进行英文词串的识别,即合并相邻的英文字母、空格以及英文中的符号;步骤102-3)对英文词串进行分词。
-
公开(公告)号:CN103020230A
公开(公告)日:2013-04-03
申请号:CN201210543839.0
申请日:2012-12-14
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G06F17/30
Abstract: 本发明实施例提供一种语义模糊匹配方法,所述方法包括:对语音识别后的文本进行特征提取,得到特征数据;用条件随机场CRF模型对所述特征数据进行命名实体的识别,找到句子中关键语义类;对所述关键语义类进行精确匹配,在精确匹配失败时进行模糊匹配,计算所述关键语义类与词典中关键词的相似度,选择相似度较大的关键词替代所述关键语义类,并进行类别标注。本发明实施例利用统计的方法,即CRF进行序列标注,将查询语句中的关键语义类进行初步标注和定位,缩小模糊匹配的范围,然后再依照领域词典,进行相似度计算,用相似度最大的词典词条来取代用户查询中出错的关键语义类,减少了运算量,提高了识别的速度。
-
公开(公告)号:CN107688576B
公开(公告)日:2020-06-16
申请号:CN201610633439.7
申请日:2016-08-04
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
Abstract: 本发明公开了一种CNN‑SVM模型的构建方法,所述方法包括:从社交媒体上抓取基于某一事件的所有评论和转发信息,构建训练样本集;建立包含卷积层、采样层和分类层的CNN模型,利用训练样本集训练CNN模型的各层参数;将训练好参数的CNN模型中的卷积层、采样层与SVM分类器联合在一起,构成CNN‑SVM模型;将训练样本集输入CNN‑SVM模型,训练SVM分类器的参数;所述CNN‑SVM模型构建完成。基于CNN‑SVM模型,本发明还提供了一种倾向性分类方法,并构建转发树,能够对含有转发文本的待分类评论进行准确分类。本发明的倾向性分类方法可以提高分类的正确率。
-
公开(公告)号:CN106959967B
公开(公告)日:2019-11-19
申请号:CN201610018320.9
申请日:2016-01-12
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G06F16/953 , H04L12/24 , H04L12/751
Abstract: 本发明提供了一种链路预测模型的训练方法,所述方法包括:步骤S1)对抓取网络数据进行预处理,将预处理后的网络数据提取训练集;步骤S2)对训练集构造的网络进行特征提取,将提取的特征组成特征集;所述特征包括:基于邻居的特征和基于网络游走的特征;步骤S3)对所述特征集用梯度迭代树模型进行特征转换,得到新的多维特征集;步骤S4)将特征集和新的多维特征集进行融合输入链路预测模型,训练得到所述链路预测模型的参数,从而得到训练完毕的链路预测模型。本发明的方法只需要从现有的特征集入手就能扩展特征集的数量;不需要再从网络中提取新的特征,极大地减少了特征提取难度;而且提升了模型的预测性能和鲁棒性。
-
公开(公告)号:CN107688576A
公开(公告)日:2018-02-13
申请号:CN201610633439.7
申请日:2016-08-04
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
CPC classification number: G06F16/35 , G06K9/6269 , G06K9/6273 , G06N3/0454 , G06N3/08
Abstract: 本发明公开了一种CNN-SVM模型的构建方法,所述方法包括:从社交媒体上抓取基于某一事件的所有评论和转发信息,构建训练样本集;建立包含卷积层、采样层和分类层的CNN模型,利用训练样本集训练CNN模型的各层参数;将训练好参数的CNN模型中的卷积层、采样层与SVM分类器联合在一起,构成CNN-SVM模型;将训练样本集输入CNN-SVM模型,训练SVM分类器的参数;所述CNN-SVM模型构建完成。基于CNN-SVM模型,本发明还提供了一种倾向性分类方法,并构建转发树,能够对含有转发文本的待分类评论进行准确分类。本发明的倾向性分类方法可以提高分类的正确率。
-
公开(公告)号:CN106959967A
公开(公告)日:2017-07-18
申请号:CN201610018320.9
申请日:2016-01-12
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G06F17/30 , H04L12/24 , H04L12/751
Abstract: 本发明提供了一种链路预测模型的训练方法,所述方法包括:步骤S1)对抓取网络数据进行预处理,将预处理后的网络数据提取训练集;步骤S2)对训练集构造的网络进行特征提取,将提取的特征组成特征集;所述特征包括:基于邻居的特征和基于网络游走的特征;步骤S3)对所述特征集用梯度迭代树模型进行特征转换,得到新的多维特征集;步骤S4)将特征集和新的多维特征集进行融合输入链路预测模型,训练得到所述链路预测模型的参数,从而得到训练完毕的链路预测模型。本发明的方法只需要从现有的特征集入手就能扩展特征集的数量;不需要再从网络中提取新的特征,极大地减少了特征提取难度;而且提升了模型的预测性能和鲁棒性。
-
-
-
-
-
-
-
-
-