-
公开(公告)号:CN109948047B
公开(公告)日:2021-09-28
申请号:CN201910047874.5
申请日:2019-01-18
Applicant: 中国科学院自动化研究所
IPC: G06F16/9535 , G06Q50/00
Abstract: 本发明涉及信息检索领域,具体涉及一种基于转移熵的文化基因排序方法与系统及相关设备,目的在于降低计算的复杂度,并提高排序准确度。本发明的文化基因排序方法包括:针对待排序的每种文化基因,在参与该文化基因传播的所有用户中,根据预设的关联用户数量阈值,筛选出传播该文化基因的关键用户;针对每个关键用户,分别计算该关键用户的每个关联用户到该关键用户的转移熵,进而计算该关键用户的影响力值;根据关键用户的影响力值,分别计算每种文化基因的流行度值;根据每种文化基因的流行度值,分别计算每种文化基因的得分,并根据得分进行排序。本发明提供了一种对文化基因流行度自动排序的方法,降低了计算复杂度,具有较高的排序准确度。
-
公开(公告)号:CN109978358B
公开(公告)日:2021-08-13
申请号:CN201910202920.4
申请日:2019-03-18
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于机器学习领域,具体涉及了一种基于半监督学习的销售风险点检测方法、系统、装置,旨在解决销售风险点分析效率低、准确率不高、应用场景局限以及大数据环境下难以应用的问题。本发明方法包括:获取数据并构建图数据库;将图数据库中的数据清洗成原始状态;对数据聚类,找出平均轮廓系数接近1时的k值;标记k个聚类数据的特征并设置规则,采用随机森林法分类数据;分析数据之间的相关性,找出风险产品组合;采用知识图谱展示风险点。本发明结合有监督与无监督学习,可以有效地检测出企业可能存在的金融风险并为企业提供建议,优化团队组合,丰富产品搭配。
-
公开(公告)号:CN111859980A
公开(公告)日:2020-10-30
申请号:CN202010549951.X
申请日:2020-06-16
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/30 , G06F40/289 , G06F16/9536 , G06N3/04 , G06N3/08
Abstract: 本申请涉及一种讽刺类型的文本识别方法、装置、设备及计算机可读介质。该方法包括:获取待处理文本,待处理文本来自于社交媒体网络平台;采用多种方式提取待处理文本的目标特征信息,目标特征信息为从特征集合中选择出来的多个特征信息的加权和表示;根据第一神经网络模型对目标特征信息的识别结果确定待处理文本的文本类型,第一神经网络模型是采用具有标记信息的训练数据对第二神经网络模型进行训练后得到的,标记信息用于标记训练数据是否为目标类型。本申请从多个维度捕获词间关联特征,并从讽刺文本的情感倾向转换出发,挖掘词语间的冲突性,进而充分体现句子中地所蕴含的讽刺含义,最终准确、合理地识别讽刺文本。
-
公开(公告)号:CN109800431B
公开(公告)日:2020-07-28
申请号:CN201910062802.8
申请日:2019-01-23
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/289 , G06F16/35
Abstract: 本发明属于计算机科学技术领域,尤其是涉及一种事件信息关键词提取、监控方法及系统及存储和处理装置,旨在为了解决解决无监督方法提取关键词效果不稳定的问题。本发明提取方法对于获取的待监控的事件信息,基于多种关键词提取技术提取并优选一组相关性很强的关键词作为第一关键词组,而后基于关键词在时域的发展演化选出最新的热点词汇作为第二关键词组,再后对同一时间段内的同一事件的不同报道进行聚类,提取各聚类的关键词合并后作为第三关键字组,最后合并三个关键词组并选定最终的关键词组合。本发明提高了系统的稳定性,同时兼顾了时域及同一事件不同侧面的发展方向。
-
公开(公告)号:CN107577656B
公开(公告)日:2020-02-14
申请号:CN201710565733.3
申请日:2017-07-12
Applicant: 中国科学院自动化研究所
IPC: G06F40/284 , G06F40/289 , G06F40/30
Abstract: 本发明涉及文本隐含语义激活方法及系统,所述激活方法包括:获取待测文本的待测词项信息;根据文本集合知识库及所述待测文本的待测词项信息,确定所述文本集合知识库的词表中每个参考词项的激活系数;所述文本集合知识库包括多个参考词项共同构成的词表、对应各参考词项的参考词向量及参考词频;根据各激活系数,选取对应的参考词项构成待测文本的隐含语义集合;将所述隐含语义集合添加到所述待测文本中进行语义扩充。从而能够准确确定待测文本的隐含信息,准确度高。
-
公开(公告)号:CN109977227A
公开(公告)日:2019-07-05
申请号:CN201910205999.6
申请日:2019-03-19
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明属于信息分类领域,具体涉及了一种基于特征编码的文本特征提取方法、系统、装置,旨在解决文本特征提取中运算复杂度高、分类效率和精度低的问题。本发明方法包括:对获取的文本预处理,获得词候选特征序列;基于词候选特征序列,生成多个二进制编码;采用基因遗传算法筛选二进制编码,获得最优二进制编码;解码最优二进制编码获得最优词特征序列并输出。本发明将一系列候选特征转化为易处理的编码序列,并使用基因遗传算法的自动筛选功能,对特征进行最大化的全局最优挑选,能够有效地筛选出最小有效特征集。
-
公开(公告)号:CN105068988B
公开(公告)日:2018-01-30
申请号:CN201510431992.8
申请日:2015-07-21
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F17/27
Abstract: 本发明涉及一种多维度和多粒度情感分析方法,包括:构建情感资源,即根据特定领域文本的类别体系构建其情感资源;选择情感倾向词,即选择每个类别下的情感词并确定其情感倾向;判别情感倾向性,包括:判断信息资源的类型;从信息资源中获取情感关键词;从信息资源中识别权威发布者,并获取该信息资源的情感分析结果;对社交类信息进行情感分析;对非专有类别社交类信息的情感倾向进行分析;针对专有类别的社交信息进行情感分析。本发明的情感分析方法能够从多维度、多粒度进行情感分析以提供较高的情感分析识别率和精度。
-
公开(公告)号:CN103106616B
公开(公告)日:2016-01-20
申请号:CN201310062057.X
申请日:2013-02-27
Applicant: 中国科学院自动化研究所
IPC: G06Q50/00
Abstract: 本发明涉及社会信息化传播网络中用户行为的数据挖掘,本发明具体公开了一种基于资源整合与信息传播特征的社区发现及演化方法,从而更加精确地定义用户社区,并发现有意义的社区演化模式。本发明针对现有社区发现与演化方法中网络资源整合度低和信息传播因素考虑较少等特点,提出了基于资源整合的社区发现方法,利用共享潜在特征的协同矩阵分解方法将用户行为和用户交互行为有机地结合到一起;并以信息传播理论为指导,纳入用户的好友影响为信息传播特征,基于一阶马尔科夫假设,采用机器学习方法完成社区演化模式的挖掘。实验表明这一方案能有效地提高用户社区的挖掘与演化质量。
-
公开(公告)号:CN105068988A
公开(公告)日:2015-11-18
申请号:CN201510431992.8
申请日:2015-07-21
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F17/27
Abstract: 本发明涉及一种多维度和多粒度情感分析方法,包括:构建情感资源,即根据特定领域文本的类别体系构建其情感资源;选择情感倾向词,即选择每个类别下的情感词并确定其情感倾向;判别情感倾向性,包括:判断信息资源的类型;从信息资源中获取情感关键词;从信息资源中识别权威发布者,并获取该信息资源的情感分析结果;对社交类信息进行情感分析;对非专有类别社交类信息的情感倾向进行分析;针对专有类别的社交信息进行情感分析。本发明的情感分析方法能够从多维度、多粒度进行情感分析以提供较高的情感分析识别率和精度。
-
公开(公告)号:CN103414792B
公开(公告)日:2015-03-25
申请号:CN201310389369.1
申请日:2013-08-30
Applicant: 中国科学院自动化研究所 , 东莞中国科学院云计算产业技术创新与育成中心
IPC: H04L29/08
Abstract: 本发明公开了一种基于云计算的加式制造资源调度系统及相应的方法,该系统包括:客户端,用于请求加式制造任务,接受来自云操作系统的反馈信息;服务端,用于执行加式制造任务,接收来自云操作系统的加式制造请求,将制得的产品发给收货方;云操作系统,用于协调处理客户端和服务端之间的工作;收货方,用于接收加式制造服务得到的产品。本发明还公开了一种加式制造资源调度方法。本发明基于云计算技术通过计算机远程操控实现对3D打印机的自动装填用料和自动去除模型,根据客户需求对同一地点打印的不同部件进行自动组装,解决了当前以3D打印为代表的加式制造业资源调度优化问题,使3D打印机由单机走向网络化,优化了有限资源利用率。
-
-
-
-
-
-
-
-
-