-
公开(公告)号:CN103246714B
公开(公告)日:2015-05-27
申请号:CN201310149482.2
申请日:2013-04-26
Applicant: 中国科学院计算技术研究所 , 人民搜索网络股份公司
IPC: G06F17/30
Abstract: 本发明提供一种基于错误模式挖掘的中文搜索引擎查询纠错方法。该方法通过挖掘搜索引擎查询日志中的错误模式并建模,有效的改善了查询纠错系统中查询及其正确形式之间转换概率的预估精度;利用隐马尔科夫模型进行查询纠错,通过隐含状态的转移实现对查询的切分和纠错,提高了查询纠错的准确率和速度。
-
公开(公告)号:CN102867040A
公开(公告)日:2013-01-09
申请号:CN201210320575.2
申请日:2012-08-31
Applicant: 中国科学院计算技术研究所 , 人民搜索网络股份公司
Abstract: 本发明涉及一种面向中文搜索引擎混杂语言的查询纠错方法及系统。本发明针对中文搜索引擎混杂语言查询的特点,采用面向混杂语言的异构字符树词典和基于高频或高点击次数用户查询日志构建的语言模型,对用户的查询进行同步切分和纠错尝试,利用状态之间的转移达到对查询进行切分的目的;采用双队列记录每一步编辑后最优的N个完成状态和M个未完成状态,在保障纠错速度的同时获取最佳的切分方式和对应的替代词条组合;利用最终纠错结果侯选集的特征进行判定,输出符合限定条件的纠错结果,有效地提高了准确率。
-
公开(公告)号:CN102867040B
公开(公告)日:2015-03-18
申请号:CN201210320575.2
申请日:2012-08-31
Applicant: 中国科学院计算技术研究所 , 人民搜索网络股份公司
Abstract: 本发明涉及一种面向中文搜索引擎混杂语言的查询纠错方法及系统。本发明针对中文搜索引擎混杂语言查询的特点,采用面向混杂语言的异构字符树词典和基于高频或高点击次数用户查询日志构建的语言模型,对用户的查询进行同步切分和纠错尝试,利用状态之间的转移达到对查询进行切分的目的;采用双队列记录每一步编辑后最优的N个完成状态和M个未完成状态,在保障纠错速度的同时获取最佳的切分方式和对应的替代词条组合;利用最终纠错结果侯选集的特征进行判定,输出符合限定条件的纠错结果,有效地提高了准确率。
-
公开(公告)号:CN103246714A
公开(公告)日:2013-08-14
申请号:CN201310149482.2
申请日:2013-04-26
Applicant: 中国科学院计算技术研究所 , 人民搜索网络股份公司
IPC: G06F17/30
Abstract: 本发明提供一种基于错误模式挖掘的中文搜索引擎查询纠错方法。该方法通过挖掘搜索引擎查询日志中的错误模式并建模,有效的改善了查询纠错系统中查询及其正确形式之间转换概率的预估精度;利用隐马尔科夫模型进行查询纠错,通过隐含状态的转移实现对查询的切分和纠错,提高了查询纠错的准确率和速度。
-
公开(公告)号:CN114581230B
公开(公告)日:2025-04-04
申请号:CN202210044130.X
申请日:2022-01-14
Applicant: 中国科学院计算技术研究所
IPC: G06Q40/04 , G06Q20/40 , G06N20/00 , G06F16/901
Abstract: 本发明提出一种流式图中的洗钱行为检测方法、装置、介质,所述方法包括获取洗钱场景中的资金交易信息作为图数据通过有向图表示;在每一条所述资金流到达时,判断所述发生源账户是否在转出资金后达到资金平衡状态,且所述目标账户是否在转入资金后到达资金平衡状态;分别统计当前时刻时所述发生源账户与目标账户达到资金平衡状态的次数以及从初始时刻到当前时刻最近一次达到资金平衡状态之间累积的资金有效转入次数,作为统计特征输入至异常账户评估模型进行异常评估。该方法能够快速并且准确地检测出不同模式的洗钱行为,并且找到可疑的洗钱账户。
-
公开(公告)号:CN113569539B
公开(公告)日:2025-04-04
申请号:CN202110164573.8
申请日:2021-02-05
Applicant: 中国科学院计算技术研究所 , 腾讯科技(深圳)有限公司
IPC: G06F40/166 , G06F40/279
Abstract: 本申请的实施例提供了一种文本内容的衍生方法、装置、计算机可读介质及电子设备。该文本内容的衍生方法包括:获取原始文本内容,基于原始文本内容以及与原始条件相对应的反事实条件,从原始结尾中识别出与原始条件相关的因果内容;基于原始结尾以及原始结尾中的因果内容,确定表示原始结尾的文本架构的结尾框架;基于前提、反事实条件以及结尾框架构成的序列,生成原始结尾对应的反事实结尾;本实施例中生成的反事实结尾在原始结尾的基础上,基于原始文本内容中的因果内容生成,在因果内容与原始文本内容一致性的前提下,使得生成的反事实结尾更加符合因果逻辑,增加表达的流畅性。
-
公开(公告)号:CN119089890A
公开(公告)日:2024-12-06
申请号:CN202410585948.1
申请日:2024-05-13
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种推荐系统评论区的群体极化问题检测方法和装置,包括:对推荐系统指定的评论主帖进行话题观点提取,得到主帖观点;对评论主帖的评论区进行立场检测,得到评论区各条评论相对主帖观点的立场类别;通过提取各条评论的关键词,得到各条评论的立场类别对应的强烈程度;按照评论时间将评论区的评论排序,统计评论初始时间段内各立场类别的评论数量,并根据初始时间段内各条评论的强烈程度,得到各立场类别的平均极化程度,作为基准;持续抽取与初始时间段相同长度但时间靠后的后续时间段,计算后续时间段各立场类别的平均极化程度,并与基准进行对比,得到立场的极化偏离程度,当极化偏离程度超出阈值时进行报警。
-
公开(公告)号:CN117131189A
公开(公告)日:2023-11-28
申请号:CN202310294820.5
申请日:2023-03-23
Applicant: 中国科学院计算技术研究所
IPC: G06F16/35 , G06F16/31 , G06F16/332 , G06F40/35 , G06N3/0499 , G06N3/08
Abstract: 本发明提出一种基于语义的开放域网页知识抽取方法,包括:获取开放域网页的骨架树,对该骨架树的骨架节点进行分裂,得到该骨架节点的骨架子节点,生成骨架子节点序列;对该骨架子节点和该骨架节点标注分类标签,根据该分类标签对该骨架树进行关系抽取,获得抽取任务的关系子节点序列,并生成关系片段;基于该关系片段对该骨架树进行客体抽取,以抽取到的骨架子节点序列为客体片段;以该关系片段和其对应的客体片段为该抽取任务的抽取结果。本发明还提出一种基于语义的开放域网页知识抽取系统,以及一种用于开放域网页知识抽取的数据处理装置。
-
公开(公告)号:CN113392139B
公开(公告)日:2023-10-20
申请号:CN202110624648.6
申请日:2021-06-04
Applicant: 中国科学院计算技术研究所
IPC: G06F16/2458 , G06F16/901 , G06N3/0442 , G06N3/045 , G06N3/08
Abstract: 本发明提出一种基于关联融合的环境监测数据补全方法和系统,包括:获取数据存在缺失的环境监测数据及其对应的标记矩阵;根据环境监测数据中每个时间点的各个属性,得到属性间的关联系数,以构建图G,图G中节点对应属性,节点间的边对应属性间的属性关联系数;通过将图G和待补全矩阵按位相乘,得到中间矩阵,通过神经网络对中间矩阵进行时序处理,得到环境监测数据中各时间点的隐藏状态;根据各时间点的隐藏状态,计算环境监测数据的时间关联性系数;通过将时间关联性系数和各时间点的隐藏状态按位相乘,得到环境监测数据中各时间点的中间状态;在环境监测数据中,对中间状态采用生成式的非线性变换,得到环境监测数据的重构补全数据。
-
公开(公告)号:CN113190733B
公开(公告)日:2023-09-12
申请号:CN202110459851.2
申请日:2021-04-27
Applicant: 中国科学院计算技术研究所
IPC: G06F16/951 , G06N3/0464 , G06N3/0442 , G06N3/08
Abstract: 本发明公开一种基于多平台的网络事件流行度预测方法,包括以下步骤:分别获取多个平台的网络事件的流行度预测序列,并融合多个流行度预测序列形成网络事件的流行度联合预测序列;分别获取多个平台的网络事件的流行度历史序列,并融合多个流行度历史序列形成网络事件的流行度联合历史序列;利用生成式对抗网络将流行度联合预测序列与流行度联合历史序列进行对齐,得到网络事件的流行度最终预测序列。
-
-
-
-
-
-
-
-
-