-
公开(公告)号:CN105608070B
公开(公告)日:2019-01-25
申请号:CN201510965136.0
申请日:2015-12-21
Applicant: 中国科学院信息工程研究所
IPC: G06F17/27
Abstract: 本发明涉及一种面向新闻标题的人物关系抽取方法,其步骤包括:1)寻找出新闻标题中的关系指示词,用以区分不同类别的人物关系;2)根据人物与关系指示词在新闻标题中的位置特征,建立描述句子的句式模板;利用训练数据统计每个模板的正/负例个数,根据正负模板的比例判定新闻标题中人物间关系的正确性;3)从新闻标题与人物属性知识库中提取特征,通过特征分类的方法并结合步骤2)得到的句式模板的正/负例个数,判定给定的人物关系是否正确。本发明在保证准确率的同时,降低了特征维度,提高了判定效率,可用于挖掘新闻标题中的人物关系,进而发现社会中的焦点人物、热点事件等,便于及时掌握社会动态,监控舆情。
-
公开(公告)号:CN118332560A
公开(公告)日:2024-07-12
申请号:CN202410449574.0
申请日:2024-04-15
Applicant: 中国科学院信息工程研究所
IPC: G06F21/57 , G06F18/241 , G06F16/9035 , G06F11/36
Abstract: 本发明涉及系统测试领域,本发明提供一种模糊测试方法、装置、设备及可读存储介质,该方法包括:对获取的原始消息序列进行过滤,得到过滤消息序列;基于所述过滤消息序列中的每个消息的反馈信息,从所述过滤消息序列中抽取消息得到最小消息序列;基于所述最小消息序列和无关消息序列,对待测试系统进行模糊测试,所述无关消息序列包含所述过滤消息序列中未被抽取的消息。本发明通过过滤去除原始消息序列中的冗余消息,然后基于消息的反馈信息确定可以作为模糊测试种子的最小消息序列,以及与最小消息序列的测试方法不同的无关消息序列,通过对模糊测试所用的消息进行区分约束,提高了模糊测试的效率。
-
公开(公告)号:CN106127222B
公开(公告)日:2019-06-04
申请号:CN201610420846.X
申请日:2016-06-13
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于视觉的字符串相似度计算方法及相似性判断方法。本发明的字符串相似度计算方法为:1)将两待比较字符串中的每一字符分别转化为一对应灰度图片;2)将步骤1)得到的图片的每一行灰度值进行拼接,得到对应图片的一维向量;3)对两待比较字符串中任意两不同字符,计算这两个字符对应的两一维向量的相似度,根据该相似度确定所选两字符的字符相似度;4)基于上述得到的字符相似度和字符位置计算两待比较字符串的视觉相似度。该方法考虑到了不同的字符在人的视觉方法所呈现的不同差异,所计算得到的字符串相似度更加符合人的主观感受。
-
公开(公告)号:CN105913094B
公开(公告)日:2019-06-21
申请号:CN201610286111.2
申请日:2016-05-03
Applicant: 中国科学院信息工程研究所
IPC: G06K9/62
Abstract: 本发明公开了一种最小距离字符串计算查找方法。本方法为:1)判断判断字符串集合是否满足加速条件,如果满足,则计算该字符串集合中任意两字符串之间的距离,得到加速索引;2)从该字符串集合中找到与待计算字符串t最相似的字符串t’并计算两者之间的距离D(t,t’);然后根据该加速索引判断该字符串集合中的字符串是否满足D(t’,r)≥2D(t,t’);如果满足,则淘汰字符串r;3)根据步骤2)处理结果,确定出与该字符串t距离最小的字符串。本方法大大提高了查找效率。
-
公开(公告)号:CN105913094A
公开(公告)日:2016-08-31
申请号:CN201610286111.2
申请日:2016-05-03
Applicant: 中国科学院信息工程研究所
IPC: G06K9/62
CPC classification number: G06K9/6215
Abstract: 本发明公开了一种最小距离字符串计算查找方法。本方法为:1)判断判断字符串集合是否满足加速条件,如果满足,则计算该字符串集合中任意两字符串之间的距离,得到加速索引;2)从该字符串集合中找到与待计算字符串t最相似的字符串t’并计算两者之间的距离D(t,t’);然后根据该加速索引判断该字符串集合中的字符串是否满足D(t’,r)≥2D(t,t’);如果满足,则淘汰字符串r;3)根据步骤2)处理结果,确定出与该字符串t距离最小的字符串。本方法大大提高了查找效率。
-
-
-
公开(公告)号:CN106127222A
公开(公告)日:2016-11-16
申请号:CN201610420846.X
申请日:2016-06-13
Applicant: 中国科学院信息工程研究所
CPC classification number: G06K9/6215 , G06K9/2054
Abstract: 本发明公开了一种基于视觉的字符串相似度计算方法及相似性判断方法。本发明的字符串相似度计算方法为:1)将两待比较字符串中的每一字符分别转化为一对应灰度图片;2)将步骤1)得到的图片的每一行灰度值进行拼接,得到对应图片的一维向量;3)对两待比较字符串中任意两不同字符,计算这两个字符对应的两一维向量的相似度,根据该相似度确定所选两字符的字符相似度;4)基于上述得到的字符相似度和字符位置计算两待比较字符串的视觉相似度。该方法考虑到了不同的字符在人的视觉方法所呈现的不同差异,所计算得到的字符串相似度更加符合人的主观感受。
-
公开(公告)号:CN105608070A
公开(公告)日:2016-05-25
申请号:CN201510965136.0
申请日:2015-12-21
Applicant: 中国科学院信息工程研究所
IPC: G06F17/27
CPC classification number: G06F17/2745 , G06F17/2775
Abstract: 本发明涉及一种面向新闻标题的人物关系抽取方法,其步骤包括:1)寻找出新闻标题中的关系指示词,用以区分不同类别的人物关系;2)根据人物与关系指示词在新闻标题中的位置特征,建立描述句子的句式模板;利用训练数据统计每个模板的正/负例个数,根据正负模板的比例判定新闻标题中人物间关系的正确性;3)从新闻标题与人物属性知识库中提取特征,通过特征分类的方法并结合步骤2)得到的句式模板的正/负例个数,判定给定的人物关系是否正确。本发明在保证准确率的同时,降低了特征维度,提高了判定效率,可用于挖掘新闻标题中的人物关系,进而发现社会中的焦点人物、热点事件等,便于及时掌握社会动态,监控舆情。
-
-
-
-
-
-
-
-