连接短文本中实体提及与语义知识库中实体的方法和设备

    公开(公告)号:CN106940702A

    公开(公告)日:2017-07-11

    申请号:CN201610006846.5

    申请日:2016-01-05

    Abstract: 本发明公开了一种连接短文本中实体提及与语义知识库中实体的方法和设备。该方法包括:从语义知识库中的实体中,选择与短文本中的实体提及相关的候选实体;确定候选实体和实体提及所属的类别;确定实体提及所属的类别的最具区分性的属性集合;基于该属性集合,计算属于该类别的候选实体与实体提及的相似度;以及基于所述相似度,选择候选实体与实体提及连接。

    信息处理装置和信息处理方法

    公开(公告)号:CN106484724A

    公开(公告)日:2017-03-08

    申请号:CN201510547792.9

    申请日:2015-08-31

    CPC classification number: G06F16/9535

    Abstract: 本公开提供了信息处理装置和信息处理方法。该信息处理装置包括:信息获取单元,其从信息源获取多条与关注对象有关的各自带有时间标签的信息;序列生成单元,其基于所述时间标签生成所述信息的时序序列;波峰检测单元,其针对所述时序序列进行检测,以获得所述时序序列的波峰时段;以及对象事件检测单元,其对所述波峰时段中的信息进行检测,以得到与所述关注对象有关的事件。所述对象事件检测单元包括:聚类单元,其针对所述时序序列的每个波峰时段,对该波峰时段中的信息进行聚类;以及时段事件检测单元,其针对每个波峰时段,基于所述聚类单元的聚类结果中包含信息条数最多的簇内的信息,检测与该波峰时段有关的事件。

    确定针对特定话题的情绪及其原因的方法和设备

    公开(公告)号:CN105335347A

    公开(公告)日:2016-02-17

    申请号:CN201410239139.1

    申请日:2014-05-30

    Inventor: 宋双永 孟遥

    Abstract: 本发明公开了确定针对特定话题的情绪及其原因的方法和设备。根据本发明的确定针对特定话题的情绪及其原因的方法包括:收集针对特定话题的多个文档;设定主题模型使得:主题的数量等于情绪种类的预定数量,每个主题的主题词包括一种对应情绪的情绪词并且一种情绪的情绪词仅在对应的一种主题的主题词中出现;利用所设定的主题模型,分析所述多个文档,以得到所述预定数量的主题、以及每个主题的主题词;以及从每个主题的主题词中,确定与该主题对应的情绪相关联的原因。

    文献搜索方法及设备、作者搜索方法及设备

    公开(公告)号:CN106951420A

    公开(公告)日:2017-07-14

    申请号:CN201610007271.9

    申请日:2016-01-06

    Abstract: 本发明公开了一种文献搜索方法及设备、作者搜索方法及设备。该文献搜索方法包括:接收关于要搜索的文献的查询文本;利用层次语义模型,确定与查询文本相关的层次语义主题;以及从与所确定的层次语义主题相关的文献中,选择文献,作为搜索结果。相比于未利用层次信息的方法,本发明通过利用层次主题信息,可以得到更为准确的搜索结果。

    描述短文本的作者的方法和设备

    公开(公告)号:CN106156091A

    公开(公告)日:2016-11-23

    申请号:CN201510151745.2

    申请日:2015-04-01

    Abstract: 本发明公开了一种描述短文本的作者的方法和设备。该描述短文本的作者的方法包括:根据作者的多个短文本,确定作者感兴趣的类别;以及提取作者感兴趣的类别的代表性短文本,作为对作者的描述。根据本发明的方法和设备能够容易地、准确地让读者了解作者的兴趣爱好。

    识别音译名的方法及装置
    16.
    发明公开

    公开(公告)号:CN104657343A

    公开(公告)日:2015-05-27

    申请号:CN201310575092.1

    申请日:2013-11-15

    Abstract: 本发明提供一种识别音译名的方法和装置。该方法包括:对于当前语言的字符串,获取源语言的与所述字符串对应的至少一种发音单元序列;确定所述至少一种发音单元序列为所述源语言中的名称的概率;根据所述至少一种发音单元序列为所述源语言中的名称的概率判断所述当前语言的字符串是否为音译名。本发明中,对于当前语言的字符串,根据其对应的源语言的发音单元序列为源语言中的名称的概率判断当前语言的字符串是否为源语言音译名,能够准确识别出当前语言的字符串是否为源语言音译名。

    无歧义日本人名列表构建方法、人名识别方法及装置

    公开(公告)号:CN104424332A

    公开(公告)日:2015-03-18

    申请号:CN201310412289.3

    申请日:2013-09-11

    CPC classification number: G06F17/30684 G06F17/30705

    Abstract: 本发明公开了无歧义日本人名列表构建方法、人名识别方法及装置。构建列表的方法包括:利用日本姓氏列表对日本常见人名列表进行姓名分离以得到日本名字列表;将带有日本人名相关标记的训练语料划分为日本人名相关词语集合和其他词语集合;将所述日本人名相关词语集合与所述日本常见人名列表、日本姓氏列表和从日本常见人名列表进行姓名分离而得到日本名字列表合并为日本人名相关词语总集合;针对日本人名相关词语总集合中的每一个日本人名相关词语判断该词语是否为无歧义日本人名相关词语以建立无歧义日本人名相关词语列表。利用该列表进行分词和人名角色标注,能够提高中文分词的整体准确率、整体的人名角色标注性能以及最终的人名识别结果。

Patent Agency Ranking