缩简词的消歧方法和消歧设备

    公开(公告)号:CN108170662A

    公开(公告)日:2018-06-15

    申请号:CN201611115210.0

    申请日:2016-12-07

    Abstract: 本发明公开了一种缩简词的消歧方法和消歧设备。该消歧方法包括:针对待处理文本中的缩简词,查找共现语义知识库中与该缩简词对应的全称实体;在查找到多个全称实体的情况下,针对每一个全称实体,检索待处理文本中出现的、共现语义知识库中与该全称实体存在关联关系的参考实体;基于参考实体与该全称实体之间的共现支持概率TF‑IDF,计算该全称实体的共现概率;基于共现概率,选择多个全称实体之一作为与该缩简词对应的全称实体;其中,所述TF‑IDF等于参考实体与该全称实体的共现次数TF和参考实体与该全称实体的逆向文件频率IDF之积。

    对级联样式表的规则集进行优化的方法和装置

    公开(公告)号:CN106293785A

    公开(公告)日:2017-01-04

    申请号:CN201510262400.4

    申请日:2015-05-21

    Abstract: 本发明涉及对级联样式表的规则集进行优化的方法和装置。该方法包括:对级联样式表的规则集中的规则的语法进行归一化以消除数据在格式上的不一致;用规则和其对应的特征构成多值关系二维表,多值关系二维表的每一行为级联样式表的规则集中的规则,列为该规则所对应的特征;将多值关系二维表转换为形式背景表,形式背景表为单值关系二维表;以及基于形式背景表生成规则之间的从属关系。根据本发明的方法和装置,能够以可视化的形式展示规则及规则间的从属关系,从而提高CSS代码的灵活性和可重用性,并且提高CSS代码的开发质量。

    为未发表的微博推荐话题词的方法和设备

    公开(公告)号:CN106202129A

    公开(公告)日:2016-12-07

    申请号:CN201510232776.0

    申请日:2015-05-08

    Inventor: 宋双永 孟遥

    Abstract: 本发明公开了一种为未发表的微博推荐话题词的方法和设备。为未发表的微博推荐话题词的方法包括:针对该微博,计算多个已有话题词的推荐得分,每个话题词的推荐得分与包含该话题词的已发表微博的数量、该话题词的扩散趋势中的至少一个、以及该微博和该话题词的内容相关性有关;以及根据话题词的推荐得分,向用户推荐适合加入该微博的话题词;其中,该话题词的扩散趋势通过如下步骤计算:统计过去每天发表的包含该话题词的微博的数量,以得到时间序列;根据该时间序列,估计趋势曲线;计算该趋势曲线在当天的斜率,作为该话题词的扩散趋势。

    信息处理设备、信息处理方法以及电子装置

    公开(公告)号:CN104951471A

    公开(公告)日:2015-09-30

    申请号:CN201410124501.0

    申请日:2014-03-28

    Inventor: 宋双永 孟遥

    Abstract: 本公开提供一种信息处理设备、信息处理方法和电子装置。该信息处理设备包括:网络建立装置,用于根据多个用户中各个用户之间的关系,在各个用户感兴趣的热词之间建立关系,以建立热词关联网络;以及热词排序装置,用于对所述热词关联网络中的热词进行排序。根据本公开的信息处理设备、信息处理方法和电子装置能够通过热词之间的关联确定热词地热度,从而能够更准确地对热词进行排序。

    文献搜索方法及设备、作者搜索方法及设备

    公开(公告)号:CN106951420A

    公开(公告)日:2017-07-14

    申请号:CN201610007271.9

    申请日:2016-01-06

    Abstract: 本发明公开了一种文献搜索方法及设备、作者搜索方法及设备。该文献搜索方法包括:接收关于要搜索的文献的查询文本;利用层次语义模型,确定与查询文本相关的层次语义主题;以及从与所确定的层次语义主题相关的文献中,选择文献,作为搜索结果。相比于未利用层次信息的方法,本发明通过利用层次主题信息,可以得到更为准确的搜索结果。

    描述短文本的作者的方法和设备

    公开(公告)号:CN106156091A

    公开(公告)日:2016-11-23

    申请号:CN201510151745.2

    申请日:2015-04-01

    Abstract: 本发明公开了一种描述短文本的作者的方法和设备。该描述短文本的作者的方法包括:根据作者的多个短文本,确定作者感兴趣的类别;以及提取作者感兴趣的类别的代表性短文本,作为对作者的描述。根据本发明的方法和设备能够容易地、准确地让读者了解作者的兴趣爱好。

    识别音译名的方法及装置

    公开(公告)号:CN104657343A

    公开(公告)日:2015-05-27

    申请号:CN201310575092.1

    申请日:2013-11-15

    Abstract: 本发明提供一种识别音译名的方法和装置。该方法包括:对于当前语言的字符串,获取源语言的与所述字符串对应的至少一种发音单元序列;确定所述至少一种发音单元序列为所述源语言中的名称的概率;根据所述至少一种发音单元序列为所述源语言中的名称的概率判断所述当前语言的字符串是否为音译名。本发明中,对于当前语言的字符串,根据其对应的源语言的发音单元序列为源语言中的名称的概率判断当前语言的字符串是否为源语言音译名,能够准确识别出当前语言的字符串是否为源语言音译名。

    无歧义日本人名列表构建方法、人名识别方法及装置

    公开(公告)号:CN104424332A

    公开(公告)日:2015-03-18

    申请号:CN201310412289.3

    申请日:2013-09-11

    CPC classification number: G06F17/30684 G06F17/30705

    Abstract: 本发明公开了无歧义日本人名列表构建方法、人名识别方法及装置。构建列表的方法包括:利用日本姓氏列表对日本常见人名列表进行姓名分离以得到日本名字列表;将带有日本人名相关标记的训练语料划分为日本人名相关词语集合和其他词语集合;将所述日本人名相关词语集合与所述日本常见人名列表、日本姓氏列表和从日本常见人名列表进行姓名分离而得到日本名字列表合并为日本人名相关词语总集合;针对日本人名相关词语总集合中的每一个日本人名相关词语判断该词语是否为无歧义日本人名相关词语以建立无歧义日本人名相关词语列表。利用该列表进行分词和人名角色标注,能够提高中文分词的整体准确率、整体的人名角色标注性能以及最终的人名识别结果。

    对实体进行语义化的信息处理装置和信息处理方法

    公开(公告)号:CN108170689A

    公开(公告)日:2018-06-15

    申请号:CN201611114803.5

    申请日:2016-12-07

    Abstract: 本申请公开了一种用于对实体进行语义化的信息处理装置和信息处理方法,该信息处理装置包括:关联度计算单元,被配置为计算实体与语义之间的关联度;排序单元,被配置为根据关联度计算单元计算的关联度以及基于实体的上下文的排序权重,对语义进行排序;以及更新单元,被配置为根据用户基于排序对与实体对应的语义的选择,对排序单元在排序中使用的排序权重进行更新。

    识别音译名的方法及装置
    10.
    发明授权

    公开(公告)号:CN104657343B

    公开(公告)日:2017-10-10

    申请号:CN201310575092.1

    申请日:2013-11-15

    Abstract: 本发明提供一种识别音译名的方法和装置。该方法包括:对于当前语言的字符串,获取源语言的与所述字符串对应的至少一种发音单元序列;确定所述至少一种发音单元序列为所述源语言中的名称的概率;根据所述至少一种发音单元序列为所述源语言中的名称的概率判断所述当前语言的字符串是否为音译名。本发明中,对于当前语言的字符串,根据其对应的源语言的发音单元序列为源语言中的名称的概率判断当前语言的字符串是否为源语言音译名,能够准确识别出当前语言的字符串是否为源语言音译名。

Patent Agency Ranking