用于提及检测中的消歧的方法和系统

    公开(公告)号:CN105630763B

    公开(公告)日:2019-08-02

    申请号:CN201410601824.4

    申请日:2014-10-31

    CPC classification number: G06F17/278

    Abstract: 本公开内容涉及用于提及检测中的消歧的方法和系统。一个实施例公开了一种用于提及检测中的消歧的方法,包括:确定文本中的目标词形在文本中出现的至少一个位置;基于目标词形在每个位置处的词袋上下文,获取目标词形在文本中的总体词袋上下文,每个位置处的词袋上下文包含位置的预定邻域内的词;基于目标词形在每个位置处的资源上下文,获取目标词形在文本中的总体资源上下文,每个位置处的资源上下文包含位置的预定邻域内的其他词形所对应的资源;以及基于总体词袋上下文和总体资源上下文来确定目标词形与用于目标词形的候选资源之间的相似度。还描述了相应的系统。

    用于提及检测中的消歧的方法和系统

    公开(公告)号:CN105630763A

    公开(公告)日:2016-06-01

    申请号:CN201410601824.4

    申请日:2014-10-31

    CPC classification number: G06F17/278

    Abstract: 本公开内容涉及用于提及检测中的消歧的方法和系统。一个实施例公开了一种用于提及检测中的消歧的方法,包括:确定文本中的目标词形在文本中出现的至少一个位置;基于目标词形在每个位置处的词袋上下文,获取目标词形在文本中的总体词袋上下文,每个位置处的词袋上下文包含位置的预定邻域内的词;基于目标词形在每个位置处的资源上下文,获取目标词形在文本中的总体资源上下文,每个位置处的资源上下文包含位置的预定邻域内的其他词形所对应的资源;以及基于总体词袋上下文和总体资源上下文来确定目标词形与用于目标词形的候选资源之间的相似度。还描述了相应的系统。

    文本表示方法和装置
    3.
    发明公开

    公开(公告)号:CN105701083A

    公开(公告)日:2016-06-22

    申请号:CN201410705205.X

    申请日:2014-11-28

    CPC classification number: G06F16/24575 G06F16/9024

    Abstract: 本发明涉及文本分析,其公开一种文本表示方法,包括:利用知识库识别文本中的概念并确定概念之间的关系;利用所述概念之间的关系生成概念图;确定所述概念图的连通分量;计算所述连通分量的权重;根据连通分量的权重确定表示该文本的概念。根据本发明实施例的方法利用了知识库中概念之间的相关性,根据图的连通分量理论,找出最能够代表文本主题的一组概念,而将和主题无关的概念去除掉,提高了文本表达的准确度,减少了噪音。

Patent Agency Ranking