一种大规模文本聚类方法及装置
    1.
    发明公开

    公开(公告)号:CN116304012A

    公开(公告)日:2023-06-23

    申请号:CN202211538156.6

    申请日:2022-12-02

    Abstract: 本说明书实施例提供了一种大规模文本聚类方法及装置。该方法中包含粗聚类和二次精细聚类。首先,通过语义表示模型确定多条文本分别对应的语义向量;基于多条文本的语义向量,确定多条文本彼此之间的相似度矩阵。接着,在粗聚类阶段,从相似度矩阵中确定多条文本分别对应的相似度最大的M个相似文本,并在M个相似文本对应的相似度大于阈值时,将对应的文本作为筛选出的中心文本,以便快速地去除大量孤立噪点。然后,基于中心文本在相似度矩阵中对应的数据,得到候选类簇,并对存在交叉文本的候选类簇进行合并,之后再对合并后的类簇进行二次精细聚类。

    一种事件对对象影响度的获取方法和系统

    公开(公告)号:CN111738532A

    公开(公告)日:2020-10-02

    申请号:CN202010817707.7

    申请日:2020-08-14

    Abstract: 本说明书实施例公开了一种事件对对象影响度的获取方法和系统,其包括:获取目标事件;将所述目标事件加入事件图谱中,并将所述目标事件对应的事件节点与所述事件图谱中至少一个描述节点关联,获得更新后的事件图谱;所述事件图谱包括多个节点以及节点之间的边权;所述节点包括事件节点、对象节点以及描述节点;在所述更新后的事件图谱中选取与所述目标事件对应的事件节点的关联路径不超过预设长度的对象节点,作为候选对象节点;利用影响度预测模型至少基于所述目标事件与各候选节点对应的候选对象,获得所述目标事件对各候选对象的影响度预测值。

    一种事件对对象影响度的获取方法和系统

    公开(公告)号:CN111738532B

    公开(公告)日:2021-02-05

    申请号:CN202010817707.7

    申请日:2020-08-14

    Abstract: 本说明书实施例公开了一种事件对对象影响度的获取方法和系统,其包括:获取目标事件;将所述目标事件加入事件图谱中,并将所述目标事件对应的事件节点与所述事件图谱中至少一个描述节点关联,获得更新后的事件图谱;所述事件图谱包括多个节点以及节点之间的边权;所述节点包括事件节点、对象节点以及描述节点;在所述更新后的事件图谱中选取与所述目标事件对应的事件节点的关联路径不超过预设长度的对象节点,作为候选对象节点;利用影响度预测模型至少基于所述目标事件与各候选节点对应的候选对象,获得所述目标事件对各候选对象的影响度预测值。

Patent Agency Ranking