文本热点提取方法及装置
    53.
    发明授权

    公开(公告)号:CN110134942B

    公开(公告)日:2020-10-23

    申请号:CN201910260924.8

    申请日:2019-04-01

    Abstract: 本发明实施例涉及一种文本热点提取方法及装置,包括:采用正则表达式对输入的至少一个文本数据按照设定规则进行分割处理,得到多个第一短文本数据;采用依存句法分析算法将第二短文本数据生成对应的第四短文本数据;将第三短文本数据和第四文短本数据进行向量化处理,得到对应的多个文本向量;基于相似度算法确定任意两个文本向量之间的相似度;将相似度大于相似度阈值的两个文本向量进行合并处理,句法分析抽取关系词而组成的短句提高了信息抽取的可观性和准确度,让用户可以更好的理解文本内容从而获取核心关键信息点,通过Word2vec将短句向量化进行相似度对比,保留词语之间的语义信息,从而保证了排重工作的准确性,尽可能的避免了热点信息的冗余。

    一种品牌影响力指数构建方法、系统及存储介质

    公开(公告)号:CN109840687A

    公开(公告)日:2019-06-04

    申请号:CN201811604779.2

    申请日:2018-12-26

    Abstract: 本发明涉及一种品牌影响力指数构建方法、系统及存储介质。现有品牌影响力指数构建方法效率低、误差大的问题,本发明获取企业影响力和产品影响力,并分别获取企业影响力权重和产品影响力权重,根据企业影响力、产品影响力和企业影响力权重和产品影响力权重计算品牌影响指数。本发明针对采集的品牌数据,采用机器的方法对设计的品牌影响指标定量评价并量化计算方法进行量化评估,从而大大提高品牌评估的准确性和有效性,可更好地服务于现有品牌的评估量化工作,准确性高,误差小,实用性强。

    文本溯源方法、设备及存储介质

    公开(公告)号:CN109783778A

    公开(公告)日:2019-05-21

    申请号:CN201811577909.8

    申请日:2018-12-20

    Abstract: 本发明实施例涉及一种文本溯源方法、设备及存储介质,所述方法包括:根据待判定文本和源文本生成词袋模型,所述源文本包括多个文本;利用多种预设的相似度算法,分别对所述词袋模型进行相似度计算,确定在不同相似度算法的情况下,所述源文本中多个文本与所述待判定文本的多个第一相似度排序;基于第一公式和所述第一相似度排序确定所述源文本源文本中多个文本与所述待判定文本的第二相似度排序;基于所述第二相似度排序从所述源文本中选择符合同源条件的文本作为所述待判定文本的同源文本,采用多种相似度的算法,可以弥补单一算法的不足,减少因计算方式不同带来的偶然性,提升计算结果的全面性和准确性。

Patent Agency Ranking