一种面向领域的文本信息抽取聚类方法、设备和存储介质

    公开(公告)号:CN111026866A

    公开(公告)日:2020-04-17

    申请号:CN201911019149.3

    申请日:2019-10-24

    Abstract: 本发明公开了一种面向领域的文本信息抽取聚类方法、设备和存储介质。该方法包括:获取文本信息集合;所述文本信息集合包括:目标领域内的多个文本信息和目标领域外的多个文本信息;将所述文本信息集合输入预先训练的抽取聚类模型;通过所述抽取聚类模型对所述文本信息集合执行抽取和聚类处理,得到所述目标领域内每个主题对应的代表性信息。本发明将抽取和聚类融合在一起,使得抽取和聚类相互支撑,在抽取聚类过程中,人工干预少且抽取和聚类高效。

    文本热点提取方法及装置
    82.
    发明公开

    公开(公告)号:CN110134942A

    公开(公告)日:2019-08-16

    申请号:CN201910260924.8

    申请日:2019-04-01

    Abstract: 本发明实施例涉及一种文本热点提取方法及装置,包括:采用正则表达式对输入的至少一个文本数据按照设定规则进行分割处理,得到多个第一短文本数据;采用依存句法分析算法将第二短文本数据生成对应的第四短文本数据;将第三短文本数据和第四文短本数据进行向量化处理,得到对应的多个文本向量;基于相似度算法确定任意两个文本向量之间的相似度;将相似度大于相似度阈值的两个文本向量进行合并处理,句法分析抽取关系词而组成的短句提高了信息抽取的可观性和准确度,让用户可以更好的理解文本内容从而获取核心关键信息点,通过Word2vec将短句向量化进行相似度对比,保留词语之间的语义信息,从而保证了排重工作的准确性,尽可能的避免了热点信息的冗余。

    一种社交媒体账号管理方法及系统

    公开(公告)号:CN108769278A

    公开(公告)日:2018-11-06

    申请号:CN201810319766.4

    申请日:2018-04-11

    Inventor: 王海亮 王磊 罗引

    CPC classification number: H04L61/302 H04L51/32 H04L61/15

    Abstract: 本发明涉及一种社交媒体账号管理方法及系统,该方法包括:通过所述互联网协议地址和端口访问任一社交媒体对应的注册网站;通过浏览器控件完成账号注册,将所述账号与所述互联网协议地址绑定为合格账号进行存储;当接收到任务时,从所述合格账号中获取执行所述任务的合格账号,通过所述浏览器控件根据所述合格账号进行登录以完成所述任务。本发明实施例主要提供针对国外社交媒体账号自动注册及利用注册账号进行指定任务的工作,同时通过将注册完成的账号与相对应的互联网协议地址进行绑定存储,以使用相匹配的互联网协议地址登录相关账号,提高账号可用性和存活概率。

    一种仿人类复杂问题检索方法、电子设备及存储介质

    公开(公告)号:CN119782463A

    公开(公告)日:2025-04-08

    申请号:CN202411840111.3

    申请日:2024-12-13

    Abstract: 本发明提供了一种仿人类复杂问题检索方法、电子设备及存储介质,该方法包括:对原始问题语句进行拆解处理,以得到若干个原子问题语句;根据若干个原子问题语句之间的关联关系,确定若干个原子问题语句之间的执行顺序;根据每一原子问题语句对应的语句类型,确定每一原子问题语句对应的目标检索信源;根据若干原子问题语句之间的执行顺序,依次通过每一原子问题语句对应的目标检索信源,对该原子问题语句进行检索,得到每一原子问题语句对应的原始答复语句;对若干原始答复语句进行语义整合,得到原始问题语句对应的目标答复语句,以通过意图识别、问题拆解、逻辑规划、扩展生成以及动态执行等多个模块协同工作,有效解决了复杂问题的检索难题。

    基于大模型的海量负面信息检测方法、装置、设备及介质

    公开(公告)号:CN119005198A

    公开(公告)日:2024-11-22

    申请号:CN202411030867.1

    申请日:2024-07-30

    Abstract: 本公开涉及一种基于大模型的海量负面信息检测方法、装置、设备及介质。其中,基于大模型的海量负面信息检测方法包括:获取待检测文本,由目标机器学习模型对待检测文本进行分析输出第一结果,在第一结果为待检测文本对应的情感分析结果为非负面时,获取目标指令语句,由目标大语言模型基于目标指令语句对待检测文本进行情感分析,输出第二结果,将第二结果确定为待检测文本的检测结果,目标大语言模型的第一参数量高于目标机器学习模型的第二参数量,由此,能够通过不同参数量的机器学习模型和大语言模型结合的方式对待检测文本进行情感分析,确定待检测文本的检测结果,实现了在对待检测文本快速进行情感分析的基础上提高了情感分析的准确性。

Patent Agency Ranking