两阶段优化的无线网优领域长实体识别方法及系统

    公开(公告)号:CN118194858A

    公开(公告)日:2024-06-14

    申请号:CN202410343955.0

    申请日:2024-03-25

    Abstract: 本发明提供一种两阶段优化的无线网优领域长实体识别方法及系统,属于无线网优运维技术领域,利用预先训练好的长实体识别模型对获取的待识别的文本内容进行处理,得到长实体识别结果;通过第一阶段前置任务,获得具备领域知识的预训练模型TelBert;第二阶段引入与实体相关的语义信息,得到基于机器阅读理解框架的长实体识别模型,以双指针网络的方式解码实体。本发明通过增加实体类型预测任务学习特定领域知识,增强基座模型文本表征学习的能力,缓解了小样本场景下模型调优的困难;对实体识别模型进行改进,得到适用于文档级长实体识别的MRC‑LER模型;提出基于语义相似度的评价指标,合理评估实体关键信息的有效抽取率。

    可泛化无线网故障决策生成方法及系统

    公开(公告)号:CN119316268A

    公开(公告)日:2025-01-14

    申请号:CN202411242601.3

    申请日:2024-09-05

    Abstract: 本发明提供一种可泛化无线网故障决策生成方法及系统,属于无线网故障处理技术领域,获取故障现象文本信息;利用预先训练好的可泛化决策生成模型对获取的故障现象文本信息进行处理,得到故障决策。本发明利用相关知识构建决策分析以减少其幻觉,增设领域决策分析过程质量验证机制,保证了分析过程充分包含与输入故障相关领域知识,进而保证了分析过程的质量,提高了模型的稳定性和可靠性;将故障现象映射为领域基础问题,从知识库中检索基础问题相关知识来辅助生成决策分析过程,并利用大模型强大的文本分析处理能力,利用分析过程生成最终决策,提高了模型的泛化性。

    一种兴趣挖掘方法及装置

    公开(公告)号:CN111475638A

    公开(公告)日:2020-07-31

    申请号:CN202010489450.7

    申请日:2020-06-02

    Abstract: 本申请提供了一种兴趣挖掘方法及装置,其中,方法包括:接收待挖掘文本集合;待挖掘文本集合包括多个不同历史时间段的待挖掘文本;待挖掘文本集合中的任一待挖掘文本包括标注词;依据目标待挖掘文本,确定用户的兴趣分布,得到用户的短期兴趣;目标待挖掘文本为待挖掘文本集合中的任一待挖掘文本;依据待挖掘文本集合,确定用户的长期兴趣;从预设知识库获取当前突发话题分布,得到用户的突发兴趣;根据用户的短期兴趣、用户的长期兴趣和用户的突发兴趣,确定用户的实际兴趣。本申请通过更全面完整的用户兴趣,得到的用户的实际兴趣,因此,本申请得到的用户的实际兴趣的准确性更高。

Patent Agency Ranking