一种多标签文本智能分类方法

    公开(公告)号:CN115905533A

    公开(公告)日:2023-04-04

    申请号:CN202211479591.6

    申请日:2022-11-24

    Abstract: 本发明属于自然语言处理的多标签分类领域,具体涉及一种多标签文本智能分类方法;该方法包括将文本与标签拼接后联合训练得到文本向量和标签向量;将文本向量和标签向量输入局部分层注意力模块得到交互文本特征向量和交互标签特征向量;采用MV‑MoE多视角专家分类模块对交互文本特征向量进行多视角分类,对多视角分类结果加权求和得到预测标签概率;通过标签语义融合模块对预测标签概率和交互标签特征向量进行处理,得到多标签文本分类结果;采用分类损失函数计算损失调整模型参数;本发明大大提高了模型在分类阶段的鲁棒性和准确性。

    一种基于偏多标记学习的患者筛选标记方法

    公开(公告)号:CN114093445A

    公开(公告)日:2022-02-25

    申请号:CN202111369388.9

    申请日:2021-11-18

    Abstract: 本发明属于偏多标记学习、数据挖掘领域,具体涉及一种基于偏多标记学习的患者筛选标记方法;该方法包括:获取患者的病理样本数据,将病理样本数据输入到训练好的基于偏多标记学习的医疗文本语义信息大数据预测模型中,预测患者的患病类型和患病概率,根据患者的患病类型和患病概率对患者进行标记;本发明对分类类别不平衡性问题进行进一步的处理,可以预测到更精准的标记结果,病人可根据此标记结果进行健康管理,医生也可以根据此结果对病人进行下一步诊断,具有良好的社会效益和经济效益。

    一种基于APP评论数据的用户需求获取方法

    公开(公告)号:CN116932853A

    公开(公告)日:2023-10-24

    申请号:CN202310914763.6

    申请日:2023-07-25

    Inventor: 王进 周继聪 周青

    Abstract: 本发明属于自然语言处理领域领域,具体涉及一种基于APP评论数据的用户需求获取方法,包括通过Python爬虫爬取APP评论数据并进行预处理,得到预处理文本数据;采用预处理文本数据对Bert模型进行SRP任务和LAP任务的联合预训练;构造用户需求预测模型,采用预训练完成的Bert模型对预处理文本数据构造训练数据编码,采用编码后的训练数据训练用户需求预测模型;预训练完成的Bert模型与训练完成的用户需求预测模型组成用户需求生成模型,获取待处理数据输入用户需求生成模型得到对应的用户需求生成结果;本发明将文本分类问题转换为匹配问题,缓解了评论类别分布不平衡的问题,提升了预测性能。

    一种基于深度学习的医学影像报告多标签分类方法

    公开(公告)号:CN114398935A

    公开(公告)日:2022-04-26

    申请号:CN202111363669.3

    申请日:2021-11-17

    Abstract: 本发明公开了一种基于深度学习的医学影像报告多标签分类方法,包括:获取医学影像报告的文本数据和医学影像报告中的异常情况的标签数据;根据文本数据和标签数据得到词向量和标签向量;将词向量和标签向量输入多标签分类模型,得到多标签分类任务损失;将词向量、文本数据和标签向量输入辅助任务模型,得到辅助任务损失;根据辅助任务损失和多标签分类任务损失对多标签分类模型进行反向传播优化,得到训练多标签分类模型;获取待检测医学影像报告的待检测文本数据;将待检测文本数据输入训练多标签分类模型,确定待检测医学影像报告的异常问题。本发明能够实现自动提取高阶特征,建立多个标签的关联性的方法,建立不同的神经网络层,来对文本进行多标签分类。

Patent Agency Ranking