-
公开(公告)号:CN117235619B
公开(公告)日:2025-03-11
申请号:CN202311020694.0
申请日:2023-08-14
Applicant: 杭州瑞成信息技术股份有限公司
IPC: G06F18/2415 , G06N3/0455 , G06N3/0499 , G06N3/082 , G06F16/35
Abstract: 本申请涉及文本分类领域,特别是涉及一种会议纪要分类方法、装置、计算机设备和存储介质。所述方法包括:提取会议纪要样本的句级特征,得到句级特征集合;获取所述句级特征集合中所述会议纪要样本的各板块所分别对应的句级特征子集合,并基于各所述句级特征子集合,分别生成对应板块的文档表示;基于各所述文档表示,将所述会议纪要样本的各类别权重的交叉熵作为训练优化的目标函数进行模型训练,得到会议纪要分类模型;利用所述会议纪要分类模型对待分类会议纪要进行分类,得到分类结果。本发明通过训练会议纪要分类模型,实现会议纪要分类的自动化。
-
公开(公告)号:CN118070814B
公开(公告)日:2024-08-02
申请号:CN202410041685.8
申请日:2024-01-11
Applicant: 杭州瑞成信息技术股份有限公司
Abstract: 本发明涉及语义理解技术领域,尤其涉及基于语义衔接判别模型的知识召回方法及其应用,为了解决现有的大语言模型的知识召回没有关注文档中语句间的语义衔接,容易造成召回内容出现语义断裂和没有关注到召回信息的合理粒度,在面对不同粒度的问题时容易造成回答内容的语义信息不全和噪声过大的问题,本发明包括收集一批用于知识召回的文本数据,进行段落划分并进行标注;对原生BERT模型进行改进;对改进的BERT模型进行微调;进行段落切分;进行句子切分;将待入知识库的每篇文章使用通用大模型提取其摘要,构成句子层级、段落层级、文章层级的关键信息;建立映射关系;存入向量搜索库,本发明充分考虑了文章的层级关系及文本段落语义的完整性。
-
公开(公告)号:CN117235619A
公开(公告)日:2023-12-15
申请号:CN202311020694.0
申请日:2023-08-14
Applicant: 杭州瑞成信息技术股份有限公司
IPC: G06F18/2415 , G06N3/0455 , G06N3/0499 , G06N3/082 , G06F16/35
Abstract: 本申请涉及文本分类领域,特别是涉及一种会议纪要分类方法、装置、计算机设备和存储介质。所述方法包括:提取会议纪要样本的句级特征,得到句级特征集合;获取所述句级特征集合中所述会议纪要样本的各板块所分别对应的句级特征子集合,并基于各所述句级特征子集合,分别生成对应板块的文档表示;基于各所述文档表示,将所述会议纪要样本的各类别权重的交叉熵作为训练优化的目标函数进行模型训练,得到会议纪要分类模型;利用所述会议纪要分类模型对待分类会议纪要进行分类,得到分类结果。本发明通过训练会议纪要分类模型,实现会议纪要分类的自动化。
-
公开(公告)号:CN118070814A
公开(公告)日:2024-05-24
申请号:CN202410041685.8
申请日:2024-01-11
Applicant: 杭州瑞成信息技术股份有限公司
Abstract: 本发明涉及语义理解技术领域,尤其涉及基于语义衔接判别模型的知识召回方法及其应用,为了解决现有的大语言模型的知识召回没有关注文档中语句间的语义衔接,容易造成召回内容出现语义断裂和没有关注到召回信息的合理粒度,在面对不同粒度的问题时容易造成回答内容的语义信息不全和噪声过大的问题,本发明包括收集一批用于知识召回的文本数据,进行段落划分并进行标注;对原生BERT模型进行改进;对改进的BERT模型进行微调;进行段落切分;进行句子切分;将待入知识库的每篇文章使用通用大模型提取其摘要,构成句子层级、段落层级、文章层级的关键信息;建立映射关系;存入向量搜索库,本发明充分考虑了文章的层级关系及文本段落语义的完整性。
-
-
-