-
公开(公告)号:CN119513319A
公开(公告)日:2025-02-25
申请号:CN202411664581.9
申请日:2024-11-20
Applicant: 上海华讯网络系统有限公司
IPC: G06F16/353 , G06F16/334 , G06F18/214 , G06F18/241 , G06N3/045 , G06N3/08 , G06N5/04
Abstract: 本发明提供了一种基于情景学习的长文档多维度文本分类方法及系统,包括:构建查询指令模版;根据查询指令模版构建人工标注的训练、开发、测试数据集,训练编码器;基于语言模型,进行判断分类;根据分类结果构建相关训练样本采样策略,进行长文档标签类别推理。本发明仅需少量标注样本,人工标注成本较低,在一次前向传播中,共用了文档摘要信息,具有更强的实用性、更为高效的计算效率;具备非常高的灵活性,系统内各模块组件之间具备高度的独立性,能够根据业务需求,对各组件进行自定义设计与优化。
-
公开(公告)号:CN118747904A
公开(公告)日:2024-10-08
申请号:CN202410893322.7
申请日:2024-07-04
Applicant: 上海华讯网络系统有限公司
IPC: G06V30/416 , G06V30/19 , G06F18/10 , G06F40/30 , G06Q50/18
Abstract: 本发明提供了一种基于大规模语言模型的商务合同风险智能审查方法及系统,包括:明确风险审查的需求边界,确定需要识别的风险类型;从合同文件中抽取出文本信息;搭建BRAT文本标注平台,以单个合同文档为基本标注单位,以段落对象为最小标注单元进行标注;训练语义相关模型;对每一风险规则设计一个独立的指令模版;训练语言模型基座;语义相关模型与语言模型训练完成之后,对合同进行风险审查。本发明减少人为错误:人工审查容易受到疲劳、注意力分散等因素的影响,导致错误和遗漏。本方法可以减少人为错误,提高审查的一致性和准确性。
-
公开(公告)号:CN119474547A
公开(公告)日:2025-02-18
申请号:CN202411664590.8
申请日:2024-11-20
Applicant: 上海华讯网络系统有限公司
IPC: G06F16/9535 , G06F18/27 , G06F18/213 , G06F40/186 , G06N3/045 , G06N3/08
Abstract: 本发明提供了一种自回归式端到端个性化内容推荐方法及系统,方法包括以下步骤:步骤S1,抽取用于体现特征信息的特定字段和通用字段,再形成标的物结构化数据;步骤S2,将标的物结构化数据转化为自然语言表示,然后生成标的物特征向量;步骤S3,构建用户行为序列;步骤S4,形成用户行为特征向量序列,利用自回归模型对用户行为特征向量序列进行分析,生成用户当前时刻的兴趣特征向量;步骤S5,生成候选标的物序列;步骤S6,根据用户对候选标的物序列中的标的物的选择结果,更新用户行为序列。通过实验证实,本发明基于深度学习技术,可以有效结合用户行为偏好信息,实现端到端的个性化内容推荐效果,能够有效服务于不同的业务场景。
-
-