一种基于数据中台数据分级分类方法

    公开(公告)号:CN113268548A

    公开(公告)日:2021-08-17

    申请号:CN202110360550.4

    申请日:2021-04-02

    Abstract: 本发明公开了一种基于数据中台数据分级分类方法,具体包括如下步骤:A.建立数据分类标准;B.建立数据分级标准;C.根据数据中台结合。本发明将单个子项组合分类为模块集,并赋予模块集以词向量为基础的名称词源,用于以一个名称词源关联模块集中所有的子项,同时设置以需求为目的的分级模式,设定总递减表,以总递减表为更新基础,能够作为多个不同用户权限的使用基础,实现根据总递减表向下的分支表,最终按照数据矩阵实现快速检索和快速分类目的,达到降低整体数据库的计算流程和复杂程度,主要基于数据库一步形成分级和分类效果,数据结论真实度更高。

    基于大语言模型的少样本关系抽取方法

    公开(公告)号:CN119646237A

    公开(公告)日:2025-03-18

    申请号:CN202411805368.5

    申请日:2024-12-10

    Abstract: 本发明公开了基于大语言模型的少样本关系抽取方法,属于自然语言技术领域。包括有数据集构建、输入与标签生成、损失函数与优化、文本特征提取、关系类型标注、数据标注与质量评分、聚类与样例库构建、获取文档特征并计算相似度、随机采样与筛选、设计提示模板、输出格式设计、模型预测,本技术方案采用了将实体识别和关系分类合并为单一模型的联合抽取方式,联合抽取方法通过共享参数和联合解码来增强子任务间的交互,与传统的先识别实体再判断关系的流水线方案相比,有效减少了误差传播,实现了整体抽取性能的有效提升,此外,联合抽取通过单一模型一次性处理两个子任务,显著减少了关系三元组抽取的训练和预测时间开销,提高了整体抽取效率。

Patent Agency Ranking