基于数字建模的跨语言信息处理方法

    公开(公告)号:CN119398060A

    公开(公告)日:2025-02-07

    申请号:CN202411407387.2

    申请日:2024-10-10

    Abstract: 本申请提供了基于数字建模的跨语言信息处理方法,涉及数据处理技术领域,包括:基于数字人文数据库,采集具有字数标签的古文训练语料集;对RoBERTa模型进行预训练,生成语言信息处理预训练模型;为满足跨语言需求,包括将文字理解转化为图像或视频,构建跨语言训练数据集;最后,通过微调该预训练模型,获得跨语言信息处理模型,实现跨语言需求处理。通过本申请可以解决现有技术由于在处理古文时表现不佳,难以结合整段话或长句的具体语境进行图像和视频的生成,导致在执行跨语言任务效率较低,进一步影响了模型在处理多样化语言和任务时的通用性和适应性,实现了对古文和跨语言任务的高效处理,显著提升了模型对古文的理解和处理效率。

    基于条件随机场的食品安全事件实体抽取方法

    公开(公告)号:CN108776656A

    公开(公告)日:2018-11-09

    申请号:CN201810569813.0

    申请日:2018-06-05

    Abstract: 本发明公开了一种多特征知识下的食品安全事件实体抽取方法,包括以下步骤:食品安全事件的实体界定;食品安全事件实体内部和外部特征统计;机器学习模型建立;语料的选择和语料的处理;特征的选取以及特征模板的制定;本发明的优点在于:对于构建食品安全事件知识库和挖掘食品安全应对策略起到了充当基础资源的作用。能够自动将食品名称与导致食品安全事件发生的具体因素抽出来。在构建抽取模型的过程中,不仅在条件随机场模型当中融入了大量的特征知识而且所构建的模型是在海量的经过标注的食品安全事件语料上进行的。

Patent Agency Ranking