文本纠错方法、装置、设备及存储介质

    公开(公告)号:CN119443087A

    公开(公告)日:2025-02-14

    申请号:CN202411515290.3

    申请日:2024-10-28

    Abstract: 本申请公开了一种文本纠错方法、装置、设备及存储介质,涉及人工智能技术领域,公开了文本纠错方法,包括:将获取到的待纠错文本输入至大语言模型,基于大语言模型对待纠错文本中的每个词汇进行错误概率识别,获得待纠错文本中的错误词汇,大语言模型是基于专业领域语料对语言模型进行训练后获得的;从预设热词权重表中匹配错误词汇的替换候选词汇,预设热词权重表是基于用户的日常用词、行业术语以及用户反馈数据创建的;基于大语言模型与预设滑动窗口,从替换候选词汇中筛选最满足错误词汇上下文的目标替换词汇;使用目标替换词汇对待纠错文本进行纠错,实现在复杂或变化的语言环境中对待纠错文本进行有效纠错,提高对文本纠错的准确性。

    图像筛选方法、装置、电子设备及计算机存储介质

    公开(公告)号:CN116188800A

    公开(公告)日:2023-05-30

    申请号:CN202310140006.8

    申请日:2023-02-20

    Abstract: 本申请公开了一种图像筛选方法、装置、电子设备及计算机存储介质,通过图像筛选模型的预处理子模型中的多个滤波器对目标图像的像素值进行计算,得到目标图像对应的残差图像。再将残差图像输入至图像筛选模型的筛选子模型中,通过筛选子模型的卷积核和通用特征提取器对残差图像进行计算,得到多个统计特征信息,并以此确定目标图像的筛选结果。如此,通过使用多个滤波器,避免了使用单一滤波器获取相邻像素之间的依赖性存在较大的局限性,能够更好的捕获相邻像素之间的依赖性,进而更好的捕捉二次处理对图像带来的影响。通过筛选子模型输出的多个统计特征信息,能够确定用于指示目标图像是否修改的筛选信息,进而提高图像筛选方法的效率。

    模型上下文长度扩充方法、装置、设备、存储介质及产品

    公开(公告)号:CN118153556A

    公开(公告)日:2024-06-07

    申请号:CN202410361675.2

    申请日:2024-03-27

    Abstract: 本发明公开了一种模型上下文长度扩充方法、装置、设备、存储介质及计算机程序产品。该方法包括:基于缩放因子通过优化大语言模型的位置编码函数扩充所述大语言模型的上下文长度,获得优化后大语言模型;根据测试数据集确定所述优化后大语言模型对应的困惑度;基于所述困惑度和所述缩放因子从所述优化后大语言模型中选择目标大语言模型。由于本发明是通过缩放因子优化大语言模型的位置编码函数,得到优化后大语言模型,再通过优化后大语言模型对应的困惑度选择目标大语言模型。相对于现有的使用更长的训练数据去微调大语言模型来扩展大语言模型的上下文窗口的方式,本发明上述方式能够提高大语言模型上下文长度扩充效率。

    人脸真伪鉴定方法、装置、设备及存储介质

    公开(公告)号:CN116416662A

    公开(公告)日:2023-07-11

    申请号:CN202211620641.8

    申请日:2022-12-15

    Abstract: 本申请公开了一种人脸真伪鉴定方法、装置、设备及存储介质,方法包括:获取待识别人脸图像的图像信息,将图像信息输入人脸真伪鉴定模型,生成颜色特征图和边缘特征图,人脸真伪鉴定模型包括级联的隐式特征提取层和鉴定层,隐式特征提取层包括级联的第一网络单元和第二网络单元,第一网络单元对颜色特征图和边缘特征图进行细节特征提取,获得第一颜色特征图和第一边缘特征图,第二网络单元对第一颜色特征图和第一边缘特征图进行深度特征提取和池化,获得颜色特征向量和边缘特征向量,鉴定层根据颜色特征向量和边缘特征向量确定人脸真伪鉴定结果。由于第一网络单元没有进行池化操作,从而防止人脸图像中噪声信号能量的减少,以提高鉴定准确率。

    知识检索方法、设备、存储介质及装置

    公开(公告)号:CN117763126A

    公开(公告)日:2024-03-26

    申请号:CN202410039037.9

    申请日:2024-01-10

    Abstract: 本发明属于人工智能技术领域,公开了一种知识检索方法、设备、存储介质及装置,本发明通过对预设知识库中的知识文档进行分割,获得多个知识片段;基于预设大语言模型对用户输入的问题信息进行答案解析,获得候选答案;基于预设BERT模型对所述问题信息、知识片段以及候选答案进行相似度分析,获得综合相似度;基于预设大语言模型以及综合相似度确定目标答案,本发明使用大语言模型将用户提问进行候选答案生成后,对问题、候选答案和知识片段进行综合相似度计算,可以更准确地衡量问题、答案和知识片段之间的相似度,从而筛选出最精准的目标答案。

    一种语音主体识别方法及装置
    9.
    发明公开

    公开(公告)号:CN115881092A

    公开(公告)日:2023-03-31

    申请号:CN202111154946.X

    申请日:2021-09-29

    Abstract: 本发明提供一种语音主体识别方法及装置。该方法包括:确定待处理的音频文件;将所述待处理的音频文件输入到音频嵌入模型,得到所述音频嵌入模型输出的所述待处理的音频文件对应的音频嵌入向量;确定所述音频嵌入向量中第一音频嵌入向量与第二音频嵌入向量之间的点积相似度矩阵,获得相应的相似度队列;并基于所述相似度队列,确定语音主体对应的音频数据;其中,所述音频嵌入模型以位于所述点积相似度矩阵对角线上的元素数值最大为训练目标进行训练得到的。采用本发明提供的语音主体识别方法,能够通过分析音频嵌入向量之间的点积相似度矩阵有效提高语音主体识别的精度,提升了语音环境较为复杂的特定场景下的语音主体识别效率和鲁棒性。

Patent Agency Ranking