评论生成模型训练方法和装置、信息生成方法和装置

    公开(公告)号:CN117591948A

    公开(公告)日:2024-02-23

    申请号:CN202410082714.5

    申请日:2024-01-19

    Abstract: 本公开提供了一种评论生成模型训练方法和装置,涉及人工智能技术领域,具体涉及自然语言处理、深度学习、大模型等技术领域。具体实现方案为:获取文本样本集,文本样本集包括:第一文本样本,第一文本样本包括:展示文本以及与展示文本相关的情感立场文本;获取预先构建的评论生成网络,评论生成网络包括:编码器和解码器,编码器分别对展示文本和情感立场文本进行建模,得到评论全局特征向量;解码器用于对评论全局特征向量进行解码,得到评论结果信息;将从文本样本集中选取的第一文本样本输入评论生成网络,得到评论生成网络输出的评论结果信息;基于评论结果信息,得到训练完成的评论生成模型。

    面向大语言模型的词向量生成方法、电子设备及存储介质

    公开(公告)号:CN117113990B

    公开(公告)日:2024-01-12

    申请号:CN202311374453.6

    申请日:2023-10-23

    Abstract: 本发明涉及计算机技术应用领域,提供了一种面向大语言模型的词向量生成方法、电子设备及存储介质,包括:获取待分词的文本,作为目标文本;对目标文本进行分词处理,得到对应的分词集S;基于预设词向量基准表T,获取每个词在每个嵌入矩阵的特征向量;基于预设滑动窗口长度d,将S划分为多个语句片段,得到对应的语句片段集SP;对每个语句片段的特征向量进行融合,得到对应的特征向量;得到SP对应的特征向量F作为目标文本的特征向量。本发明在词向量生成过程中,将多个相邻的词组合视为一个词,能够使得分词的长度得到极大的压缩。此外,将不同词的特征向量通过张量积的方式组合成一个词的特征向量,可以极大的降低可训练参数量。

    含不确定性引导的测试阶段训练人脸伪造检测方法及系统

    公开(公告)号:CN117275068A

    公开(公告)日:2023-12-22

    申请号:CN202311224982.8

    申请日:2023-09-21

    Abstract: 本发明公开了一种含不确定性引导的测试阶段训练人脸伪造检测方法及系统,属于深度学习以及计算机视觉技术领域,方法包括:获取待判别的图像作为初始输入图像;获取所述初始输入图像的高频信息图像;提取所述高频信息图像中不同尺度的RGB特征和频域注意力特征,将所述RGB特征和所述频域注意力特征进行融合;将所述融合后RGB特征和所述频域特征进行交叉注意力计算,得到融合特征;基于所述融合特征,并根据不同的输入图像和任务需求,自适应选择融合方式,得到判别特征,并基于所述判别特征进行分类任务。本发明充分利用频域和RGB域中有效的信息挖掘伪造痕迹,利用不确定性引导的测试阶段训练策略,对网络中的不确定性进行优化,提高了泛化性能。

    一种面向大场景多对象的自监督群体检测方法及装置

    公开(公告)号:CN115187898A

    公开(公告)日:2022-10-14

    申请号:CN202210765779.0

    申请日:2022-07-01

    Abstract: 本发明公开了一种面向大场景多对象的自监督群体检测方法及装置,方法包括:对拥挤的多人场景视频的每t帧视频中的N个人进行建模;对每个人提取活动和时间轨迹等特征信息;以自我监督方式训练一个环境感知人类行为模拟器,即在一群体中自发地学习人类的自然行为;基于因果推理思想,利用环境感知人类行为模拟器训练关系网络,以发现多人之间成对的人际关系;确定关系网络的参数,并添加一基于全连接层的网络来实现人工群体检测任务。装置包括:处理器和存储器。本发明基于因果推理的思想,可在一群体中自发地学习人类的自然行为而无需大量标注信息,从而完成较好的群体检测任务。

    视频拷贝检测方法和装置、存储介质和电子装置

    公开(公告)号:CN113051984A

    公开(公告)日:2021-06-29

    申请号:CN201911389790.6

    申请日:2019-12-26

    Abstract: 本申请提供了一种视频拷贝检测方法和装置、存储介质和电子装置,其中,该方法包括:抽取查询视频的第一目标关键帧;提取所述第一目标关键帧的第一视频特征;获取参考视频的第二目标关键帧的第二视频特征;在根据所述第一视频特征和第二视频特征确定出所述查询视频与所述参考视频匹配的情况下,抽取所述查询视频与所述参考视频中相似的视频片段。通过本发明,解决了相关技术中的视频拷贝检测方法中存在的视频拷贝检测效率低,视频拷贝检测准确度差的问题,进而达到了提高视频拷贝检测效率,提升视频拷贝检测准确度的效果。

    一种视频合成方法、装置、设备及存储介质

    公开(公告)号:CN112866586A

    公开(公告)日:2021-05-28

    申请号:CN202110003232.2

    申请日:2021-01-04

    Abstract: 本发明实施例公开了一种视频合成方法、装置、设备及存储介质。获取的待合成文本可以是任意语种的文本,待合成视频可以是用户选择的包括任意主播形象的视频片段,根据获取的待合成文本自动生成音频流,基于待合成视频中的无音视频流生成视频特征和唇部特征,并根据音频流生成音频特征和口型特征,基于口型特征和唇部特征确定口唇映射关系,根据口唇映射关系生成口唇一致的视频序列,进一步地,根据融合后的视频序列,生成目标合成视频,使整个目标合成视频中的人脸和唇部动作保持一致,并使目标合成视频中的主播唇动保持自然一致,并生成符合用户意愿的目标合成视频,提高用户观看体验。

    Agent自主规划多模态大模型内容创作方法、装置及系统

    公开(公告)号:CN119917641A

    公开(公告)日:2025-05-02

    申请号:CN202411988650.1

    申请日:2024-12-31

    Abstract: 本发明提供了一种Agent自主规划多模态大模型内容创作方法、装置及系统,涉及大模型内容创作技术领域,包括:根据写作要求及参考文件生成待创作内容的脉络结构骨架;根据每一段落信息对应的若干待检索问题进行相关信息资料收集,生成每一段落信息对应的段落内容;根据每一锚点信息生成每一锚点信息对应的图表或图片;获取每一段落内容中的每一需要做引用计算的句子,以得到引用句子列表A;遍历相似度列表η,若ηi>η’,则确定Ai无异常;生成用户输入的写作要求对应的多模态长文;对写作内容的校对;本发明中,通过创新性地结合动态知识获取、多模态生成、长篇写作规划及内容可信度保障,显著提升了AI写作的智能性、可靠性及多样性。

    大模型驱动的树索引结构在RAG内容解析中的应用方法

    公开(公告)号:CN119884278A

    公开(公告)日:2025-04-25

    申请号:CN202510070908.8

    申请日:2025-01-16

    Abstract: 本发明提供了大模型驱动的树索引结构在RAG内容解析中的应用方法,所述方法根据原始文本的长度和预设文本长度获取初始文本;根据初始文本对应的中间文本列表,获取中间文本列表对应的树状存储数据,其中,中间文本包括中间段落文本和中间段落文本对应的中间标题路径,中间标题路径中包括若干个标题级别不同的标题文本;获取树状存储数据中的每一个节点对应的属性信息,并将节点对应的属性信息存储到节点中,以使得对树状存储数据进行更新并给树状存储数据分配一个唯一的ID;将树状存储数据和树状存储数据的ID上传到RAG对应的数据库中,能够保证文本的整体结构和初始文本之间的语义联系不被破坏,能够提高RAG的检索效率和生成质量。

Patent Agency Ranking