一种多模态融合的采访镜头检测方法

    公开(公告)号:CN101316327A

    公开(公告)日:2008-12-03

    申请号:CN200710099725.0

    申请日:2007-05-29

    Abstract: 本发明公开了一种多模态融合的采访镜头检测方法,包括:输入未编辑的原始视频,对视频进行预处理,得到原始视频的视频流和音频流,以及视频流中的镜头、各个镜头的关键帧;根据视频预处理操作所得到的音频流建立人声模型,并依赖所建立的人声模型判断镜头是否为包含人声的镜头;根据视频预处理操作所得到的视频流建立人脸模型,并依赖人脸模型判断镜头是否为包含人脸的镜头;融合人声检测结果和人脸检测结果,如果一个镜头中同时包含人声和人脸信息,则镜头为采访镜头。本发明的优点是通过融合视频和音频信息,建立通用的基于镜头的采访检测模型,并实现了对未经编辑的原始视频的概念检测和标注。

    乱笔顺库建立方法及联机手写汉字识别评测系统

    公开(公告)号:CN1641686A

    公开(公告)日:2005-07-20

    申请号:CN200410000823.0

    申请日:2004-01-17

    Abstract: 本发明涉及一种建立乱笔顺库的方法及联机手写汉字识别技术的评测系统。本发明方法,包括标准样本库的采集和乱笔顺库的生成,其特征在于,所述乱笔顺库是按照笔画的连通关系,对采集的联机手写汉字笔迹数据进行等价划分,分割出至少一个以上的部件后,再打乱每个部件内笔画的顺序生成的。本发明的评测系统,包括:存储设备,用于存储标准样本库和乱笔顺库;采集模块,用于采集标准样本库;转换模块,用于将联机汉字笔迹数据转化成一幅二值图像;分割模块,用于按照笔画的连通关系从二值图像中分割出至少一个以上的部件;生成模块,包括一用于打乱每个部件内笔画的顺序的单元,以及一用于打乱部件之间排列顺序的单元。

    一种人工智能生成文本检测方法及系统

    公开(公告)号:CN117972092A

    公开(公告)日:2024-05-03

    申请号:CN202410160432.2

    申请日:2024-02-04

    Abstract: 本发明提出一种人工智能生成文本检测方法,包括:使用代理语言模型从待检测文本中选取多个字为代表性字;使用预选语言模型依次对每个该代表性字进行多次生成操作,以每次生成结果的第一个字生成该代表性字的生成字集合,以该生成字集合获取所有该代表性字的估计概率矩阵;从该估计概率矩阵中抽取概率特征,并使用所有该代表性字的上下文语义表示形成上下文特征矩阵,基于该上下文特征矩阵和该概率特征得到增强特征;通过对该增强特征进行分类检测,获得该待检测文本的检测结果。本发明还提出一种人工智能生成文本检测系统,以及一种用于检测人工智能生成文本的数据处理装置。

    基于解耦自增强的细节可控个性化图像生成方法及系统

    公开(公告)号:CN117876522A

    公开(公告)日:2024-04-12

    申请号:CN202410069798.9

    申请日:2024-01-17

    Abstract: 本发明提出一种基于解耦自增强的细节可控个性化图像生成方法和系统,包括:获取参考概念图像和文本指令,构造文本指令的属性描述,基于概念图像的概念特征和属性描述,生成多个初始图像并筛选,将筛选后的每张初始图像与其对应的属性描述作为训练样本;为训练样本中初始图像添噪得到噪声图像,将噪声图像和其对应的属性描述送入包括文本编码器的扩散网络,扩散网络根据属性描述,预测噪声图像中所添加的噪声,根据预测结果和真实添加噪声构建损失函数训练扩散网络,得到图像生成模型;将具有目标属性的图像生成文本指令和噪声图像输入图像生成模型,图像生成模型根据图像生成文本指令为噪声图像去噪,得到图像生成文本指令对应的图像生成结果。

    一种新闻创作意图自动识别方法和装置

    公开(公告)号:CN117851589A

    公开(公告)日:2024-04-09

    申请号:CN202311586040.4

    申请日:2023-11-24

    Abstract: 本发明提出一种新闻创作意图自动识别方法和系统,包括:获取待检测的新闻文本,用文本编码器将新闻文本编码为词嵌入向量;使用三个特征生成器分别作为专家网络提取词嵌入向量的创作信念特征、欲望特征和计划特征;将创作信念特征、欲望特征和计划特征三者进行融合,得到意图特征;将意图特征输入新闻意图识别分类器中进行分类,输出新闻文本的新闻意图识别结果。本发明可以提取多维度的新闻意图表示,专家门可以动态聚合多任务特征,得到最终的新闻意图表达,本发明可进行新闻创作意图自动识别,实现了新闻意图识别的能力。

    一种基于令牌封装与增强的视觉Transformer轻量化方法及系统

    公开(公告)号:CN117592525A

    公开(公告)日:2024-02-23

    申请号:CN202311576896.3

    申请日:2023-11-23

    Inventor: 唐胜 房海鹏 曹娟

    Abstract: 本发明提出一种基于令牌封装与增强的视觉Transformer轻量化方法,包括:以视觉Transformer网络构建视觉模型;划分目标图像为多个图像块,将该图像块编码为图像令牌,对该图像令牌依重要性分类为高重要性令牌和低重要性令牌,将该低重要性令牌的信息封装至该代理令牌;以预设的注意力增强矩阵对该高重要性令牌、该分类令牌和封装后的代理令牌进行增强,生成该视觉模型的模型输入;以该视觉模型对该模型输入进行处理操作。本发明还提出一种基于令牌封装与增强的视觉Transformer轻量化系统,以及一种用于实现基于令牌封装与增强的视觉Transformer轻量化方法的数据处理装置。

    基于时序趋势预测的虚假新闻检测方法及系统

    公开(公告)号:CN116894184A

    公开(公告)日:2023-10-17

    申请号:CN202310728444.6

    申请日:2023-06-19

    Abstract: 本发明提出一种基于时序趋势预测的虚假新闻检测方法,包括:提取新闻样本的新闻表征;将该新闻表征进行聚类以获取至少一个主题簇;以每个主题簇的新闻样本按时序分布,建模为对应新闻主题的数据模型,基于该数据模型,预测该新闻主题的时序分布趋势;基于该时序分布趋势将各主题簇的新闻样本进行重加权后合并为训练集;以该训练集对虚假新闻检测器进行训练;通过该虚假新闻检测器对目标新闻进行虚假新闻检测。本发明还提出一种基于时序趋势预测的虚假新闻检测系统,以及一种用于实现基于时序趋势预测的虚假新闻检测的数据处理装置。

Patent Agency Ranking