Patent search ap:("北京达佳互联信息技术有限公司") AND inv:"肖秋实" Page 1

1.

发明公开
一种视频文件分词方法、装置及电子设备审中-实审

公开(公告)号：CN113901816A

公开(公告)日：2022-01-07

申请号：CN202111324348.2

申请日：2021-11-10

Applicant: 北京达佳互联信息技术有限公司

Inventor： 周湘阳 , 蒋萧泽 , 梅丰 , 肖秋实 , 李岩

IPC: G06F40/289 , G06K9/00 , G06N3/04

Abstract: 本公开关于一种视频文件分词方法、装置及电子设备，该方法包括：确定待处理的视频文件，提取待处理的视频文件的多个图像帧；对多个图像帧进行文本检测处理，获得第一特征图和第二特征图；第一特征图包括多个图像帧中均存在的处于同一位置且文本内容相同的全局文本特征以及全局文本特征对应的第一区域位置；第二特征图包括多个图像帧中任一文本内容对应的基础文本特征；基于第一特征图中的全局文本特征，对基础文本特征进行视频信息增强，获得多个图像帧的局部文本特征；根据多个图像帧对应的局部文本特征、以及局部文本特征对应的区域位置与第一区域位置对应的关系，确定是否结合第一特征图对局部文本特征对应的分词文本进行分词，获得分词结果。

2.

发明授权
一种视频文件分词方法、装置及电子设备有权

公开(公告)号：CN113901816B

公开(公告)日：2025-04-08

申请号：CN202111324348.2

申请日：2021-11-10

Applicant: 北京达佳互联信息技术有限公司

Inventor： 周湘阳 , 蒋萧泽 , 梅丰 , 肖秋实 , 李岩

IPC: G06F40/284 , G06V20/62 , G06V30/18 , G06V30/26 , G06V10/82 , G06N3/0442 , G06N3/0455

Abstract: 本公开关于一种视频文件分词方法、装置及电子设备，该方法包括：确定待处理的视频文件，提取待处理的视频文件的多个图像帧；对多个图像帧进行文本检测处理，获得第一特征图和第二特征图；第一特征图包括多个图像帧中均存在的处于同一位置且文本内容相同的全局文本特征以及全局文本特征对应的第一区域位置；第二特征图包括多个图像帧中任一文本内容对应的基础文本特征；基于第一特征图中的全局文本特征，对基础文本特征进行视频信息增强，获得多个图像帧的局部文本特征；根据多个图像帧对应的局部文本特征、以及局部文本特征对应的区域位置与第一区域位置对应的关系，确定是否结合第一特征图对局部文本特征对应的分词文本进行分词，获得分词结果。

3.

发明授权
信息获取方法、装置、电子设备及存储介质有权

公开(公告)号：CN113792166B

公开(公告)日：2023-04-07

申请号：CN202110951049.5

申请日：2021-08-18

Applicant: 北京达佳互联信息技术有限公司

Inventor： 高泽洲 , 周湘阳 , 伍星 , 黄伟航 , 肖秋实 , 梅丰

IPC: G06F16/483 , G10L15/20 , G10L15/22 , G06F40/289 , G06F40/30 , G06N3/08

Abstract: 本公开是关于一种信息获取方法、装置、电子设备及存储介质，该方法包括：获取视频的多模态信息，视频的多模态信息包括：视频的主要文字信息、视频的辅助文字信息和多媒体信息，该多媒体信息包括：视觉信息和/或语音信息，其中，视觉信息包括：视频的多个关键帧图像，语音信息包括：视频中的语音信号；基于视频的多模态信息，生成该视频的摘要信息。同时考虑了视频的主要文字信息、视频的辅助文字信息和视频的多媒体信息等多个类型的信息与待生成的视频的摘要信息的关联性，基于视频的主要文字信息、视频的辅助文字信息和视频的多媒体信息等多个类型的信息，生成视频的摘要信息，从而，充分地利用视频的信息，得到视频的摘要信息。

4.

发明公开
信息获取方法、装置、电子设备及存储介质有权

公开(公告)号：CN113792166A

公开(公告)日：2021-12-14

申请号：CN202110951049.5

申请日：2021-08-18

Applicant: 北京达佳互联信息技术有限公司

Inventor： 高泽洲 , 周湘阳 , 伍星 , 黄伟航 , 肖秋实 , 梅丰

IPC: G06F16/483 , G10L15/20 , G10L15/22 , G06F40/289 , G06F40/30 , G06N3/08

Abstract: 本公开是关于一种信息获取方法、装置、电子设备及存储介质，该方法包括：获取视频的多模态信息，视频的多模态信息包括：视频的主要文字信息、视频的辅助文字信息和多媒体信息，该多媒体信息包括：视觉信息和/或语音信息，其中，视觉信息包括：视频的多个关键帧图像，语音信息包括：视频中的语音信号；基于视频的多模态信息，生成该视频的摘要信息。同时考虑了视频的主要文字信息、视频的辅助文字信息和视频的多媒体信息等多个类型的信息与待生成的视频的摘要信息的关联性，基于视频的主要文字信息、视频的辅助文字信息和视频的多媒体信息等多个类型的信息，生成视频的摘要信息，从而，充分地利用视频的信息，得到视频的摘要信息。

Patent Agency Ranking