直播字幕生成方法、系统、设备及存储介质

    公开(公告)号:CN114040255A

    公开(公告)日:2022-02-11

    申请号:CN202111259282.3

    申请日:2021-10-28

    Abstract: 本发明公开了直播字幕生成方法、系统、设备及存储介质,方法包括:S100:接收直播信源,解码分离出视频流和多条音轨的音频流;S200:接收多个音频流,识别并生成多个第一字幕数据;第一字幕数据中包含各个音频流中语音所对应的语音识别文本以及所对应的时间序列;实时翻译各语音识别文本,分别生成多个语音翻译文本;S300:接收多个语音识别文本和对应的语音翻译文本,封装成多语种的字幕流;S400:利用转码引擎基于时间序列,按帧格式对视频流、音频流以及字幕流进行编码封装,输出带有字幕切片的多条HLS直播流。本发明实现字幕与音视频同步,并且播放端可以根据需求选择音轨、字幕显示,满足不同视听需求的受众群体。

    一种适用于监控场景下的P2P技术方法

    公开(公告)号:CN118018686A

    公开(公告)日:2024-05-10

    申请号:CN202410083091.3

    申请日:2024-01-19

    Abstract: 本发明涉及视频传输技术领域,尤其涉及一种适用于监控场景下的P2P技术方法,包括以下步骤:S1:通过SIP协议确定摄像装置的摄像信息,注册到边缘平台,边缘平台获取并处理RTP数据包;S2:边缘平台的P2P Client和客户端的P2P Client通过信令服务获取对端的媒体信息实现通讯;S3:边缘平台的P2P Client的第一流媒体进行拉流,发送到客户端的P2P Client,客户端接收到视频流后,通过播放器进行解码播放;S4:当客户端不需要播放时,客户端的P2P Client通过信令服务告知边缘平台的P2P Client停止推流,完成停止播放流程。本发明在符合GB28181标准的基础上,可以进行平台级联,边缘设备中加入P2P技术可将边缘平台的视频流直接推送到播放端,使用P2P技术具有安全性高、延时低,并减少服务器压力的优势。

    一种在线转码多输出共用滤镜的方法及系统

    公开(公告)号:CN116016969A

    公开(公告)日:2023-04-25

    申请号:CN202211620354.7

    申请日:2022-12-15

    Abstract: 本发明涉及音视频在线转码技术领域,提供了一种在线转码多输出共用滤镜的方法,包括:S1:对原始音视频流进行解封装得到视频帧和音频帧;S2:定义与待输出的音视频路数相同个数的滤镜,采用滤镜中的第一个滤镜将视频帧缩放成与第一路待输出的视频帧相同的分辨率,并对视频帧进行适应性的处理;S3:除第一个滤镜之外的滤镜复制第一路处理完成的视频帧,将视频帧缩放到与当前滤镜对应的一路视频输出相同的分辨率;S4:创建与待输出的音视频路数相同个数的输出通道,通过输出通道分别将对应的处理完成的视频帧和音频帧输出到不同的设备。针对现有的在线转码系统性能消耗缺陷,使用线程同步的方式大大降低CPU使用率,从而降低转码成本。

    一种基于WebRTC实现的视频超低延时边缘设备解决方法及系统

    公开(公告)号:CN119788650A

    公开(公告)日:2025-04-08

    申请号:CN202411910148.9

    申请日:2024-12-24

    Abstract: 本发明涉及视频采集编码和传输技术领域,提供了一种基于WebRTC实现的视频超低延时边缘设备解决方法,包括以下步骤:S1:设置用于转发发送端和接收端之间的信令信息的信令服务,所述信令信息包括在所述发送端和所述接收端之间进行交互的会话控制信息、编解码信息和其他控制信息;S2:所述发送端采集视频信息,并对所述视频信息进行硬件编码,并在编码完成后将所述视频信息传输到所述接收端;S3:所述接收端对接收到的所述视频信息采用硬件加速解码,以及采用硬件加速渲染显示。上述技术方案,涉及实现在边缘设备中实现超低延时的方案。具体的说,是在一种低配置的边缘设备上,基于WebRTC架构,实现一种低于100毫秒的超低延时的解决方案。

    一种动态获取Nginx流媒体状态信息的方法

    公开(公告)号:CN118827833A

    公开(公告)日:2024-10-22

    申请号:CN202411024237.3

    申请日:2024-07-29

    Abstract: 本发明涉及计算机网络技术领域,公开了一种动态获取Ngi nx流媒体状态信息的方法,包括:S1:自定义实现HTTP‑TS协议的监控模块,所述监控模块实时解析协议通信数据,提取关键指标动态记录到状态页;S2:配置所述状态页,在Ngi nx配置文件中设置一个URI,映射到所述监控模块记录的状态信息;S3:使用实时数据分析算法,即时处理拦截的协议数据转化为所述状态信息。用户可以实时获取Ngi nx流媒体服务器的状态信息,包括连接数、带宽使用等,自定义模块使得用户可以根据具体需求灵活配置需要监控的指标,使系统更加适应不同的应用场景,状态信息会动态地定期更新,确保用户获取的信息是最新的,提高信息的实时性。

    一种实时切流直播转码方法、系统、设备及存储介质

    公开(公告)号:CN116886995A

    公开(公告)日:2023-10-13

    申请号:CN202311010005.8

    申请日:2023-08-11

    Abstract: 本发明公开了一种实时切流直播转码方法、系统、设备及存储介质,包括如下步骤:实时对输入的视频源进行帧率检测,获取帧率信息。基于帧率信息选择固定帧率模式或是可变帧率模式,固定帧率模下,输出帧率设置为与输入视频源帧率相同的固定值;可变帧率模式下,根据输入视频源帧率的变化动态调整输出帧率,进而输出的视频源进行转码并输出。本发明通过固定帧率和可变帧率模式实现帧率随信源的处理,确保输出帧率与信源的帧率相匹配,保持视频流的连续流畅。还对输入切流、断流及恢复操作进行处理,动态调整输出帧率,避免卡顿和不流畅现象,提升观看体验。还针对H264、HEVC视频编码,提供了具体的实时处理方式,保证编码后的视频质量和流畅度。

    一种用于直播流实时生成字幕的方法及系统

    公开(公告)号:CN112188241A

    公开(公告)日:2021-01-05

    申请号:CN202011072549.3

    申请日:2020-10-09

    Abstract: 本发明涉及音视频直播技术领域,提供了一种用于直播流实时生成字幕的方法及系统,其方法包括:对直播信源解码得到视频帧和音频帧;建立AI语音翻译引擎与转码引擎之间的通信;AI语音翻译引擎向转码引擎获取音频帧,并对音频帧实时翻译,输出翻译内容;转码引擎实时向AI语音翻译引擎获取翻译内容,通过将翻译内容使用通过包括将翻译内容烧入视频帧中、将翻译内容填充打包成字幕帧在内的任意一种方式与原始的视频帧与音频帧共同封装输出直播流。在直播时对音频流进行实时翻译生成字幕,实现真正的字幕与音视频同步,并同时输出多国语言的字幕,同时满足不同直播流推送协议的带字幕直播流,并且满足播放器自由选择不同语言的字幕显示。

Patent Agency Ranking