Patent search ap:("上海网达软件股份有限公司") AND inv:"郭文龙" Page 1

1.

发明公开
语音对讲业务实现方法、设备和存储介质有权

公开(公告)号：CN114374729A

公开(公告)日：2022-04-19

申请号：CN202111679325.3

申请日：2021-12-31

Applicant: 上海网达软件股份有限公司

Inventor： 唐杰 , 郭文龙 , 李庆瑜 , 戴立言

IPC: H04L67/14 , H04L67/141 , H04L67/02 , H04Q5/24

Abstract: 本发明提供了一种语音对讲业务实现方法、设备和存储介质。语音对讲发送端通过调用HTTP接口开启语音对讲会话，并分配相应的端口用于建立会话链路，在语音对讲会话开启的情况下，且在预设时间范围内保持同一会话链情况下，将语音对讲会话调度至满足预设条件的任何一个语音对讲服务器，并调用HTTP接口开启语音对讲传输任务，建立语音对讲能力服务器与语音对讲接收端的交互，根据交互将语音内容对应的语音数据流传输至语音对讲接收端。通过本申请的技术方案，语音对讲支持跨平台部署、私网部署、公网部署、公私网混合部署，支持SSL加密数据传输。此种方式部署简单、使用流程简单，可跨平台使用。

2.

发明公开
一种在智能视频检索中解决大数据存储快速查询的方法审中-实审

公开(公告)号：CN119089002A

公开(公告)日：2024-12-06

申请号：CN202411012574.0

申请日：2024-07-26

Applicant: 上海网达软件股份有限公司

Inventor： 张宋伟 , 唐杰 , 郭文龙 , 单存宇 , 戴立言

IPC: G06F16/73 , G06F16/2455 , G06T7/62

Abstract: 本发明涉及智能视频检索技术领域，公开了一种在智能视频检索中解决大数据存储快速查询的方法，包括：设置分级查询缓存和计算，第一级查询从Elasticsearch中采用分页的方式并发查询数据；将所述查询数据的结果作为第二级查询按照设定时间范围缓存到Redis中，再作为第三级查询缓存到服务器内存中，查询时优先从第三级取查询数据；获取到所述查询数据后，对所述返回给Web的数据按照若干时间并发计算去重后再聚合，形成如按检测事件的起始时间为点位的时间轴数据格式；按照缓存到Redis中时设定的时间范围检测摄像头画面某个区域发生事件的计算优化，按照图像中心点坐标(x,y,w,h)进行检测区域面积交并比IoU计算。智能视频检索调用接口响应速度由原来的1分钟以上降低到1s～5s。

3.

发明公开
一种AI应用中多视频流多模型聚合处理的实现方法审中-实审

公开(公告)号：CN117857838A

公开(公告)日：2024-04-09

申请号：CN202311815624.4

申请日：2023-12-26

Applicant: 上海网达软件股份有限公司

Inventor： 郭文龙 , 唐杰 , 张宋伟 , 戴立言

IPC: H04N21/234 , H04N21/2343 , H04N21/44 , H04N21/4402

Abstract: 本发明涉及视频流处理技术领域，尤其涉及一种AI应用中多视频流多模型聚合处理的实现方法，包括以下步骤：S1：AI聚合检测服务根据摄像设备建立AI检测任务，所述AI聚合检测服务的抽帧能力服务抽取所述AI检测任务的图像流并记录抽取信息；S2：所述AI聚合检测服务并行接收所述抽取信息，所述AI聚合检测服务对所述抽取信息判断处理后加入内存队列；S3：所述AI聚合检测服务的AI检测能力服务通过HTTP接口接收所述AI检测任务，所述AI检测能力服务对所述抽取信息进行处理获得检测结果，并将所述检测结果同步。采用上述方法，降低HTTP请求并发数量消耗和抽帧抽取的网络传输时间，发送的图片流在内存中压缩传输，降低带宽消耗和提升传输效率。

4.

发明公开
在数字人领域驱动中文语音精准生成唇形视频的方法审中-实审

公开(公告)号：CN117750064A

公开(公告)日：2024-03-22

申请号：CN202311746822.X

申请日：2023-12-18

Applicant: 上海网达软件股份有限公司

Inventor： 郭文龙 , 唐杰 , 张宋伟 , 戴立言

IPC: H04N21/234 , H04N21/242 , H04N21/44 , H04N21/43 , G10L21/10 , G10L21/055

Abstract: 本发明提供了一种在数字人领域驱动中文语音精准生成唇形视频的方法，包括：下载CMLR中文数据集并进行预处理，得到预处理后的CMLR中文数据集；将预处理后的CMLR中文数据集作为训练数据，按照设置的训练标准对wav2lip唇形同步模型进行训练，得到新的模型；将预处理后的视频帧输入到新的模型进行唇部推理，输出新的口型驱动视频。本发明针对现有的模型中对中文语音支持度差的缺陷，通过采用中文语音的数据集进行了重训练，使得中文发音口型得到校准；避免了现有模型在匹配到中文语音时口型开合过快的问题。此外，新的模型在训练时采用人脸关键点检测技术，从而能够更好的适配了下半脸，使上下脸看起来更加协调。

5.

发明授权
语音对讲业务实现方法、设备和存储介质有权

公开(公告)号：CN114374729B

公开(公告)日：2023-04-18

申请号：CN202111679325.3

申请日：2021-12-31

Applicant: 上海网达软件股份有限公司

Inventor： 唐杰 , 郭文龙 , 李庆瑜 , 戴立言

IPC: H04L67/14 , H04L67/141 , H04L67/02 , H04Q5/24

Abstract: 本发明提供了一种语音对讲业务实现方法、设备和存储介质。语音对讲发送端通过调用HTTP接口开启语音对讲会话，并分配相应的端口用于建立会话链路，在语音对讲会话开启的情况下，且在预设时间范围内保持同一会话链情况下，将语音对讲会话调度至满足预设条件的任何一个语音对讲服务器，并调用HTTP接口开启语音对讲传输任务，建立语音对讲能力服务器与语音对讲接收端的交互，根据交互将语音内容对应的语音数据流传输至语音对讲接收端。通过本申请的技术方案，语音对讲支持跨平台部署、私网部署、公网部署、公私网混合部署，支持SSL加密数据传输。此种方式部署简单、使用流程简单，可跨平台使用。

Patent Agency Ranking