-
公开(公告)号:CN117371420A
公开(公告)日:2024-01-09
申请号:CN202311231819.4
申请日:2023-09-22
Applicant: 北京华宇信息技术有限公司
IPC: G06F40/194 , G06F40/232 , G06F40/186 , G06F18/22
Abstract: 本申请公开一种文字校核的方法及装置,针对字序颠倒的字符串的校核精度低的问题,提供以下技术方案,根据取样字符串和模板字符串,确定两个字符串共有的第一字符、第一字符在取样字符串中的第一字序和第一字符在模板字符串中的第二字序;根据第一字序和第二字序,确定第一字符从第一字序移动到第二字序的第一移动距离值;根据第一移动距离值、取样字符串和模板字符串,利用改进型莱文斯坦距离算法,确定取样字符串和模板字符串之间的相似度值;当相似度值在第一预设范围内时,标记取样字符串。通过将字符的移动距离考虑进相似度计算中,以一次移动操作替代删除添加的两次操作,降低操作步数,增加相似度,提高校核精度。
-
公开(公告)号:CN114359943B
公开(公告)日:2024-12-20
申请号:CN202210038042.9
申请日:2022-01-13
Applicant: 北京华宇信息技术有限公司
IPC: G06V30/41 , G06V30/148 , G06V10/762
Abstract: 本申请公开了一种OFD版式文档段落识别方法及装置,用以解决版式文档提取文字段落错误率高的技术问题。其中,一种OFD版式文档段落识别方案,通过对所述版式图像进行图像分割,至少生成若干文字块;提取所述若干文字块的特征属性;将相似版式进行聚类,生成元素为文字块的若干聚类文字块集合;对所述若干聚类文字块集合进行段落识别,生成段落块信息;根据所述段落块信息,更新版式文档中的段落标识。以便操作者在对文本段落进行提取时,可以得到还原流式格式的字符串。并且通过对文字块的语义连续性进行计算,提高了识别文本段落的准确性。同时,还针对OFD版式文档表格提出了一种新的文本提取方案,提高了文本提取的泛用性。
-
公开(公告)号:CN116467403A
公开(公告)日:2023-07-21
申请号:CN202310656992.2
申请日:2023-06-05
Applicant: 北京华宇信息技术有限公司
IPC: G06F16/31 , G06F16/215 , G06F16/22 , G06F16/25 , G06F16/27 , G06F40/216 , G06F40/284 , G06F40/295 , G06F18/22 , G06F16/35 , G06F9/54 , G06N3/0442 , G06N3/045 , G06N3/0455 , G06Q30/018 , G06Q50/26
Abstract: 本申请公开了一种企业身份信息数据融合方法及装置,用以解决数据治理能力差的技术问题。其中,一种数据融合方案,包括:采集企业对象的身份信息数据,并构成原始数据集合;对若干身份信息数据进行预处理,更新为整合数据集合;根据预设识别策略,确定整合数据集合中的唯一标识属性,作为融合键;建立整合数据集合中任意元素与融合键的关联关系,更新为融合数据集合;分别输入至命名实体识别模型、事件抽取模型、文本相似度计算模型、关键词提取模型,得到第一、第二、第三、第四信息分析数据,并以预设存储格式策略存储,作为企业对象在当前周期内的身份信息数据。这样将来自不同数据库的数据规范化,统一治理,提高了企业合规改进效率。
-
公开(公告)号:CN116844551A
公开(公告)日:2023-10-03
申请号:CN202310071797.3
申请日:2023-01-13
Applicant: 北京华宇信息技术有限公司
Abstract: 本申请公开了一种带情绪描述的笔录文档处理方法即装置,用以解决现有技术判断效率低的技术问题。该方法包括:获取用于表征参与制作笔录的人物声纹特征;采集制作笔录现场的音频文件;对音频文件进行转换文字的语音转写、人物情绪识别、人物声纹特征识别,以建立人物声纹特征与文字的对应关系、建立人物声纹特征与人物情绪的对应关系;根据人物声纹特征和音频特征,制作带人物情绪描述的文字型笔录。对音频文件进行语音转写、人物情绪识别、人物声纹特征识别,将转写、识别结果建立对应关系,并生成文字型笔录。这样,在后续翻看笔录的时不必重复的查看当时的语音视频记录,就可以还原当事人的情绪状态,进行研判,提高了审判员的判断效率。
-
公开(公告)号:CN116112704A
公开(公告)日:2023-05-12
申请号:CN202211657166.1
申请日:2022-12-22
Applicant: 北京华宇信息技术有限公司
IPC: H04N21/234 , H04N21/233 , H04N21/242 , H04N21/6437 , H04N21/8547 , H04N17/02 , H04N17/06 , G10L25/60 , G06T7/00
Abstract: 本发明公开了一种庭审录制异常检测方法及装置,用以解决现有技术针对庭审现场录制异常无法及时发现的问题。该方法包括:获取庭审现场设备录制的多终端的流媒体数据;解析所述流媒体数据,生成待分析的多终端流媒体片段;判断所述多终端流媒体片段中是否发生同步录制异常事件;当发生同步录制异常事件时,向异常终端发送同步录制异常警告。本发明在庭审音视频录制过程中,对庭审现场设备录制的音视频流媒体片段进行实时检测,在检测到音视频流媒体片段出现录制异常特征时,及时向庭审告警设备发送告警消息,以便庭审现场人员可以及时查看到该录制异常告警消息,对庭审现场设备录制异常进行故障排除,避免庭审音视频内容缺失。
-
公开(公告)号:CN111181938A
公开(公告)日:2020-05-19
申请号:CN201911325976.5
申请日:2019-12-20
Applicant: 北京交通大学 , 北京华宇信息技术有限公司
IPC: H04L29/06
Abstract: 本发明提供了一种基于分片传输的边缘计算分布式数据加密传输方法,包括数据分片传输以及分布式加密算法的实现两个部分;通过互素的正整数组可以与数据包分开发送,即使攻击者必须同时截获两种数据包,且由于正整数组使用RSA算法进行加密,所以在私钥安全性得以保证的情况下,攻击者依旧无法破解该数据;本发明提供的方法本发明使用了分片式的传输方案,因此,即使部分数据被截获并被破解,但是依旧无法获得有效的信息,进一步提高了安全性。
-
公开(公告)号:CN116996730A
公开(公告)日:2023-11-03
申请号:CN202310827817.5
申请日:2023-07-06
Applicant: 北京华宇信息技术有限公司
IPC: H04N21/431 , H04N21/2187 , G10L21/013 , H04N21/4402 , H04N21/44 , H04N21/439
Abstract: 本申请提供一种庭审直播中隐私保护方法及装置,用于隐私保护效率低的技术问题。其中,一种隐私保护方案包括:采集人物声纹特征、轮廓特征,并建立关联关系;存储人物声纹特征至声纹库、轮廓特征至图像库,预训练得到声纹识别模型、图像识别模型;获取并解码庭审记录视频流,生成音频数据,并输入至声纹识别模型进行识别,得到庭审音频数据后变调,得到变调音频数据;解码庭审记录视频,生成画面数据,并输入至图像识别模型进行识别,得到庭审画面数据后模糊,得到模糊画面数据;封装变调音频数据、模糊画面数据,生成隐私保护后的庭审直播视频流。通过对隐私信息对应的音频进行变调处理、画面进行模糊处理,提高保护效率,降低隐私泄漏的风险。
-
公开(公告)号:CN116186438B
公开(公告)日:2023-09-05
申请号:CN202310071850.X
申请日:2023-01-13
Applicant: 北京华宇信息技术有限公司
IPC: G06F16/957 , H04L67/06 , H04L67/568 , G06F40/205 , G06F21/62
Abstract: 本申请公开了一种版式文档浏览方法及系统,用以解决连续浏览多个版式文档对存储资源造成浪费的技术问题。其中,一种版式文档浏览方案,通过在线加载多个版式文档以减轻存储资源造成的浪费。通过根据浏览对象的浏览权限,提供匹配的多个版式文档,以便不同浏览权限的浏览对象进行浏览,提高了访问的安全性。通过对版式文档进行分组加载,提高了加载效率。
-
公开(公告)号:CN116301962A
公开(公告)日:2023-06-23
申请号:CN202310017727.X
申请日:2023-01-06
Applicant: 北京华宇信息技术有限公司
Abstract: 本公开提供了一种服务模型更新方法、装置、设备以及存储介质,包括:获取用户上传的新版本更新数据;将服务运行空间中的原始服务模型数据移植到预设的备份空间;启动服务更新空间,在服务更新空间中基于新版本更新数据对原始服务模型进行更新;响应于原始服务模型成功更新为新版本服务模型,将新版本服务模型向服务运行空间进行移植;或者响应于原始服务模型更新失败,将原始服务模型数据移植回服务运行空间。上述方法可以完整地保留原有数据,也可以及时为即将得到的新版本服务模型预留出运行资源,还可以确保服务模型进行更新过程受无关数据的影响,提高更新成功率。一旦出现更新失败的情况,可以直接使用原始服务模型继续提供服务。
-
公开(公告)号:CN116186438A
公开(公告)日:2023-05-30
申请号:CN202310071850.X
申请日:2023-01-13
Applicant: 北京华宇信息技术有限公司
IPC: G06F16/957 , H04L67/06 , H04L67/568 , G06F40/205 , G06F21/62
Abstract: 本申请公开了一种版式文档浏览方法及系统,用以解决连续浏览多个版式文档对存储资源造成浪费的技术问题。其中,一种版式文档浏览方案,通过在线加载多个版式文档以减轻存储资源造成的浪费。通过根据浏览对象的浏览权限,提供匹配的多个版式文档,以便不同浏览权限的浏览对象进行浏览,提高了访问的安全性。通过对版式文档进行分组加载,提高了加载效率。
-
-
-
-
-
-
-
-
-