OFD版式文档段落识别方法及装置

    公开(公告)号:CN114359943B

    公开(公告)日:2024-12-20

    申请号:CN202210038042.9

    申请日:2022-01-13

    Abstract: 本申请公开了一种OFD版式文档段落识别方法及装置,用以解决版式文档提取文字段落错误率高的技术问题。其中,一种OFD版式文档段落识别方案,通过对所述版式图像进行图像分割,至少生成若干文字块;提取所述若干文字块的特征属性;将相似版式进行聚类,生成元素为文字块的若干聚类文字块集合;对所述若干聚类文字块集合进行段落识别,生成段落块信息;根据所述段落块信息,更新版式文档中的段落标识。以便操作者在对文本段落进行提取时,可以得到还原流式格式的字符串。并且通过对文字块的语义连续性进行计算,提高了识别文本段落的准确性。同时,还针对OFD版式文档表格提出了一种新的文本提取方案,提高了文本提取的泛用性。

    语音识别方法及其装置
    32.
    发明授权

    公开(公告)号:CN112489646B

    公开(公告)日:2024-04-02

    申请号:CN202011295150.1

    申请日:2020-11-18

    Abstract: 本申请公开了一种语音识别方法及其装置。其中,所述方法包括:获取输入的语音数据;通过解码模型解码所述语音数据,生成语音识别中间结果;基于核心词数据库中核心词拼音与声调序列,对所述语音识别中间结果进行匹配;根据所述拼音于声调序列与所述语音识别中的中间结果的匹配状态,输出匹配结果。通过语音识别中间结果与核心词数据库中核心词拼音与声调序列的匹配,可以解决语音识别结果偏离正常语境的问题。

    视频文件处理方法、视频管理平台及存储介质

    公开(公告)号:CN117714741A

    公开(公告)日:2024-03-15

    申请号:CN202311533514.9

    申请日:2023-11-16

    Abstract: 本申请实施例提供一种视频文件处理方法、视频管理平台及存储介质,在本申请实施例中,在视频文件上传阶段,用户向视频管理平台上传原始视频文件之后,视频管理平台将原始视频文件转码成多个不同编码参数的转码视频文件,并保存原始视频文件和多个不同编码参数的转码视频文件,以及建立原始视频文件的文件标识及其编码参数,以及,多个转码视频文件中每个转码视频文件的文件标识及其编码参数之间的对应关系,并将所述对应关系保存在映射关系表中。在自适应网络播放视频文件时,查询映射关系表确定与当前网络状况适配的视频文件并向播放端下发,由此,极大地保证播放器播放视频文件的流畅度,提高用户体验。

    基于文本输入习惯的词库更新方法及系统

    公开(公告)号:CN117252193A

    公开(公告)日:2023-12-19

    申请号:CN202311301055.1

    申请日:2023-10-09

    Abstract: 本申请公开了一种基于文本输入习惯的词库更新方法及系统,用以解决由文本输入习惯导致文本输入准确度较低的技术问题。其中,一种基于文本输入习惯的词库更新方案,通过将输入习惯错误词典传输至输入法词库,以纠正拼音和提升候选词排名的方式减少误输入,从而在输入源头上就提高输入的准确度。通过将输入习惯错误词典传输至文字校对词库,可以实现文字校对词库的自学习,提高校对系统的准确性和专业性。

    视频点播方法、装置、设备以及存储介质

    公开(公告)号:CN116095417A

    公开(公告)日:2023-05-09

    申请号:CN202310017725.0

    申请日:2023-01-06

    Abstract: 本公开提供了一种视频点播方法、装置、设备以及存储介质,包括:服务器在接收到视频点播请求时,能够及时地确定出包含相应的视频片段的目标视频集合,并通过对视频点播请求所对应的原始视频的时长和目标视频集合时长进行对比,准确地判断出目标视频集合所包含的视频片段是否完整;并且,在确定目标视频集合所包含的视频片段不完整时,能够快速地从原始视频中截取出目标视频集合中缺少的视频片段并添加到目标视频集合,使得目标视频集合能够包含原始视频的完整的视频片段,以便终端能够通过依次播放目标视频集合中的视频片段来展示完整的视频内容。

    线上实时回放录制视频的方法及装置

    公开(公告)号:CN112929686B

    公开(公告)日:2022-12-20

    申请号:CN202110158025.4

    申请日:2021-02-04

    Abstract: 本申请公开了一种线上实时回放录制视频的方法及装置。其中所述方法,包括:实时接收上传的录制视频,获取音视频帧数据;封装所述音视频帧数据,得到片段数据;实时读取所述片段数据,得到所述音视频帧的位置数据;根据所述音视频帧的位置数据,取出相应的音视频帧进行解码播放;其中,所述片段数据为至少包括一个完整帧的数据。通过对接收的录制视频进行片段封装并实时读取播放相应的片段数据,实现线上实时回放录制视频。

    输入法候选词推荐方法及装置
    38.
    发明公开

    公开(公告)号:CN113360004A

    公开(公告)日:2021-09-07

    申请号:CN202110743668.5

    申请日:2021-07-01

    Abstract: 本申请公开了一种输入法候选词推荐方法及装置,用以解决输入法推荐候选词准确性低的技术问题。其中,一种输入法候选词推荐方法,根据当前输入位置前的词组、当前字符,计算对应当前字符的若干候选词的出现概率,并以预设推荐策略排列对应当前字符的若干候选词,实现对输入法中候选词的动态调整。从而使得推荐候选词与上下文的关联程度更高,提高了输入的准确性。

    输入法多元词发现方法及装置

    公开(公告)号:CN113204963A

    公开(公告)日:2021-08-03

    申请号:CN202110493402.X

    申请日:2021-05-07

    Abstract: 本申请提供一种输入法多元词发现方法及装置,用于解决输入法发现多元词效率低的技术问题。其中,一种输入法多元词发现方法,包括以下步骤:获取语料数据;通过分词模型,对所述语料数据进行分词,生成若干分词单元;以WFP数据结构存储分词单元;通过读取WFP数据结构,比较分词单元与分词单元的关联性,确定分词单元组合;添加所述分词单元组合至词库。相对于现有技术,所述输入法多元词发现方法能实现多元词关系的发现,并且提高了发现多元词的准确率、效率。

    基于JSSE的国密加密通信方法及其装置、存储介质

    公开(公告)号:CN113037480A

    公开(公告)日:2021-06-25

    申请号:CN202110318921.2

    申请日:2021-03-25

    Abstract: 本申请公开了一种基于JSSE的国密加密通信方法及其装置、存储介质。其中所述方法,包括:接收客户端的握手请求;通过JSSE目标服务端解析所述握手请求,生成握手信息;匹配JSSE目标服务端中预设的国密信息和所述握手信息,得到匹配结果;当匹配结果符合国密通信条件时,通过重构的JSSE握手过程逻辑继续进行握手操作,和客户端建立握手关系;所述客户端和所述目标服务端握手,以便后续进行加密通信;其中,所述预设的国密信息包括预先在JSSE的协议版本中扩展的国密版本号和预先在JSSE密码套件中扩展的符合国密规范的密码套件。通过对客户端的握手请求进行相应的处理并返还相应的响应数据,实现了基于JSSE的国密加密通信。

Patent Agency Ranking