OFD版式文档段落识别方法及装置

    公开(公告)号:CN114359943B

    公开(公告)日:2024-12-20

    申请号:CN202210038042.9

    申请日:2022-01-13

    Abstract: 本申请公开了一种OFD版式文档段落识别方法及装置,用以解决版式文档提取文字段落错误率高的技术问题。其中,一种OFD版式文档段落识别方案,通过对所述版式图像进行图像分割,至少生成若干文字块;提取所述若干文字块的特征属性;将相似版式进行聚类,生成元素为文字块的若干聚类文字块集合;对所述若干聚类文字块集合进行段落识别,生成段落块信息;根据所述段落块信息,更新版式文档中的段落标识。以便操作者在对文本段落进行提取时,可以得到还原流式格式的字符串。并且通过对文字块的语义连续性进行计算,提高了识别文本段落的准确性。同时,还针对OFD版式文档表格提出了一种新的文本提取方案,提高了文本提取的泛用性。

    语音识别方法及其装置
    2.
    发明授权

    公开(公告)号:CN112489646B

    公开(公告)日:2024-04-02

    申请号:CN202011295150.1

    申请日:2020-11-18

    Abstract: 本申请公开了一种语音识别方法及其装置。其中,所述方法包括:获取输入的语音数据;通过解码模型解码所述语音数据,生成语音识别中间结果;基于核心词数据库中核心词拼音与声调序列,对所述语音识别中间结果进行匹配;根据所述拼音于声调序列与所述语音识别中的中间结果的匹配状态,输出匹配结果。通过语音识别中间结果与核心词数据库中核心词拼音与声调序列的匹配,可以解决语音识别结果偏离正常语境的问题。

    线上实时回放录制视频的方法及装置

    公开(公告)号:CN112929686B

    公开(公告)日:2022-12-20

    申请号:CN202110158025.4

    申请日:2021-02-04

    Abstract: 本申请公开了一种线上实时回放录制视频的方法及装置。其中所述方法,包括:实时接收上传的录制视频,获取音视频帧数据;封装所述音视频帧数据,得到片段数据;实时读取所述片段数据,得到所述音视频帧的位置数据;根据所述音视频帧的位置数据,取出相应的音视频帧进行解码播放;其中,所述片段数据为至少包括一个完整帧的数据。通过对接收的录制视频进行片段封装并实时读取播放相应的片段数据,实现线上实时回放录制视频。

    信息数据融合方法及装置
    4.
    发明公开

    公开(公告)号:CN114860822A

    公开(公告)日:2022-08-05

    申请号:CN202210303168.4

    申请日:2022-03-24

    Abstract: 本申请公开了一种信息数据融合方法及装置,用以解决信息数据融合结果质量较低的技术问题。其中,一种信息数据融合方案,通过键值存储技术构建融合数据库,将不同数据库的信息数据进行融合,满足处理较大数据时对于读写性能的要求。并通过智能化获取属性值来源置信度、属性值置信度,提高了融合效率。通过多因素地评价属性值的综合置信度,并选择综合置信度评价TOP‑K的属性值作为融合数据库中对应属性类型的属性值,提高了融合数据库中属性值的正确率,优化了数据融合结果。

    输入法词频调整方法及装置
    5.
    发明公开

    公开(公告)号:CN113177403A

    公开(公告)日:2021-07-27

    申请号:CN202110357086.3

    申请日:2021-04-01

    Abstract: 本申请公开了一种输入法词频调整方法及装置,用以解决输入法词组词频调整效果差的技术问题。一种输入法词频调整方法,包括以下步骤:获取语料数据;通过分词模型,对所述语料数据进行分词,生成若干分词单元;通过识音模型,对所述分词单元进行注音,生成分词单元音节;将音节相同的分词单元保存至同一音节词库;统计同一音节词库中第一分词单元的出现概率;将所述第一分词单元的出现概率与预设阈值进行比较,得到比较结果;根据比较结果,调整第一分词单元的词频;根据调整后所述第一分词单元的词频,以预设顺序排列第一分词单元所在音节词库的分词单元顺序,更新音节词库。通过对同一音节词库中词组的词频进行动态调整,提高了输入的准确性。

    文本编辑器语音识别方法及装置
    6.
    发明公开

    公开(公告)号:CN112560404A

    公开(公告)日:2021-03-26

    申请号:CN202011461049.9

    申请日:2020-12-11

    Abstract: 本申请公开了一种文本编辑器语音识别方法及装置,提供了一种无需手动切换语音识别的输入法便可直接完成文本输入的实现方式。其中,文本编辑器语音识别方法,包括以下步骤:调用文本编辑器提供的接口,获取音频信息;根据所述音频信息,在数据库中确定匹配的文本;输入所述匹配的文本到对应的待编辑文本域;所述待编辑文本域用于提供文本输入。文本编辑器语音识别装置包括:获取模块,用于获取音频信息;匹配模块,用于根据所述音频信息,在数据库中确定匹配的文本;输入模块,用于输入所述匹配的文本到对应的待编辑文本域;所述待编辑文本域用于提供文本输入。

    电子文档归档方法及其装置

    公开(公告)号:CN112733658B

    公开(公告)日:2022-11-25

    申请号:CN202011619714.2

    申请日:2020-12-31

    Abstract: 本申请公开了一种电子文档归档方法及其装置。其中方法包括:接收待归档的电子文档;采用图像分割算法分析待归档的电子文档,获取版面结构信息;根据版面结构信息,对待归档电子文档进行归档。通过本申请的电子文档归档方法,采用图像分割算法对待归档电子文档的版面进行分析,根据版面结构,对具有关键信息的区域再进行OCR识别,从而实现对电子文档的分类与归目。本申请的电子文档归档方法避免了大量OCR识别导致的资源占用和数据冗余,进一步提高电子文档归档的精度和效率。

    电子文档归档方法及其装置

    公开(公告)号:CN112733658A

    公开(公告)日:2021-04-30

    申请号:CN202011619714.2

    申请日:2020-12-31

    Abstract: 本申请公开了一种电子文档归档方法及其装置。其中方法包括:接收待归档的电子文档;采用图像分割算法分析待归档的电子文档,获取版面结构信息;根据版面结构信息,对待归档电子文档进行归档。通过本申请的电子文档归档方法,采用图像分割算法对待归档电子文档的版面进行分析,根据版面结构,对具有关键信息的区域再进行OCR识别,从而实现对电子文档的分类与归目。本申请的电子文档归档方法避免了大量OCR识别导致的资源占用和数据冗余,进一步提高电子文档归档的精度和效率。

    语音识别方法及其装置
    9.
    发明公开

    公开(公告)号:CN112489646A

    公开(公告)日:2021-03-12

    申请号:CN202011295150.1

    申请日:2020-11-18

    Abstract: 本申请公开了一种语音识别方法及其装置。其中,所述方法包括:获取输入的语音数据;通过解码模型解码所述语音数据,生成语音识别中间结果;基于核心词数据库中核心词拼音与声调序列,对所述语音识别中间结果进行匹配;根据所述拼音于声调序列与所述语音识别中的中间结果的匹配状态,输出匹配结果。通过语音识别中间结果与核心词数据库中核心词拼音与声调序列的匹配,可以解决语音识别结果偏离正常语境的问题。

    OFD版式文档段落识别方法及装置

    公开(公告)号:CN114359943A

    公开(公告)日:2022-04-15

    申请号:CN202210038042.9

    申请日:2022-01-13

    Abstract: 本申请公开了一种OFD版式文档段落识别方法及装置,用以解决版式文档提取文字段落错误率高的技术问题。其中,一种OFD版式文档段落识别方案,通过对所述版式图像进行图像分割,至少生成若干文字块;提取所述若干文字块的特征属性;将相似版式进行聚类,生成元素为文字块的若干聚类文字块集合;对所述若干聚类文字块集合进行段落识别,生成段落块信息;根据所述段落块信息,更新版式文档中的段落标识。以便操作者在对文本段落进行提取时,可以得到还原流式格式的字符串。并且通过对文字块的语义连续性进行计算,提高了识别文本段落的准确性。同时,还针对OFD版式文档表格提出了一种新的文本提取方案,提高了文本提取的泛用性。

Patent Agency Ranking