Patent search ap:("中国科学院计算技术研究所") AND inv:"王向东" Page 10

91.

发明授权
汉语语音识别中重复出现词识别错误的自动修正方法有权

公开(公告)号：CN102324233B

公开(公告)日：2014-05-07

申请号：CN201110220842.4

申请日：2011-08-03

Applicant: 中国科学院计算技术研究所

Inventor： 李新辉 , 王向东 , 钱跃良 , 林守勋

IPC: G10L15/26 , G06F17/30

Abstract: 本发明提供一种汉语语音识别中重复出现词识别错误的自动修正方法，包括：(1)对每句话经识别后得到的字混淆网络与词组库中的词组及中间识别结果进行相似性匹配，以查找重复出现词组；其中，字混淆网络是所有可能识别结果的集合，字混淆网络包括最优识别结果即原有最优识别结果和最优识别结果中的每个字对应的中间识别结果；词组库包括词组及其对应的中间识别结果；(2)根据查找得到的词组信息，重新计算相似概率值和字识别概率值；(3)根据新的概率值，对字混淆网络按照概率值大小排序；和(4)使用排序结果替换字混淆网络的最优识别结果以及中间识别结果。优点在于：利用之前已修正的识别结果中的经验知识，自动修正当前识别语句中重复出现词的识别错误，从而提高识别错误的修正效率，加快识别错误修正速度。

92.

发明授权
一种电话连续语音识别系统性能的评测方法及其系统失效转让

公开(公告)号：CN100426376C

公开(公告)日：2008-10-15

申请号：CN200510011285.X

申请日：2005-01-28

Applicant: 中国科学院计算技术研究所

Inventor： 王向东 , 栾焕博 , 林守勋 , 钱跃良 , 刘宏 , 张勇东

IPC: G10L15/00

Abstract: 本发明公开一种电话连续语音识别系统性能的评测方法及系统，该系统包括录音模块、被测的电话连续语音识别系统、语法库、语法展开模块、语料筛选模块、槽解析模块以及自动评测模块。先对电话查询的若干领域，按其语法定义若干槽；在各个领域按其语法展开，从生成的句子中选择出作为评测语料的句子并录制测试语音；将测试语音输入要评测的电话连续语音识别系统，将每个句子的语音识别结果解析为所包含的槽后输出；将系统输出的识别结果与标准答案对照，计算槽识别正确率，得到系统性能的评判指标。本发明方法比目前常用的听写机式的评测方法更符合电话连续语音识别系统的特点，能够更准确地评价电话连续语音识别系统性能。

93.

发明公开
一种广告检测识别方法及系统失效

公开(公告)号：CN101221622A

公开(公告)日：2008-07-16

申请号：CN200810057162.3

申请日：2008-01-30

Applicant: 中国科学院计算技术研究所

Inventor： 赵丹 , 王向东 , 钱跃良 , 刘群 , 林守勋

IPC: G06K9/00 , G06K9/36 , G06K9/46

Abstract: 本发明提供一种广告检测识别方法，包括：对待检测的广播电视节目数据进行预处理，得到所述数据音频流的短时能量包络；根据音频的短时能量特征，将所得到的短时能量包络切分为能量包络单元，得到待检测的广播电视节目数据的能量包络单元图；利用跳单元的策略和基于能量包络单元的相似性度量方法，对所述待检测的广播电视节目数据的能量包络单元图与已知广告的能量包络单元图进行比较，根据比较结果实现对广告的检测识别。本发明以音频特征取代视频特征、音视频特征结合等进行广告检测，具有计算复杂度低，检测效率高的优点；通过将待测数据与已知广告的音频特征进行比较，可以实现对特定广告的识别；本发明还具有应用范围广的优点。

94.

发明公开
一种盲文计算机点字输入系统和装置以及方法有权

公开(公告)号：CN101135940A

公开(公告)日：2008-03-05

申请号：CN200710121525.0

申请日：2007-09-07

Applicant: 中国科学院计算技术研究所

Inventor： 钱跃良 , 王向东 , 谢书华 , 谢萦

IPC: G06F3/03

Abstract: 本发明公开了一种盲文计算机点字输入系统和装置以及方法。该系统包括电脑手写板，计算机，还包括盲文点字输入导板，点字笔，以及盲文点字处理模块；所述盲文点字输入导板与所述电脑手写板的书写区域的尺寸相一致，安装在手写板的书写表面；所述电脑手写板通过接口与所述计算机相连接；所述盲文点字处理模块，用于当使用者利用所述点字笔和所述盲文点字输入导板在所述电脑手写板上进行点字时，对来自手写板的点字输入信号进行处理，并转换成文字。其通用性强，成本低，使用方便。

95.

发明授权
一种方言语音数据切分及标注方法、系统有权

公开(公告)号：CN113781999B

公开(公告)日：2024-02-20

申请号：CN202111066861.6

申请日：2021-09-13

Applicant: 中国科学院计算技术研究所

Inventor： 谢萦 , 钱跃良 , 王向东

IPC: G10L15/00 , G10L15/04 , G10L15/14 , G10L15/26 , G10L15/16 , G10L15/02

Abstract: 本发明提出一种方言语音数据切分及标注方法和系统，使用普通话语音识别模型对第一方言语音进行语音数据切分及标注，得到第一方言语音的汉字识别结果，并基于第一方言语音及其对应汉字文本和汉字识别结果，构建方言词汇库；获取待切分和标注的语音数据作为第二方言语音，基于方言词汇库和第二方言语音对应的汉字文本，得到第二方言语音对应的音素序列，并采用音素对齐算法和普通话语音识别模型，得到第二方言语音的语音切分标注结果；基于经人工校对的语音切分标注结果及其对应的语音数据训练得到方言语音声学模型，将方言语音数据输入至方言语音声学模型，得到方言语音数据的切分和标注结果。

96.

发明授权
一种基于影像数据和深度学习的肿瘤良恶性识别方法和系统有权

公开(公告)号：CN113743463B

公开(公告)日：2023-09-26

申请号：CN202110879294.X

申请日：2021-08-02

Applicant: 中国科学院计算技术研究所

Inventor： 刘宏 , 焦梦磊 , 王向东 , 钱跃良

IPC: G06V10/764 , G06V10/774 , G06V10/80 , G06V10/25 , G06T7/00

Abstract: 本发明提出一种面向医学影像序列的基于深度学习的患者级肿瘤良恶性自动判别方法及系统。首先进行患者影像数据的采集和整理及标注，然后使用肿瘤区域检测模型、序列分类模型、年龄信息这三个信息模块获得不同级别下患者肿瘤良恶性的概率，最后通过多模型加权融合进行患者级肿瘤良恶性综合判别。该技术将有助于在患者早期，基于影像检测数据对肿瘤良恶性进行预判，从而制定相应的治疗方案及提升预后效果，同时也能辅助提高医生早期利用影像数据进行肿瘤良恶性诊断的准确率。

97.

发明公开
一种基于多模态融合的肿瘤分类方法及系统审中-实审

公开(公告)号：CN115019405A

公开(公告)日：2022-09-06

申请号：CN202210594803.9

申请日：2022-05-27

Applicant: 中国科学院计算技术研究所

Inventor： 刘宏 , 焦梦磊 , 王向东 , 钱跃良

IPC: G06V40/60 , G06V10/40 , G06V10/74 , G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/04 , G06N3/08

Abstract: 本发明提出一种基于多模态融合的肿瘤分类方法和系统，包括：根据来自同一位用户的多模态影像构建多模态图，多模态图中顶点为该多模态影像中单帧影像，多模态图中边为模态相异的顶点间的匹配边；使用肿瘤分类模型对多模态图中所有匹配边进行特征的提取和融合，得到每条边的置信度；根据每条边的置信度，选择并构建出一个可信边集合，将可信边集的置信度和该用户的临床信息进行加权融合，得到该多模态影像建图的肿瘤识别结果。由此能够结合用户不同模态的影像数据，进行肿瘤高精度分类。

98.

发明公开
一种汉字-通用盲文对照语料库的构建方法及系统审中-实审

公开(公告)号：CN114429128A

公开(公告)日：2022-05-03

申请号：CN202111566342.6

申请日：2021-12-20

Applicant: 中国科学院计算技术研究所

Inventor： 王向东 , 姚鑫 , 王子和 , 刘宏 , 钱跃良

IPC: G06F40/289 , G06F40/242 , G06F16/903 , G06F16/2455 , G06N3/04 , G06N3/08

Abstract: 本发明提出一种汉字‑通用盲文对照语料库的构建方法和系统，本发明一方面充分利用了现有汉字‑现行盲文对照语料库中的分词信息，另一方面采用一种半自动的方式得到现行盲文所对应的带声调的拼音，进而得到通用盲文。本发明先由计算机自动给没有标注声调的拼音添加声调，然后自动判断哪些拼音的声调可能存在错误，将这些可能存在错误的拼音及其对应的汉字显示在屏幕上，供人工校对修改。通过这种方式，把需要人工校对修改的拼音的比率控制在很小的范围内，可以实现快速的语料库构建。

99.

发明公开
一种汉字到通用盲文的转换方法及系统审中-实审

公开(公告)号：CN114429127A

公开(公告)日：2022-05-03

申请号：CN202111566326.7

申请日：2021-12-20

Applicant: 中国科学院计算技术研究所

Inventor： 王向东 , 王子和 , 姚鑫 , 刘宏 , 钱跃良

IPC: G06F40/289 , G06N3/04 , G06N3/08

Abstract: 本发明提出一种汉字到通用盲文的转换方法和系统，包括：构建深度学习模型，且该深度学习模型具有两个共享特征编码的子任务分支，其中一条子任务分支用于根据盲文规则将汉语文本分词，另一条子任务分支用于为每个汉字标注拼音及对应声调；使用已标记盲文分词的汉字语料和汉字拼音的对照语料，交替训练该深度学习模型的两个子任务分支，直到两子任务分支的损失函数均收敛或达到预设迭代次数，保存当前深度学习模型作为识别模型；将待通用盲文转换的汉字数据输入该识别模型，得到该汉字数据的分词信息和带调拼音信息，并基于该分词信息和该带调拼音信息，以将该汉字数据转换为对应的通用盲文文本。本发明可以实现汉字到盲文的实时准确转换。

100.

发明授权
一种盲文方自适应定位方法及系统有权

公开(公告)号：CN108062548B

公开(公告)日：2020-11-03

申请号：CN201711071082.9

申请日：2017-11-03

Applicant: 中国科学院计算技术研究所

Inventor： 刘宏 , 黎仁强 , 王向东 , 钱跃良

IPC: G06K9/32 , G09B21/00

Abstract: 本发明涉及一种盲文方自适应定位方法及系统，包括：获取盲文图像的盲文点位置信息；对盲文点位置信息进行纵坐标的聚类，以得到多条预选盲文方水平行线的位置；根据各预选盲文方水平行线的纵坐标，从上往下判断是否存在符合标准的水平行线，若存在，则从三条水平行线开始，根据统计得到的盲文方点距、行距等信息分别向上、向下拓展，且拓展的过程中生成以最新拓展的一组三条水平行线为基准，同时剔除位置错误的水平行线，直到达到盲文图像上下两端，得到包含多组以三条水平行线为一组的盲文方水平线；同理得到盲文方竖直线；以盲文方竖直线和盲文方竖直线的相交点，构成盲文方网格。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification