Patent search ap:("中国科学院计算技术研究所") AND inv:"王向东" Page 4

31.

发明公开
一种基于深度学习的盲文图像自动识别方法和系统有权

公开(公告)号：CN110298236A

公开(公告)日：2019-10-01

申请号：CN201910419983.5

申请日：2019-05-20

Applicant: 中国科学院计算技术研究所

Inventor： 刘宏 , 黎仁强 , 王向东 , 钱跃良

IPC: G06K9/00 , G06K9/62 , G06T7/187

Abstract: 本发明提出一种基于深度学习的盲文图像自动识别方法和系统，包括：获取多张盲文点字图像作为训练集，并获取其对应的标注图像，标注图像中每个像素均已标注为对应的盲方类别；以训练集中的盲文点字图像为输入，并以对应的盲方标注图像为标准答案，使用卷积神经网络训练语义分割模型，直到语义分割模型输出的语义分割结果图中每个像素的盲方类别和标准答案之间的差异低于阈值，保持当前语义分割模型作为盲方语义分割模型；将待识别的盲文点字图像输入盲方语义分割模型，得到待识别盲文点字图像的语义分割结果图，作为识别结果，识别结果中每个像素均对应其所属的盲方类别。

32.

发明授权
融合加速度和音频信息的脚步检测方法有权许可

公开(公告)号：CN106531186B

公开(公告)日：2019-07-12

申请号：CN201610971953.1

申请日：2016-10-28

Applicant: 中国科学院计算技术研究所

Inventor： 王成 , 龙舟 , 钱跃良 , 王向东 , 袁静

IPC: G10L25/51 , G10L25/45 , G10L25/03

Abstract: 本发明提供了一种融合加速度和音频信息的脚步检测方法，包括：1)检测双声道音频数据，得出脚步对应的时间区间；所述双声道音频数据包括固定在左脚的采集设备所采集的左脚声道音频数据和固定在右脚的采集设备所采集的右脚声道音频数据；2)对于得出的各个脚步对应的时间区间，根据该时间区间对应的加速度方差进行二次检测，根据该加速度方差是否大于预设的方差阈值判断该时间区间是否为脚步。本发明依靠可穿戴即可检测出对应的脚步，使用方便，并且具有很高的精确率和召回率。本发明还能够适应多种不同的应用场景，通用性强。

33.

发明公开
一种高精度盲文识别方法及系统有权

公开(公告)号：CN108052955A

公开(公告)日：2018-05-18

申请号：CN201711070466.9

申请日：2017-11-03

Applicant: 中国科学院计算技术研究所

Inventor： 刘宏 , 黎仁强 , 王向东 , 钱跃良

IPC: G06K9/62 , G06K9/20 , G09B21/00

Abstract: 本发明涉及一种高精度盲文识别方法及系统，包括：利用采集设备获取纸版盲文的数字化图像；对数字化图像的盲文进行盲文点标注，并将标注完成的数字化图像作为训练样本，其中盲文点为凸点或凹点；根据训练样本中盲文点的标注信息，将数字化图像划分为包含盲文点的正样本和包含背景点的负样本；提取正样本和负样本的多种特征，分别训练多个分类器；对待检测盲文图像的盲文方进行定位，将以各盲文方对应的6个盲文点为中心的区域作为待检测区域，将待检测区域的多种特征分别输入至相应分类器；通过融合各分类器的识别结果，确定待检测盲文图像内盲文点的位置和类型信息。由此通过融合多分类器的检测结果，实现对盲文的高精度识别。

34.

发明公开
一种盲文点检测方法及系统有权

公开(公告)号：CN107958261A

公开(公告)日：2018-04-24

申请号：CN201711071085.2

申请日：2017-11-03

Applicant: 中国科学院计算技术研究所

Inventor： 刘宏 , 钱跃良 , 王向东

IPC: G06K9/62

Abstract: 本发明涉及一种盲文点检测方法及系统，包括：利用采集设备获取纸版盲文的数字化图像；对该数字化图像的盲文进行盲文点标注；根据标注好的盲文图像，截取以盲文点为中心的盲文点图像区域作为正样本，截取除该盲文点图像区域以外的背景图像区域作为负样本；提取该正样本和该负样本的多个特征，训练级联分类器；在待检测的盲文图像上，利用该级联分类器进行盲文点的检测和定位。由此本发明可实现对盲文数字化图像的盲文点自动标注。

35.

发明授权
一种融合用户反馈的汉语语音识别方法及系统有权

公开(公告)号：CN104538032B

公开(公告)日：2018-02-06

申请号：CN201410806233.0

申请日：2014-12-19

Applicant: 中国科学院计算技术研究所

Inventor： 王向东 , 杨阳 , 钱跃良 , 刘宏

IPC: G10L15/26 , G10L15/28

Abstract: 本发明公开了融合用户反馈的汉语语音识别方法及系统，涉及语音识别领域，包括步骤1，获取输入语音，根据所述输入语音，生成词网格，并将所述词网格转换为字的候选列表；步骤2，获取用户对所述候选列表中的所述用户反馈，所述用户反馈包括：所述用户选择所述候选列表中与所述输入语音相对应的正确字，或输入与所述输入语音相对应的所述正确字；步骤3，将所述正确字以及所述正确字对应的候选列之前的各候选列的第一个候选字作为已确定文字，并以所述已确定文字为约束和指导，调整未确定文字对应的所述候选列表，生成新的候选列表；步骤4，重复所述步骤2、3，直到正确识别所述输入语音或所述用户输入新输入语音，以完成语音识别。

36.

发明公开
一种步态参数的采集方法及设备有权许可

公开(公告)号：CN106166071A

公开(公告)日：2016-11-30

申请号：CN201610519761.7

申请日：2016-07-04

Applicant: 中国科学院计算技术研究所

Inventor： 王成 , 王向东 , 钱跃良 , 龙舟 , 袁静

IPC: A61B5/11

CPC classification number: A61B5/112

Abstract: 本发明提供一种步态数据的采集方法，包括：1)获取左、右脚的声音信号曲线；2)根据峰值检测算法提取出该声音信号曲线中表征节点足触地声音的峰值位置和非节点足触地声音的峰值位置，然后计算每一步的步距Lsd＝V声(t2‑t1)；其中,V声为声音在空气中传播的速度，t1和t2分别是固定在不同脚的步态数据采集装置采集到同一次单脚触地所发出的声音的时刻，其中，t2为采集到非节点足触地声音的时间，t1为采集到节点足触地声音的时间。本发明还提供了相应的步态数据的采集设备。本发明可基于可穿戴的声传感器采集数据，不需要在特定环境中使用，特别适合于监测人的日常行走过程的步态。

37.

发明授权
用于融合多个语音识别系统的识别结果的方法及系统有权

公开(公告)号：CN103474069B

公开(公告)日：2016-03-30

申请号：CN201310413628.X

申请日：2013-09-12

Applicant: 中国科学院计算技术研究所

Inventor： 王向东 , 杨阳 , 钱跃良

IPC: G10L15/26 , G10L15/19 , G10L15/08

Abstract: 本发明提供一种用于融合多个语音识别系统的识别结果的方法及系统。所述方法包括：将多个语音识别系统的识别结果分别表示为相应的候选列表。所述方法还包括从得到的所有候选列表集合中任选两个候选列表进行对齐且合并；从该集合中剩下的候选列表中任选一个与已融合候选列表进行对齐且合并，然后重复这一过程直到处理完该集合中所有候选列表，其中通过对齐且合并操作得到的候选列表为已融合候选列表。本发明可提高语音识别准确率，且减少用户的修正操作。

38.

发明公开
一种用于盲人读取汉字的方法及系统有权

公开(公告)号：CN105404621A

公开(公告)日：2016-03-16

申请号：CN201510623525.5

申请日：2015-09-25

Applicant: 中国科学院计算技术研究所

Inventor： 王向东 , 杨阳 , 钱跃良 , 刘宏 , 张金超 , 姜文斌

IPC: G06F17/28

Abstract: 本发明提出一种用于盲人读取汉字的方法及系统，涉及自然语言处理技术领域和面向残疾人的人机交互技术领域，该方法包括获取汉语文本，对所述汉语文本进行分词操作，生成汉字串，通过发音词典、多音字字典与词频信息，参考分词得到的词性标注，将所述汉字串中的每个词转换为对应的拼音并连接为拼音串；通过查找拼音和盲符的对照字典，将所述拼音串转换为盲符串，通过分词模型对所述盲符串进行盲文分词，生成初始盲文分词，将所述汉字串与所述初始盲文分词进行融合，生成新盲文分词，根据盲文分词连写规则对所述新盲文分词进行调整；对根据盲文分词连写规则调整后的所述新盲文分词进行盲文标调，生成最终盲文分词，将所述最终盲文分词进行显示。

39.

发明授权
一种人机交互戒指有权

公开(公告)号：CN102866789B

公开(公告)日：2015-12-09

申请号：CN201210347942.8

申请日：2012-09-18

Applicant: 中国科学院计算技术研究所

Inventor： 张博宁 , 钱跃良 , 陈益强 , 王向东

IPC: G06F3/0346

Abstract: 本发明公开了一种人机交互戒指，包括：加速度传感器模块，用于测量手指与作用平面的投影角度并用坐标系变换；陀螺仪模块，用于测量所述手指与作用平面的角速度变化，根据变换后的投影角度和所述角速度变化通过计算获得手指运动轨迹；距离传感器模块，用于修正在手指发生弯曲时，所述陀螺仪模块无法准确测量带来的误差，从而得出正确的手指运动轨迹；麦克风传感器模块，用于获得所述手指与其他表面的摩擦音频；处理模块，用于人机交互命令，实现所述人机交互命令与相应的设备或计算机进行交互。

40.

发明授权
一种语音浏览方法及浏览器失效

公开(公告)号：CN102163213B

公开(公告)日：2015-06-24

申请号：CN201110046896.3

申请日：2011-02-25

Applicant: 中国科学院计算技术研究所

Inventor： 邓铸辉 , 陈启华 , 王向东 , 钱跃良 , 林守勋

IPC: G06F17/30

Abstract: 本发明提供一种语音浏览方法，包括：网页信息提取步骤：对于用户请求的任一网页，首先对其进行网页分类，若判定该网页属于主题型网页，则对网页进行主内容抽取；若该网页为非主题型网页，则进行网页分块；网页格式转换步骤：将HTML格式的网页自动转换为VOICEXML格式的网页；其中，对于主题型网页，所抽取的网页主内容设置为优先向用户朗读；对于非主题型网页，为用户设置快捷键以使用户能够在各网页块之间自由切换和选择；语音推送步骤：基于voiceXML格式网页，向用户朗读网页内容。本发明还提供了相应的语音浏览器。发明能够使得网页内容的呈现更为合理和高效；发明能够使满足用户的实时请求。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification