-
公开(公告)号:CN114429127B
公开(公告)日:2025-04-08
申请号:CN202111566326.7
申请日:2021-12-20
Applicant: 中国科学院计算技术研究所
IPC: G06F40/289 , G06N3/045 , G06N3/084
Abstract: 本发明提出一种汉字到通用盲文的转换方法和系统,包括:构建深度学习模型,且该深度学习模型具有两个共享特征编码的子任务分支,其中一条子任务分支用于根据盲文规则将汉语文本分词,另一条子任务分支用于为每个汉字标注拼音及对应声调;使用已标记盲文分词的汉字语料和汉字拼音的对照语料,交替训练该深度学习模型的两个子任务分支,直到两子任务分支的损失函数均收敛或达到预设迭代次数,保存当前深度学习模型作为识别模型;将待通用盲文转换的汉字数据输入该识别模型,得到该汉字数据的分词信息和带调拼音信息,并基于该分词信息和该带调拼音信息,以将该汉字数据转换为对应的通用盲文文本。本发明可以实现汉字到盲文的实时准确转换。
-
公开(公告)号:CN114970453A
公开(公告)日:2022-08-30
申请号:CN202210569910.6
申请日:2022-05-24
Applicant: 中国科学院计算技术研究所
IPC: G06F40/117 , G06F40/151 , G06F40/289 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种通用盲文到汉字的转换方法和系统,其特征在于,包括:构建深度学习模型,由通用盲文文本生成拼音音节序列和分词标记序列,经由深度学习模型的嵌入层向量化后拼接得到融合盲文分词信息的拼音嵌入向量,分别输入深度学习模型的局部语义特征提取层和全局语义特征提取层;得到局部语义信息和上下文语义信息,将两者拼接后输入全连接层得到通用盲文文本对应的汉字文本。本发明通过拼音音节嵌入与分词信息嵌入拼接为一个总体的嵌入向量,以及局部语义特征提取层和全局语义特征提取层共享嵌入层结合的特征提取模块,实现了高准确率的通用盲文‑汉字转换。
-
公开(公告)号:CN114429128A
公开(公告)日:2022-05-03
申请号:CN202111566342.6
申请日:2021-12-20
Applicant: 中国科学院计算技术研究所
IPC: G06F40/289 , G06F40/242 , G06F16/903 , G06F16/2455 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种汉字‑通用盲文对照语料库的构建方法和系统,本发明一方面充分利用了现有汉字‑现行盲文对照语料库中的分词信息,另一方面采用一种半自动的方式得到现行盲文所对应的带声调的拼音,进而得到通用盲文。本发明先由计算机自动给没有标注声调的拼音添加声调,然后自动判断哪些拼音的声调可能存在错误,将这些可能存在错误的拼音及其对应的汉字显示在屏幕上,供人工校对修改。通过这种方式,把需要人工校对修改的拼音的比率控制在很小的范围内,可以实现快速的语料库构建。
-
公开(公告)号:CN114429127A
公开(公告)日:2022-05-03
申请号:CN202111566326.7
申请日:2021-12-20
Applicant: 中国科学院计算技术研究所
IPC: G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种汉字到通用盲文的转换方法和系统,包括:构建深度学习模型,且该深度学习模型具有两个共享特征编码的子任务分支,其中一条子任务分支用于根据盲文规则将汉语文本分词,另一条子任务分支用于为每个汉字标注拼音及对应声调;使用已标记盲文分词的汉字语料和汉字拼音的对照语料,交替训练该深度学习模型的两个子任务分支,直到两子任务分支的损失函数均收敛或达到预设迭代次数,保存当前深度学习模型作为识别模型;将待通用盲文转换的汉字数据输入该识别模型,得到该汉字数据的分词信息和带调拼音信息,并基于该分词信息和该带调拼音信息,以将该汉字数据转换为对应的通用盲文文本。本发明可以实现汉字到盲文的实时准确转换。
-
公开(公告)号:CN114970453B
公开(公告)日:2025-04-08
申请号:CN202210569910.6
申请日:2022-05-24
Applicant: 中国科学院计算技术研究所
IPC: G06F40/117 , G06F40/151 , G06F40/289 , G06F40/30 , G06N3/0464 , G06N3/0499 , G06N3/084
Abstract: 本发明提出一种通用盲文到汉字的转换方法和系统,其特征在于,包括:构建深度学习模型,由通用盲文文本生成拼音音节序列和分词标记序列,经由深度学习模型的嵌入层向量化后拼接得到融合盲文分词信息的拼音嵌入向量,分别输入深度学习模型的局部语义特征提取层和全局语义特征提取层;得到局部语义信息和上下文语义信息,将两者拼接后输入全连接层得到通用盲文文本对应的汉字文本。本发明通过拼音音节嵌入与分词信息嵌入拼接为一个总体的嵌入向量,以及局部语义特征提取层和全局语义特征提取层共享嵌入层结合的特征提取模块,实现了高准确率的通用盲文‑汉字转换。
-
-
-
-