一种面向机器翻译的多策略英文长句分割方法

    公开(公告)号:CN105068990B

    公开(公告)日:2017-12-19

    申请号:CN201510441708.5

    申请日:2015-07-24

    Abstract: 本发明涉及一种面向机器翻译的多策略英文长句分割方法及装置,属于自然语言处理机器翻译技术领域。该方法包括训练和实际使用两个步骤;对于训练步骤:首先准备英文训练语料,并对其进行预处理;然后对语料进行特征提取,包括提取依存句法特征、词性标注特征以及逗号位置特征等;最后创建特征模版训练CRF模型;同时设计了若干能够较准确地处理简单的现象的规则;对于实际使用步骤,首先对待处理英文长句进行特征提取,提取的特征同训练步骤;之后分别使用规则算法以及CRF模型来标注逗号的位置;然后在所标注的位置添加逗号,完成分割。对比现有技术,通过采用规则与统计相结合的策略,能够有效且准确地分割英文长句,提高机器翻译的质量。

    一种基于词汇语义和句法依存的情感关键句识别方法

    公开(公告)号:CN104281645B

    公开(公告)日:2017-06-16

    申请号:CN201410425148.X

    申请日:2014-08-27

    Abstract: 本发明涉及一种基于词汇语义和句法依存的情感关键句识别方法,属于自然语言处理应用技术领域,包括以下步骤:首先对语料及其分词结果进行规范化处理;然后基于一定规则扩展情感词典、创建关键词词典和提取依存结构模板,并通过扩展后的情感词典和关键词词典获取候选情感关键句;最后设计一种位置打分函数,辅以情感词特征、关键词特征和依存模板特征,利用这四种特征训练SVM分类器,并以之完成情感关键句的最终识别。对比现有技术,通过采用规则与统计相结合的策略,能够有效利用不同层级词汇语义和句法依存信息进行识别,使用户能够更快速而且准确地找到语料中置信度较高的情感关键句,提高中文情感关键句的识别率。

    一种基于本体匹配的语义查询方法

    公开(公告)号:CN103744955B

    公开(公告)日:2017-04-05

    申请号:CN201410004084.6

    申请日:2014-01-04

    Abstract: 本发明公开了一种基于本体匹配的语义查询方法,属于计算机应用技术领域。本方法先计算本体资源的名称、注释与用户输入字符串的语义相似度,然后分别将本体类、本体个体、本体属性与用户输入字符串的语义相似度按从大到小排序,选出最符合用户查询要求的不超过λ*3个本体资源。本方法能够在语义层面进行检索,捕捉设计人员检索意图,提高系统检索效率。

    维汉翻译系统的多层次维语词法分析方法

    公开(公告)号:CN104239295B

    公开(公告)日:2017-01-18

    申请号:CN201410459155.1

    申请日:2014-09-10

    Inventor: 黄河燕 黄静

    Abstract: 本发明公开了一种维汉翻译系统的多层次维语词法分析方法,包括:接收维语单词;原形单词库中检索单词:检索到,生成单词内部结构;否则继续;不规则变化形变单词库中检索单词:检索到,取出原形单词和追加词形特征属性,生成单词内部结构;否则继续;非动词变化词缀规则库中对相关各词缀规则逐一还原判断:存在成功还原的词缀规则,取出追加词形特征属性,生成单词内部结构;否则继续;对各动词范畴构成规则依次还原判断:当找到成功还原的动词范畴构成规则,记录成功还原涉及的各追加词形特征属性,生成单词内部结构;若不存在成功还原的动词范畴构成规则,报错处理,结束。本发明可识别维语单词的各种词缀变化,正确、全面地完成词法分析。

    一种基于超图模型的遥感图像语义相似性度量方法及装置

    公开(公告)号:CN104820992A

    公开(公告)日:2015-08-05

    申请号:CN201510256069.5

    申请日:2015-05-19

    CPC classification number: G06T7/0002 G06T7/344 G06T2207/10032

    Abstract: 本发明涉及一种基于超图模型的遥感图像语义相似性度量方法,属于遥感图像处理技术领域;本发明利用超图模型对每个时相遥感图像进行建模,通过利用超图模型中顶点和超边实现遥感图像中每个像素点的语义表征,并结合超图匹配思想实现语义相似性度量,将多时相遥感图像语义相似性计算表示为多个超图模型中相同位置上顶点的相似性与顶点对应超边相似性的加权和。对比现有技术,本发明利用超图模型的高阶邻域表征能力提高复杂场景下多时相遥感图像语义相似性度量的准确性,降低了语义奇异性,以及配准误差、光照变化、季节差异等因素导致的噪声干扰;将多时相遥感图像语义相似性度量问题转化为一种超图模型匹配问题,通过最优化求解实现相似性度量。

    一种基于领域词典和语义角色的评价对象抽取方法

    公开(公告)号:CN104268160A

    公开(公告)日:2015-01-07

    申请号:CN201410453074.0

    申请日:2014-09-05

    CPC classification number: G06F17/30867 G06F17/2735 G06F17/2785

    Abstract: 本发明涉及一种基于领域词典和语义角色的评价对象抽取方法,属于自然语言处理应用技术领域,包括以下步骤:首先根据词性、依存和语义角色信息,构建评价对象的领域词典DL,然后充分挖掘词汇、依存、相对位置和语义角色四方面的特征,与DL一起利用条件随机场(CRFs)进行模型训练和预测,从而完成评价对象的抽取工作。对比现有技术,根据中文句子特别是微博、论坛评论信息结构灵活多样、构成方法变化多、句子特征较少的特点,充分利用不同层级句法和语义信息,结合基于规则和机器学习的评价对象抽取方法的优点,自动快速而且准确地找到语料中置信度较高的评价对象,提高了中文句子评价对象抽取的准确率。

    一种基于协同训练的双语命名实体识别方法

    公开(公告)号:CN103853710A

    公开(公告)日:2014-06-11

    申请号:CN201310593746.3

    申请日:2013-11-21

    Abstract: 本发明公开了一种基于双语协同训练的命名实体的识别方法,属于计算机科学中的自然语言处理技术领域。把平行的汉语句子和英语句子这两个数据集看作为一个数据集的两个不同的视图进行双语协同训练。在投射过程中使用一个对数线性模型修正投射标记,在利用模型对未见示例进行预测时引入命名实体双语对齐标注一致率作为标记置信度估计的衡量指标。本方法对比现有技术,降低了命名实体识别的领域依赖性,融合了双语识别的优势,解决了单语识别中的部分识别歧义问题,尤其适合用于大规模语料的双语命名实体同步识别。

    一种面向知识管理的自定义知识分类方法

    公开(公告)号:CN103793474A

    公开(公告)日:2014-05-14

    申请号:CN201410003685.5

    申请日:2014-01-04

    CPC classification number: G06F17/30705

    Abstract: 本发明属于计算机应用技术领域,涉及应用于知识管理系统的一种自定义知识分类方法。本发明的目的是为了解决知识管理系统中,在缺乏标注文本集合的条件下,实现用户自定义分类管理知识的问题,提出了一种基于词匹配的用户自定义的知识分类方法。本方法绕过了训练文本集合标注的难题,通过用《同义词词林》扩展用户自定义关键词,利用Wu-Manber多模式匹配算法来快速匹配关键词,根据关键词在文档中的命中率来判断分类类别。本方法有适应缺乏标注文本的条件,且速度快的特点。

    一种未登录词的识别方法
    99.
    发明公开

    公开(公告)号:CN101751386A

    公开(公告)日:2010-06-23

    申请号:CN200910265839.7

    申请日:2009-12-28

    Abstract: 本发明公开了一种未登录词的识别方法,属于计算机科学中的自然语言处理技术领域。在未登录词的检测阶段,先用多重规则过滤重复串集合,然后使用统计模型作为主体统计框架,将尽可能多的特征融入到框架内,确保未登录词检测具有较高的准确率和召回率;在未登录词词性猜测阶段,基于统计模型框架,在通用特征的基础上,通过引入有效的新特征,来提高未登录词词性猜测的准确率。本方法对比现有技术,不受内存规模的限制,扩大了未登录词的检测范围,有效减少了未登录词检测过程中的漏召问题,尤其适合用于大规模语料的未登录词的识别。

    一种基于计算机视觉的识别脚型尺寸的方法

    公开(公告)号:CN117115226B

    公开(公告)日:2024-08-30

    申请号:CN202311049171.9

    申请日:2023-08-21

    Inventor: 黄河燕 郭存涵

    Abstract: 本申请提供一种基于计算机视觉的识别脚型尺寸的方法,方法包括:步骤1,图片获取:分别获取被测量者脚放置于白纸上的侧视图,以及俯视图;步骤2,进行图片缩放处理;步骤3,利用多重阈值分割法,分别对A4纸和脚部轮廓进行分割,再使用全新透视矫正法对A4纸轮廓进行矫正,使用掩码法获取目标的脚部区域图像;步骤4,进行俯视图处理获得最大脚宽:分别对A4纸和脚部轮廓进行分割,在使用简易矫正法对A4纸轮廓进行矫正,获取目标的脚部区域图像后,确定目标参数。

Patent Agency Ranking