一种通用字符串相似性度量框架的构建方法

    公开(公告)号:CN109284422B

    公开(公告)日:2019-12-27

    申请号:CN201811010804.4

    申请日:2018-08-31

    Abstract: 本发明涉及一种通用字符串相似性度量框架的构建方法,其具体是先设定需要比较的两个字符串群,再将匹配或相似的集合与不匹配集合组成的一组字符串,接着基于匹配或相似的集合和不匹配集合,为每个字符串相似性度量定义一个比较标准的集合,得到后验概率即字符串相似性度量的准确结果后,再基于最大似然估计方法,来估计后验概率;最后得到一个结合附加特征的字符串相似性度量框架。本发明基于Fellegi‑Sunter模型,构思合理、简单,将对需要快速和灵活地纳入大量语义特征的字符串相似度测量系统的设计提供指导。

    一种中医临床辅助诊断方法

    公开(公告)号:CN110600123A

    公开(公告)日:2019-12-20

    申请号:CN201910805443.0

    申请日:2019-08-29

    Abstract: 本发明公开了一种中医临床辅助诊断方法,具体涉及中医临床诊断领域,具体辅助诊断方法如下:S1、首先经网上以及各个中医院搜集中医临床问诊数据,得到中医临床记录中的各种病症以及问诊记录,然后将问诊记录和其对应病症整理成文本数据归类存储在中医临床辅助诊断系统中;S2、通过数据表征方法将整理的中医问诊文本数据表示为计算机可计算的数值数据形式;S3、将表征后的数据形式通过多层感知机模型计算判断出中医问诊数据对应的病症情况。本发明通过数据表征方法将文本数据转换为数值数据,最后输入至多层感知机模型内,经多标签分类任务搜索,能够实现辅助中医医疗人员,特别是在经验不足或者医疗资源稀少的情况下,进行中医医疗诊断。

    一种中医细粒度证候名分割的远程监督方法

    公开(公告)号:CN109408831A

    公开(公告)日:2019-03-01

    申请号:CN201811186683.9

    申请日:2018-10-11

    Abstract: 本发明是一种实现中医细粒度证候名分割的远程监督方法,其使用中医证候的命名和翻译惯例来训练基于中医细粒度证候名分割的条件随机场模型,首先利用汉英平行语料库中医证候的汉英字词关系,采用概率对准方法构建带噪声的标记训练数据,该概率对准方法可以启发式地结合正向对准和反向检查来推断出中医证候中的细粒度段,然后使用这些细粒度段训练条件随机场模型。本发明构思合理、简单,用于训练中医药领域中的基于中医细粒度证候名分割的条件随机场模型,几乎不依赖甚至不需要手工标记训练数据。

    一种中医细粒度证候名分割的远程监督方法

    公开(公告)号:CN109408831B

    公开(公告)日:2020-02-21

    申请号:CN201811186683.9

    申请日:2018-10-11

    Abstract: 本发明是一种实现中医细粒度证候名分割的远程监督方法,其使用中医证候的命名和翻译惯例来训练基于中医细粒度证候名分割的条件随机场模型,首先利用汉英平行语料库中医证候的汉英字词关系,采用概率对准方法构建带噪声的标记训练数据,该概率对准方法可以启发式地结合正向对准和反向检查来推断出中医证候中的细粒度段,然后使用这些细粒度段训练条件随机场模型。本发明构思合理、简单,用于训练中医药领域中的基于中医细粒度证候名分割的条件随机场模型,几乎不依赖甚至不需要手工标记训练数据。

    一种从中文临床记录学习高质量词嵌入的方法

    公开(公告)号:CN109376356A

    公开(公告)日:2019-02-22

    申请号:CN201811176401.7

    申请日:2018-10-09

    Abstract: 本发明涉及一种从中文临床记录学习高质量词嵌入的方法,其包括(1)通过skip-gram模型从中文临床记录学习词向量;(2)使用领域外数据;(3)嵌入中医临床记录学习词的通用框架,提出从中医临床记录学习词嵌入的通用框架;(4)对学习到的新嵌入进行评价,提出对学得词嵌入的评价方法。本发明构思合理,在仅仅拥有有限的中文临床记录的情况下,可以结合领域内以及领域外的数据并且通过skip-gram模型从中文临床记录中学得更好的词嵌入。

    一种在线观点挖掘方法及系统

    公开(公告)号:CN109299256A

    公开(公告)日:2019-02-01

    申请号:CN201811071285.2

    申请日:2018-09-14

    CPC classification number: G06F2216/03

    Abstract: 本发明涉及一种在线观点挖掘方法及系统,该方法包括:(1)构建一个定向网络爬虫,以实现自动抓取针对电商的商品属性和商品评论信息数据;(2)对爬取的文本数据采用分词算法进行预处理,以转换成计算机方便处理的格式;(3)对商品细粒度属性和情感进行倾向性分析和观点挖掘;(4)采用启发式规则方法,在大量文本中总结出需要寻找的“属性-观点”这种特定关系的规律,并基于“短评论包含的评价对象应是单一的”基本假设,实现从评论句中获取商品细粒度属性和情感描述信息。该系统包括网络爬虫模块、数据处理模块和观点挖掘模块。本发明能提升用户获取关于商品多粒度的质量信息的速度,能极大提高人们获取商品观点的效率。

    一种通用字符串相似性度量框架的构建方法

    公开(公告)号:CN109284422A

    公开(公告)日:2019-01-29

    申请号:CN201811010804.4

    申请日:2018-08-31

    Abstract: 本发明涉及一种通用字符串相似性度量框架的构建方法,其具体是先设定需要比较的两个字符串群,再将匹配或相似的集合与不匹配集合组成的一组字符串,接着基于匹配或相似的集合和不匹配集合,为每个字符串相似性度量定义一个比较标准的集合,得到后验概率即字符串相似性度量的准确结果后,再基于最大似然估计方法,来估计后验概率;最后得到一个结合附加特征的字符串相似性度量框架。本发明基于Fellegi-Sunter模型,构思合理、简单,将对需要快速和灵活地纳入大量语义特征的字符串相似度测量系统的设计提供指导。

Patent Agency Ranking