用于分割文本的方法和设备

    公开(公告)号:CN107229609A

    公开(公告)日:2017-10-03

    申请号:CN201610177984.X

    申请日:2016-03-25

    CPC classification number: G06F17/3071 G06F17/2705

    Abstract: 本发明提供了用于分割文本的方法和设备。一种用于分割包括多个句子的文本的方法包括:从所述文本中提取多个证据和多个推论;对于所述多个推论中的每一个推论,基于所述文本和/或分割历史来确定所述多个证据中的每一个证据的优先位置,其中所述优先位置表示该证据在用来作出该推论的证据的序列中最可能处于的位置;以及通过基于证据的优先位置将所述文本中的每两个连续句子之间的边界中的一个或更多个边界确定为片段边界,来将所述文本分割成多个片段。通过利用本发明,分割将更为准确。

    用于从医疗文档中提取诊断对象的方法和装置

    公开(公告)号:CN107239722A

    公开(公告)日:2017-10-10

    申请号:CN201610177996.2

    申请日:2016-03-25

    Abstract: 本发明提供了用于从医疗文档中提取诊断对象的方法和装置。该方法包括:从输入医疗文档中提取身体部位实体和至少一种类型的非身体部位实体以及身体部位实体与非身体部位实体之间的关系,其中对不少于两个非身体部位实体进行提取;对于所提取出的非身体部位实体的所有对中的每一对,取得一对中两个非身体部位实体之间的相关性评分,其中,该相关性评分基于历史医疗文档中的所述一对中的两个非身体部位实体与一个或多个身体部位实体之间的关系;基于所有对的相关性评分将输入医疗文档中的非身体部位实体聚类为一个或多个群集,及输出与被聚类在每个群集中的一个或多个非身体部位实体相关的一个或多个身体部位实体作为一个诊断对象。

    基于用户意图识别执行推荐的设备和方法

    公开(公告)号:CN102968416A

    公开(公告)日:2013-03-13

    申请号:CN201110256156.2

    申请日:2011-09-01

    Abstract: 本发明提供一种能够基于用户的意图提供更精确的推荐项目的、基于用户的意图的识别执行推荐的设备和方法。该设备包括:传感器,被配置为感测用户的行为;识别器,被配置为从感测的行为提取特征并由提取的特征识别用户的意图;以及推荐生成器,被配置为基于识别的用户意图来生成推荐。

    用于分割文本的方法和设备

    公开(公告)号:CN107229609B

    公开(公告)日:2021-08-13

    申请号:CN201610177984.X

    申请日:2016-03-25

    Abstract: 本发明提供了用于分割文本的方法和设备。一种用于分割包括多个句子的文本的方法包括:从所述文本中提取多个证据和多个推论;对于所述多个推论中的每一个推论,基于所述文本和/或分割历史来确定所述多个证据中的每一个证据的优先位置,其中所述优先位置表示该证据在用来作出该推论的证据的序列中最可能处于的位置;以及通过基于证据的优先位置将所述文本中的每两个连续句子之间的边界中的一个或更多个边界确定为片段边界,来将所述文本分割成多个片段。通过利用本发明,分割将更为准确。

    文档图像处理装置及方法

    公开(公告)号:CN109671157A

    公开(公告)日:2019-04-23

    申请号:CN201710964248.3

    申请日:2017-10-17

    Inventor: 郭瑞山 乔智勇

    Abstract: 本发明公开了文档图像处理装置及方法。所述装置包括:信息获取单元,获取与携带标记的纸质文档对应的存储的文档模型以及从纸质文档捕捉的文档图像的信息,其中所述标记包括第一标记和第二标记;第一标记检测单元,检测所述文档图像中的第一标记并且获得第一标记的姿态;第二标记确定单元,根据变换和所述存储的文档模型的所述信息确定所述文档图像中的第二标记,其中所述变换根据第一标记的所述姿态和所述存储的文档模型的所述信息确定;及信息变换单元,根据更新的变换将所述存储的文档模型的所述信息转换到所述文档图像,其中,所述更新的变换基于所述变换和第二标记更新。与现有技术相比,本发明将提高从文档到文档图像的坐标变换的准确性。

    兴趣点选择方法及装置
    6.
    发明公开

    公开(公告)号:CN104424330A

    公开(公告)日:2015-03-18

    申请号:CN201310411082.4

    申请日:2013-09-11

    Inventor: 郭瑞山 黄耀海

    CPC classification number: G06F17/30867 G06F17/3087

    Abstract: 本发明公开了一种用于从多个兴趣点中选择目标兴趣点的方法,包括:确定开始状态;根据开始状态从所述多个兴趣点中选择开始兴趣点;获取至少一条路线,每条路线都经过所述开始兴趣点;根据所述开始兴趣点和所获取的路线而从所述多个兴趣点中选择候选兴趣点,其中所述候选兴趣点至少位于所述路线之一上;计算每个候选兴趣点的分数;以及根据候选兴趣点的分数而从所述候选兴趣点中选择至少一个目标兴趣点。

    用于从医疗文档中提取诊断对象的方法和装置

    公开(公告)号:CN107239722B

    公开(公告)日:2021-11-12

    申请号:CN201610177996.2

    申请日:2016-03-25

    Abstract: 本发明提供了用于从医疗文档中提取诊断对象的方法和装置。该方法包括:从输入医疗文档中提取身体部位实体和至少一种类型的非身体部位实体以及身体部位实体与非身体部位实体之间的关系,其中对不少于两个非身体部位实体进行提取;对于所提取出的非身体部位实体的所有对中的每一对,取得一对中两个非身体部位实体之间的相关性评分,其中,该相关性评分基于历史医疗文档中的所述一对中的两个非身体部位实体与一个或多个身体部位实体之间的关系;基于所有对的相关性评分将输入医疗文档中的非身体部位实体聚类为一个或多个群集,及输出与被聚类在每个群集中的一个或多个非身体部位实体相关的一个或多个身体部位实体作为一个诊断对象。

    未登录属性抽取方法和装置

    公开(公告)号:CN108932223A

    公开(公告)日:2018-12-04

    申请号:CN201710374631.3

    申请日:2017-05-24

    Abstract: 本发明提供一种从医学文档中抽取未登录属性的未登录属性抽取方法和装置。所述未登录属性抽取装置包括:获取单元,配置为从文本文档中获取文本语句;属性抽取单元,配置为从所述文本语句中抽取已登录属性、候选未登录属性、所述已登录属性之间的关系以及所述已登录属性与所述候选未登录属性之间的关系;未登录属性识别单元,配置为在所述候选未登录属性满足通用属性结构的一部分的情况下将所述候选未登录属性识别为未登录属性。

    基于网络服务应用的光学字符识别系统和方法

    公开(公告)号:CN100419785C

    公开(公告)日:2008-09-17

    申请号:CN200410032522.6

    申请日:2004-04-08

    Inventor: 郭瑞山 倪勇

    CPC classification number: G06K9/00979 G06K9/00993

    Abstract: 本发明公开一种基于网络上的网络服务应用的光学字符识别方法和光学字符识别系统。所述方法包括步骤:a)使用网络浏览器将原始图像的图像文件上载到网络服务器;b)存储所述上载的图像文件;c)通过网络服务应用转换所述上载的图像文件并保存所转换的图像文件;d)图像小程序通过网络服务器调用网络服务应用,识别选择的需要识别的图像区域;以及e)返回所述选择的需要识别的图像区域的识别信息数据。使用该基于网络的网络服务应用的光学字符识别方法和光学字符识别系统,用户能够控制整个识别处理流程,并且效率得到提高。

    基于网络服务应用的光学字符识别系统和方法

    公开(公告)号:CN1680973A

    公开(公告)日:2005-10-12

    申请号:CN200410032522.6

    申请日:2004-04-08

    Inventor: 郭瑞山 倪勇

    CPC classification number: G06K9/00979 G06K9/00993

    Abstract: 本发明公开一种基于网络上的网络服务应用的光学字符识别方法和光学字符识别系统。所述方法包括步骤:a)使用网络浏览器将原始图像的图像文件上载到网络服务器;b)存储所述上载的图像文件;c)通过网络服务应用转换所述上载的图像文件并保存所转换的图像文件;d)图像小程序通过网络服务器调用网络服务应用,识别选择的需要识别的图像区域;以及e)返回所述选择的需要识别的图像区域的识别信息数据。使用该基于网络的网络服务应用的光学字符识别方法和光学字符识别系统,用户能够控制整个识别处理流程,并且效率得到提高。

Patent Agency Ranking