一种文本分类方法
    1.
    发明公开

    公开(公告)号:CN108829818A

    公开(公告)日:2018-11-16

    申请号:CN201810599385.6

    申请日:2018-06-12

    Abstract: 本发明提供了一种构建文本分类模型的方法。该方法包括以下步骤:根据文本信息的字、词语和句子的结构特征构建训练样本集,其中,所述训练样本集中的每一条样本数据对应一条文本信息关于词语的特征矩阵A、关于字的特征矩阵B和该条文本信息对应的类别向量O,O的维度与类别数量相同;以所述训练样本集中关于词语的特征矩阵A和关于字的特征矩阵B为输入,以对应的类别向量O为输出,训练深度学习模型,以获得文本分类模型。根据本发明构建的分类模型进行分类,能够提高文本分类的准确率,尤其适用于短文本分类。

    一种基于历史行为共现的数据划分方法及系统

    公开(公告)号:CN108647730A

    公开(公告)日:2018-10-12

    申请号:CN201810456096.0

    申请日:2018-05-14

    Abstract: 本发明涉及机器分类领域,特别是一种利用历史交互数据共现进行的无人工参与的属性划分领域。本发明利用互联网长期的交互数据积累,从海量数据中获取信息,根据历史数据中多数人通过一定时间窗口内浏览、点击等交互行为中共同出现的物体、信息等,将这些物体、信息等通过无监督的技术手段进行归类,从而解决物体划分标准不统一、无划分规则或标准时很难划分、人工参与成本高的现有划分的三个难题,帮助需求方节省成本、创造价值的同时解决划分中遇到的问题。

    一种基于用户偏好的信息推送方法和装置

    公开(公告)号:CN105069663A

    公开(公告)日:2015-11-18

    申请号:CN201510546644.5

    申请日:2015-08-31

    Abstract: 本发明公开了一种基于用户偏好的信息推送方法和装置。方法包括:提取当前页面中景点的景点标号i和信息文件j;在预设的文化资源库中,查询景点的信息文件j对应的偏好等级k;在用户模型中包含景点标号i的情况下,在用户模型中,获取偏好等级大于等于偏好等级k的所有景点的景点标号和/或信息文件,并行向当前页面推送;以及,在用户模型中包含景点标号i的情况下,在用户模型的相似用户模型中,获取在用户模型中不存在景点标号,向当前页面推送。本发明在用户浏览旅游景点相关的网页时,自动发现用户的偏好及其变化情况,构建用户模型;在用户模型构建完成之后,根据用户模型,为用户推送用户偏好的信息,满足用户的个性化需求。

    一种景区信息推送方法和装置

    公开(公告)号:CN104933643A

    公开(公告)日:2015-09-23

    申请号:CN201510363302.X

    申请日:2015-06-26

    Abstract: 本发明提出了一种景区信息推送方法和装置,该方法包括:采集用户信息;基于用户所处的情境判断是否需要向用户推送景区资源;当需要向用户推送景区资源时,将所述用户信息与预先存储的景区资源相匹配以确定出需要向用户推送的景区资源,并进行推送。本发明可以组织和管理旅游景区数据,将旅游景区数字化、资源结构化存储,使它们成为可通过互联网获取到的信息,贯穿游客整个旅游过程。根据不同游客的不同需要,提供不同版本的推送内容。能够根据游客提交推送设置、游客行为记录提取分析游客兴趣点、游客对推送内容进行反馈这三种方式来收集游客的推送精度和喜好,进而进行信息的推送,满足游客对推送系统的个性化需求。

    用于多级数据库的中间件和多级数据库系统

    公开(公告)号:CN106599043A

    公开(公告)日:2017-04-26

    申请号:CN201610982604.X

    申请日:2016-11-09

    CPC classification number: G06F16/27 G06F9/546 G06F16/2471 G06F2209/547

    Abstract: 本发明公开了用于多级数据库的中间件和多级数据库系统。该中间件包括:任务接收模块,用于接收来自于上一级节点的任务请求,其中上一级节点为客户端或其他中间件;任务分解模块,基于所述任务请求的语义分析将所述任务请求分解为一个或多个子任务;任务分发模块,查询执行所述子任务的下一级节点并相应地转发,其中,下一级节点为数据库实例或其它中间件;以及任务执行结果统计模块,用于从所述下一级节点汇集所述任务请求的执行结果并反馈至所述上一级节点。根据本发明的中间件技术可以跨域部署多级数据库系统,从而能够提高大数据处理的能力以及满足众多分级多数据中心的数据管理需要。

    一种法律数据库构建方法及法律检索服务方法

    公开(公告)号:CN104008171A

    公开(公告)日:2014-08-27

    申请号:CN201410242810.8

    申请日:2014-06-03

    Inventor: 刘婕 张程 赵晓芳

    CPC classification number: G06F17/30613 G06F17/3069 G06Q50/18

    Abstract: 本发明提供一种法律数据库构建方法,包括:1)对于一个新的法律文本,按条目拆分所接收的法律文本,得到相应的法律条目文档并创建相应的唯一标识;2)对每个法律条目文档进行分词,对于分词所得的每个词项,在基于内容的倒排索引中建立或更新该词项所对应的唯一一条记录,所述基于内容的倒排索引的每条记录均包括:内容中出现该条记录所对应词项的每个法律条目文档及相应的索引信息;3)回到步骤1)处理下一个法律文本直至所有法律文本均处理完毕。本发明还提供了相应的检索服务方法。本发明使得一次检索即可获得精确到法律条目的检索结果。

    一种用于对机器人体域信道进行建模仿真方法

    公开(公告)号:CN119766366A

    公开(公告)日:2025-04-04

    申请号:CN202411839072.5

    申请日:2024-12-13

    Abstract: 本发明提供了一种用于对机器人体域信道进行建模仿真方法,可以在虚拟场景内用机器人模型模拟需开发的机器人;在天线库内收集需使用的型号的天线对应的天线模型,以模拟其所代表型号的天线的辐射特性;然后基于交互界面,将选择的天线模块按所需的位置以及方向安装到机器人模型的相关部件上;最后,控制机器人运动调整位姿以带动部件调整位置和方向,从而基于所调整的位姿以及天线模块对应的辐射特性模拟需通信的天线模块间的无线信道,并评估在该位姿下机器人模型体域内无线信道的状态;由此,可以具备让开发者在各种所需的位姿下,获得机器人模型体域内无线信道的状态,以便开发者高效地发现问题所在,提高开发机器人的效率,降低成本。

    一种基于历史行为共现的数据划分方法及系统

    公开(公告)号:CN108647730B

    公开(公告)日:2020-11-24

    申请号:CN201810456096.0

    申请日:2018-05-14

    Abstract: 本发明涉及机器分类领域,特别是一种利用历史交互数据共现进行的无人工参与的属性划分领域。本发明利用互联网长期的交互数据积累,从海量数据中获取信息,根据历史数据中多数人通过一定时间窗口内浏览、点击等交互行为中共同出现的物体、信息等,将这些物体、信息等通过无监督的技术手段进行归类,从而解决物体划分标准不统一、无划分规则或标准时很难划分、人工参与成本高的现有划分的三个难题,帮助需求方节省成本、创造价值的同时解决划分中遇到的问题。

Patent Agency Ranking