一种文本分类方法、装置及电子设备

    公开(公告)号:CN107766426B

    公开(公告)日:2020-05-22

    申请号:CN201710828217.5

    申请日:2017-09-14

    Abstract: 本申请公开了一种文本分类方法、装置及电子设备,所述方法包括:通过无监督方法训练词向量模型;根据词向量模型,确定在文本中提取出的关键词的词向量;根据所述关键词的词向量,确定所述文本的文本向量;计算所述文本向量与预设类目的向量之间的相似度;将相似度符合预设条件的类目作为所述文本的类目。本发明实现了对文本的无监督方式分类,避免大工作量的人工标注数据,降低成本。

    一种数据查询的方法、装置及电子设备

    公开(公告)号:CN110674112A

    公开(公告)日:2020-01-10

    申请号:CN201910899832.4

    申请日:2019-09-23

    Abstract: 本发明实施例公开了一种数据查询的方法、装置及电子设备,所述方法、装置及电子设备包括:获取待查询语句中包含的目标实体信息;基于目标实体信息,从预设数据库中获取与目标实体信息匹配的目标关联信息,预设数据库包括第一数据库和第二数据库,第一数据库用于存储实体信息,第二数据库用于存储与实体信息匹配的关联信息,其中,关联信息包括实体执行和/或响应的关联事件以及所述关联事件的响应或执行对象。采用该方法、装置及电子设备,在查询目标实体的多个关联信息时,不需要多次查询,可以基于待查询语句中的目标实体信息,从预设数据库中获取与目标实体信息匹配的多个目标关联信息,从而提高关联信息的查询效率。

    一种对文本序列进行分词的方法、装置和电子设备

    公开(公告)号:CN108038103A

    公开(公告)日:2018-05-15

    申请号:CN201711364208.1

    申请日:2017-12-18

    Abstract: 本发明公开了一种文本的分词方法、装置和电子设备,所述方法包括:确定与所述文本序列对应的概率矩阵,所述概率矩阵记录有所述文本序列中的每个字符与预设的每个标注字符相匹配的概率值,所述标注字符用于对所述文本序列进行分词;确定与所述概率矩阵对应的转移矩阵,所述转移矩阵记录了所述每个标注字符之间的转移概率;根据所述概率矩阵和转移矩阵,对所述文本序列进行分词。本发明可以避免在中文分词过程中,存在分词特征抽取受限以及领域适应性较差的问题。

    命名实体识别方法及装置

    公开(公告)号:CN107797992A

    公开(公告)日:2018-03-13

    申请号:CN201711102742.5

    申请日:2017-11-10

    CPC classification number: G06F17/278

    Abstract: 本申请实施例提供一种命名实体识别方法及装置,该方法包括:获取输入序列;对所述输入序列中的字符进行向量化处理,得到所述输入序列对应的字符向量序列;使用神经网络算法处理所述字符向量序列,得到所述输入序列的文本特征序列;使用条件随机场处理所述文本特征序列,得到所述输入序列对应的命名实体识别结果。由于字符能够表征更细粒度的特征、且字符数量远小于词语的数量,神经网络算法能够考虑到输入序列中各字符的上下文信息,以及条件随机场能够避免标记偏置问题,因此,本申请技术方案通过将字符向量化、神经网络算法及条件随机场这三者进行结合的方式,来实现命名实体识别,可以达到较好的识别效果。

    业务数据的处理方法及装置

    公开(公告)号:CN107230108A

    公开(公告)日:2017-10-03

    申请号:CN201710443935.0

    申请日:2017-06-13

    CPC classification number: G06Q30/0201 G06Q40/025

    Abstract: 本发明实施例提供了一种业务数据的处理方法及装置,其中方法包括:利用预先构造的业务数据模型对指定机构中待挖掘用户的业务数据进行分析,得到所述待挖掘用户的转化率;检测所述待挖掘用户的转化率是否达到预设的第一阈值;若检测到所述待挖掘用户的转化率达到预设的第一阈值,确定所述待挖掘用户为所述指定机构的潜在种子用户。本发明实施例的技术方案,能够提高客户转化率,提高客户的信用度使用程度,降低营销成本。

    数据推送方法及其系统
    6.
    发明公开

    公开(公告)号:CN106991598A

    公开(公告)日:2017-07-28

    申请号:CN201710224488.X

    申请日:2017-04-07

    CPC classification number: G06Q30/0631 G06Q40/06 H04L67/26

    Abstract: 本发明公开一种数据推送方法及其系统,其中所述方法包括:获取与第一用户相关联的多个业务产品信息;计算所述多个业务产品之间的相似度,获取相似度大于预设值的第一业务产品和第二业务产品;若第二用户与所述第一业务产品关联并不与所述第二业务产品关联,则设置所述第二用户与所述第二业务产品关联,并将所述第二业务产品推送至所述第二用户;其中所述第一用户和所述第二用户具有相同或相关的属性信息。通过本发明实现了业务产品推荐的智能化、自动化和个性化。

    一种用户特征数据的处理方法和装置

    公开(公告)号:CN106022800A

    公开(公告)日:2016-10-12

    申请号:CN201610323618.0

    申请日:2016-05-16

    CPC classification number: G06Q30/01

    Abstract: 本发明提供一种用户特征数据的处理方法,包括:从数据源获取用户行为数据和数据项信息数据;根据不同的业务逻辑,对所述获取的用户行为数据和数据项信息数据进行数据整合,得到与所述业务逻辑对应的用户特征数据;采用与所述用户特征数据相对应的封装模型对所述用户特征数据进行处理得到与所述业务逻辑对应的处理结果数据。本发明实施例通过建立多个封装模型,采用与用户特征数据相对应的封装模型对所述用户特征数据进行处理得到与业务逻辑对应的处理结果数据,可以为企业提供全量数据挖掘的模型封装,为企业提供更加精确的用户行为特征信息。

    一种商品评论数据的口碑分析方法和装置

    公开(公告)号:CN106021433A

    公开(公告)日:2016-10-12

    申请号:CN201610321688.2

    申请日:2016-05-16

    CPC classification number: G06F17/30705 G06F17/2785

    Abstract: 本发明实施例提供一种商品评论数据的口碑分析方法及装置,包括:接收输入的待分析商品评论数据,并对所述待分析商品评论数据进行分句处理;当判定所述待分析商品评论数据中具有匹配所述规则文件的规则的子句时,则根据匹配的规则提取所述待分析商品评论数据的属性词和评价词;其中,所述规则文件是将待训练商品评论数据的属性种子词和评价种子词输入Boostrapp i ng算法得到的;判断所述属性词是否存在属性树文件中,判断所述评价词是否存在评价文件中;当判定所述属性词存在所述属性树文件中且所述评价词存在所述评价词文件中时,从聚类映射文件中匹配所述属性词和评价词对应的口碑数据,获得目标口碑数据。

    自动问答方法、装置、可读存储介质及电子设备

    公开(公告)号:CN112182195A

    公开(公告)日:2021-01-05

    申请号:CN202011165913.0

    申请日:2020-10-27

    Abstract: 本公开涉及一种自动问答方法、装置、可读存储介质及电子设备。方法包括:响应于接收到用户输入的问答语句,确定所述问答语句的问答类型信息,其中,所述问答类型信息包括问答跳数和所述问答语句的查询结构,所述查询结构包括链式结构和夹式结构;获取所述问答语句中的实体;根据所述问答语句、所述实体和所述问答语句的问答类型信息,确定与所述问答语句匹配的目标回答语句。如此,可以解决现有技术中无法查询出夹式结构的问答语句的答案的问题,实现既可以查找到链式结构的问题的答案,也可以查找到夹式结构问题的答案的目的,提高了自动问答的适用范围,提升了用户使用体验。

    一种意见领袖的识别方法、装置和设备

    公开(公告)号:CN111460317A

    公开(公告)日:2020-07-28

    申请号:CN202010238810.6

    申请日:2020-03-30

    Abstract: 本说明书实施例公开了一种意见领袖的识别方法、装置及电子设备,用于提高意见领袖的识别效果。该方法包括:确定话题网络中的节点用户是意见领袖的概率;将所述概率以及所述节点用户的多个指标参数输入预设模型,得到所述多个指标参数分别对应的比例系数;其中,所述概率和所述多个指标参数以及所述多个指标参数分别对应的比例系数相关;基于所述多个指标参数以及所述多个指标参数分别对应的比例系数,得到所述节点用户的权重;基于所述节点用户的权重,通过PageRank算法识别出所述话题网络中的意见领袖。

Patent Agency Ranking