一种聊天文本特征分类方法、装置及存储介质

    公开(公告)号:CN112214600B

    公开(公告)日:2022-06-10

    申请号:CN202011131344.8

    申请日:2020-10-21

    Abstract: 本发明公开了一种聊天文本特征分类方法、装置及存储介质,通过获对聊天文本进行预处理得到词向量,将词向量输入卷积网络层,分别计算生成聊天文本的局部特征向量,将局部特征向量连接形成上下文语义特征向量,将上下文语义特征向量输入深度卷积神经网络输出第一固定长度向量;将词向量和表示聊天文本中每个单词位置的位置向量组合形成联合词向量,联合词向量通过门限线性单元网络GLU,并结合多核Depthwise卷积网络层得到第二固定长度向量;将第一固定长度向量与第二固定长度向量连接得到多层次文本语义向量,将多层次文本语义向量输入全连接网络层计算输出向量;对输出向量使用softmax函数计算聊天文本的分类概率值,得到聊天文本所属的特征类别。

    文本分类方法和装置
    12.
    发明授权

    公开(公告)号:CN111078887B

    公开(公告)日:2022-04-29

    申请号:CN201911326228.9

    申请日:2019-12-20

    Abstract: 本申请实施例公开了文本分类方法和装置。该方法的一具体实施方式包括:获取待分类文本;对待分类文本进行分词,得到词语列表;对待分类本文中的文字进行声调划分,得到声调组合列表;确定词语列表中的每个词语的词向量,以及确定声调组合列表中的每个声调组合的声调向量;将所得到的词向量和声调向量输入预先训练的文本分类模型,得到用于表征待分类文本的类别的标签。该实施方式实现了将词向量和声调向量相结合,从词和声调两个维度分别提取文本的语义和语调特征,使用这些特征可以有效地改善字/词级特征存在的不足,提高文本分类的准确性。

    数据库异常修复方法、装置、计算设备及存储介质

    公开(公告)号:CN112579336B

    公开(公告)日:2022-04-22

    申请号:CN202011619239.9

    申请日:2020-12-31

    Abstract: 本发明公开一种数据库异常修复方法、装置、计算设备及存储介质,该方法包括:获取异常节点以及异常节点的错误信息;当异常节点为第一数据类型时,对异常节点执行跳过处理;当异常节点为第二数据类型时且用户选择跳过处理时,对异常节点执行跳过处理;当异常节点为第二数据类型时且用户选择修复处理,从数据库失联页面表中选出符合当前数据库结构的第一数据类型页面集合、第二数据类型页面集合和脏数据页面集合,并根据这些集合和异常节点的错误信息对所述异常节点执行修复处理;重复上述步骤以遍历所述脏数据页错误信息库的所有异常节点以完成数据库异常修复。根据本发明实施例可以实现一定程度的数据库异常修复,尽可能保证数据库解析的准确性。

    一种聊天记录匹配事件分析方法、终端设备及存储介质

    公开(公告)号:CN114116963A

    公开(公告)日:2022-03-01

    申请号:CN202111297433.4

    申请日:2021-11-04

    Abstract: 本发明涉及一种聊天记录匹配事件分析方法、终端设备及存储介质,该方法中包括:S1:采集已知事件和行为的聊天记录,并根据采集的聊天记录的事件进行一次分类,根据聊天记录的行为进行二次分类后,构建样本知识库;S2:接收待分析的聊天记录数据包;S3:将数据包中的每条聊天记录与样本知识库中的各聊天记录一一进行相似度计算,如果相似度小于相似度阈值,则将数据包中的该聊天记录打上对应样本知识库中聊天记录的记录ID的标签;S4:将聊天记录按照交互双方账号进行分组后,统计每组聊天记录包含的所有记录ID组成第一记录序列KM1,并根据每组聊天记录的KM1从样本知识库查找该组聊天记录的匹配事件。本发明实现了聊天记录内容与事件的智能化匹配。

    一种基于汽车电子数据的区间超速驾驶检测方法、装置和存储介质

    公开(公告)号:CN113870583A

    公开(公告)日:2021-12-31

    申请号:CN202111395048.3

    申请日:2021-11-23

    Abstract: 本发明提供了一种基于汽车电子数据的区间超速驾驶检测方法、装置和可读存储介质,包括:获取记录仪中时间、速度、轨迹信息;检测到出发点和相邻轨迹处于同一限速区时,将最先出现的超速记录和出发点录入超速记录集合;检测到出发点和相邻轨迹处于不同限速区时,积分计算原出发点到最先出现超速记录时间内的行驶距离并根据地图数据计算当前位置,将当前位置超过相邻轨迹时的超速记录和相邻轨迹信息录入超速记录集合,将当前位置未超过相邻轨迹时的超速记录和出发点信息录入超速记录集合。通过提取行驶记录仪设备中存储的时间、速度、位置数据,结合道路限速要求,计算车辆在该限速区域内是否存在超速行为,可全程监控车辆是否存在超速行为。

    一种EXT文件系统离线修改方法、装置及存储介质

    公开(公告)号:CN110569218B

    公开(公告)日:2021-11-23

    申请号:CN201910708700.9

    申请日:2019-08-01

    Abstract: 本发明公开了一种EXT文件系统离线修改方法和装置,包括:提取物理存储设备的镜像文件,在镜像文件中获取需要访问的EXT分区;对EXT分区进行初始化,读取EXT分区中的超级块、组描述符、块位图、节点位图和节点表;根据目标文件的文件名路径或节点号路径遍历EXT分区,得到目标文件所在的镜像位置;在镜像位置上对文件名、文件内容或文件属性进行修改。本方案优化了文件系统的初始化条件,可以实现单独访问某个文件,并大大提升了访问文件的速度,同时支持文件名路径和节点号路径遍历,方便有效地定位文件位置,获取文件结构。并可以精准控制修改粒度,使得离线修改方式简单精确。

    一种基于矩阵的账单周期规律的分析方法、装置及存储介质

    公开(公告)号:CN112215695A

    公开(公告)日:2021-01-12

    申请号:CN202011102409.6

    申请日:2020-10-15

    Abstract: 本发明提出了一种基于矩阵的账单周期规律的分析方法、装置及存储介质,该方法包括:获取待分析账单的起始时间和结束时间,以所述起始时间至所述结束时间经历的所有时间单位作为所述矩阵的行标识及以所述时间单位中具有的最大天数作为列标识构建矩阵,所述矩阵中元素的初始值均为0;对所述起始时间至所述结束时间内的账单进行扫描,如果当前日期存在交易记录,则将所述矩阵中对应的元素的值修改为1;对所述矩阵中每列的数值中连续1的个数进行分析,确定账单周期的规律。本发明基于二维矩阵对交易进行标识,随后通过字符串比对,分析效率高,不依赖其它第三方分析软件,且对当前列的数值进行校准,提高了账单周期分析的准确性。

    一种网络语境的文本识别方法、装置及存储介质

    公开(公告)号:CN111581970A

    公开(公告)日:2020-08-25

    申请号:CN202010396183.9

    申请日:2020-05-12

    Abstract: 本发明提出了一种网络语境的文本识别方法、装置及存储介质,该方法包括:基于文本长窗口构建风格语义模型,基于文本短窗口构建偏旁级语义模型;使用网络语境的语料库基于风格语义模型向量模型和偏旁级语义模型训练得到网络语境的中文词向量模型;使用所述网络语境的中文词向量模型对输入的网络语境的文本进行识别并输出识别结果。本发明在分词时使用两个不同窗口,长窗口用于提取网络化风格的语义信息,文本短窗口用于提取不同细粒度的语义特征,在训练阶段将二者结合,获得更加准确的词向量表达,以提高网络语境的文本识别率,本发明优化了目标函数,使得模型训练速度加快,在训练时,还建立了部首转义的方法,从而提高了文本的识别率。

    基于中文词向量模型的文本识别方法、装置及存储介质

    公开(公告)号:CN111563379A

    公开(公告)日:2020-08-21

    申请号:CN202010396412.7

    申请日:2020-05-12

    Abstract: 本发明提出了一种基于中文词向量模型的文本识别方法、装置及存储介质,该方法包括:基于目标词、上下文窗口词和目标词声调n-grams构建第一中文词向量模型和第二中文词向量模型;基于语料库对所述第一中文词向量模型和第二中文词向量模型进行训练得到训练后的所述第一中文词向量模型和第二中文词向量模型;使用训练后的所述第一中文词向量模型获取输入文本的语义向量并输出结果。本发明使用训练后的所述第二中文词向量模型对所述识别结果进行验证,提高了识别准确率,且构建词向量时使用了声调这一元素,丰富中文词向量所包含信息,避免了特征噪声对词向量的影响,最大程度的保留目标词的语义和语调特征,引入了负样本并构建了损失函数。

Patent Agency Ranking