一种基于多模态词向量的生成式对话系统编码方法及编码器

    公开(公告)号:CN110569499B

    公开(公告)日:2021-10-08

    申请号:CN201910648554.5

    申请日:2019-07-18

    Abstract: 本发明公开了一种基于多模态词向量的生成式对话系统编码方法及编码器。本方法为:1)根据当前语料与单词的上下文语境训练多模态词向量,其中每个单词生成多个词向量;2)使用双向LSTM神经网络与词向量对问句进行编码,然后将每个单词对应的前向神经网络的隐层状态与后向神经网络的隐层状态进行拼接作为该单词的上下文表示;3)将该单词的上下文表示与该单词的每一词向量分别计算相关度得分,取得分最高的词向量作为该单词的词向量;4)使用LSTM与该问句的各单词词向量对该问句进行编码,得到该问句的分布表示;5)对该问句的分布进行随机采样得到该问句的编码。本发明提高了句子编码的精准性。

    基于序列预测的日志异常检测方法及装置

    公开(公告)号:CN113434357A

    公开(公告)日:2021-09-24

    申请号:CN202110534643.4

    申请日:2021-05-17

    Abstract: 本发明公开了一种基于序列预测的日志异常检测方法及装置,包括:解析待检测日志序列,得到待检测日志键序列;将待检测日志键序列输入日志异常检测模型,获取日志异常检测结果。本发明通过基于语义的预处理模块构造了日志键的嵌入向量,从周围序列学习目标信息的特性,从而可以保留更多的语义特征,适用于规则多、规模大的平台日志数据,获取更高的检测精度,提高了模型的训练效率。

    一种层级对齐结构的问答立场检测方法及装置

    公开(公告)号:CN113127599A

    公开(公告)日:2021-07-16

    申请号:CN202110230676.X

    申请日:2021-03-02

    Abstract: 本发明公开了一种层级对齐结构的问答立场检测方法及装置,包括:分别将问题文本与回答文本转换为问题序列与回答序列;拼接问题序列与回答序列,得到问题回答序列;将问题序列、回答序列及问题回答序列输入层次对齐模型,得到问答立场检测结果。本发明的层次对齐模型,先使用了BERT预训练模型得到粗粒度的立场表示,然后从QA对中的问题和回答两方面进行了概念级别的目标对齐和证据级别的信息对齐,得到了由粗到精的立场表示,从而在问答立场检测任务上可以获得更高的准确率和F1值。

    一种基于对抗学习和非对称哈希的跨模态检索方法

    公开(公告)号:CN110222140B

    公开(公告)日:2021-07-13

    申请号:CN201910323769.X

    申请日:2019-04-22

    Abstract: 本发明公开了一种基于对抗学习和非对称哈希的跨模态检索方法,其步骤包括:1)选取一跨模态数据集并将其划分为训练集和测试集;对模型进行训练,该模型包括一损失模块、特征提取单元和哈希码学习单元;哈希码学习单元包括哈希码学习网络和一个共享的多标签二值矩阵,损失模块包含特征提取单元的对抗损失,哈希码学习单元的三元边距损失、余弦量化损失和非对称哈希损失;2)利用训练的最优模型,生成跨模态数据集中每一模态数据的二值哈希码;3)对于一给定的查询数据,首先生成二值哈希码,然后计算该查询数据的二值哈希码与该跨模态数据集中与该查询数据模态不同的模态数据的二值哈希码之间计算汉明距离,得到满足条件的跨模态数据实例。

    一种基于实时查询的数据交互方法及装置

    公开(公告)号:CN112650915A

    公开(公告)日:2021-04-13

    申请号:CN202011375913.3

    申请日:2020-11-30

    Abstract: 本发明提供一种基于实时查询的数据交互方法及装置,包括:解析接收的客户端数据查询请求,判断所述客户端数据查询请求为长查询或短查询;若为长查询,则依据生成的查询记录对数据库进行查询,并将长查询结果存储至分布式文件系统中;若为短查询,则通过转换得到的系统sql语句对数据库进行查询,得到短查询结果;将获取的长查询结果或短查询结果返回至客户端。本发明支持短查询和长查询两种不同的请求方式,可以根据业务的紧急程度做不同速度的处理;短查询可以跳过中间系统直接访问数据源并返回结果数据,以达到更快的速度;长查询的结果以较小单位依次返回给请求方达到更高的时效性。

    基于迭代图注意力网络的用户兴趣预测方法及电子装置

    公开(公告)号:CN112380427A

    公开(公告)日:2021-02-19

    申请号:CN202011159408.5

    申请日:2020-10-27

    Abstract: 本发明公开了一种基于迭代图注意力网络的用户兴趣预测方法及电子装置,通过未知兴趣标签分布与兴趣标签联合依赖概率,将用户特征学习的图注意力网络GATθ与兴趣潜在关系建模的图注意力网络 相结合,并引入标签传播机制捕捉兴趣标签的局部依赖关系,对用户网络中的各用户兴趣进行预测。本发明,弥补了目前主流的用户兴趣预测方法对兴趣潜在关系建模的空缺,充分利用用户社交关系数据,预测准确率更高,并且高效快捷。

    一种基于联邦学习的受控共享学习方法及系统

    公开(公告)号:CN112348200A

    公开(公告)日:2021-02-09

    申请号:CN202011203717.8

    申请日:2020-11-02

    Abstract: 本发明提供一种基于联邦学习的受控共享学习方法及系统,包括接收各客户端模型Vi,t的参数,并根据参数从各客户端中选取一或多个共享客户端,向共享的客户端发送共享指令,其中模型Vi,0通过各客户端的算力构建并依据相应私有数据集训练得到,且各模型Vi,0的分类模块结构一致;获取共享客户端模型Vi,t的分类模块参数St,并将计算得到的分类模块参数St+1发送至各客户端,以使各客户端依据私有数据集与分类模块参数St+1得到模型Vi,t+1。本发明仅需提供模型部分参数完成共享学习,使数据安全得到了很好的保障;且各客户端模型、是否参与共享学习等都自主可控。

    一种基于搜索引擎返回结果的谣言检测方法及电子装置

    公开(公告)号:CN112256861A

    公开(公告)日:2021-01-22

    申请号:CN202010929737.7

    申请日:2020-09-07

    Abstract: 本发明提供一种基于搜索引擎返回结果的谣言检测方法及电子装置,包括:依据一原文的内容,检索得到若干文档及相应发布来源,并从每一所述文档中选取若干单词组成一证据文档;拼接原文、原文发布人与每一证据文档及相应发布来源,得到一文本集合,并将所述文本集合输入到预训练语言模型,得到原文和证据文档之间的相关性特征;依据相关性特征对原文进行分类,判断原文是否为谣言。本发明未使用特征工程和领域知识,从外部证据文章中捕获对谣言检测有帮助的词句,训练数据获得难度极低,准确率优于现有方法。

    一种GPU上的候选口令生成及应用破解方法

    公开(公告)号:CN112199214A

    公开(公告)日:2021-01-08

    申请号:CN202011089941.9

    申请日:2020-10-13

    Abstract: 本发明公开了一种GPU上的候选口令生成及应用破解方法。口令生成方法包括:1)根据目标需求创建破解任务,设置破解空间大小N1;2)对训练集进行处理,得到上下文无关文法和规则概率;3)根据上下文无关文法计算出可生成的最大候选口令数目N2,确定破解任务生成的总候选口令数目N=MIN(N1,N2);然后根据N以及GPU性能确定每次核函数生成的候选口令数、开启的线程总数以及为运行核函数分配所需要GPU上的内存空间;4)核函数根据上下文无关文法和本次核函数生成候选口令数目,确定本次核函数处理的基础语法规则表中的基础语法结构,并利用GPU来生成符合文法要求的候选口令;5)返回第4步直到生成所有候选口令。

    一种多方参与数据不共享的网络模型训练方法

    公开(公告)号:CN112163238A

    公开(公告)日:2021-01-01

    申请号:CN202010940180.7

    申请日:2020-09-09

    Abstract: 本发明公开了一种多方参与数据不共享的网络模型训练方法,其步骤包括:1)参与数据共享的各参与方利用所选隐私数据集训练各自所选网络模型,分别得到一教师网络模型;2)采用步骤a)~b)对学生网络模型S进行多轮训练,得到最终的公开网络模型M;a)选出一个教师网络模型Ti指导学生网络模型S更新:首先将训练数据Xi输入模型Ti,得到标签 在中加入噪声N得到Yi,将Xi输入学生网络模型S,输出S(Xi);然后最小化S(Xi)与Yi之间的相似距离训练学生网络模型S;b)利用学生网络模型S对公开的未标记数据进行部分标记,然后使用部分标注的数据通过半监督知识蒸馏的方法将学生网络模型S中的知识蒸馏到一公开网络模型M中。

Patent Agency Ranking