生成广告脚本的方法和装置以及存储介质

    公开(公告)号:CN119444317A

    公开(公告)日:2025-02-14

    申请号:CN202310946739.0

    申请日:2023-07-28

    Inventor: 高玥 张姝 孙俊

    Abstract: 公开了生成广告脚本的方法和装置以及存储介质。该方法包括:由大型语言模型接收用户的第一提示语,并且基于第一提示语生成任务列表,所述任务列表包括多个步骤的描述内容,所述多个步骤至少与识别产品的特点和优势有关;基于从所述多个步骤的描述内容中提取的关键字在网络上搜索与产品有关的信息,并且利用搜索到的信息建立本地知识库;由大型语言模型接收来自本地知识库的内容,并且基于所接收的内容生成报告,所述报告至少包含产品的特点和优势;由大型语言模型基于所述报告生成产品的广告脚本。

    基于神经网络的语言模型训练方法和装置

    公开(公告)号:CN108694443B

    公开(公告)日:2021-09-17

    申请号:CN201710217479.8

    申请日:2017-04-05

    Abstract: 本发明涉及基于神经网络的语言模型训练方法和装置。该方法包括:针对训练集中的每一个目标词,利用噪声生成网络生成目标词特征和噪声词特征,其中,目标词特征和噪声词特征具有各自对应的类别标签;利用上下文神经网络提取目标词的上下文特征;将目标词特征、噪声词特征以及上下文特征构成训练样本输入二分类器;迭代更新噪声生成网络的参数和上下文神经网络的参数,直到二分类器的预测误差接近预定值时停止更新;以及用训练得到的上下文神经网络作为语言模型。根据本发明的方法和装置可以训练得到一种收敛速度较快同时泛化能力较好的语言模型。

    训练人工智能模型的方法和装置

    公开(公告)号:CN113128544A

    公开(公告)日:2021-07-16

    申请号:CN202010043527.8

    申请日:2020-01-15

    Inventor: 高玥 张姝 孙俊

    Abstract: 公开了训练人工智能模型的方法和装置。该模型用于处理张量数据并且输出指示多种类别之一的分类结果,张量数据包括多个元素,每个元素包括多个特征。该训练方法包括:对张量数据进行分解以获得核心张量;基于核心张量执行第一解释算法,以确定每个元素对于每种类别的贡献分,其中,贡献分表示该元素对于该类别被确定为分类结果的贡献程度;在多个元素中选择贡献分大于阈值的元素;针对所选择的每一个元素,利用第二解释算法来确定该元素中的每个特征对于每种类别的重要性分数;基于重要性分数来选择特征,并且基于所选择的特征来构建张量数据训练样本;利用构建的张量数据训练样本来训练该模型。

    信息处理方法和基于文本生成图像的装置

    公开(公告)号:CN108959322A

    公开(公告)日:2018-12-07

    申请号:CN201710379515.0

    申请日:2017-05-25

    CPC classification number: G06K9/6256

    Abstract: 本发明公开了信息处理方法和基于文本生成图像的装置。所述方法包括:从样本文本中提取表征样本文本中的词之间的关联性的文本特征;以尺寸变化的窗口来选择性地截取文本特征的各个局部,以得到各个局部文本特征;基于样本文本的各个局部文本特征和与样本文本对应的样本图像来训练图像生成模型,其中,图像生成模型包括编码器模块和解码器模块,训练后的图像生成模型中的解码器模块根据所输入的文本的各个局部文本特征来迭代地生成与所输入的文本对应的图像,并且各个局部文本特征分别在各次迭代中截取。

    信息处理方法和装置以及信息检测方法和装置

    公开(公告)号:CN108875758A

    公开(公告)日:2018-11-23

    申请号:CN201710320880.4

    申请日:2017-05-09

    Abstract: 公开了一种信息处理方法和装置以及信息检测方法和装置,其中信息处理方法包括:从多个样本图像中的每个样本图像提取具有预定宽度和预定高度的一组特征图,其中,一组特征图中的特征图分别与不同的图像特征相对应;以及基于所提取的一组特征图和为多个样本图像标记的文字描述来训练文字描述模型,文字描述模型用于根据输入图像生成相应文字描述,其中,训练文字描述模型包括基于一组特征图和循环神经网络模型的前一状态向量,计算一组特征图上的关注窗口的中心和大小。根据本公开的实施例,能够产生图像的更合适的文字描述。

    基于语义表示模型来生成词向量的方法、装置和电子设备

    公开(公告)号:CN108228554A

    公开(公告)日:2018-06-29

    申请号:CN201611128785.6

    申请日:2016-12-09

    Inventor: 张姝 孙俊

    Abstract: 本申请的实施例提供一种基于语义表示模型来生成词向量的方法、装置和电子设备,该方法通过对源语言和目标语言的隐含状态值进行均值匹配来构建语义表示模型的损失函数,并且,在基于损失函数而调整语义表示模型的过程中,能够在双语共享的K维词向量空间中,分别得到源语言的词向量和目标语言的词向量,从而使得语义接近的源语言的词语与目标语言的词语所对应的词向量也彼此接近。根据本申请实施例,无需借助于跨语言监督,就能够实现源语言和目标语言的跨语言表示。

    自然语言深度学习系统和方法

    公开(公告)号:CN107402914A

    公开(公告)日:2017-11-28

    申请号:CN201610341719.0

    申请日:2016-05-20

    Inventor: 杨铭 张姝 孙俊

    Abstract: 本发明涉及自然语言深度学习系统和方法。该系统包括:误差计算单元,其被配置成在对自然语言深度学习系统进行训练时,根据基于样本对的损失函数来计算样本的误差值,损失函数为相似度损失函数与类别损失函数的组合,其中,相似度损失函数基于如下准则来定义:当样本对的真实类别相同时,其类别预测向量值之间的差别应当较小,而当样本对的真实类别不同时,其类别预测向量值之间的差别应当较大,类别损失函数基于样本对的类别误差来定义。在该系统中,基于样本对设计损失函数,减少了基于样本对损失学习的代价。

    对实体词的语义关系进行分类的方法和装置

    公开(公告)号:CN107305543A

    公开(公告)日:2017-10-31

    申请号:CN201610258308.5

    申请日:2016-04-22

    Inventor: 杨铭 张姝 孙俊

    CPC classification number: G06F17/2785

    Abstract: 本发明涉及对实体词的语义关系进行分类的方法和装置。该方法包括:基于句子中的每个词以及其相对于两个实体词的位置权重来生成待分类向量;用预定的方向分类特征参数和预定的类型分类特征参数分别与待分类向量相乘,用非线性激活函数对各自的乘积分别进行非线性变换,从而生成方向分类特征和类型分类特征;以及根据方向分类特征和类型分类特征,利用预先存储的分类模型来确定两个实体词之间的语义关系方向和语义关系类型。

    对实体词的语义关系进行分类的方法和装置

    公开(公告)号:CN106407211A

    公开(公告)日:2017-02-15

    申请号:CN201510459760.3

    申请日:2015-07-30

    Inventor: 张姝 杨铭 孙俊

    CPC classification number: G06F16/36 G06F16/35 G06F17/2785

    Abstract: 本发明涉及对实体词的语义关系进行分类的方法和装置。该方法包括:通过将句子中的每个词用词向量表示来构建第一矩阵,将第一矩阵中的实体词的向量进行连接以得到第一实体词向量;对第一矩阵利用深度学习模型进行处理得到第二矩阵,将第二矩阵中的实体词的向量进行连接以得到第二实体词向量;对第二矩阵进行池化处理来得到句子级特征;将第一实体词向量与第二实体词向量进行连接得到词汇级特征;以及将句子级特征和词汇级特征进行连接得到的向量作为待分类向量输入预先存储的分类模型来确定实体词之间的语义关系。根据本发明,提供了一种更有效的对实体词的语义关系进行分类的方法和装置。

    获取装置、获取方法、训练装置以及检测装置

    公开(公告)号:CN105989047A

    公开(公告)日:2016-10-05

    申请号:CN201510060916.0

    申请日:2015-02-05

    Inventor: 张姝 孟遥

    Abstract: 本公开提供了获取装置、获取方法、训练装置以及检测装置。用于获得用户的属性信息的获取装置包括:第一信息获取单元,其基于用户的用户简档中的结构化信息获得用户的第一属性信息;以及第二信息获取单元,其基于用户发布的内容中的非结构化信息获得用户的第二属性信息,其中,第二信息获取单元被配置为在用户发布的内容中搜索与至少一个关键词相似的近似词,以获得用户的第二属性信息,其中,关键词是通过下述迭代过程获得的:在给定语料中搜索与预设触发词相似的近似词,作为新的触发词,再在给定语料中搜索与新的触发词相似的近似词,重复上述迭代过程,直到达到预设的迭代停止条件为止,并将所有得到的近似词连同预设触发词一起作为关键词。

Patent Agency Ranking