一种商品信息推送方法及装置

    公开(公告)号:CN110717801A

    公开(公告)日:2020-01-21

    申请号:CN201810768395.8

    申请日:2018-07-13

    Abstract: 本申请公开了一种商品信息推送方法及装置,方法包括:接收到搜索一商品的搜索关键词,搜索与所述关键词对应的至少一个网络页面;提取所述至少一个网络页面中所包含的网络链接形成链接集合;对所述链接集合中的各网络链接进行数据访问,获取每个网络链接所对应网络页面中的商品描述信息形成商品信息集合;按照预设的信息显示格式在一个网络页面中向用户推送所述商品信息集合中的所述商品描述信息。解决了现有技术中网络信息采集获取到的数据容易存在乱码或抓取到的信息混乱的技术问题。

    问答机器人训练方法、系统及问答机器人

    公开(公告)号:CN111400462A

    公开(公告)日:2020-07-10

    申请号:CN201910002488.4

    申请日:2019-01-02

    Abstract: 本发明公开了一种问答机器人训练方法,其包括:对由多个训练样本组成的语义相似度训练数据集进行训练,根据训练样本中的两个训练语句的相似度与所述两个训练语句的相似度标签的交叉熵损失来更新所述训练样本的样本权重,其中,每个训练样本包括了两个不同的训练语句以及对两个训练语句设置的相似度标签和样本权重。本发明的问答机器人训练方法可提高问答机器人的答题匹配度。本发明还公开了一种问答机器人训练系统和问答机器人。

    文本相似度的获取方法及装置

    公开(公告)号:CN110874528A

    公开(公告)日:2020-03-10

    申请号:CN201810910162.7

    申请日:2018-08-10

    Abstract: 本申请提供了一种文本相似度的获取方法及装置,其中,该方法包括:针对待测试与目标文本的相似度的待测试文本,获取待测试文本的句子的第二主干词,以及获取目标文本的句子的第一主干词;依据第二主干词和第一主干词确定待测试文本的第二向量和目标文本的第一向量,依据所述第二向量和所述第一向量,确定待测试文本和目标文本的相似度。采用上述技术方案,依据主干词的文本向量确定文本之间的相似度,保证了对比结果的真实有效性,提供了测试准确率,解决了相关技术中计算文本相似度准确率较低的问题。

    文本生成方法、装置、设备和存储介质

    公开(公告)号:CN119719363A

    公开(公告)日:2025-03-28

    申请号:CN202411915526.2

    申请日:2024-12-24

    Abstract: 本发明公开了一种文本生成方法、装置、设备和存储介质,包括:生成原始文本中各句子的句子向量,以及原始文本向量;基于各句子的句子向量的权重以及预设的选择条件,从原始文本中选择多个句子形成第一文本,并生成第一文本的第一文本向量;计算第一相似度;对原始文本中各句子的句子向量进行分簇,生成每一簇的句子向量对应的簇向量,并计算第二相似度;基于第一相似度、第二相似度,从原始文本中选择多个句子,形成摘要文本。本申请公开的文本生成方法、装置、设备和存储介质,解决了现有的文本分析系统所生成的文本摘要结果的精准度较差的问题,使得提高了摘要文本的精准度,以减少在生成摘要文本时忽略掉某些有效数据的情况的发生概率。

    一种字段提取方法、装置及计算机存储介质

    公开(公告)号:CN111221975B

    公开(公告)日:2021-12-14

    申请号:CN201811420222.3

    申请日:2018-11-26

    Abstract: 本申请涉及一种字段提取方法、装置及计算机存储介质,所述方法包括以下步骤:获取待提取文件中的目标文本,得到包含有至少一个目标文本的目标文本集合;利用对应的训练模型和字段规则提取所述目标文件的目标字段,得到包含有至少一个所述目标字段的目标字段集合。本申请,结合了自定义的字段规则和训练模型来实现目标文件中的目标字段的提取,综合了自定义的字段规则的准确度高和训练模型的泛化能力强的优点,不仅提高了目标字段的提取准确度,而且还具有较高的通用性。

    文本相似度的获取方法及装置

    公开(公告)号:CN110874528B

    公开(公告)日:2020-11-10

    申请号:CN201810910162.7

    申请日:2018-08-10

    Abstract: 本申请提供了一种文本相似度的获取方法及装置,其中,该方法包括:针对待测试与目标文本的相似度的待测试文本,获取待测试文本的句子的第二主干词,以及获取目标文本的句子的第一主干词;依据第二主干词和第一主干词确定待测试文本的第二向量和目标文本的第一向量,依据所述第二向量和所述第一向量,确定待测试文本和目标文本的相似度。采用上述技术方案,依据主干词的文本向量确定文本之间的相似度,保证了对比结果的真实有效性,提供了测试准确率,解决了相关技术中计算文本相似度准确率较低的问题。

Patent Agency Ranking