-
公开(公告)号:CN110717801A
公开(公告)日:2020-01-21
申请号:CN201810768395.8
申请日:2018-07-13
Applicant: 珠海格力电器股份有限公司
Abstract: 本申请公开了一种商品信息推送方法及装置,方法包括:接收到搜索一商品的搜索关键词,搜索与所述关键词对应的至少一个网络页面;提取所述至少一个网络页面中所包含的网络链接形成链接集合;对所述链接集合中的各网络链接进行数据访问,获取每个网络链接所对应网络页面中的商品描述信息形成商品信息集合;按照预设的信息显示格式在一个网络页面中向用户推送所述商品信息集合中的所述商品描述信息。解决了现有技术中网络信息采集获取到的数据容易存在乱码或抓取到的信息混乱的技术问题。
-
公开(公告)号:CN115658291A
公开(公告)日:2023-01-31
申请号:CN202211211726.0
申请日:2022-09-30
Applicant: 珠海格力电器股份有限公司 , 珠海联云科技有限公司
Abstract: 本申请涉及一种数据仓库的资源配额调整方法、装置、设备及介质,其中,方法包括:监测目标数据仓库对预期配额的实际使用配额,其中,预期配额为预先为目标数据仓库初始化的服务器集群资源的资源配额;在实际使用配额达到预期配额的目标负载阈值的情况下,确定与目标负载阈值匹配的目标调整策略;按照目标调整策略对目标数据仓库的预期配额进行调整。通过监控实际使用配额与目标负载阈值的关系来及时调整预期配额,解决了预期配额调整不及时的问题。
-
公开(公告)号:CN115550344A
公开(公告)日:2022-12-30
申请号:CN202210987119.7
申请日:2022-08-17
Applicant: 珠海格力电器股份有限公司 , 珠海联云科技有限公司
IPC: H04L67/06
Abstract: 本申请提供的一种文件下载方法、装置、电子设备及存储介质,通过所述变量词和所述请求参数向所述文件搜索接口发出第一搜索请求,然后获取所述文件搜索接口返回的搜索结果,基于搜索结果的个数和各个文件的下载链接发送请求,以获取各个下载链接对应的响应信息,所述响应信息包括所述待下载文件的文件内容;将所述文件内容进行下载,能够实现文件的批量下载,提高文件下载效率和准确性。
-
公开(公告)号:CN111400462A
公开(公告)日:2020-07-10
申请号:CN201910002488.4
申请日:2019-01-02
Applicant: 珠海格力电器股份有限公司
IPC: G06F16/332 , G06F40/211
Abstract: 本发明公开了一种问答机器人训练方法,其包括:对由多个训练样本组成的语义相似度训练数据集进行训练,根据训练样本中的两个训练语句的相似度与所述两个训练语句的相似度标签的交叉熵损失来更新所述训练样本的样本权重,其中,每个训练样本包括了两个不同的训练语句以及对两个训练语句设置的相似度标签和样本权重。本发明的问答机器人训练方法可提高问答机器人的答题匹配度。本发明还公开了一种问答机器人训练系统和问答机器人。
-
公开(公告)号:CN110874528A
公开(公告)日:2020-03-10
申请号:CN201810910162.7
申请日:2018-08-10
Applicant: 珠海格力电器股份有限公司
IPC: G06F40/211 , G06F40/284
Abstract: 本申请提供了一种文本相似度的获取方法及装置,其中,该方法包括:针对待测试与目标文本的相似度的待测试文本,获取待测试文本的句子的第二主干词,以及获取目标文本的句子的第一主干词;依据第二主干词和第一主干词确定待测试文本的第二向量和目标文本的第一向量,依据所述第二向量和所述第一向量,确定待测试文本和目标文本的相似度。采用上述技术方案,依据主干词的文本向量确定文本之间的相似度,保证了对比结果的真实有效性,提供了测试准确率,解决了相关技术中计算文本相似度准确率较低的问题。
-
公开(公告)号:CN110874434A
公开(公告)日:2020-03-10
申请号:CN201811010439.7
申请日:2018-08-31
Applicant: 珠海格力电器股份有限公司
IPC: G06F16/9535
Abstract: 本申请涉及网页数据采集方法、装置、存储介质及电子设备,属于网页数据采集技术领域。本申请获取第一网址集合;对第一网址集合中的网址进行清理,以得到第二网址集合;根据第二网址集合对网页数据进行采集。使得采集到的数据中的多余数据得到有效降低,进而有助于减轻对采集到的数据的清洗压力。
-
公开(公告)号:CN119719363A
公开(公告)日:2025-03-28
申请号:CN202411915526.2
申请日:2024-12-24
Applicant: 珠海格力电器股份有限公司 , 珠海联云科技有限公司
IPC: G06F16/34 , G06F18/22 , G06F40/194
Abstract: 本发明公开了一种文本生成方法、装置、设备和存储介质,包括:生成原始文本中各句子的句子向量,以及原始文本向量;基于各句子的句子向量的权重以及预设的选择条件,从原始文本中选择多个句子形成第一文本,并生成第一文本的第一文本向量;计算第一相似度;对原始文本中各句子的句子向量进行分簇,生成每一簇的句子向量对应的簇向量,并计算第二相似度;基于第一相似度、第二相似度,从原始文本中选择多个句子,形成摘要文本。本申请公开的文本生成方法、装置、设备和存储介质,解决了现有的文本分析系统所生成的文本摘要结果的精准度较差的问题,使得提高了摘要文本的精准度,以减少在生成摘要文本时忽略掉某些有效数据的情况的发生概率。
-
公开(公告)号:CN111221975B
公开(公告)日:2021-12-14
申请号:CN201811420222.3
申请日:2018-11-26
Applicant: 珠海格力电器股份有限公司
IPC: G06F16/36
Abstract: 本申请涉及一种字段提取方法、装置及计算机存储介质,所述方法包括以下步骤:获取待提取文件中的目标文本,得到包含有至少一个目标文本的目标文本集合;利用对应的训练模型和字段规则提取所述目标文件的目标字段,得到包含有至少一个所述目标字段的目标字段集合。本申请,结合了自定义的字段规则和训练模型来实现目标文件中的目标字段的提取,综合了自定义的字段规则的准确度高和训练模型的泛化能力强的优点,不仅提高了目标字段的提取准确度,而且还具有较高的通用性。
-
公开(公告)号:CN112528116A
公开(公告)日:2021-03-19
申请号:CN201910882453.4
申请日:2019-09-18
Applicant: 珠海格力电器股份有限公司 , 珠海联云科技有限公司
IPC: G06F16/951 , G06F16/9538
Abstract: 本发明公开了一种信息管理方法存储介质,通过获得预设的外部网站的网站内容信息,为所述网站内容信息分配内部网站的网址,并在内部网站对所述网站内容信息及其对应的内部网站的网址向指定类型的用户进行展示,解决了现有技术中在不能直接接入外部网站的情况下,内部网站的用户不能获取预设的外部网站的网站内容信息的问题,实现了能够将获得的预设的外部网站的网站内容信息在内部网站进行展示的目的。
-
公开(公告)号:CN110874528B
公开(公告)日:2020-11-10
申请号:CN201810910162.7
申请日:2018-08-10
Applicant: 珠海格力电器股份有限公司
IPC: G06F40/211 , G06F40/284
Abstract: 本申请提供了一种文本相似度的获取方法及装置,其中,该方法包括:针对待测试与目标文本的相似度的待测试文本,获取待测试文本的句子的第二主干词,以及获取目标文本的句子的第一主干词;依据第二主干词和第一主干词确定待测试文本的第二向量和目标文本的第一向量,依据所述第二向量和所述第一向量,确定待测试文本和目标文本的相似度。采用上述技术方案,依据主干词的文本向量确定文本之间的相似度,保证了对比结果的真实有效性,提供了测试准确率,解决了相关技术中计算文本相似度准确率较低的问题。
-
-
-
-
-
-
-
-
-