-
公开(公告)号:CN113688310A
公开(公告)日:2021-11-23
申请号:CN202110839324.4
申请日:2021-07-23
Applicant: 北京中科闻歌科技股份有限公司 , 国家计算机网络与信息安全管理中心 , 国科智安(北京)科技有限公司
IPC: G06F16/9535 , G06Q50/00
Abstract: 本公开涉及一种内容推荐方法、装置、设备及存储介质。该方法包括:获取多媒体内容,确定多媒体内容的推荐度影响参数,推荐度影响参数包括互动热度和内容热度,互动热度用于表征针对多媒体内容的互动程度,内容热度用于表征多媒体内容所属的目标主题的受关注程度,基于推荐度影响参数,确定多媒体内容的目标推荐度,在目标推荐度大于或等于预设推荐度阈值的情况下,将多媒体内容推荐至目标用户。根据本公开实施例,提高目标用户对所推荐的多媒体内容感兴趣的可能性,从而提高内容推荐的准确性。
-
公开(公告)号:CN112685204A
公开(公告)日:2021-04-20
申请号:CN202011593204.2
申请日:2020-12-29
Applicant: 北京中科闻歌科技股份有限公司 , 北京中科闻歌智安科技有限公司 , 深圳中科闻歌科技有限公司
Abstract: 本申请涉及一种基于异常检测的社交机器人检测方法及装置,其中方法包括:在目标数据源中,筛选得到满足预设数量要求,且对应于目标类别的待检测信息;通过确定发布各个所述待检测信息的账户,得到每个所述账户对应的待检测信息集;根据所述待检测信息集,确定所述账户对应的行为特征信息;采用预设异常检测算法对所述行为特征信息进行异常检测,确定所有行为特征信息中的异常行为特征信息;基于异常行为特征信息确定所有账户中的社交机器人账户。通过本实施例中的方法,只依赖于筛选得到的待检测信息即可快速确定社交机器人账户,相对于人工筛选,可以有效提高处理效率以及准确率。
-
公开(公告)号:CN112613324A
公开(公告)日:2021-04-06
申请号:CN202011596697.5
申请日:2020-12-29
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司 , 北京中科闻歌智安科技有限公司
Abstract: 本申请涉及一种语义情绪识别方法、装置、设备及存储介质,所述方法包括:获取待识别文本,然后对待识别文本的全局语义信息进行提取,得到第一语义向量,再利用预训练的词向量模型确定待识别文本的词向量矩阵,之后根据词向量矩阵确定第二语义向量,根据词向量矩阵计算待识别文本中每个词的词向量与预设情绪词语的词向量的相似度,并将计算得到的所有相似度确定为第三语义向量,最后根据第一语义向量、第二语义向量和第三语义向量确定待识别文本所属的情绪类别,如此,便可以根据待识别文本的全局语义信息以及待识别文本的词向量矩阵确定待识别文本的情绪类别,考虑了待识别文本的词语义、词组语义以及句子语义信息,提高了情绪识别的准确性。
-
公开(公告)号:CN112364641A
公开(公告)日:2021-02-12
申请号:CN202011259475.4
申请日:2020-11-12
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司 , 北京中科闻歌智安科技有限公司
IPC: G06F40/284 , G06F40/166
Abstract: 本申请涉及一种面向文本审核的中文对抗样本生成方法及装置,其中方法包括:获取待处理语句信息;对待处理语句信息进行分词,得到多个词语;确定词语的第一重要性信息;获取各个词语对应的扰动词语;根据第一重要性信息,依次得到将待处理语句信息中各个词语替换为对应的扰动词语后的扰动语句信息;在确定扰动语句信息满足预设条件时,根据扰动语句信息得到对待处理语句信息攻击成功后的对抗样本。通过本实施例中的方法可以实现对待处理语句进行词语替换的方式得到对抗样本,进而可以增加用于对预测模型进行训练的样本的多样性,同时可以通过自动生成对抗样本,提升训练数据获取的便利性,提升模型训练的效率。
-
公开(公告)号:CN112329470A
公开(公告)日:2021-02-05
申请号:CN202011241374.4
申请日:2020-11-09
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司 , 北京中科闻歌智安科技有限公司
IPC: G06F40/295 , G06F40/226 , G06N3/08
Abstract: 本申请提供了一种基于端到端模型训练的智能地址识别方法及装置,属于计算机技术领域。本申请通过获取训练数据集,所述训练数据集包括多个地址文本数据及每个所述地址文本数据对应的验证数据;针对每个地址文本数据,生成所述地址文本数据对应的字符嵌入向量序列;将所述字符嵌入向量序列输入至第一级子模型;将每一级子模型的输出数据与所述验证数据比较,得到多个误差;根据所述多个误差调整所述地址文本识别模型的参数,直至所述地址文本识别模型收敛时,训练结束。通过本申请,可以将多个级联的子模型产生的多个误差,作为依据以调整地址文本识别模型的参数,减少多个级联子模型的整体误差,避免了多个子模型之间的误差累积。
-
公开(公告)号:CN119849624A
公开(公告)日:2025-04-18
申请号:CN202411916261.8
申请日:2024-12-24
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06N5/04 , G06F18/25 , G06N3/0455 , G06N3/0464 , G06N3/0475
Abstract: 本申请涉及一种基于多模态情感的大模型对话方法、装置、设备及介质,尤其涉及自然语言处理技术领域。包括:接收用户的多模态输入,并对多模态输入进行多模态情感分析得到多模态情感表征;将多模态情感表征和当前对话上下文输入情感生成网络,得到情感生成网络输出的当前情感倾向;基于当前情感倾向对历史情感倾向进行更新,得到目标情感倾向;将目标情感倾向和当前对话上下文输入解码器,得到解码器输出的情感回复内容。本申请实施例提升了情感理解的准确性,适应于用户情感波动,能够生成连贯且一致的情感回复内容。
-
公开(公告)号:CN119848168A
公开(公告)日:2025-04-18
申请号:CN202411916262.2
申请日:2024-12-24
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/31 , G06F16/3329 , G06F16/36 , G06F16/3332 , G06F16/334 , G06F16/901 , G06N5/022
Abstract: 本申请实施例公开了一种基于大语言模型和知识图谱的检索生成方法及装置,可解决检索语义关联性弱、召回数据缺乏全局性知识的问题。该方法包括:对预设的多个领域文档进行向量解析,构建向量数据库;根据多个领域文档中提取出的实体描述信息和关系描述信息,构建知识图谱,并将知识图谱存储到图数据库中;对用户输入的目标问题进行特征提取,得到目标问题对应的多维度关键词;通过预设搜索引擎、向量数据库以及图数据库,对多维度关键词进行检索,得到目标检索结果;根据目标检索结果,确定目标输入信息,并将目标输入信息输入到目标语言模型中,得到目标输出响应信息。
-
公开(公告)号:CN119761336A
公开(公告)日:2025-04-04
申请号:CN202411820053.8
申请日:2024-12-11
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/194 , G06F40/16 , G06N5/04 , G06N3/045 , G06N3/0475 , G06F18/25
Abstract: 本发明提供了一种图表问答模型的综合评测方法、设备及介质,涉及数据处理技术领域,方法根据预设图表问答任务类型列表和目标图表类型列表,获取初始图表数据列表集合的总集,根据初始图表数据、初始图表数据对应的预设图表问答任务类型的定义文本和目标多模态大模型,获取初始图表数据对应的问题文本列表和问题文本对应的标准答案文本,根据多线程处理方式、预设配置文件和图表问答模型,并行获取问题文本对应的目标答案文本,根据问题文本对应的标准答案文本和目标答案文本,获取图表问答模型对应的人工评分和自动评分,用于评测图表问答模型,能够评估多种图表问答任务类型的情况下图表问答模型的输出结果的准确性,可以满足用户的多样化需求。
-
公开(公告)号:CN119761333A
公开(公告)日:2025-04-04
申请号:CN202411891714.6
申请日:2024-12-20
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/186 , G06F40/194 , G06F40/30 , G06F18/214
Abstract: 本公开涉及一种基于大语言模型的公平竞争审查方法、装置、设备及介质。其中,基于大语言模型的公平竞争审查方法包括:获取待审文档;基于所述待审文档确定参考案例,并获取目标审查条例;根据预设指令模板,对所述待审文档、所述参考案例和所述目标审查条例进行处理,生成目标模型指令;对所述目标模型指令进行审查处理,得到对应的审查结论。根据本公开实施例,能够提高处理文档的判断准确性和可靠性,提供更为全面和深刻的审查结果。
-
公开(公告)号:CN119692335A
公开(公告)日:2025-03-25
申请号:CN202411760336.8
申请日:2024-12-03
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/205 , G06F18/2431 , G06V30/41
Abstract: 本发明提供了一种基于多模型的PDF解析方法、电子设备和存储介质,方法包括利用规则提取、版面分析、表格识别、公式检测、公式识别、多模态大模型chart2text、多模态大模型段落排序等方法获取复杂PDF中可能出现的所有元素类型。本发明能够实现复杂PDF的完整结构化解析以及支持扫描件和非扫描件。
-
-
-
-
-
-
-
-
-