-
公开(公告)号:CN112685204B
公开(公告)日:2024-03-05
申请号:CN202011593204.2
申请日:2020-12-29
Applicant: 北京中科闻歌科技股份有限公司 , 国科智安(北京)科技有限公司 , 深圳中科闻歌科技有限公司
Abstract: 本申请涉及一种基于异常检测的社交机器人检测方法及装置,其中方法包括:在目标数据源中,筛选得到满足预设数量要求,且对应于目标类别的待检测信息;通过确定发布各个所述待检测信息的账户,得到每个所述账户对应的待检测信息集;根据所述待检测信息集,确定所述账户对应的行为特征信息;采用预设异常检测算法对所述行为特征信息进行异常检测,确定所有行为特征信息中的异常行为特征信息;基于异常行为特征信息确定所有账户中的社交机器人账户。通过本实施例中的方法,只依赖于筛选得到的待检测信息即可快速确定社交机器人账户,相对于人工筛选,可以有效提高处理效率以及准确率。
-
公开(公告)号:CN115718835A
公开(公告)日:2023-02-28
申请号:CN202211370652.5
申请日:2022-11-03
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC: G06F16/9535 , G06F17/16
Abstract: 本申请涉及一种破除信息茧房问题的冷启动个性化推荐方法及装置,其中,方法包括:在目标账号的使用阶段处于冷启动阶段的情况下,确定与目标账号的用户行为相似度达到第一阈值的对照账号;利用对照账号的对照兴趣矩阵确定目标账号的目标兴趣矩阵;利用目标兴趣矩阵在预设内容池中确定候选推荐集;利用量化因子对候选推荐集中的特征相关度进行权重调整,得到各个候选推荐数据的推荐指数;将推荐指数达到第二阈值的候选推荐数据确定为目标推荐数据,并将目标推荐数据推送给目标账号。通过对照账号来预测用户账号的兴趣矩阵,然后用兴趣矩阵选出候选推荐集,最后结合目标账号的浏览记录确定推荐数据,解决了为冷启动阶段用户推荐的内容趋于同质化的问题。
-
公开(公告)号:CN115270807A
公开(公告)日:2022-11-01
申请号:CN202210764771.2
申请日:2022-06-29
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种网络用户的情感倾向判定方法、装置、设备及存储介质,其中方法包括:获取网络用户对目标事件评论的第一评论信息,以及对象对所述目标事件的第二评论信息;根据所述第一评论信息构建所述目标事件的知识图谱;基于所述知识图谱对所述第二评论信息进行情感分析,得到第一情感倾向值;至少基于所述第一情感倾向值,确定所述对象对于所述目标事件的情感倾向。本公开使用整体网络用户的评论构建知识图谱作为目标事件的背景知识库,通过结合目标事件的背景知识来对目标对象的网络用户的评论进行情感分析,进而判定情感倾向,使得对网络用户情感倾向的判定更准确。
-
公开(公告)号:CN114692601A
公开(公告)日:2022-07-01
申请号:CN202011572938.2
申请日:2020-12-25
Applicant: 北京中科闻歌科技股份有限公司 , 国科智安(北京)科技有限公司 , 深圳中科闻歌科技有限公司
IPC: G06F40/211 , G06F40/279 , G06F16/31 , G06F16/33 , G06F16/35
Abstract: 本发明实施例涉及一种信息抽取方法、装置、电子设备及存储介质,包括:利用预设规则从至少一个信息通道中获取目标事件的相关文本;对所述相关文本进行分割,得到多个句子;对每一所述句子进行句法分析,根据句法分析结果得到所述句子中的目标专家实体和目标发言指示词;根据所述目标专家实体和目标发言指示词从所述句子中抽取目标专家职称和目标专家观点。由此,可以实现从互联网的海量信息中抽取出专家对于特定事件的观点。
-
公开(公告)号:CN113052413A
公开(公告)日:2021-06-29
申请号:CN201911368970.6
申请日:2019-12-26
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本申请提供了一种风险旅客评估方法,包括:获取多个待评估旅客的信息,每个待评估旅客的信息包括多个出行信息和多个属性信息;根据出行信息计算每个待评估旅客的第一风险值,并将第一风险值超过第一预设阈值的待评估旅客纳入第一候选旅客集合;将出行信息输入梯度提升决策树,输出待评估旅客的第二风险值,并将第二风险值超过第一预设阈值的待评估旅客纳入第二候选旅客集合;根据第一候选旅客集合与第二候选旅客集合得到第三候选旅客集合;根据第三候选旅客集合中的第三候选旅客的身份信息,计算第三风险值,并确定第三风险值超过第二预设阈值的第三候选旅客为风险旅客,采用多方信息和梯度提升决策树对风险旅客进行评估,增加了评估的准确性。
-
公开(公告)号:CN112329470A
公开(公告)日:2021-02-05
申请号:CN202011241374.4
申请日:2020-11-09
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司 , 北京中科闻歌智安科技有限公司
IPC: G06F40/295 , G06F40/226 , G06N3/08
Abstract: 本申请提供了一种基于端到端模型训练的智能地址识别方法及装置,属于计算机技术领域。本申请通过获取训练数据集,所述训练数据集包括多个地址文本数据及每个所述地址文本数据对应的验证数据;针对每个地址文本数据,生成所述地址文本数据对应的字符嵌入向量序列;将所述字符嵌入向量序列输入至第一级子模型;将每一级子模型的输出数据与所述验证数据比较,得到多个误差;根据所述多个误差调整所述地址文本识别模型的参数,直至所述地址文本识别模型收敛时,训练结束。通过本申请,可以将多个级联的子模型产生的多个误差,作为依据以调整地址文本识别模型的参数,减少多个级联子模型的整体误差,避免了多个子模型之间的误差累积。
-
公开(公告)号:CN109783778A
公开(公告)日:2019-05-21
申请号:CN201811577909.8
申请日:2018-12-20
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本发明实施例涉及一种文本溯源方法、设备及存储介质,所述方法包括:根据待判定文本和源文本生成词袋模型,所述源文本包括多个文本;利用多种预设的相似度算法,分别对所述词袋模型进行相似度计算,确定在不同相似度算法的情况下,所述源文本中多个文本与所述待判定文本的多个第一相似度排序;基于第一公式和所述第一相似度排序确定所述源文本源文本中多个文本与所述待判定文本的第二相似度排序;基于所述第二相似度排序从所述源文本中选择符合同源条件的文本作为所述待判定文本的同源文本,采用多种相似度的算法,可以弥补单一算法的不足,减少因计算方式不同带来的偶然性,提升计算结果的全面性和准确性。
-
公开(公告)号:CN112329470B
公开(公告)日:2024-05-28
申请号:CN202011241374.4
申请日:2020-11-09
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司 , 国科智安(北京)科技有限公司
IPC: G06F40/295 , G06F40/226 , G06N3/08
Abstract: 本申请提供了一种基于端到端模型训练的智能地址识别方法及装置,属于计算机技术领域。本申请通过获取训练数据集,所述训练数据集包括多个地址文本数据及每个所述地址文本数据对应的验证数据;针对每个地址文本数据,生成所述地址文本数据对应的字符嵌入向量序列;将所述字符嵌入向量序列输入至第一级子模型;将每一级子模型的输出数据与所述验证数据比较,得到多个误差;根据所述多个误差调整所述地址文本识别模型的参数,直至所述地址文本识别模型收敛时,训练结束。通过本申请,可以将多个级联的子模型产生的多个误差,作为依据以调整地址文本识别模型的参数,减少多个级联子模型的整体误差,避免了多个子模型之间的误差累积。
-
公开(公告)号:CN113505221B
公开(公告)日:2024-03-12
申请号:CN202010214386.1
申请日:2020-03-24
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司 , 国科智安(北京)科技有限公司
IPC: G06F16/35 , G06F18/2411 , G06Q30/018
Abstract: 本发明公开了一种企业虚假宣传风险识别方法、设备和存储介质。该方法包括:在目标企业对应的多个企业舆情文本中,提取疑似风险文本;在每个疑似风险文本中提取对应种类的风险特征,形成每个疑似风险文本对应的风险特征向量;将多个疑似风险文本分别对应的风险特征向量顺次输入预先训练的风险识别模型,使风险识别模型对每个疑似风险文本进行识别,并将识别为存在虚假宣传风险的疑似风险文本确定为风险文本;根据确定出的所有风险文本的信息,确定目标企业对应的虚假宣传风险强度值;如果虚假宣传风险强度值大于预设的风险阈值,则确定目标企业存在虚假宣传风险。本发明可以避免人工匹配规则的局限性,提升了虚假宣传风险识别的准确性。
-
公开(公告)号:CN109815395B
公开(公告)日:2021-06-08
申请号:CN201811608345.X
申请日:2018-12-26
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/9535 , G06F16/957
Abstract: 本发明实施例涉及一种网页垃圾信息过滤方法、装置及存储介质,所述方法包括:按照设定处理规则对输入的原始文本进行分割,得到多个目标数据;对多个所述目标数据进行预处理;将经预处理后的多个目标数据进行向量化;确定经过向量化处理后的多个目标数据对应的多个相似度值;基于多个所述相似度值确定所述原始文本中的异常文本,够准确的提高内容识别系统的准确性和鲁棒性。
-
-
-
-
-
-
-
-
-