一种基于知识图谱的web日志异常行为识别方法

    公开(公告)号:CN114328962A

    公开(公告)日:2022-04-12

    申请号:CN202111637283.7

    申请日:2021-12-29

    Abstract: 为提高对网络DNS服务器日志分析的能力,本发明综合多种技术,创新性的提出了构建面向域名解析系统的知识图谱。首先,应用域名解析、权威域名服务器、别名解析、自治系统等原理设计了基于aiohttp和dig技术相结合的自动化爬虫模型,构建了相应的领域知识库;其次基于该知识库设计了面向域名解析系统的知识图谱原型并完成了知识图谱的构建,其节点规模达近500万;最后,基于该知识图谱辅助完成web日志异常行为识别模型的构建。通过实验和实际应用反馈,该知识图谱在网络服务器日志异常行为检测与分析的过程中起到了关键作用,提高了web日志异常行为模型的识别率。

    微博特定事件关注群体识别方法

    公开(公告)号:CN111026976A

    公开(公告)日:2020-04-17

    申请号:CN201911282150.5

    申请日:2019-12-13

    Abstract: 一种微博特定事件关注群体识别方法,通过改进PageRank算法对特定事件的重点用户进行识别,在对特定事件的重点关注用户进行识别的基础上,对重点关注用户进行特征抽取,采用基于特征映射的方式对用户属性特征进行向量表征,然后采用模糊c-means聚类算法对特定事件关注用户进行聚类,识别出某个特定事件下重点关注的人群层次。本发明的方法能够很好的识别出特定事件的重点关注用户,同时采用特征映射的方法对用户群体聚类分析,在平均聚类准确度上要比基于硬匹配规则高出至少0.06个百分点。

    基于主题模型的领域标签获取方法

    公开(公告)号:CN110543564A

    公开(公告)日:2019-12-06

    申请号:CN201910784200.3

    申请日:2019-08-23

    Abstract: 本发明提供一种基于主题模型的领域标签获取方法,在海量学术数据的基础上,分析学术数据固有的特点,引入学术词频特征构建FLDA主题模型,利用主题模型将同一学者的学术文档进行“主题-短语”抽取。其次,引入领域体系,将主题模型的抽取结果与体系标签进行向量表征,经过位置加权后使用相似度进行体系映射,最终获得学者的领域标签。实验表明,FLDA模型与传统的LDA模型、基于统计的TFIDF算法和基于网络图的TextRank算法相比,最终获取的标签词效果更好,准确率更高,说明基于主题模型的标签抽取方法在学术领域具有良好的适用性。

    一种物流仓储中心优化选址方法及系统

    公开(公告)号:CN114742593B

    公开(公告)日:2024-09-17

    申请号:CN202210428659.1

    申请日:2022-04-22

    Abstract: 本发明公开了一种物流仓储中心优化选址方法及系统,该方法包括:获取数据集,包括目标地区各行政区域的政务中心位置数据及经济适应量;采用K均值聚类法对数据集中数据点进行基于位置数据的聚类;构建物流仓储中心的选址模型,基于选址模型,对各聚类区域分别采用帝王蝶优化法优化选取物流仓储中心地址。本发明更能契合实际问题的解决,可进一步降低物流运输时间和成本。

    基于主题模型的领域标签获取方法

    公开(公告)号:CN110543564B

    公开(公告)日:2023-06-20

    申请号:CN201910784200.3

    申请日:2019-08-23

    Abstract: 本发明提供一种基于主题模型的领域标签获取方法,在海量学术数据的基础上,分析学术数据固有的特点,引入学术词频特征构建FLDA主题模型,利用主题模型将同一学者的学术文档进行“主题‑短语”抽取。其次,引入领域体系,将主题模型的抽取结果与体系标签进行向量表征,经过位置加权后使用相似度进行体系映射,最终获得学者的领域标签。实验表明,FLDA模型与传统的LDA模型、基于统计的TFIDF算法和基于网络图的TextRank算法相比,最终获取的标签词效果更好,准确率更高,说明基于主题模型的标签抽取方法在学术领域具有良好的适用性。

    一种应用程序运行方法及系统

    公开(公告)号:CN114443172A

    公开(公告)日:2022-05-06

    申请号:CN202210119557.1

    申请日:2020-12-18

    Inventor: 段瑞雪

    Abstract: 本发明涉及一种应用程序运行及系统。该方法包括:获取申请请求;所述申请请求包括本地客户端的ID以及应用程序的标识;根据所述申请请求获取云端中的所述应用程序;采用所述本地客户端运行所述应用程序;所述应用程序下载到本地客户端之后再运行;每次运行之后保留运行数据;如本地客户端空间紧张,删除本地客户端保存的程序和数据;如需运行本地客户端没有的应用程序,则再次向云端请求;云端返回应用程序运行所需数据,其中包括上次运行产生的数据,本地客户端以上次运行之后的状态运行所述应用程序。本发明能够提高本地客户端的内存利用率,保证运行速度。

    一种面向古籍的命名实体识别方法

    公开(公告)号:CN117787281A

    公开(公告)日:2024-03-29

    申请号:CN202311839688.8

    申请日:2023-12-28

    Abstract: 本发明公开了一种面向古籍的命名实体识别方法,涉及古籍命名实体识别技术领域,该方法针对用于古籍命名实体识别古籍语料少、古文信息熵高的问题,构建基于二十四史的古籍文本语料库,并提出一种基于增量预训练和对抗学习的古籍命名实体识别模型(ANER‑IPAL)。基于自建的古籍文本数据集,使用NEZHA‑TCN模型进行预训练,在嵌入层融合对抗学习增强模型泛化能力,在解码层引入全局指针网络,将实体识别任务建模为子串提取任务,最后结合规则进行结果的矫正输出。实验结果表明,所提模型在“古籍命名实体识别2023”数据集(GuNER2023)上的F1值达到了95.34%,相较于基线模型NEZHA‑GP提高了4.19%。

    页面打开方法和装置、页面内容检索方法和装置

    公开(公告)号:CN109918153B

    公开(公告)日:2022-05-27

    申请号:CN201910204663.8

    申请日:2019-03-18

    Inventor: 段瑞雪 霍芳

    Abstract: 本发明提出一种应用页面打开方法、装置和设备,应用于终端设备,所述方法包括:获取第一应用页面链接,其中,所述第一应用页面链接包含第一应用的标识;根据所述第一应用页面链接,确定预设应用库中是否包含所述第一应用,其中,所述预设应用库包含一个或更多个应用;以及在确定所述预设应用库中包含所述第一应用时,利用应用程序免安装技术运行所述第一应用,以打开所述第一应用页面链接。本发明还提出一种应用页面内容检索方法、装置和服务器。利用本发明的技术方案,通过利用应用程序免安装技术来运行应用,在接收到应用页面链接时可以自动以原生应用打开应用页面链接。

    一种微博突发事件的检测方法

    公开(公告)号:CN110543590A

    公开(公告)日:2019-12-06

    申请号:CN201910061262.1

    申请日:2019-01-23

    Abstract: 本发明公开了一种微博突发事件的检测方法,包括:步骤1,对去除噪声和分词处理后的微博数据进行时间划分,获得与时间窗口对应的微博数据集;步骤2,计算各时间窗口包含的所有微博中各词w的突发词判断权重Wk(w),将Wk(w)大于突发词阈值的词作为突发词,从而获得各时间窗口的突发词集;步骤3,基于突发词集中两两突发词的耦合度,利用聚类算法对突发词集中突发词进行聚类,并基于聚类结果检测时间窗口的突发事件。和现有方法相比,本发明基于突发特征词的微博突发事件的检测方法在准确率和F值上有了很大的提升,即检测结果更准确。

    微博特定事件关注群体识别方法

    公开(公告)号:CN111026976B

    公开(公告)日:2024-01-09

    申请号:CN201911282150.5

    申请日:2019-12-13

    Abstract: 一种微博特定事件关注群体识别方法,通过改进PageRank算法对特定事件的重点用户进行识别,在对特定事件的重点关注用户进行识别的基础上,对重点关注用户进行特征抽取,采用基于特征映射的方式对用户属性特征进行向量表征,然后采用模糊c‑means聚类算法对特定事件关注用户进行聚类,识别出某个特定事件下重点关注的人群层次。本发明的方法能够很好的识别出特定事件的重点关注用户,同时采用特征映射的方法对用户群体聚类分析,在平均聚类准确度上要比基于硬匹配规则高出至少0.06个百分点。

Patent Agency Ranking