Patent search ap:("中国科学院计算技术研究所" OR "国家计算机网络与信息安全管理中心") AND inv:"陈银鹏" Page 2

11.

发明公开
基于单平台的网络事件流行度预测方法与系统无效

公开(公告)号：CN113190734A

公开(公告)日：2021-07-30

申请号：CN202110461513.2

申请日：2021-04-27

Applicant: 中国科学院计算技术研究所

Inventor： 郭岩 , 匡广生 , 程学旗 , 刘悦 , 陈银鹏 , 付宏宇 , 俞晓明

IPC: G06F16/951 , G06N3/04 , G06N3/08

Abstract: 本发明公开一种基于单平台的网络事件流行度预测方法，包括以下步骤：将网络事件在时序上按照固定时间间隔进行划分以形成多个事件片段，并提取各个事件片段的多个维度特征；分别提取各个事件片段的多个维度特征中的相同维度特征以形成多个维度时序特征，并融合多个维度时序特征得到网络事件的统一特征；根据统一特征预测网络事件的流行度。

12.

发明公开
面向网页的阅读理解模型的训练方法、装置、存储介质审中-实审

公开(公告)号：CN118445392A

公开(公告)日：2024-08-06

申请号：CN202410577965.0

申请日：2024-05-10

Applicant: 中国科学院计算技术研究所

Inventor： 郭岩 , 黄婉仪 , 陈银鹏 , 吴昱明 , 薛源海 , 刘悦 , 沈华伟 , 程学旗

IPC: G06F16/332 , G06F16/33 , G06F40/284 , G06F40/30

Abstract: 本发明提出一种面向网页的阅读理解模型的训练方法、装置、存储介质，该方法包括：获取网页基于DOM树结构的路径信息，利用该路径信息表征网页的逻辑结构信息表示；获取网页基于网页快照的坐标信息，利用该坐标信息表征网页的空间结构信息表示；获取网页中的提示词，利用该提示词对初始问题文本进行信息增强，得到目标问题文本；将该逻辑结构信息表示与该空间结构信息表示融合，输入到网页阅读理解模型中；以及将该目标问题文本与该网页内容文本拼接，输入到该网页阅读理解模型中，获取答案。该方法提升了模型的网页理解能力，进而提高答案的准确性和相关性。

13.

发明公开
一种网站列表页面的分类方法、系统及存储介质有权

公开(公告)号：CN112287273A

公开(公告)日：2021-01-29

申请号：CN202011161426.7

申请日：2020-10-27

Applicant: 中国科学院计算技术研究所

Inventor： 孟剑 , 郭岩 , 贺广福 , 陈银鹏 , 史存会 , 俞晓明 , 刘悦 , 程学旗

IPC: G06F16/958 , G06F16/35 , G06F16/957 , G06N3/04 , G06N3/08

Abstract: 本发明涉及一种网站列表页面的分类方法，所述网站系基于超文本标记语言(HTML)，方法包括：步骤100，获取网站页面集合，页面归属于同一网站；步骤200，提取每一网站页面的文档对象模型(Document Object Model，DOM)的树结构特征和页面文本特征，分别构成DOM树结构特征空间和页面文本特征空间；步骤300，在DOM树结构特征空间和页面文本特征空间针对DOM树结构特征和页面文本特征分别进行聚类，分别得到结构类簇和文本类簇；步骤400，根据网站页面的网址链接(URL)，在结构类簇与文本类簇之间进行映射，当映射出现多对一的情况，则选择最大相交的结构类簇或者文本类簇，并找到所述最大相交的结构类簇或者文本类簇在网站中的最近公共父节点，该公共父节点即为列表页面。

Patent Agency Ranking