一种确定最大影响程度指标的种子集合的方法及装置

    公开(公告)号:CN111242670A

    公开(公告)日:2020-06-05

    申请号:CN201911377938.4

    申请日:2019-12-27

    Abstract: 本发明实施例提供的一种确定最大影响程度指标的种子集合的方法及装置,方法包括:获取有向图;利用预设的竞争节点,以及有向图中随机选择的起始节点,生成初始数量个子图;将获得的多个子图加入预设的集合,得到子图集合;将有向图中的每个节点,分别单独加入预设的种子集合中,获得不同的第一种子集合;针对有向图中的当前节点,将每个当前节点分别单独加入影响程度指标最大的第一种子集合中,获得第二种子集合,直至第二种子集合中的节点个数达到预设的种子用户的个数;将影响程度指标最大的第二种子集合,确定为目标种子集合。因此,本发明实施例能够减少确定目标种子集合的时间。

    一种同构子图查询方法、装置、电子设备及存储介质

    公开(公告)号:CN110489607A

    公开(公告)日:2019-11-22

    申请号:CN201910705957.9

    申请日:2019-08-01

    Abstract: 本发明实施例提供了一种同构子图查询方法、装置、电子设备及存储介质,其中,该方法包括:获取查询图和目标图,并分别对查询图和目标图进行分解,使用分解得到查询子图,对每个分解得到的目标子图进行同构操作,得到每个目标子图对应的同构子图;获取查询图任意两个节点间的最短路径,并在最短路径中选择最大距离;计算第一同构子图和第二同构子图的最短路径的最大值,在第一同构子图和第二同构子图的最短路径的最大值小于或等于在最短路径中选择的最大距离时;对第一同构子图和第二同构子图进行连接,得到目标图中与查询图对应的同构子图。无需遍历目标图的所有节点。从而可以提高同构子图的查询效率。

    基于混合模型的群体日均到达人数的预测方法及装置

    公开(公告)号:CN111612226B

    公开(公告)日:2023-04-18

    申请号:CN202010395764.0

    申请日:2020-05-12

    Abstract: 本发明提出了一种基于混合模型的群体日均到达人数的预测方法及装置,方法包括:基于群体日均人数的历史数据构建混合模型;基于混合模型对群体的日均到达人数进行预测;其中,混合模型包括基于历史数据中的线性数据部分构建的线性模型,以及基于历史数据中的非线性数据部分构建的非线性模型。根据本发明的基于混合模型的群体日均到达人数的预测方法,根据群体日均人数的历史数据中的线性数据部分和非线性数据部分,分别构建了线性模型和非线性模型,并将线性模型和非线性模型结合形成混合模型,该混合模型充分融合了线性模型和非线性模型各自的特有优势,来来对群体日均到达人数进行预测,有效提高了群体日均到达人数的准确性和可靠性。

    面向群聊的对话结构分析模型训练方法、分析方法及装置

    公开(公告)号:CN115293129A

    公开(公告)日:2022-11-04

    申请号:CN202210676186.7

    申请日:2022-06-15

    Abstract: 本发明提供一种面向群聊的对话结构分析模型训练方法、分析方法及装置,在利用BERT模型获取各消息的文本表示后,结合所定义的各讲者之间的关系编码,通过GRU挖掘目标消息讲者的注意力表示;根据上文消息的回复关系构建相应的线程,通过将目标消息连接在各线程后输入GRU,得到各线程的内容语义表征;通过多层感知机获取目标消息与上文消息的语篇结构表征。结合注意力表示、内容语义表征和语篇结构表征共同评价分析判断目标消息的真实回复对象,极大提高了对话结构分析的准确率。

    基于图模型表示学习的消息回复关系判断系统

    公开(公告)号:CN113343041B

    公开(公告)日:2022-05-20

    申请号:CN202110686245.4

    申请日:2021-06-21

    Abstract: 基于图模型表示学习的消息回复关系判断系统,涉及信息通讯技术领域,解决现有技术只采用两条消息的文本信息和消息间的交叉后的关系信息,没有包含群组用户信息;没有使用当前消息聊天场景的上下文信息等问题,包括图的构建和生成模块、局部图获取和合并模块、异质图注意力网络模块以及孪生网络模块;本发明基于群组内容构建群组图和生成自适应消息图,综合学习群组消息的文本信息、发送消息的群组用户信息和上下文群组消息信息,利用图模型在图结构上进行群组消息的表示学习,拼接消息对的表示向量并进一步预测群组消息间的回复关系。本发明处理不同的输入消息序列生成任务相关的局部消息图,用于捕捉消息之间的隐式关联,弥补人工构图的不足。

    一种镜像网站的判别方法和装置
    27.
    发明公开

    公开(公告)号:CN114417077A

    公开(公告)日:2022-04-29

    申请号:CN202111505940.2

    申请日:2021-12-10

    Abstract: 本发明公开了一种镜像网站的判别方法和装置,所述方法包括:对于待识别的网站,对所述网站的网页的首部发出请求;在判断所述网站返回的首部内容信息具有判别力度后,从所述首部内容信息中提取特征信息;根据提取的特征信息生成所述网站的隐藏服务指纹;将生成的隐藏服务指纹与数据库中存储的各主网站的隐藏服务指纹进行相似性比较;根据比较结果,判别所述网站是否为其中一个主网站的镜像网站。应用本发明既能减少访问Tor网络的信息量、又能保证判别镜像网站的准确率。

    一种可定制的网络爬虫方法及系统

    公开(公告)号:CN110020062B

    公开(公告)日:2021-09-24

    申请号:CN201910292891.5

    申请日:2019-04-12

    Abstract: 本发明实施例提供了一种可定制的网络爬虫方法及系统,其中可定制的网络爬虫方法,包括:通过人工输入配置界面获取单个待生成爬虫任务的配置项;利用所述配置项中的第一爬虫名称,查找为所述第一爬虫名称预先配置的网站静态配置文件,作为目标静态配置文件;通过所述目标静态配置文件中包含的第一网站运行配置文件名称,查找为所述第一网站运行配置文件名称预先配置的网站运行配置文件,作为目标运行配置文件;基于所述目标静态配置文件、所述目标运行配置文件及所述配置项,生成包含所述配置项的爬虫任务;获取所述目标静态配置文件中包含的爬虫入口链接;执行用于对所述爬虫入口链接进行目标数据抓取的爬虫任务。

    语料数据集的处理方法、装置、电子设备及存储介质

    公开(公告)号:CN110543634B

    公开(公告)日:2021-03-02

    申请号:CN201910822709.2

    申请日:2019-09-02

    Abstract: 本发明实施例提供了一种语料数据集的处理方法、装置、电子设备及存储介质,可以实现获取原始的语料数据集,语料数据集中包括多条提及以及预先针对各条提及标注的标签数据;判断语料数据集中的各条提及之间是否具有关联关系;针对具有关联关系的关联提及,根据关联提及的标签数据,计算关联提及的边缘概率;从语料数据集中,删除边缘概率小于预设概率值的关联提及。应用本发明可以剔除语料数据集中人为标注带来的错误信息,降低语料数据集中的噪声问题,进而提高模型训练的准确度,提高关系提取的准确率。

    基于混合模型的群体日均到达人数的预测方法及装置

    公开(公告)号:CN111612226A

    公开(公告)日:2020-09-01

    申请号:CN202010395764.0

    申请日:2020-05-12

    Abstract: 本发明提出了一种基于混合模型的群体日均到达人数的预测方法及装置,方法包括:基于群体日均人数的历史数据构建混合模型;基于混合模型对群体的日均到达人数进行预测;其中,混合模型包括基于历史数据中的线性数据部分构建的线性模型,以及基于历史数据中的非线性数据部分构建的非线性模型。根据本发明的基于混合模型的群体日均到达人数的预测方法,根据群体日均人数的历史数据中的线性数据部分和非线性数据部分,分别构建了线性模型和非线性模型,并将线性模型和非线性模型结合形成混合模型,该混合模型充分融合了线性模型和非线性模型各自的特有优势,来来对群体日均到达人数进行预测,有效提高了群体日均到达人数的准确性和可靠性。

Patent Agency Ranking