基于规则模型的实体抽取与关系挖掘构建知识图谱的方法

    公开(公告)号:CN106874378B

    公开(公告)日:2020-06-02

    申请号:CN201710006826.2

    申请日:2017-01-05

    Abstract: 本发明涉及一种基于规则模型的实体抽取与关系挖掘构建知识图谱的方法,步骤一:爬取目标领域的百科知识库数据,并定义食品类、农药类、营养类、病虫害类字典,便于规则挖掘;步骤二:对百科类数据进行去HTML标签化,获取中文文本并获取URL链接,便于后续处理;步骤三:通过加入人工标注的关系属性信息,来获取更全的实体属性信息;步骤四:对事件的获取以及图谱关系建立。本发明将文本信息转换成词向量数学信息,然后进行向量相似度比较,并根据数字间的关系,来标注实体间的关系,为用户展现出该领域的核心知识库,并提高优化搜索质量,实现了从简单字符串到实体理解的过程。

    一种度量导演与演员合作可能性的方法

    公开(公告)号:CN109102111A

    公开(公告)日:2018-12-28

    申请号:CN201810835050.X

    申请日:2018-07-26

    Abstract: 本发明公开了一种度量导演与演员合作可能性的方法,其特征在于,包括以下步骤:步骤一:根据导演与演员、演员与演员间合作关系以及合作次数,构建导演演员合作网络图;步骤二:建立导演间相似度矩阵,用公式求得各导演间的相似度,并建立相似度矩阵;步骤三:确定导演与演员间是否存在最佳路径,寻找最佳路径的过程是:寻找出演员ai和导演dj之间的全部路径,然后选择出这些路径中的最短路径,在最短路径集合中选出路径上权重和最大的路径,即为最佳路径;步骤四:计算导演与演员间的合作度;从网络结构和导演、演员自身因素两方面出发,突破了传统方法单纯通过合作电影的票房度量导演演员间合作可能性的局限。

    一种基于网络的微博消息可信度判别模型的方法

    公开(公告)号:CN107403007A

    公开(公告)日:2017-11-28

    申请号:CN201710609782.2

    申请日:2017-07-25

    Abstract: 本发明是一种基于网络的微博消息可信度判别模型的方法,步骤如下:步骤一:计算先验知识;步骤二:定义网络模式;步骤三:定义元路径并生成网络;步骤四:在异构信息网络上做分类;步骤五:虚假消息识别。本发明的优点及功效:一、将评论网络建模为异构信息网络并在异构信息网络上做分类,这在微博虚假消息识别中是一次创新。二、训练数据不需要标注,节省了人力和时间。三、相比于以往研究中通过最终结果来计算特征的重要性,本发明中将特征权重的计算作为模型的一部分,得到最终分类结果的同时也得到了特征的重要性,并且在分类过程中可以观察到特征权重的变化。四、提高了微博虚假消息识别的准确率。

    基于规则模型的实体抽取与关系挖掘构建知识图谱的方法

    公开(公告)号:CN106874378A

    公开(公告)日:2017-06-20

    申请号:CN201710006826.2

    申请日:2017-01-05

    Abstract: 本发明涉及一种基于规则模型的实体抽取与关系挖掘构建知识图谱的方法,步骤一:爬取目标领域的百科知识库数据,并定义食品类、农药类、营养类、病虫害类字典,便于规则挖掘;步骤二:对百科类数据进行去HTML标签化,获取中文文本并获取URL链接,便于后续处理;步骤三:通过加入人工标注的关系属性信息,来获取更全的实体属性信息;步骤四:对事件的获取以及图谱关系建立。本发明将文本信息转换成词向量数学信息,然后进行向量相似度比较,并根据数字间的关系,来标注实体间的关系,为用户展现出该领域的核心知识库,并提高优化搜索质量,实现了从简单字符串到实体理解的过程。

    基于频繁子树的社交网络马甲识别模型的方法

    公开(公告)号:CN106598954A

    公开(公告)日:2017-04-26

    申请号:CN201710007000.8

    申请日:2017-01-05

    CPC classification number: G06F17/271 G06F2216/03

    Abstract: 本发明涉及一种基于频繁子树的社交网络马甲识别模型的方法,步骤一:获取微博文本数据。步骤二:数据预处理:步骤三:利用依存句法分析软件,对微博文本进行依存句法分析,每条微博会得到一个句法分析结果。步骤四:将步骤三得到的依存句法树采用Pre‑Order‑String方法表示。步骤五:某人的微博列表中的每个文本利用步骤四的方法得到分析结果;步骤六:将需要判断是否为马甲关系的两个账号分别按照步骤一至五,得到两个马甲账号的频繁依存句法树。本发明所提供的一种基于频繁子树的社交网络马甲识别模型的方法,通过大量的数据训练之后,可以将方法利用在社交网站对于网络安全的管理以及政府关于网络犯罪的追查,能够快速,有效地识别马甲账号。

    一种基于依存句法关系的微博马甲账号识别方法

    公开(公告)号:CN106021232A

    公开(公告)日:2016-10-12

    申请号:CN201610350203.2

    申请日:2016-05-24

    CPC classification number: G06F17/271 H04L51/046 H04L63/08

    Abstract: 本发明涉及一种基于依存句法关系的微博马甲账号识别方法,具体步骤如下:步骤一:获取微博文本数据;步骤二:采用分词软件进行分词,去除英文及标点符号;步骤三:采用依存句法分析软件,对已分词后的文本进行依存句法分析,每条微博会得到一个句法分析结果;步骤四:某人的微博列表中的每个文本利用步骤三的方法得到分析结果;采用Apriori算法计算某人微博的常用依存句法结构;步骤五:将需要判断是否为马甲关系的两个账号分别按照步骤一至四的结果进行对比,相同即为马甲关系,反之,则为非马甲关系。本发明方法可以用在社交网站对于网络安全的管理以及政府关于网络犯罪的追查,能够快速,有效地识别马甲账号。

    一种基于三角结构的社会网络节点影响力度量方法

    公开(公告)号:CN105719190A

    公开(公告)日:2016-06-29

    申请号:CN201610031130.0

    申请日:2016-01-18

    CPC classification number: G06Q50/01 G06F17/30864

    Abstract: 本发明一种基于三角结构的社会网络节点影响力度量方法,将用户和用户间的关系抽象为网络拓扑结构中的节点和连边形成社会网络拓扑图。以图为对象,结合当前节点与其邻居之间三角结构的数量和邻居节点的度值,度量当前节点与邻居节点之间的连边对当前节点影响力的贡献。然后计算当前节点的所有连接对节点影响力贡献之和,从而得到节点的最终影响力并通过排序可以得到影响力最大的节点子集。社会网络中,三个节点之间两两连接形成三角结构,若两个节点之间形成三角结构的数量越多,则两个节点的联系越紧密,这两个节点处于联系紧密的小团体内部中的可能性较大,对于节点的全局影响力是起负面作用的。

    一种基于硬件的核心路由器TCP连接状态维护模块设计方案

    公开(公告)号:CN101989985B

    公开(公告)日:2013-08-28

    申请号:CN201010501182.2

    申请日:2010-10-09

    Abstract: 本发明涉及一种新的基于硬件的核心路由器TCP连接状态维护模块设计方案,包括该模块的原理、处理内容和工作过程。核心路由器的TCP协议状态维护是关系到核心路由器安全的一个重要因素。本发明的基于硬件技术的核心路由器TCP连接状态维护模块设计方案可以有效地的减少因TCP状态维护问题而导致的对核心路由器的恶意攻击,有效地保护核心路由器的CPU和存储空间资源,防止因攻击而导致的TCP/IP协议栈的溢出、堆栈崩溃,路由器死机等情况,从而大大改善核心路由器运行的稳定性。

    一种基于硬件的核心路由器TCP连接状态维护模块设计方案

    公开(公告)号:CN101989985A

    公开(公告)日:2011-03-23

    申请号:CN201010501182.2

    申请日:2010-10-09

    Abstract: 本发明涉及一种新的基于硬件的核心路由器TCP连接状态维护模块设计方案,包括该模块的原理、处理内容和工作过程。核心路由器的TCP协议状态维护是关系到核心路由器安全的一个重要因素。本发明的基于硬件技术的核心路由器TCP连接状态维护模块设计方案可以有效地的减少因TCP状态维护问题而导致的对核心路由器的恶意攻击,有效地保护核心路由器的CPU和存储空间资源,防止因攻击而导致的TCP/IP协议栈的溢出、堆栈崩溃,路由器死机等情况,从而大大改善核心路由器运行的稳定性。

    一种基于大模型和机器学习模型融合的中小微企业融资担保额度测算方法及系统

    公开(公告)号:CN119809803A

    公开(公告)日:2025-04-11

    申请号:CN202411860871.0

    申请日:2024-12-17

    Abstract: 本发明公开了一种基于大模型和机器学习模型融合的中小微企业融资担保额度测算方法及系统,涉及额度评估技术领域,包括以下步骤:S1、数据收集;S2、额度测算模型训练;S3、构建RAG外接经验知识库;S4、构建大模型Agent框架。本发明采用大模型Agent框架与机器学习模型KAN,显著提高额度测算精度,充分利用了企业的软信息以及项目经理和资产评估师的大量评估经验,与传统结构化机器学习预测模型相结合,解决了传统机器学习模型只能接收结构化数据的弊端,完美地运用了该领域大量的专家经验和知识积累,显著提高了预测的准确性与逻辑合理性,并能够给出完整的评审意见,实现端到端的中小微企业融资担保额度测算。

Patent Agency Ranking