一种基于句法语义的农业领域关系抽取方法

    公开(公告)号:CN108920465A

    公开(公告)日:2018-11-30

    申请号:CN201810766657.7

    申请日:2018-07-13

    Applicant: 福州大学

    Abstract: 本发明涉及一种基于句法语义的农业领域关系抽取方法,首先从农业专业网站爬取农业知识相关的文本。将收集得到的文本进行整理,去除掉无关文本,得到就是与农业领域相关的文本。结合事先确定的关系种类,对农业领域文本进行人工标注,构建农业领域的语料库。根据确定好的特征种类对文本进行特征抽取,构建特征向量。最后使用SVM对分类器进行建模,得到面向农业领域的关系分类模型。本发明有较好的抽取效果。

    一种基于特征选择的入侵检测方法

    公开(公告)号:CN105930723A

    公开(公告)日:2016-09-07

    申请号:CN201610246178.3

    申请日:2016-04-20

    Applicant: 福州大学

    Inventor: 陈星 戴远飞

    CPC classification number: G06F21/554 G06K9/6267

    Abstract: 本发明涉及一种基于特征选择的入侵检测方法,首先对原始数据进行离散化处理,将离散化处理之后的数据进行特征选择,对特征选择之后的数据进行归一化处理,将归一化处理之后的数据导入分类器进行训练。本发明能够在训练模型的时间和准确率上都有提升。

    面向信息发布类网站的移动版自动生成的方法

    公开(公告)号:CN106503211B

    公开(公告)日:2019-12-17

    申请号:CN201610953876.7

    申请日:2016-11-03

    Applicant: 福州大学

    Abstract: 本发明涉及一种面向信息发布类网站的移动版自动生成的方法,其包括以下步骤:利用爬虫技术,根据用户指定转化网站的入口地址,爬取该网站中的所有网页;对爬取网站中的所有网页进行分析,针对每一个网页提取导航栏中的数据和网页中的主要内容;将提取的结构化数据经过适配转化为适应移动端页面展示风格的数据。采用本发明技术方案用户只需要给出该网站的入口地址,就能够自动生成适合手机浏览移动版网站。在这个过程中通过网页爬取,数据提取,网页适配完成来完成移动端页面的生成。本发明极大地较少了开发移动版的成本并且减少了移动版网站的开发周期,具有很强的商业价值。

    面向法制相关文本的判别方法

    公开(公告)号:CN109033081A

    公开(公告)日:2018-12-18

    申请号:CN201810787857.0

    申请日:2018-07-18

    Applicant: 福州大学

    CPC classification number: G06F17/2715 G06K9/6278

    Abstract: 本发明涉及一种面向法制相关文本的判别方法。利用爬虫在互联网上爬取法制相关文本,构建法制相关语料库;对法制相关语料库中的语料标注关联度,并且利用结巴分词技术及TF‑IDF关键词技术对每条语料进行分词,统计得到关键词;利用关键词组生成每条语料和关键词的特征向量;对于每条语料和关键词的特征向量进行机器学习并生成对应的分类模型;最后利用分类模型对互联网上文本进行判别。本发明利用机器学习对于处理好的数据进行学习训练,最终实现法制相关文本的判别。

    一种基于语义网的机器学习流程智能组装方法

    公开(公告)号:CN109871809A

    公开(公告)日:2019-06-11

    申请号:CN201910131216.4

    申请日:2019-02-22

    Applicant: 福州大学

    Abstract: 本发明涉及一种基于语义网的机器学习流程智能组装方法,首先将不同格式的数据根据其数据类型和问题类型来进行预处理;接着将预处理好的数据根据其数据类型和问题类型进行多种分类模型、回归模型的训练;然后对训练完成的模型进行测试和评估;将算子进行统一的封装;最后根据用户描述的所要使用的机器学习方法以及要进行处理的数据的格式,组装一条以上的机器学习工作流路径。本发明能够快速有效地定制和调优可复用的机器学习流程,从而能够高效的进行数据挖掘工作。

    价值观相关话题的文本判别方法

    公开(公告)号:CN108009256A

    公开(公告)日:2018-05-08

    申请号:CN201711298798.2

    申请日:2017-12-08

    Applicant: 福州大学

    Abstract: 本发明提供一种价值观相关话题的文本判别方法,其包括以下步骤:步骤S1:基于选定的种子词,从社交网络上搜索出具有代表性的帖子,基于领域知识提出主题词,组成主题词库;步骤S2:结合专家知识和具有代表性的帖子验证,建立相关话题的领域知识模型;步骤S3:结合领域知识模型,建立相关话题的判别模型;基于领域知识设定阈值为R,若是某个帖子的相关性R大于阈值,则该贴子和话题相关,反之亦然。与现有技术相比,本发明不用通过预先训练模型,能够快速准备的判断一个帖子是否属于某一话题。

    一种基于网页聚类的正文信息提取方法

    公开(公告)号:CN106557565A

    公开(公告)日:2017-04-05

    申请号:CN201611027102.8

    申请日:2016-11-22

    Applicant: 福州大学

    CPC classification number: G06F16/9577 G06F16/35 G06F16/951

    Abstract: 本发明涉及一种基于网页聚类的正文信息提取方法,将网站级别与网页级别相结合,通过网站级别的网页聚类来实现平滑网页之间的差距,再利用网页分块和节点的密度特征来确定该类网页正文的位置,并提取相应的抽取规则。本发明可以有效的提高网页正文内容提取的准确率。

    面向信息发布类网站的移动版自动生成的方法

    公开(公告)号:CN106503211A

    公开(公告)日:2017-03-15

    申请号:CN201610953876.7

    申请日:2016-11-03

    Applicant: 福州大学

    Abstract: 本发明涉及一种面向信息发布类网站的移动版自动生成的方法,其包括以下步骤:利用爬虫技术,根据用户指定转化网站的入口地址,爬取该网站中的所有网页;对爬取网站中的所有网页进行分析,针对每一个网页提取导航栏中的数据和网页中的主要内容;将提取的结构化数据经过适配转化为适应移动端页面展示风格的数据。采用本发明技术方案用户只需要给出该网站的入口地址,就能够自动生成适合手机浏览移动版网站。在这个过程中通过网页爬取,数据提取,网页适配完成来完成移动端页面的生成。本发明极大地较少了开发移动版的成本并且减少了移动版网站的开发周期,具有很强的商业价值。

Patent Agency Ranking