-
公开(公告)号:CN114297400A
公开(公告)日:2022-04-08
申请号:CN202111485360.1
申请日:2021-12-07
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明公开一种五元组实体关系抽取方法,通过将文本语料进行实体关系标注得到标注数据,再将标注数据进行五元组化预处理,得到含有主体、主体类型、关系、客体和客体类形的五元组训练数据集,而后再通过含有五元组的训练数据集对深度学习模型进行训练得到关系抽取模型,从而当需要抽取文本数据内的信息时,能够通过关系抽取模型对文本数据进行抽取并得到对应的五元组数据,可以极大的提高实体关系抽取的召回率,同时也能保证较高的准确率,并且抽取出的数据更加多元化,从而提高文本关系提取的效果。
-
公开(公告)号:CN108170680A
公开(公告)日:2018-06-15
申请号:CN201711480960.2
申请日:2017-12-29
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F17/27
Abstract: 本发明涉及一种基于隐马尔科夫模型关键词识别方法,包括以下步骤:S1、构建隐马尔科夫模型,隐马尔科夫模型包括五个元素:隐含状态S、可观测状态O、初始状态概率矩阵π、隐含状态转移概率矩阵A和观测状态矩阵B;S2、将目标文章通过分词算法拆分成词语+词性的格式后,输入已经构建好的隐马尔科夫模型中,获得可观测状态序列O,然后将可观测状态序列O输入构建好的隐马尔科夫模型,得到模型μ;S3、利用构建好的隐马尔科夫模型μ和得到的观测状态序列O={O1,O2,….OT},通过维特比算法,计算隐藏状态的最大可能值,从而识别每个词是否为关键词。本发明实现较好的通用性,可同时针对较长文章及短小文章提取关键词,识别的准确性高。
-
公开(公告)号:CN110912896B
公开(公告)日:2022-02-25
申请号:CN201911177336.4
申请日:2019-11-27
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: H04L9/40
-
公开(公告)号:CN112395522A
公开(公告)日:2021-02-23
申请号:CN202011264564.8
申请日:2020-11-13
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/955 , G06F16/958 , G06F16/9538 , G06F16/16 , G06F40/166
Abstract: 本发明涉及一种在线编辑预览Office文档的方法、终端设备及存储介质,该方法中包括:S1:客户端发送查看或编辑文档的请求至WOPI Server;S2:WOPI Server返回WOPI Client的调用所需信息至客户端;S3:客户端向WOPI Client发起查看页面的请求;S4:WOPI Client向WOPI Server发起获取文件基本信息的请求;S5:WOPI Server返回文件基本信息至WOPI Client;S6:WOPI Client向WOPI Server发起获取用户文档的数据流的请求;S7:WOPI Server返回文件的数据流至WOPI Client;S8:WOPI Client将文件流返回给客户端进行展示。本发明将文档存储在Web上,即使其他人未安装Office,只要他们具有支持的浏览器,也可以与他们共享。
-
公开(公告)号:CN111176643A
公开(公告)日:2020-05-19
申请号:CN201911343624.2
申请日:2019-12-24
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明公开了一种子系统首页的生成方法及计算机可读存储介质,方法包括:获取面板参数,并根据面板参数渲染首页面板;当监听到鼠标在首页面板上释放的事件时,记录当前的鼠标在所述首页面板上的偏移位置,并将当前被选中的模块组件以预设的宽高渲染到所述偏移位置上;当检测到所述首页面板上的一模块组件被选中时,显示所述一模块组件的组件编辑器界面;接收所述一模块组件的组件修改参数,并重新渲染所述一模块组件;当接收到保存指令时,根据子系统首页的唯一标识、当前首页面板的面板参数以及当前首页面板上各模块组件的组件参数,生成子系统首页数据,并进行保存。本发明可减少代码的冗余,提高代码的复用性。
-
公开(公告)号:CN111163366A
公开(公告)日:2020-05-15
申请号:CN201911392176.5
申请日:2019-12-30
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: H04N21/845 , H04N21/44 , G06K9/00
Abstract: 本发明公开了一种视频处理方法及终端,预设关键信息,自动爬取符合关键信息的待分类视频;分析待分类视频的语音信息的语音情感特征并得到其情感特征类别,根据情感特征类别得到待分类视频的第一视频类别;分析待分类视频的每一帧图片信息的归属类别以得到待分类视频的第二视频类别;根据待分类视频的第一视频类别和第二视频类别以得到待分类视频的分类结果;本发明通过预设关键信息以获取到视频信息,根据视频信息的语音信息来进行自动提取及分析出语音情感特征,以得到待分类视频在情感特征上的视频类别,通过分析每一帧图片信息的归属类别,以得到待分类视频的归属类别,从而得到更为合理有效的视频分类结果。
-
公开(公告)号:CN110912896A
公开(公告)日:2020-03-24
申请号:CN201911177336.4
申请日:2019-11-27
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: H04L29/06
Abstract: 本发明涉及一种非侵入式的HTTP接口安全策略注入方法,包括以下步骤:S1、设计一个前端与服务端互相配合完成HTTP请求验证的安全策略,包括在前端生成特定形式的鉴权数据的逻辑和在服务端验证该鉴权数据的逻辑;S2、在前端通过预制作的前端代码构建工具插件操作构建过程,使底层对象被代理,代理对象拦截所有向接口发送的请求,并按安全策略中生成鉴权数据的逻辑改造请求,使其可以被验证;S3、在服务端导入依赖模块对所有被发往接口的请求进行预处理,按安全策略中验证鉴权数据的逻辑对其进行验证,使得只有验证通过的请求才可进入其目标接口执行。
-
公开(公告)号:CN114330316A
公开(公告)日:2022-04-12
申请号:CN202111483527.0
申请日:2021-12-07
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F40/274 , G06F40/216 , G06F40/211 , G06F40/289
Abstract: 本发明公开了一种简拼的识别方法及计算机可读存储介质,获取包含简拼字符串的句子;获取拼音首字母组合与所述简拼字符串一致的词语,得到候选词集;将所述句子中的简拼字符串分别替换为所述候选词集中的各候选词,得到各候选句,并通过N‑Gram模型,分别计算各候选句的概率;将概率最高的候选句中的候选词作为所述简拼字符串的识别结果。本发明可识别得到与首字母简拼最匹配的中文词汇,方便阅读。
-
公开(公告)号:CN114238732A
公开(公告)日:2022-03-25
申请号:CN202111312377.7
申请日:2021-11-08
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/951 , G06F16/955 , G06F16/957
Abstract: 本发明公开一种爬取贴文过程中的数据排重方法,通过当前链接接收页面数据的同时获取数据中的多组关键字段,并将多组关键字段组合并生成与页面数据对应的第一关键值,当内网中存在与当前数据的第一关键值相同的另一第一关键值时,表示当前数据为重复数据,将其排除,实现第一次排重;然后再获取当前链接信息,当前链接信息与预设的关键字段组合并生成与页面数据对应的第二关键值,当内网中不存在与当前第二关键值相同的另一第二关键值时,则判断为新数据,否则判断为重复数据,实现第二次排重;通过比较第一关键值和第二关键值对接收数据进行两次排重,极大降低了从外网爬取到相同数据的可能性,降低爬取数据过程中数据的重复率。
-
-
-
-
-
-
-
-