-
公开(公告)号:CN116049416A
公开(公告)日:2023-05-02
申请号:CN202210980743.4
申请日:2022-08-16
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/36 , G06F40/295 , G06F40/30 , G06N3/0464 , G06N3/084
Abstract: 本发明公开一种实体分析方法及终端,采集待分析数据;使用训练后的实体抽取模型对所述待分析数据进行实体抽取,得到对应的实体;基于所述实体使用分布式流式处理方法进行关系提取,得到实体与实体之间的关系;基于所述实体与所述关系建立知识图谱,并根据所述知识图谱进行实体分析,得到分析结果,通过引入实体抽取模型能够提高实体抽取任务的精确度,使用分布式流式处理方法进行关系提取,能够提高处理流程的并发度,提高数据处理的效率,同时基于实体与关系建立知识图谱,可将海量数据汇聚联通,从而能够实现对海量数据的有效分析,进而挖掘实体的某种行为。
-
公开(公告)号:CN108170680A
公开(公告)日:2018-06-15
申请号:CN201711480960.2
申请日:2017-12-29
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F17/27
Abstract: 本发明涉及一种基于隐马尔科夫模型关键词识别方法,包括以下步骤:S1、构建隐马尔科夫模型,隐马尔科夫模型包括五个元素:隐含状态S、可观测状态O、初始状态概率矩阵π、隐含状态转移概率矩阵A和观测状态矩阵B;S2、将目标文章通过分词算法拆分成词语+词性的格式后,输入已经构建好的隐马尔科夫模型中,获得可观测状态序列O,然后将可观测状态序列O输入构建好的隐马尔科夫模型,得到模型μ;S3、利用构建好的隐马尔科夫模型μ和得到的观测状态序列O={O1,O2,….OT},通过维特比算法,计算隐藏状态的最大可能值,从而识别每个词是否为关键词。本发明实现较好的通用性,可同时针对较长文章及短小文章提取关键词,识别的准确性高。
-
公开(公告)号:CN112380866B
公开(公告)日:2025-01-21
申请号:CN202011334632.3
申请日:2020-11-25
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F40/295 , G06F40/30 , G06F16/335 , G06N3/045 , G06N3/08
Abstract: 本发明涉及一种文本话题标签生成方法、终端设备及存储介质,该方法中包括:S1:将待识别话题文本进行数据清洗后,进行命名实体识别;S2:采集数据并构建一对多的词汇组合形式的样本组成训练集,构建神经网络模型,通过训练集对神经网络模型进行训练,其中样本中的一个词作为神经网络模型的输入,该词对应的多个语义关联词作为神经网络模型的输出;S3:将待识别话题文本对应的每个命名实体依次输入训练后的神经网络模型后,获得输出的多个词,并对多个词进行清洗和筛选后,将清洗和筛选后的结果作为命名实体对应的标签。本发明通过逻辑语义标签训练生成,可对大范围文本进行话题语义的关联度量,将文本相似度范围进行可解释性归纳。
-
公开(公告)号:CN114239053A
公开(公告)日:2022-03-25
申请号:CN202111386468.5
申请日:2021-11-22
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明公开一种内外网数据传输的方法及终端,根据预设数据传输规则对数据库数据、附件数据以及应用服务数据进行打包和加密,得到加密数据库数据包、加密附件数据包以及加密应用服务数据包;对其进行备份,并将所述加密数据库数据包、加密附件数据包以及加密应用服务数据包汇总至数据传输目录;通过安全传输设备将所述数据传输目录中的所述加密数据库数据包、加密附件数据包以及加密应用服务数据包从外网传输至内网;所述内网接收所述加密数据库数据包、加密附件数据包以及加密应用服务数据包,并按照预设数据解析规则对其进行解析,得到所述数据库数据、附件数据以及应用服务数据,从而提高了内外网数据传输的效率和安全性。
-
公开(公告)号:CN112487209A
公开(公告)日:2021-03-12
申请号:CN202011468768.3
申请日:2020-12-15
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/36 , G06F16/332 , G06F16/951 , G06Q30/08
Abstract: 本发明涉及基于知识图谱的串标行为分析方法、终端设备及存储介质,该方法中包括:S1:采集招投标公告数据;S2:对招投标公告数据进行预处理,识别其中的投标相关信息;S3:根据投标相关信息的参标单位,获取对应的参标单位信息;S4:根据投标相关信息和参标单位信息的关联关系构建知识图谱;S5:根据构建的知识图谱判断是否具有存在串标行为的可能性。本发明将文本处理和知识图谱等相关技术用于招投标数据分析,实现了从招投标公告数据中分析疑似串标行为,为招标单位或企业提供了参考。
-
公开(公告)号:CN109918497A
公开(公告)日:2019-06-21
申请号:CN201811572759.1
申请日:2018-12-21
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明提供了一种基于改进textCNN模型的文本分类方法、装置及存储介质。该方法包括:训练步骤,使用样本文本对改进textCNN模型进行训练得到训练后的改进textCNN模型;文本分类步骤,使用训练后的改进textCNN模型对待分类的文本进行分类。本发明通过对传统的textCNN模型进行改进得到改进textCNN模型的文本分类算法,由于预训练了词嵌入层,使得训练阶段的训练时间和计算量大大减少;由于加深了卷积层的深度以及增加了批归一化层,使得分类准确率较大提高,更加适用于对样本实时性要求(即要根据新样本较频繁的更新模型)和分类准确率都要求较高的场景,如互联网舆情的文本分类等等。
-
公开(公告)号:CN114334174A
公开(公告)日:2022-04-12
申请号:CN202210008050.9
申请日:2022-01-06
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G16H50/80
Abstract: 本发明公开了一种疫情追踪方法及终端,获取人员轨迹信息,所述人员轨迹信息包括轨迹点和所述轨迹点对应的停留时间;获取感染人员轨迹信息及待判定地点,根据所述待判定地点确认待定人员轨迹信息;根据所述感染人员轨迹信息中的第一轨迹点及第一停留时间与所述待定人员轨迹信息中的第二轨迹点计算每一所述待判定地点对应的传播风险;根据每一所述地点的传播风险得到高风险传播链;本发明统计风险最高的待判定地点就能够得到一条高风险传播链,从而能够预测疫情可能的发展趋向,对应进行防控,提高防控工作的效率和准确性。
-
公开(公告)号:CN112416907A
公开(公告)日:2021-02-26
申请号:CN202011397804.1
申请日:2020-12-03
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明涉及一种数据库表数据导入导出方法、终端设备及存储介质,其中导入方法中包括:S11:根据需要导出数据的第一数据库构建数据库连接配置文件、第一数据库中的数据表信息配置文件和文件导出格式的配置文件,设置导出过程中的并发线程数和导出文件的目录地址;S12:从第一数据库中导出数据,并将导出的数据的转换为统一的编码格式;在导出过程中每隔额定数目条记录生成一个.data数据文件;如果同时导出了索引文件,则每个.data数据文件对应生成一个.index索引文件;将导出的表结构生成.table文件;S13:将导出的所有文件打包为一个文件并压缩后存储。本发明可以同时支持多类主流数据库及其不同版本之间的数据迁移,并且可以进行数据的自动并行操作。
-
公开(公告)号:CN107945024B
公开(公告)日:2020-08-21
申请号:CN201711317178.9
申请日:2017-12-12
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明公开一种基于知识图谱识别互联网金融借贷企业经营异常的方法,S1:构建互联网金融借贷企业的企业知识库,S2:从企业知识库中,按照RDF三元组的结构,提取各种知识库中的实体名称和关系名称,存入知识图谱数据库中,形成包含企业基础信息实体、企业招聘信息实体、企业投资标的实体、企业网络舆情实体和企业财务信息实体的企业实体数据库,S3:在企业实体数据库中,将同一个企业的多个实体的数据库进行关联,构建该企业的企业信息知识图谱,S4:选用适宜的机器学习的算法,从企业信息知识图谱中抽取和各种经营数据有关的知识数据,从多个维度对互联网金融借贷企业进行经营异常的风险预测,识别出经营异常的互联网金融借贷企业。
-
公开(公告)号:CN112801288A
公开(公告)日:2021-05-14
申请号:CN202110157860.6
申请日:2021-02-05
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06N3/08
Abstract: 本发明涉及一种图网络的向量表示方法及装置,方法包括以下步骤:依据图网络各节点间的关联关系,构建图网络的邻接矩阵YN×N×K,其中N代表节点的个数,K代表不同类型边的数量;根据各节点在不同类型边上实际的关联次数,更新K个对应邻接矩阵中的元素值;对K个邻接矩阵进行标准化处理;应用特征提取函数f对K种边进行特征提取,形成该图网络的向量表示D(G)。通过本发明的方法,可以大为简化生成图网络向量的计算复杂度,特别是当图网络发送变化的时候,比如替换部分结构或者增加部分节点时,只需要更新有变化部分的邻接矩阵,就可以重新生成图网络的向量表示,方便模型的快速训练部署。
-
-
-
-
-
-
-
-
-