一种基于叙词表构建领域本体的方法及装置

    公开(公告)号:CN115934959A

    公开(公告)日:2023-04-07

    申请号:CN202211558216.0

    申请日:2022-12-06

    Abstract: 本申请提出了一种基于叙词表构建领域本体的方法及装置,该方法包括以下步骤:S1、遍历叙词表,提取叙词表中所有词条的关联文件集合;S2、构建叙词向量:叙词表包括N级叙词,遍历N级叙词,并且以对应的上一级叙词为原点,重复构建N‑1级叙词向量;S3、构建词条向量:从第一级叙词指向第N‑1级叙词,构建XY平面向量;S4、构建关联文件向量:从第一级叙词,以词条向量为点积,生成由关联文件集合决定的顶层本体三维模型;以及S5、根据顶层本体三维模型和输入的领域主题生成领域本体模型。能够解决大数据治理中的重复建设、重复治理的问题,可形成本体库管理知识图谱的模式层,层次结构清晰明了,减小冗余程度。

    一种基于数据标签海量网页的数据提取识别方法和系统

    公开(公告)号:CN116578794A

    公开(公告)日:2023-08-11

    申请号:CN202211504500.X

    申请日:2022-11-28

    Abstract: 公开了基于数据标签海量网页的数据提取识别方法和系统,包括获取HTML文档,HTML文档包括HOST、URL、HTTP HEAD、HTTP CONTENT;利用hostinfo标记HTTP HOST,属性包括主机名host、主机编码hostid和主机说明desc,根据host属性逐级匹配对应提取模板,匹配各级子域名直至匹配到提取模板;利用urlinfo标记HTTP URL,属性包括url、urlid、dec、fullmatch,根据url属性在对应提取模板中匹配符合的提取规则;根据HTTP HOST和HTTP URL匹配到对应的提取模板后,利用模板内定义的getinfo提取规则进行内容提取。本申请通过标签提取网页内容并还原网页内容的真实含义,具备一次配置标签模板反复使用的特点,按网站域名进行标签模板配置方便管理,极大提升了网页内容提取的效率和精确度。

    基于业务中台的应用开发方法、系统、装置及存储介质

    公开(公告)号:CN114791797A

    公开(公告)日:2022-07-26

    申请号:CN202210384108.X

    申请日:2022-04-13

    Abstract: 本发明公开了一种基于业务中台的应用开发方法、系统、装置及存储介质,本发明的方案通过对业务场景的共性需求进行归纳抽象设计并提供引擎服务,将其中可复用的引擎服务封装并定义成业务组件,再根据业务需求将所述业务组件分配到业务场景中,并对各个组件之间的业务逻辑进行配置以完成应用开发。通过使用业务中台搭建的业务应用程序比起其他传统程序能有更短的研发周期、更健壮的运行机制、更快速的运维响应、更平滑的升级体验及更长的服务寿命,简化了由于业务复杂度的提高而带来的基本组件抽象难度,减少了应用程序的开发难度。

    一种基于检验统计量的高维数据流变点检验方法及系统

    公开(公告)号:CN114239747A

    公开(公告)日:2022-03-25

    申请号:CN202111581957.6

    申请日:2021-12-22

    Abstract: 本申请提出了一种基于检验统计量的高维数据流变点检验方法及系统,包括:利用WBS2将高维数据流随机分成若干个完整的数据子集;计算数据子集区间的检验统计量值Lt,输出最大检验统计量值的数据点位置,将数据点作为候选点添加至变点候选集中;利用候选点将数据子集一分为二,在候选点的左右两侧再次递归抽取数据子集;重复上述步骤,直到数据子集的长度达到最小长度阈值;计算每个候选点对应的检验统计量值的累加和V,将累加和V除以标准差所得的商V/sv与检验阈值Zα比较;若所得的商V/sv大于检验阈值Zα,则认定该候选点为变点,输出变点的个数和位置。结合了高维数据流的时空依赖性,能够检验和估计位于时间序列边界上的变点,准确率和鲁棒性更高且速度更快。

Patent Agency Ranking