一种基于智能推荐的字段标准化的方法和系统

    公开(公告)号:CN113626558A

    公开(公告)日:2021-11-09

    申请号:CN202110767556.3

    申请日:2021-07-07

    Abstract: 本发明给出了一种基于智能推荐的字段标准化的方法和系统,包括将原始数据入库,抽取部分原始数据作为内容分析集合,动态映像抽取原始数据相应的字段到数据目录表中,形成待分析的字段集合;利用字段的属性特征获取原始数据的字段的真实表征,对字段集合进行标准化处理以获取包括推荐数据元和限定词的标准化字段集合;调用特征校验引擎识别内容分析集合获取数据特征的结果集合,保存与结果集合的数据吻合的标准化字段集合。该方法和系统可以自动分析出字段属性和内容特征,智能推荐字段的标准化处理方案,大大提升原始数据解析入库的效率。

    一种用户自定义函数的实现方法和系统

    公开(公告)号:CN115964050A

    公开(公告)日:2023-04-14

    申请号:CN202211669162.5

    申请日:2022-12-23

    Abstract: 公开了用户自定义函数的实现方法和系统,包括系统服务接口接受并解析从用户提交的Flink SQL任务及UDF请求参数;响应于用户提交的UDF请求参数中仅提供UDF唯一标识,从系统缓存中获取UDF唯一标识;响应于UDF请求参数中提供了UDF源码,根据UDF源码获取对应开发语言的解释器或编译器,将一或多个使用不同语言开发的UDF源码从文本形式动态转换为JVM对象,并向Flink SQL运行时环境注册JVM对象所指向的UDF函数;响应于成功执行UDF相关Flink SQL任务,将UDF源码相关信息进行持久化存储,同时将UDF唯一标识写入系统缓存。本申请可以减少持久化存储的远程连接开销,解决UDF重复编译问题,加快调试效率,解决不同技术领域的研发人员和普通用户协同开发难题。

    一种旅游评论分析方法与系统
    35.
    发明公开

    公开(公告)号:CN115203417A

    公开(公告)日:2022-10-18

    申请号:CN202210843636.7

    申请日:2022-07-18

    Abstract: 本发明给出了一种旅游评论分析方法与系统,包括通过抓取旅游评论的文本构成训练集,利用卷积神经网络的卷积层对训练集中的文本从主题和情感两个维度进行特征提取,分别获得主题特征和情感特征;在所述卷积神经网络中分别对所述主题特征和所述情感特征进行池化成为两列向量;再利用所述卷积神经网络的全连接层把所述两列向量合并起来组成一个矩阵之后,再对所述矩阵的两列向量分别进行分类训练后输出结果,从而得到主题和情感两个维度各自的分类结果;保存所述卷积神经网络的模型,利用所述模型对需要分析的旅游评论的文本计算其分别属于所述两个维度的各个分类的评论数量,并分析计算结果。本发明实现了多维度的文本分析,同时得到直观的结果。

    一种自动巡检采集设备的方法、装置和存储介质

    公开(公告)号:CN115017127A

    公开(公告)日:2022-09-06

    申请号:CN202210573285.2

    申请日:2022-05-25

    Abstract: 本发明提供了一种自动巡检采集设备的方法、装置及存储介质,该方法包括:S1,获取各采集设备的采集日志数据;S2,对采集日志数据进行对象归一化处理和地址归一化处理,获得各区域的区域分析信息;S3,分析各区域的区域分析信息,根据各区域的区域分析信息中关联对象信息是否一致来确定异常记录,并在异常记录连续出现的天数达到预定阈值时,确定异常记录对应的采集设备出现异常。利用上述技术方案,可以实现在全域范围的采集设备的巡检工作,且并通过对采集数据中关联对象的一致性分析可以实现对采集设备是否存在异常进行自动判断。

    一种人脸图像聚类中非活体过滤的方法、装置、介质

    公开(公告)号:CN113673382B

    公开(公告)日:2022-07-15

    申请号:CN202110898483.1

    申请日:2021-08-05

    Abstract: 本发明提出了一种人脸图像聚类中非活体过滤的方法、装置及存储介质,该方法包括:分组步骤S101,对聚类后的人脸图像根据摄像头的ID进行分组,其中n≥2;计算步骤S102,针对每一个分组计算所有人脸图像位置的区域及该区域对应的多边形面积,以及该分组对应的摄像头视野面积;过滤步骤S103,基于该区域对应的多边形面积及该分组对应的摄像头视野面积确定采集的人脸图像是否为非活体,如果是,则将非活体的人脸图像删除。本发明创造性的提出了基于人脸出现的区域的面积及摄像头的视野面积进行非活体的识别,识别方法简单可靠,无需增加硬件设备,也不需要被识别人的配合,且识别率较高,满足了工程需要。

    一种PPTP数据实时解析的处理方法和装置

    公开(公告)号:CN111181972A

    公开(公告)日:2020-05-19

    申请号:CN201911409676.5

    申请日:2019-12-31

    Abstract: 本发明公开了一种PPTP数据实时解析的处理方法,包括如下过程:步骤一:读取客户端和服务端的通信报文,落地成文件并解析,获取已知数据值;步骤二:计算nthash的值,得到解密后续业务报文所需要的密钥;步骤三:在计算过程中,检验是否生成新的破解结果,如果有则写入缓存,同时解密落地文件;步骤四:检查密钥是否破解过,如果是则利用密钥和账号信息从缓存中取出破解结果,解密数据;步骤五:数据解密还原成明文后,进行还原判断。通过该方法,可以实时解析访问的明文内容,进而对敏感行为进行监控。

    一种数据分发方法、装置、系统及存储介质

    公开(公告)号:CN110175210A

    公开(公告)日:2019-08-27

    申请号:CN201910346093.6

    申请日:2019-04-26

    Abstract: 本发明提供一种数据分发方法、装置、系统及存储介质,所述方法包括:获取来自至少一个数据源的原始数据;基于生成规则对所述原始数据进行处理生成待分发数据;根据分发规则向对应的目标分发所述待分发数据;其中,所述生成规则包括根据所述分发规则生成所述待分发数据的目标编号。根据本发明的方法、装置、系统及计算机存储介质,通过将数据生成规则和分发规则有效地结合,实现对于不同结构的多源化数据的分发配置耦合度低、灵活、扩展性和通用度高,以提高数据开发的使用效率,更好地满足客户需求。

    可定制化的多源数据库的数据抽取方法、装置及存储介质

    公开(公告)号:CN110032594A

    公开(公告)日:2019-07-19

    申请号:CN201910218315.6

    申请日:2019-03-21

    Abstract: 本发明提供了一种可定制化的多源数据库的数据抽取方法、装置及存储介质,该方法包括:获取数据抽取系统的当前时间,作为数据抽取的开始时间;从ETL的日志表中的到当前的最小FLAG作为抽取数据起始点;接收输入的数据抽取策略,所述抽取策略包括待抽取的数据源;在待抽取的数据源中从抽取数据起始点基于数据抽取策略进行数据的抽取,抽取完成后将抽取记录到日志表。本发明提出了数据抽取系统,租户向该平台提交数据抽取需求后,经管理员审批通过,所述服务服务提供商完成数据的抽取并反馈至租户,这样租户就不再需要维护独立的数据抽取系统,提高了系统性能,且数据的抽取过程可通过审批机制提高数据系统的安全性。

Patent Agency Ranking