一种文本原创识别方法、装置、电子设备及存储介质

    公开(公告)号:CN113553839B

    公开(公告)日:2024-05-10

    申请号:CN202010340711.9

    申请日:2020-04-26

    Abstract: 本申请涉及一种文本原创识别方法、装置、电子设备及存储介质,该方法包括:获取待识别的第一文本数据,以及与所述第一文本数据相关联的第二文本数据;确定所述第一文本数据的来源信息;当所述来源信息不满足于预设条件时,对所述第一文本数据和所述第二文本数据进行比较,得到相似度特征指标;将所述相似度特征指标输入训练好的识别模型,由所述识别模型根据所述相似度特征指标进行计算得到所述文本数据的原创识别结果。该技术方案一方面通过基于来源信息对文本进行初步原创判断,另一方面采用相似度指标对文本进行原创识别,以此种方式提高了原创识别的准确性和有效性,本申请采用的方法能够更好的服务于新闻工作的需求。

    视频拷贝检测方法和装置、存储介质和电子装置

    公开(公告)号:CN113051984A

    公开(公告)日:2021-06-29

    申请号:CN201911389790.6

    申请日:2019-12-26

    Abstract: 本申请提供了一种视频拷贝检测方法和装置、存储介质和电子装置,其中,该方法包括:抽取查询视频的第一目标关键帧;提取所述第一目标关键帧的第一视频特征;获取参考视频的第二目标关键帧的第二视频特征;在根据所述第一视频特征和第二视频特征确定出所述查询视频与所述参考视频匹配的情况下,抽取所述查询视频与所述参考视频中相似的视频片段。通过本发明,解决了相关技术中的视频拷贝检测方法中存在的视频拷贝检测效率低,视频拷贝检测准确度差的问题,进而达到了提高视频拷贝检测效率,提升视频拷贝检测准确度的效果。

    一种数据监测系统
    6.
    发明公开

    公开(公告)号:CN118394748A

    公开(公告)日:2024-07-26

    申请号:CN202410514210.6

    申请日:2024-04-26

    Abstract: 本发明提供了一种数据监测系统,系统包括处理器、存储器和数据库,存储器中存储有计算机程序,数据库中存储有监测规则参考表,处理器用于:获取用户输入的监测任务信息集M;对于M中的Mr,如果当前时间为Tr对应的监测时间,则利用DRr对Mr对应的当前需要处理的数据集DCr进行监测,得到对应的监测结果RSr;如果RSr为表征DCr的质量不满足预设要求的结果,输出对应的提示信息。本发明能够多维度对数据质量进行自动监测,能够提高监测效率和监测准确率。

    一种针对流式数据处理的弹性扩缩容方法及装置

    公开(公告)号:CN118227262A

    公开(公告)日:2024-06-21

    申请号:CN202410364624.5

    申请日:2024-03-28

    Abstract: 本申请实施例提供了一种针对流式数据处理的弹性扩缩容方法及装置,涉及云原生技术领域,部署于Kubernetes平台中,通过监控指标参数集合中的各个指标,获取所述指标参数集合中各个指标对应的参数值;所述指标参数集合中包括至少一个关于流式数据任务的自定义指标;基于所述各个指标对应的参数值,结合预设告警规则生成告警消息;响应于所述告警消息,对所述各个指标对应的参数值进行分析,以生成目标资源的配置信息;所述目标资源为基于自定义资源定义CRD创建的自定义资源;基于所述目标资源的配置信息,对所述目标资源对应的Deployment进行扩缩容。本申请实施例用于在Kubernetes平台中处理流式数据业务时,提高业务处理的效率。

    基于kafka流的数据处理方法、电子设备及存储介质

    公开(公告)号:CN117033449B

    公开(公告)日:2023-12-15

    申请号:CN202311296035.X

    申请日:2023-10-09

    Abstract: 本发明提供了一种基于kafka流的数据处理方法、电子设备和存储介质,包括:获取通过kafka流获取的m个用户的数据需求信息;将获取的m个数据需求信息通过消息组件发送给数据预处理节点,得到具有设定格式的目标数据需求信息;获取当前时刻t对应的原始数据集Dt;从Dt中获取DSti,并基于Ir对应的目标数据需求信息,确定DSti是否为Ir对应的关联数据,如果是,则将Dti标记为Ir对应的关联数据;基于Irfs,从MDrw中获取对应的字段作为Ir对应的目标数据。本发明能够从海量的数据中及时且准确的获取到多个用户所需求的数据。

    实体关系抽取方法、装置及存储介质

    公开(公告)号:CN115688773A

    公开(公告)日:2023-02-03

    申请号:CN202110857375.X

    申请日:2021-07-28

    Abstract: 本申请涉及一种实体关系抽取方法、装置及存储介质,所述方法包括:利用已训练的关系抽取模型从待抽取的目标语料中抽取目标关系;基于所述目标关系从所述目标语料中抽取目标实体对;利用所述目标关系和所述目标实体对构建所述目标语料对应的实体关系三元组。由此,可以实现先抽取目标语料中的目标关系,然后再基于目标关系抽取目标语料中的实体对,这相较于现有技术而言,可以避免在进行关系判断时,引入并无关系的实体对这一冗余信息,从而提高实体关系抽取结果的准确性。

    内容聚类方法及系统
    10.
    发明公开

    公开(公告)号:CN113515648A

    公开(公告)日:2021-10-19

    申请号:CN202111070507.0

    申请日:2021-09-13

    Abstract: 本公开涉及一种内容聚类方法及系统。该方法包括:获取待聚类的多媒体内容集,待聚类的多媒体内容集包括第一多媒体内容集和第二多媒体内容集,根据第一多媒体内容集中第一多媒体内容的多媒体特征生成第一聚类簇,多媒体特征包括语义特征、实体特征以及词语特征中的至少两种,以第一聚类簇中的簇中心为聚类中心,对第二多媒体内容集中第二多媒体内容进行聚类,得到目标聚类簇。通过上述技术方案,实现了准确且快速的对多媒体内容进行聚类,以满足自然语言处理场景的实际聚类需求。

Patent Agency Ranking