数据标注方法及装置
    41.
    发明授权

    公开(公告)号:CN113205163B

    公开(公告)日:2021-11-19

    申请号:CN202110764998.2

    申请日:2021-07-07

    Abstract: 本发明公开了一种数据标注方法及装置,该方法包括:利用无监督学习算法进行冷启动,对原始的无标签数据进行初级分类,生成弱和伪标签数据信息;对伪标签数据信息进行校验标注;对预设数量的弱标签数据信息进行标注,获得部分已标注数据,基于弱监督学习算法和部分已标注数据,对剩余的弱标签数据信息进行预标注,生成预标注结果;对预标注结果进行半监督学习算法的样本筛选,获得精品数据集;对精品数据集进行数据补充,获得全标签数据集;利用全标签数据集对无监督学习算法、弱监督学习算法和半监督学习算法进行算法迭代,获得优化的无监督学习算法、弱监督学习算法和半监督学习算法。本发明可以大幅减少人工标注成本,并提高数据标注效率。

    一种语音数据质量检测方法、装置、服务器及存储介质

    公开(公告)号:CN110580917A

    公开(公告)日:2019-12-17

    申请号:CN201910870667.X

    申请日:2019-09-16

    Abstract: 本发明提供一种语音数据质量检测方法、装置、服务器及存储介质,以帧为单位对待进行质量检测的语音数据进行分割得到至少一个语音帧,计算语音帧在预先设置的至少一个频段中每个频段的频谱能量值,并将利用至少一个语音帧中每个语音帧在频段的频谱能量值计算语音数据在频段的目标频谱能量值,分析语音数据在各个频段的目标频谱能量值得到语音数据的质量检测结果。本发明提供的技术方案通过对语音数据在不同频段的目标频谱能量值的计算可分析出语音数据的语音质量检测结果,实现了对语音数据质量的检测。

    一种图像标注方法及通用图像标注工具

    公开(公告)号:CN108829435A

    公开(公告)日:2018-11-16

    申请号:CN201810631648.7

    申请日:2018-06-19

    Abstract: 本申请提供了一种图像标注方法,根据图像标注需求对功能配置文件进行配置和解析,加载相应的功能模块,生成标注工具;根据所述标注工具中的绘制插件对图像进行标绘,并根据所述标注工具中的界面插件对标绘后的图像的属性进行标注,对图像进行标绘包括打点标绘、标线标绘、标框标绘和区域标绘。根据不同的图像标注需求可以灵活配置生成相应的标注工具,实现了打点标绘、标线标绘、标框标绘和区域标绘,还可以实现对标绘后的图像的属性进行标注,提高了图像标注的效率。

Patent Agency Ranking