一种利用掩码语言模型建模的图片敏感文字检测方法

    公开(公告)号:CN118172778A

    公开(公告)日:2024-06-11

    申请号:CN202211579126.X

    申请日:2022-12-08

    Applicant: 南京大学

    Abstract: 本发明提出了一种利用掩码语言模型建模的图片敏感文字检测方法,包括:光学字符识别模块、关键位置召回模块、掩码重建模块、重建结果选择模块和文字敏感性检测模块;待检测图片依次经过光学字符识别模块、关键位置召回模块、掩码重建模块、重建结果选择模块和文字敏感性检测模块,得到最终的图片敏感文字检测结果。本发明方法简单直接,可理解性强;不需要人工标注数据训练模型,成本低廉;可以作为现有的图片敏感文字检测系统的扩充,用途广泛;通过掩码语言模型对关键位置的文本进行重建,既能够对光学字符识别出错的文字进行纠错,也可以还原出被故意修改的地方原本的文字,有助于减少图片敏感文字检测系统错检漏检情况的发生。

    融合外部数据的基于方面类别的可解释性推荐方法及系统

    公开(公告)号:CN111966888B

    公开(公告)日:2023-12-15

    申请号:CN201910420367.1

    申请日:2019-05-20

    Applicant: 南京大学

    Abstract: 本发明公开了一种融合外部数据的基于方面类别的可解释性推荐方法和系统,该方法包括:S1:利用外部标准标注数据训练方面类别分类器和方面类别的情感极性分类器;S2:利用所述方面类别分类器和情感极性分类器对评论数据进行分类,得到每条评论的方面类别向量[a1,a2,…,an]和对应每个方面的情感向量[p1,p2,…,pn],其中n为方面的数量;S3:将所述方面类别向量与情感向量进行融合,得到待推荐的商品的预测打分和推荐理由。本发明引入了外部数据,提高了aspect和情感极性判断的准确性,使得对于评论的建模更加准确,也更加标准化,并

    一种标点标注方法及装置
    34.
    发明授权

    公开(公告)号:CN112036174B

    公开(公告)日:2023-11-07

    申请号:CN201910407855.9

    申请日:2019-05-15

    Applicant: 南京大学

    Abstract: 本公开涉及一种标点标注方法及装置。包括:获取语音识别得到的动态文本,所述动态文本中包括至少一个词语;依次获取所述词语,并将所述词语输入至标注模型,经所述标注模型输出所述词语的预测标点;判断所述预测标点的置信度是否不小于预设值,若所述置信度不小于所述预设值,则在所述词语之后标注所述预测标点。本公开以字或词语作为最小的处理单元,首先通过预测模型对所述字或词进行标点预测,并通过判断置信度的方式,对预测的准确性进行校准,显著的缩短了从音频中出现某个字或词到输出标注结果的时延,输出结果实时性较高,且准确性较强,不需要对标注结果进行二次修正,用户体验好。

    翻译质量测评方法及装置
    35.
    发明授权

    公开(公告)号:CN111985251B

    公开(公告)日:2023-11-07

    申请号:CN201910422427.3

    申请日:2019-05-21

    Applicant: 南京大学

    Abstract: 本公开涉及一种翻译质量测评方法及装置,所述方法包括:接收待测评的目标语言语句和对应的源语言语句;获取所述源语言语句的特征信息和所述目标语言语句的特征信息;对所述源语言语句的特征信息和所述目标语言语句的特征信息进行处理,得到测评信息。利用本公开各实施例,可以提高翻译质量测评结果的可靠性。

    一种基于环结构网格标记的隐式情感三元组抽取方法

    公开(公告)号:CN116244436A

    公开(公告)日:2023-06-09

    申请号:CN202310177676.7

    申请日:2023-02-24

    Applicant: 南京大学

    Abstract: 本发明提出了一种基于环结构网格标记的隐式情感三元组抽取方法,包括:构建人工标注的情感三元组数据集,包含待抽取的文本以及情感三元组信息;划分训练集、验证集和测试集;使用基于环的网格标签标注方法,结合情感三元组信息对文本进行网格标签标注,得到实体标签和网格标签;对环结构网格标记模型进行训练;验证评估模型,预测出实体标签与网格标签,并抽取对应的情感三元组;重复上述两个步骤直至模型收敛,保留验证集中最优模型作为最终模型,使用最终模型进行测试集上的F1分数评估;利用最终模型,对网络上的真实文本数据进行隐式情感三元组抽取。

    一种跨语言稠密检索中的查询表示增强方法

    公开(公告)号:CN116204622A

    公开(公告)日:2023-06-02

    申请号:CN202310157691.5

    申请日:2023-02-23

    Applicant: 南京大学

    Abstract: 本发明提出了一种跨语言稠密检索中的查询表示增强方法,包括:从跨语言检索系统的搜索日志中,收集用户输入的源语言查询以及对应的查询结果即目标语言候选文档中用户点击的目标语言文档,构建有标注的数据;检索出与用户输入的源语言查询相似度分数最高的前K个查询,将检索出的前K个查询分别对应的K个相关文档作为反馈文档;训练跨语言稠密检索模型,并根据K个反馈文档和用户输入的源语言查询获得稠密表示向量并进行融合,得到增强后的源语言查询表示;计算得到查询与文档的相似度;对目标语言候选文档进行排序,输出排序后的结果作为最终的检索结果。

    一种适用于EUV光刻的Mo/Si多层膜反射镜制备方法

    公开(公告)号:CN115323332A

    公开(公告)日:2022-11-11

    申请号:CN202210162233.6

    申请日:2022-02-22

    Applicant: 南京大学

    Abstract: 一种适用于EUV光刻的Mo/Si多层膜反射镜制备方法,采取直流磁控溅射方法在凸面镜上生长Mo/Si周期性多层膜,凸面镜在直流磁控溅射生长腔中做溅射处理以清洁表面吸附气体和使得样品表面平整,从而得到高质量的样品,溅射清洗功率为5‑10W,溅射清洗时间为5‑10分钟;Mo,Si均由高能Ar+轰击进行溅射,通过分别控制直流溅射功率来控制两种元素的沉积速率;通过磁控溅射腔体中,Mo和Si源顶端的挡板连续切换控制实现Mo/Si周期性交替生长,最后一层生长1.5nm的Si层进行覆盖防止氧化。磁控溅射腔体中需要有石英晶体振荡器作为原位的沉积速率定标手段。该方法膜厚控制精确、简单易行、可重复性高。

    机器翻译方法、装置及存储介质

    公开(公告)号:CN111310485B

    公开(公告)日:2022-06-21

    申请号:CN202010172133.2

    申请日:2020-03-12

    Applicant: 南京大学

    Abstract: 本公开涉及机器翻译领域,尤其涉及一种机器翻译方法、装置及存储介质。所述方法包括:根据待翻译的源端文本序列,调用编码器进行编码得到编码向量;根据编码向量,调用解码器进行解码得到中间结果;根据中间结果,通过总结层采用单头注意力得到当前时刻的词语对应的翻译概率分布,翻译概率分布用于指示多个候选词各自对应的选取概率;根据源端文本序列中各个词语的翻译概率分布,生成源端文本序列对应的目标译文。本公开实施例通过在包括编码器和解码器的机器翻译模型中增加一层总结层的方式,避免了相关技术中使用对多头注意力做剪枝、得到的注意力作为拷贝的注意力的情况,在保证解码速度的同时,提高了机器翻译模型的翻译质量。

    一种激光等离子体极紫外光源靶材的优化方法

    公开(公告)号:CN114442441A

    公开(公告)日:2022-05-06

    申请号:CN202210166835.9

    申请日:2022-02-23

    Applicant: 南京大学

    Abstract: 一种激光等离子体极紫外光源靶材优化方法,通过电子束蒸发的方式在产生激光等离子体的靶材衬底上生长锡薄膜,形成有限质量的固体薄膜靶,通过控制锡层的厚度来控制激光单次作用所消耗的锡量;当高能量脉冲激光与靶材作用产生等离子体时,通过控制薄膜靶的锡量进而优化极紫外光产生的效率和碎屑的产生。通过控制薄膜厚度调整靶材表面生长的锡燃料的量,使其在单次激光脉冲下,光斑作用下的锡可以充分利用,进而可以有效提高激光转化效率和靶材工作物质利用率,并减少碎屑对光学系统的污染。

Patent Agency Ranking