基于ResNet-50时间压缩的胃镜图片分类方法、装置和存储介质

    公开(公告)号:CN112364926A

    公开(公告)日:2021-02-12

    申请号:CN202011283381.0

    申请日:2020-11-17

    Applicant: 苏州大学

    Abstract: 本申请公开了一种基于ResNet‑50时间压缩的胃镜图片分类方法、装置和存储介质,涉及医学图像智能处理技术领域,所述方法包括:获取胃镜图片;对所述胃镜图片进行预处理;将预处理后的所述胃镜图片输入至ResNet‑50网络模型中,所述ResNet‑50网络模型的前三种残差结构中每种残差结构之后设置有分支分类器,最后一种残差结构之后设置有主干分类器;依次获取所述ResNet‑50网络模型中每个分类器的分类结果,根据获取到的分类结果确定所述胃镜图片的最终分类结果。解决了现有技术中人眼观察胃镜图片时由于医生经验水平等影响导致人为判断会存在误诊并且需要耗费大量时间的问题,达到了将胃镜图片输入至ResNet‑50网络模型之后即可自动输出分类结果,在基本不影响分类准确度的情况下节省测试时间的效果。

    一种基于多标注数据的依存句法分析模型训练方法及装置

    公开(公告)号:CN112232024A

    公开(公告)日:2021-01-15

    申请号:CN202011089840.1

    申请日:2020-10-13

    Applicant: 苏州大学

    Abstract: 本申请公开了一种基于多标注数据的依存句法分析模型训练方法,包括:获取词序列以及多种标注结果;将词序列输入依存句法分析模型,得到弧得分和标签得分;根据目标损失函数,计算弧得分和标签得分相对于多种标注结果的损失值;通过迭代训练,以最小化损失值为目的,调整依存句法分析模型的模型参数,以实现模型训练。可见,该方法能够根据目标损失函数计算模型输出结果相对于全部标注结果的损失值,并据此完成对模型的迭代训练,实现了充分利用全部标注数据中的有效信息的目的,提升了模型的依存句法分析能力。此外,本申请还提供了一种基于多标注数据的依存句法分析模型训练装置、设备及可读存储介质,其技术效果与上述方法相对应。

    基于多级词典的分词方法、装置、设备及可读存储介质

    公开(公告)号:CN112214994A

    公开(公告)日:2021-01-12

    申请号:CN202011079701.0

    申请日:2020-10-10

    Applicant: 苏州大学

    Abstract: 本申请公开了一种基于多级词典的分词方法,该方法采用至少两个词典以辅助分词模型进行分词,在对字符进行表示的时候,不仅生成常规的向量表示,还生成该字符在至少两个词典中的特征表示,最终根据向量表示和特征表示确定该字符的成词标签。该方法通过区分不同词的地位和重要性,从而提升整体方案的分词性能,提升领域适应能力和分词准确性。此外,本申请还提供了一种基于多级词典的分词装置、设备及可读存储介质,其技术效果与上述方法的技术效果相对应。

    多领域实体识别方法
    34.
    发明公开

    公开(公告)号:CN111611802A

    公开(公告)日:2020-09-01

    申请号:CN202010437407.6

    申请日:2020-05-21

    Applicant: 苏州大学

    Abstract: 本发明公开了一种多领域实体识别方法。本专利中,我们主要做出了如下2个创新:1、针对目标领域无任何人工标注数据的跨领域场景,快速自动构建目标领域的弱标注数据。2、将局部标注学习应用到跨领域命名实体识别任务中。有益效果:在目标领域没有任何人工标注数据的场景下,有效改善源领域模型的领域自适应能力,在降低数据标注成本的同时,提高了目标领域的实体识别性能。

    一种机器翻译文本的译后编辑方法及装置

    公开(公告)号:CN109635269A

    公开(公告)日:2019-04-16

    申请号:CN201910079518.1

    申请日:2019-01-31

    Applicant: 苏州大学

    CPC classification number: G06F17/24 G06F17/289

    Abstract: 本发明公开了一种机器翻译文本的译后编辑方法,包括:获取源文本和机器翻译文本;通过自注意力机制提取源文本的第一文本特征,并利用前馈神经网络对第一文本特征进行处理,得到表示源文本的第一向量;通过自注意力机制提取机器翻译文本的第二文本特征,通过对第一向量使用注意力机制优化第二文本特征;利用前馈神经网络对优化后的第二文本特征进行处理,得到表示机器翻译文本的第二向量;根据第一向量和第二向量从左至右逐词生成机器翻译文本的译后编辑文本。该方法能够提高译后编辑的处理效率和准确率,使得处理得到的译后编辑文本的准确性更佳。本发明公开的一种机器翻译文本的译后编辑装置、设备及可读存储介质,也同样具有上述技术效果。

    基于语法规约指导的神经机器翻译方法

    公开(公告)号:CN108984538A

    公开(公告)日:2018-12-11

    申请号:CN201810784072.8

    申请日:2018-07-17

    Applicant: 苏州大学

    Abstract: 本发明涉及一种基于语法规约指导的神经机器翻译方法,为了得到更加精准的神经翻译模型而设计。本发明基于语法规约指导的神经机器翻译方法,本发明对源端和目标端都进行指导:在源端,添加了注意力损失来指导注意力集中在源端短语上;在目标端通过一层子网络来指导目标端词关注到合适的目标端短语上。网络的源端和目标端构成一个汇总损失,称为指导损失,用于指导NMT。本发明能够有效地改善神经机器翻译质量。

    一种实体识别方法、装置、设备及计算机可读存储介质

    公开(公告)号:CN108845988A

    公开(公告)日:2018-11-20

    申请号:CN201810581154.2

    申请日:2018-06-07

    Applicant: 苏州大学

    Abstract: 本发明公开了一种实体识别方法、装置、设备及计算机可读存储介质,该方法包括:获取训练数据集为当前数据集;利用当前数据集训练当前识别模型得到当前识别模型,判断其识别准确度是否达到准确度阈值,若是,则确定完成训练,若否,则调整当前识别模型的参数得到当前识别模型,将当前数据集中每个训练样本的样本特征输入至当前选取模型,计算当前选取模型输出的决策的分数,基于该分数调整当前选取模型的参数得到当前选取模型;将包括有决策为保留的全部训练样本的数据集作为当前数据集,返回执行训练当前识别模型的步骤;利用实体识别模型实现实体识别,基于识别到的实体实现对应产品的推荐。保证实体识别模型识别性能较好,实现产品的准确推荐。

    一种智能检索方法、装置和计算机可读存储介质

    公开(公告)号:CN108763529A

    公开(公告)日:2018-11-06

    申请号:CN201810549831.2

    申请日:2018-05-31

    Applicant: 苏州大学

    Inventor: 张民 董孝政

    CPC classification number: G06F17/278 G06F17/2785 G06N5/025

    Abstract: 本发明实施例公开了一种智能检索方法、装置和计算机可读存储介质,对获取的文档信息进行分句处理,以得到多个源语句;利用训练后的问题生成模型,对各源语句进行处理,得到对应的文档题目;根据源语句及其对应的文档题目,建立文档问答对,并将文档问答对存储于知识库中。按照预设的索引规则,对各问答对进行处理,得到对应的多个语汇单元;当出现待处理的题目时,依据各语汇单元,便可以快速的从知识库中查找出与待处理题目相对应的答案。由于知识库中存储有依据文档信息生成的问答对,其答案的准确性可以得到有效的保障,使得依据该知识库查找出的答案更容易满足用户的需求。并且通过建立语汇单元,有效的提升了检索的效率。

    多粒度分词标注数据自动获取方法及系统

    公开(公告)号:CN107818079A

    公开(公告)日:2018-03-20

    申请号:CN201710791701.5

    申请日:2017-09-05

    Applicant: 苏州大学

    Inventor: 李正华 张民 龚晨

    CPC classification number: G06F17/2775

    Abstract: 本发明涉及一种多粒度分词标注数据自动获取方法及系统,为了能够准确、快速、自动的获得多粒度分词标注数据而设计。本发明选择n种不同规范的单粒度分词标注数据集,将至少一种单粒度分词标注数据集中的句子分别转化为遵守其他n-1种分词规范的分词序列,被转化后的句子对应的n种不同规范的分词序列为该句子的多粒度分词结果;合并每一个句子的多粒度分词结果,形成多粒度分词标注数据集。本发明首次提出了多粒度分词的概念;使用耦合序列标注模型进行不同规范间单粒度分词标注数据的转换,从而获取多粒度分词标注数据。

    基于序列标注建模的多粒度分词方法及系统

    公开(公告)号:CN107729312A

    公开(公告)日:2018-02-23

    申请号:CN201710790736.7

    申请日:2017-09-05

    Applicant: 苏州大学

    Inventor: 张民 李正华 龚晨

    CPC classification number: G06F17/277 G06N3/049

    Abstract: 本发明涉及一种基于序列标注建模的多粒度分词方法与系统,提供了一种采用机器学习的方式获取多粒度标签序列的方法及系统,本发明所述的方法,包括:将至少一种单粒度标注数据集中的句子分别转化为遵守其他n-1种分词规范的分词序列,将每一个句子对应的n种遵守不同规范分词序列转化为多粒度分词层次结构,根据预定的编码方法以及多粒度分词层次结构,得到每一个句子的每一个字的多粒度标签,进而得到每一个句子的多粒度标签序列;基于所述的包含句子和对应多粒度标签序列的数据集,通过训练序列标注模型,得到多粒度序列标注模型。本发明首次提出了多粒度分词的概念,能够快速、自动的获取多粒度分词层次结构。

Patent Agency Ranking