-
公开(公告)号:CN118733772A
公开(公告)日:2024-10-01
申请号:CN202410856045.2
申请日:2024-06-28
Applicant: 浙江大学
IPC: G06F16/35 , G06F18/213 , G06F18/22 , G06N3/0455 , G06N3/047
Abstract: 本发明公开了一种儿童医疗文本数据分类方法,包括:(1)获取儿童医疗文本数据,标注得到层级多标签文本;(2)处理得到医疗文本、正样本标签文本、负样本标签文本,构建三元组数据集;(3)构建三塔模型,三塔模型包括三个编码器模块、一个标签召回模块和一个标签排序模块;(4)基于三元组数据集训练三塔模型;(5)使用训练完的三塔模型,分别对层级多标签文本中的父类标签文本和子类标签文本进行处理,将得到特征向量保存至离线特征向量库中;(6)针对待预测儿童医疗文本,使用三塔模型进行处理,再结合离线特征向量库,预测获取相似度高于阈值的top‑k预测标签。本发明可以大大提高儿童医疗文本到标签的匹配效率。
-
公开(公告)号:CN119380077A
公开(公告)日:2025-01-28
申请号:CN202411400145.0
申请日:2024-10-09
Applicant: 浙江大学
IPC: G06V10/764 , G06V10/82 , G06V10/80 , G06V10/774 , G16H50/70 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于改进ResNet的儿童皮肤病多分类系统,包括计算机存储器以及存储在计算机存储器中的分类模型;分类模型包含特征提取单元和预测单元;特征提取单元包含残差模块结构、中尺度膨胀卷积结构、宽尺度膨胀卷积结构和多尺度融合空洞卷积结构;图像顺次经过一个卷积层、一个最大池化层、一个卷积层和一个批正则化层后从提取特征,进入上述四个并行使用的结构,输出各自的特征图;预测单元将每个结构输出的特征图融合后输入一个批正则化层,对融合后的特征进行标准化;之后通过平均池化层对标准化后的特征图进行下采样;最后通过softmax层将特征转化为皮肤疾病的分类概率分布。利用本发明,可以提高常见儿童皮肤病的识别和分类准确性。
-
公开(公告)号:CN118733772B
公开(公告)日:2025-04-01
申请号:CN202410856045.2
申请日:2024-06-28
Applicant: 浙江大学
IPC: G06F16/353 , G06F18/213 , G06F18/22 , G06N3/0455 , G06N3/047
Abstract: 本发明公开了一种儿童医疗文本数据分类方法,包括:(1)获取儿童医疗文本数据,标注得到层级多标签文本;(2)处理得到医疗文本、正样本标签文本、负样本标签文本,构建三元组数据集;(3)构建三塔模型,三塔模型包括三个编码器模块、一个标签召回模块和一个标签排序模块;(4)基于三元组数据集训练三塔模型;(5)使用训练完的三塔模型,分别对层级多标签文本中的父类标签文本和子类标签文本进行处理,将得到特征向量保存至离线特征向量库中;(6)针对待预测儿童医疗文本,使用三塔模型进行处理,再结合离线特征向量库,预测获取相似度高于阈值的top‑k预测标签。本发明可以大大提高儿童医疗文本到标签的匹配效率。
-
-