一种基于细粒度最优视角约束的医学影像报告生成方法

    公开(公告)号:CN119811574A

    公开(公告)日:2025-04-11

    申请号:CN202411565903.4

    申请日:2024-11-05

    Abstract: 本发明涉及深度学习、自然语言处理、跨模态对齐、图像字幕等技术,并公开了一种基于细粒度最优视角约束的医学影像报告生成方法。该方法通过分析医学影像中所有对象的位置关系和视觉特征来确定该医学影像最合适视角。随后,将最优视角作为前缀编码,融合句子对应对象的位置信息与视觉特征,通过计算对象与句子对应的概率分数以过滤对象集合。在此基础上,利用过滤后的对象集合重构联合对象子图像,根据先前的句子和与当前句子对应的视觉特征来生成当前时间步的句子,并确定是否是最后一个句子,最后得到医学影像文本报告。本发明的技术方案弥合了医学影像报告生成领域的视觉与语言之间的鸿沟,为解决这一难题提供了一种创新方法。

    一种基于频域调制的对比学习序列推荐方法

    公开(公告)号:CN119577263A

    公开(公告)日:2025-03-07

    申请号:CN202411608807.3

    申请日:2024-11-12

    Abstract: 本发明提出一种基于频域调制和对比学习的序列推荐方法。本发明针对的是序列推荐中数据存在大量噪声和数据稀疏以及现有模型预测平滑的问题。所述方法包括:一方面,将用户序列通过嵌入层,利用绝对位置编码引入位置信息,再通过多头自注意力网络提取序列中用户的长期依赖得到新的嵌入Eattention。另一方面,将用户初始嵌入通过感应偏置网络进行频域调制。通过傅里叶变化及其逆变化,捕获用户数据中高通分量和低通分量,将其动态融合得到Et。最后通过自适应融合,将Eattention和Et融合。此外,在模型训练过程中,本发明引入了对比学习思想,将Eattention和Et视作同一样本的不同增强视图,提高了模型的泛化能力。

    一种基于广度视角的虚假新闻检测方法

    公开(公告)号:CN119493864A

    公开(公告)日:2025-02-21

    申请号:CN202411451132.6

    申请日:2024-10-17

    Abstract: 本发明提出了一种基于广度视角的虚假新闻检测方法。旨在解决现有检测方法中忽视新闻背景及传播时间动态性的问题。该方法通过构建宏观和微观新闻背景,对原帖子的发布背景进行观察,分别提取流行度导向和新颖度导向的特征,并利用预训练模型BERT提取新闻的语义特征。本发明还引入了时间图快照和图卷积神经网络相结合的方法,提取虚假新闻的时间动态特征和结构特征,形成多阶段图快照,捕捉虚假新闻的扩散过程。最终将广度视角特征、传播结构特征与文本语义特征进行融合,通过SoftMax分类器实现新闻真假分类。该方法能够更有效地分析新闻背景、传播规律及其动态特征,从而提高虚假新闻检测的准确性和时效性。

    一种基于Transformer的跨模态细粒度检索方法

    公开(公告)号:CN117874264A

    公开(公告)日:2024-04-12

    申请号:CN202311654682.3

    申请日:2023-12-05

    Abstract: 本发明公开了一种基于Transformer的跨模态细粒度检索方法,包括选取并制作跨模态检索任务所需的训练集数据和验证集数据,分别包含了图像,视频,音频和文本四个模态,以及它们各自的标签文件。本方法核心创新分为两部分,第一部分为模态特异性特征提取,将来自各模态的数据通过各自的编码器后,接LAGC‑Attention模块完成细粒度特征提取;第二部分为跨模态信息交互,通过自设计的跨模态交互的MMC模块完成,该模块可以充分融合来自不同模态的特征信息,并对不同模态的公共特征表达进行对齐。因此,每个模态提取得到的特征表达不仅包含了其单模态的有效信息,还包含了不同模态之间的联系与共性。这极大地增强了每一个模态的特征表达能力,尤其是缩小了文本模态与图像模态之间的异构性。因此在跨模态检索任务中,各模态皆可高效且准确地搜寻到其他模态。本发明为后续的跨模态细粒度检索和推荐算法等研究提供了重要的技术支持,可广泛应用于搜索引擎,精准推送等现实场景。

    一种基于多尺度残差生成对抗网络的单图像盲去运动模糊方法

    公开(公告)号:CN111199522A

    公开(公告)日:2020-05-26

    申请号:CN201911349604.6

    申请日:2019-12-24

    Abstract: 本发明公开了一种基于多尺度残差生成对抗网络的单图像盲去运动模糊方法。包括如下步骤:获取GoPRo成对数据集将其连接成形为模糊——清晰形式的图像对;将训练图像随机裁剪成256×256大小的图像补丁;将标准化后的图像作为模型训练输入数据;设计卷积神经网络,输出去模糊之后的图像;计算模型的输出信息与对应标签清晰图像的峰值信噪比和结构相似性以及损失优化;利用优化后的模型参数,对现实中的具有运动模糊场景的图片进行去模糊得到相应的清晰图片。本发明基于卷积神经网络,采用条件生成对抗网络作为骨干网络并采用了细粒度残差模块作为主体模块,实现了对图像去模糊问题转变为图像翻译问题并加以解决的突破,为图像去模糊的后续操作提供了重要的技术支持。

    一种图像处理的方法及装置

    公开(公告)号:CN105761267B

    公开(公告)日:2019-08-06

    申请号:CN201610129868.0

    申请日:2016-03-08

    Abstract: 本发明公开了一种图像处理的方法及装置,所述方法包括:获取待显示的图像,通过边缘检测算子对所述待显示的图像进行预处理,得到所述待显示的图像中的感兴趣ROI;计算所述ROI中的特征参数;根据所述特征参数和线性回归法得到目标映射函数;在根据所述特征参数和所述目标映射函数确定所述特征参数满足预设调整条件时,根据所述目标映射函数对所述特征参数进行自适应调整,并将自适应调整后的所述待显示的图像输出并显示。实现自适应调整,提高图像的显示质量和用户体验。

    一种基于分类器链的汽车评论主题提取方法

    公开(公告)号:CN109783636A

    公开(公告)日:2019-05-21

    申请号:CN201811517941.7

    申请日:2018-12-12

    Abstract: 本发明请求保护一种基于分类器链的汽车评论主题提取方法,包括:101汽车评论文本数据预处理,对汽车论坛用户历史评论数据进行预处理操作;102评论文本向量化,使用加权TF-IDF方法对数据预处理后的每条文本进行向量化从而提取文本特征;103评论主题聚类划分,使用k-means算法对文本主题聚类划分,得到现有主题类别的一个划分;104局部多标签分类器链主题提取算法设计:将一条完整的分类器链转化为多条局部分类器链,同时每条局部分类器链采用距离类簇中心点由远到近的原则构建链,最后多条局部分类器链集成得到最终预测结果。本发明基于汽车论坛的用户历史评论数据,提取文本特征,设计改进的局部分类器算法,建立预测模型,从而预测每条评论属于哪些主题。

    一种基于自适应特征通道的行人检测方法

    公开(公告)号:CN109766790A

    公开(公告)日:2019-05-17

    申请号:CN201811581304.6

    申请日:2018-12-24

    Abstract: 本发明公开了一种基于自适应特征通道的行人检测方法,包括如下步骤:步骤一,获取Caltech行人数据帧,基于该数据帧捕获训练集和验证集;步骤二,缩放训练集和验证集图像;步骤三,将标准化后图像作为模型输入数据;步骤四,基于Caffe开源深度学习框架设计卷积神经网络,输出图像包含行人与否的信息、行人的位置信息以及该位置存在行人的可能性;步骤五,计算模型的输出信息与对应标注信息的损失,优化并训练模型;步骤六,利用优化后的模型参数,检测真实场景图像中存在的行人,得到相应的行人检测框。本发明基于卷积神经网络,采用了转移学习以及多任务联合学习的技术,实现了端到端的行人检测方法,为行人检测的后续操作提供了重要的技术支持。

    一种文字识别方法及装置

    公开(公告)号:CN104915627B

    公开(公告)日:2019-04-26

    申请号:CN201410088106.1

    申请日:2014-03-11

    Abstract: 本发明实施例公开了一种文字识别方法及装置,所述方法包括:接收输入的任一待识别文字;将所述待识别文字进行向量处理后,得到所述待识别文字的待识别特征集,所述待识别特征集包括待识别特征;根据所述待识别特征生成预设个数的待识别超边;将所述待识别超边与预先存储的超边库中的超边进行对比,当所述待识别超边与所述超边库中的超边匹配个数满足预设条件时,确定所述待识别文字识别成功。与现有技术相比,本发明能够提高文字的识别效率,同时尽量避免识别误差的产生。

    一种基于大数据的搜索广告转化智能预测方法

    公开(公告)号:CN109255651A

    公开(公告)日:2019-01-22

    申请号:CN201810961106.6

    申请日:2018-08-22

    Abstract: 本发明公开了一种基于大数据的搜索广告转化智能预测方法,包括以下步骤:数据预处理;根据行为时间对数据进行划分操作;根据搜索广告、用户、商铺历史数据进行特征工程构建操作;根据特征工程特征分布进行特征调整操作;建立多个机器学习模型,并进行模型融合操作;通过已建立模型,根据搜索广告、用户、商铺数据预测广告转化率。本发明主要通过对搜索广告、用户、商铺数据进行预处理和分析提取特征,建立多个机器学习模型并进行stacking模型融合,从而准确预测广告的转化率,能够使得广告主匹配到最可能购买自家商品的用户;另一方面,也能让用户快速找到购买意愿最强的商品,从而提升在电商平台中的用户体验。

Patent Agency Ranking