基于医学图像的病灶检测方法、模型训练的方法及装置

    公开(公告)号:CN110414631A

    公开(公告)日:2019-11-05

    申请号:CN201910833614.0

    申请日:2019-09-04

    Abstract: 本申请公开了一种基于医学图像的病灶检测方法,该方法应用于人工智能领域,具体可应用于智能医疗领域,该方法包括:获取待预测钼靶图像;通过主任务网络模型获取待预测钼靶图像中每个像素点属于病灶的概率值,主任务网络模型为通过源域数据集合以及域分类网络模型训练得到的,域分类网络模型为通过源域数据集合以及目标域数据集合训练得到的;根据每个像素点属于病灶的概率值生成待预测钼靶图像的肿块检测结果。本申请还提供了一种模型训练的方法和装置。本申请利用主任务网络模型和域分类网络模型之间的关系,解决源域数据集合和目标域数据集合之间的域差异问题,使得主任务网络模型在目标数据集合上获得优良的检测性能。

    一种敏感数据发布中的隐私保护方法

    公开(公告)号:CN106874788B

    公开(公告)日:2019-10-08

    申请号:CN201710043245.6

    申请日:2017-01-19

    Abstract: 本发明公开了一种敏感数据发布中的隐私保护方法,包括:接收来自用户的数据集以及对应的多个概化输入树,遍历数据集中的每一组数据,并依次判断该组数据中的每一列数据是否存在对应的概化输入树,如果存在,则根据该数据的属性值在对应概化输入树中查找对应的节点,并将该节点的信息输入到坐标数组中,如果不存在,则直接将该数据的属性值输入坐标数组中,从而得到m行坐标数组,并为每个坐标数组添加初始值为0的标志位,建立p个簇,从m行坐标数组中随机选择其中p行坐标数组分别作为建立的p个簇的中心点。本发明使用先聚类再概化的方法,不仅提高了计算效率,也为进行大规模计算奠定了基础。

    一种基于深度学习的块级缓存预取优化方法和系统

    公开(公告)号:CN110245094A

    公开(公告)日:2019-09-17

    申请号:CN201910526384.3

    申请日:2019-06-18

    Abstract: 本发明公开了一种基于深度学习的块级缓存预取优化方法,包括:从测试数据集获取以字节为单位的IO数据,将该IO数据转化为以块为单位的IO数据,判断转化后的IO数据是否在缓存中命中,如果没有则对转化后的IO数据进行顺序预测,以得到多个存储块,将转化后的IO数据存储在内存的IO队列中,并判断该IO队列是否已满,如果是则将内存的IO队列中的所有IO数据输入训练好的Seq2Seq模型中,以得到预测的IO数据,并根据该预测的IO数据获取对应的多个存储块。本发明根据利用深度学习的方法挖掘IO的相关性,并利用基于LSTM的Seq2Seq模型完成IO序列的预测,最后将IO序列预测与顺序预测相结合,从而完成缓存的预取,提升缓存的命中率。

    一种基于RDMA网络的分布式文件系统数据传输方法和系统

    公开(公告)号:CN110191194A

    公开(公告)日:2019-08-30

    申请号:CN201910508982.8

    申请日:2019-06-13

    Inventor: 王桦 周可 阴智辉

    Abstract: 本发明公开了一种基于RDMA网络的分布式文件系统数据传输方法,包括:客户端在接收到来自用户的文件访问请求时,向服务端发起RDMA连接请求,服务端在获取到来自客户端的RDMA连接请求后,建立与客户端的RDMA连接,客户端根据文件访问请求生成网络数据访问请求,并利用RDMA连接将该网络数据访问请求发送到服务端,服务端对网络数据访问请求进行解析,以获取其中的地址信息,并根据该地址信息获取其对应的文件在该服务端的内存中的地址作为服务端返回地址,服务端将服务端返回地址、以及RDMA远程访问权限信息发送到客户端。本发明能够解决现有分布式文件系统存在的数据传输过程中内存操作的开销较大的技术问题,以及服务端的负载较大、传输时延较长的技术问题。

    一种基于分类预测的缓存选择方法和系统

    公开(公告)号:CN107247675B

    公开(公告)日:2019-08-20

    申请号:CN201710397520.4

    申请日:2017-05-31

    Abstract: 本发明公开了一种基于分类预测的缓存选择策略。该策略利用朴素贝叶斯分类思想将对象分为两类:“只访问一次”和“访问大于一次”。避免将“只访问一次”的对象放入缓存,并且基于朴素贝叶斯的分类时空开销较小。在缓存过程中,通过历史信息表对预测不准的图片进行弥补,降低误判概率。此外,根据缓存实时情况动态调整“只访问一次”的预测权重,使更有效地利用缓存。本发明用于缓存替换算法之前的预判断,可以结合任何一种缓存替换算法。在不改变缓存算法复杂度的同时提升缓存命中率,减少SSD写入并延长SSD寿命。同时,将机器学习的思想引入缓存也给缓存算法研究提供了一种新的考虑思路。

    一种大数据环境下的多粒度访问控制方法

    公开(公告)号:CN107370604B

    公开(公告)日:2019-05-31

    申请号:CN201710548645.2

    申请日:2017-07-07

    Abstract: 本发明公开了一种大数据环境下的多粒度访问控制方法,其通过将文件层次的访问控制丰富成文件夹、文件、文件元数据三个层次的访问控制,实现多粒度的访问控制,从多个层面保障了大数据环境下的数据安全。在用户创建文件夹时指定基于文件夹的访问控制策略,上传文件时指定基于文件和文件元数据的访问控制策略,并且可选择对文件进行CPABE加密方式进行加密,使其以密文的形式存储在云端,适应了云端的半可信特性。当用户请求数据时,会依次判断文件夹的访问权限和文件的访问权限,只有同时满足条件时才能得到密文,并用自己的密钥进行解密。由于增加了策略冲突检测和策略合并模块,使整个系统的运行更加高效。

    一种面向高校图书馆的图书个性化推荐方法和系统

    公开(公告)号:CN106202184B

    公开(公告)日:2019-05-31

    申请号:CN201610481556.6

    申请日:2016-06-27

    Abstract: 本发明公开了一种面向高校图书馆的图书个性化推荐的方法,解决高校图书馆现有的图书推荐算法中大规模数据存储和查询、可扩展性及推荐效果差的问题,其基本思路如下:首先将图书馆内的读者和图书等作为节点,构建图模型;其次,将读者的操作日志文件转化为读者‑图书类别偏好矩阵,和读者个人信息矩阵一起计算读者间的相似度,并把这些操作和挖掘出的信息作为边构建关联图谱;其次,将关联图谱和谱聚类相结合,提出了一种新的图书个性化推荐模型,计算得到关于读者的类簇分布;最后,当需要进行图书推荐时,在该读者对应的类簇中根据协同过滤算法计算出推荐图书列表。

    一种基于词性分类的文本分类方法和系统

    公开(公告)号:CN108763539A

    公开(公告)日:2018-11-06

    申请号:CN201810551315.3

    申请日:2018-05-31

    Inventor: 周可 李兴 曾江峰

    Abstract: 本发明公开了一种基于词性分类的文本分类方法,包括:从网络获取训练文本集和测试文本集,对训练文本集与测试文本集进行预处理,从而获得训练文本集与测试文本集中每一个文本的多个词集,将得到的每个文本的多个词集作为输入对文本主题生成模型LDA进行训练,以得到每个文本在不同主题数目下的文本‑词集‑主题的混合概率分布模型,使用SVM‑train函数对多个文本‑词集‑主题的混合概率分布模型进行分类器训练,以得到多个训练后的分类器,使用多个文本‑词集‑主题的混合概率分布模型作为训练后的分类器的输入进行SVM类别预测。本发明能解决现有方法中存在的训练模型时所需特征词的维度高、分类的准确率低、以及分类器的泛化能力差的技术问题。

    一种基于聚类的重复数据检测方法

    公开(公告)号:CN107515931A

    公开(公告)日:2017-12-26

    申请号:CN201710747552.2

    申请日:2017-08-28

    Inventor: 周可 王桦 张攀峰

    CPC classification number: G06F16/2228 G06F16/215 G06K9/6215 G06K9/6218

    Abstract: 本发明公开了一种基于聚类的重复数据检测方法,其主要针对数据相似性较强的数据集类型,通过利用数据集中的数据相似性原理,提高重复数据检测的性能,同时提升数据去重的性能。具体而言,对于数据集中可能的重复数据,本发明利用相似性合并策略,先对检测指纹列表进行分段,每段选出代表性指纹,根据其代表性指纹将不同段分类并合并到不同的指纹容器中。指纹容器从数据集的相似段中收集重复的指纹,以增加数据去重的效率,同时提升去重的性能。指纹容器存储在磁盘上,它可以作为一个整体被写入和读出磁盘,这提高了指纹检索效率并克服了相似段的分段存储的问题。

    一种大数据环境下的多粒度访问控制方法

    公开(公告)号:CN107370604A

    公开(公告)日:2017-11-21

    申请号:CN201710548645.2

    申请日:2017-07-07

    Abstract: 本发明公开了一种大数据环境下的多粒度访问控制方法,其通过将文件层次的访问控制丰富成文件夹、文件、文件元数据三个层次的访问控制,实现多粒度的访问控制,从多个层面保障了大数据环境下的数据安全。在用户创建文件夹时指定基于文件夹的访问控制策略,上传文件时指定基于文件和文件元数据的访问控制策略,并且可选择对文件进行CPABE加密方式进行加密,使其以密文的形式存储在云端,适应了云端的半可信特性。当用户请求数据时,会依次判断文件夹的访问权限和文件的访问权限,只有同时满足条件时才能得到密文,并用自己的密钥进行解密。由于增加了策略冲突检测和策略合并模块,使整个系统的运行更加高效。

Patent Agency Ranking