一种分层结构、分布式搜索引擎系统及其实现方法

    公开(公告)号:CN101950300A

    公开(公告)日:2011-01-19

    申请号:CN201010290008.8

    申请日:2010-09-20

    Abstract: 本发明公开了一种应用于分布式搜索引擎的分层结构,包括物理层、抽象层、应用层和表示层;本发明还公开了一种分布式搜索引擎系统,包括Web服务器、代理节点、查询代理池、抽象适配器和多个工作节点,所述查询代理池由多个查询节点组成;本发明还公开了上述一种分布式搜索引擎系统的实现方法,包括以下步骤:S1、查询节点注册;S2、工作节点的注册;S3、节点的状态更新;S4、查询请求的分发与检索。本发明具有性能好、可靠性高、多样化、专业化以及适用性强等优点。

    基于有限医学文本的乳腺癌pCR早期预测系统

    公开(公告)号:CN120032879A

    公开(公告)日:2025-05-23

    申请号:CN202510099265.X

    申请日:2025-01-22

    Inventor: 袁华 赵宁

    Abstract: 本发明公开了一种基于有限医学文本的乳腺癌pCR早期预测系统,通过预训练优化并冻结大语言模型的参数;获取治疗前带有临床数据的DWI和DCE‑MRI用于训练;利用不同的特征提取模块分别从DWI和DCE‑MRI中提取形态学特征和血流动力学特征;使用冻结参数的大语言模型扩充有限的临床数据,用编码器提取文本特征;将文本特征、形态学特征和血流动力学特征动态融合获得最终的特征表示,然后输入到全连接神经网络中进行分类并训练出最优模型;使用最优模型进行推理。本发明利用大语言模型解决医学文本稀缺的问题,有效融合多源图像的信息,提升pCR预测的准确率。

    一种多因素的短时交通流预测方法

    公开(公告)号:CN109658695B

    公开(公告)日:2020-09-22

    申请号:CN201910001441.6

    申请日:2019-01-02

    Inventor: 陈泽濠 袁华

    Abstract: 本发明公开了一种多因素的短时交通流预测方法,包括步骤:1)计算特定检测器与气象站之间的距离,筛选出距离最近的气象站,将该气象站的天气数据作为检测器的天气数据;2)分别对检测器的历史交通流数据与历史天气数据进行预处理,再根据时间合并;3)构建多种特征,基于LightGBM进行特征筛选;4)利用LSTM对交通流数据的时序特征与周期性特征进行建模;5)使用神经网络中的全连接网络将交通流的时序特征、周期性特征与步骤3)筛选出来的多种特征进行融合;6)训练模型并对短时交通流进行预测。本发明克服了现有方法不能充分利用已有数据的不足,能对交通流数据进行更深入的挖掘分析,预测准确性高,鲁棒性好。

    一种基于时间衰减采样的广告点击预估方法

    公开(公告)号:CN106886915B

    公开(公告)日:2020-07-28

    申请号:CN201710041277.2

    申请日:2017-01-17

    Abstract: 本发明公开了一种基于时间衰减采样的广告点击预估方法,主体思想是从离测试集日期近的数据中多采样,离测试集日期远的数据中少采样,采样量依据时间的远近呈现一个渐变的趋势,通过将采样数据进行时间维度上的划分,构建出适合广告点击预估的训练数据,再通过多模型融合的方法,为广告点击预估构建出更加精准和有效的模型。本发明更能捕捉到时间更近的数据的特征,达到更好的预估效果,此类基于时间衰减的采样方法可以延伸到其他跟时间相关,基于时间序列的不平衡数据中,具有广泛的应用前景。

    一种基于车辆历史轨迹的个性化路线推荐方法

    公开(公告)号:CN108303108B

    公开(公告)日:2020-05-22

    申请号:CN201711266923.1

    申请日:2017-12-05

    Inventor: 易先锋 袁华

    Abstract: 本发明公开了一种基于车辆历史轨迹的个性化路线推荐方法,该方法是:首先建立一个分场景路径时间预测模型,热门路径采用KNN预测,非热门路径采用GBDT算法预测;接着,采用最优化的思想,利用梯度下降方法建模用户偏好;最后根据用户偏好进行个性化推荐。推荐过程中,一方面,本发明将协同过滤思想引入了进来,通过寻找相似的用户,利用相似用户的历史轨迹进行推荐;另一方面,我们也可以将其认为是一个导航问题,只不过不是普通导航,而是一个个性化导航,此时,建立一个多权重道路网图,在这个多权重路网图上,根据用户偏好向量,利用迪杰斯特拉算法求得一条总开销最小的路径,即最满足用户偏好的路径。

    一种基于云计算平台Spark的变异检测方法

    公开(公告)号:CN107665291B

    公开(公告)日:2020-05-22

    申请号:CN201710886300.8

    申请日:2017-09-27

    Abstract: 本发明公开了一种基于云计算平台Spark的变异检测方法,包括步骤:1)Spark主节点截取部分的输入序列比对映射格式文件,分发到各个Spark工作节点中;2)Spark工作节点并行对上述的片段序列比对映射格式文件进行预处理,获取片段的预处理信息并返回到Spark主节点;3)Spark主节点根据上述的预处理信息对输入序列比对映射格式文件进行自定义粒度划分,并分发到各个Spark工作节点;4)Spark工作节点对片段序列比对映射格式文件进行变异检测,Spark主节点接收所有工作节点的返回数据并写入文件。本发明能有效解决HaplotypeCaller变异检测方法不能适应于多节点环境情景或者在多节点时负载不均衡的问题。

    一种分布式搜索引擎系统及其实现方法

    公开(公告)号:CN101950300B

    公开(公告)日:2013-07-24

    申请号:CN201010290008.8

    申请日:2010-09-20

    Abstract: 本发明公开了一种分布式搜索引擎系统,包括Web服务器、代理节点、查询代理池、抽象适配器和多个工作节点,所述查询代理池由多个查询节点组成;本发明还公开了上述一种分布式搜索引擎系统的实现方法,包括以下步骤:S1、查询节点注册;S2、工作节点的注册;S3、节点的状态更新;S4、查询请求的分发与检索。本发明具有性能好、可靠性高、多样化、专业化以及适用性强等优点。

    一种基于页面分块的图片摘要提取系统及方法

    公开(公告)号:CN101944109A

    公开(公告)日:2011-01-12

    申请号:CN201010275844.9

    申请日:2010-09-06

    Abstract: 本发明公开了一种基于页面分块的图片摘要提取系统,包括页面预处理模块、页面分类模块、页面分块模块、主题块识别模块和信息提取模块。本发明还公开了一种基于页面分块的图片摘要提取方法,具体包括:步骤S1、从Internet上把页面抓取下来;步骤S2、页面预处理模块对页面进行预处理;步骤S3、页面分类模块对预处理后的页面分类;步骤S4、页面分块模块进行语义块划分;步骤S5、页面分块模块将主题型页面发送到主题块识别模块,主题块识别模块识别出主题块,并发送给信息提取模块;页面分块模块将非主题型页面发送到信息提取模块;步骤S6、信息提取模块下载图片并与页面关联。本发明具有提取速度快、准确度高、效果好的优点。

    一种基于多视角图像的乳腺肿块检测系统

    公开(公告)号:CN116740045A

    公开(公告)日:2023-09-12

    申请号:CN202310821323.6

    申请日:2023-07-05

    Abstract: 本发明公开了一种基于多视角图像的乳腺肿块检测系统,包括:数据导入模块,用于加载乳腺的多视角图像,并对数据进行预处理;特征提取模块,用于提取主视图和辅助视图的图像特征;区域提取模块,用于获取主视图中肿块的候选区域和ROI特征、辅助视图中的Patch位置和Patch特征;信息融合模块,利用加权融合将ROI和Patch进行信息融合,得到增强后的ROI视觉特征;肿块检测模块,用于依据增强后的ROI视觉特征进行分类和位置回归,得到主视图的肿块检测结果。本发明模拟医生分析多视角图像的思路,构建基于多视角图像的肿块检测系统,有效融合多视图的信息,提升乳腺肿块的检出率并降低假阳率。

    一种领域适应医学文献神经机器翻译模型的训练方法

    公开(公告)号:CN112989848B

    公开(公告)日:2022-12-16

    申请号:CN202110332815.X

    申请日:2021-03-29

    Abstract: 本发明公开了一种领域适应医学文献神经机器翻译模型的训练方法,包括:1)对域内外数据集进行数据预处理;2)基于域外子词化训练集进行域外子词化神经机器翻译模型进行动态递减训练集训练;3)使用改进的数据选择法,从域外数据集中挑选出与域内平行数据集相似的数据集来增强域内数据集;4)基于高质量的人工纠错的子词化医学数据集,训练小型的分类器或语言模型,获得域内子词化训练集句子对的训练权重,将权重作为训练参数加入到继续训练过程中;5)结合上一步骤处理得到的域内子词化训练集和训练权重文件,基于已训练域外子词化神经机器翻译模型,在域内子词化训练集上继续训练。本发明可节省总体训练时间,提高最终翻译训练效果。

Patent Agency Ranking