一种优化BERT的问题语义匹配方法

    公开(公告)号:CN114218921A

    公开(公告)日:2022-03-22

    申请号:CN202111442232.9

    申请日:2021-11-30

    Abstract: 本发明公开了一种基于Bert的语义匹配方法,该方法基于哈工大的预训练模型Bert‑wwm‑ext,我们先使用该模型在我们的大数据背景下做全词遮罩的无监督训练,使得模型先适应下我们的数据特点,保存基于我们数据的模型后,我们在该模型的结构上做了以下调整,在Bert的输出层加上Pooling层,在句子输入的时候,每个Batch我们输入的是一组特定的句子,其中一部分句子是语义相近的,剩下的句子是语义不同的,这样做是考虑到使得模型像人学习时一样,考虑数据之间的对比学习,使得模型更快收敛,模型架构改造完成后,我们基于该模型,再次在我们的大语料背景下做句子语义相似性训练,在训练的过程中,我们加入了同义句和非同义句之间的对比计算,然后使模型反向传播,最终得到的句向量语义表示更贴合实际。

    一种人口健康数据集敏感度处理方法及系统

    公开(公告)号:CN113488127A

    公开(公告)日:2021-10-08

    申请号:CN202110856219.1

    申请日:2021-07-28

    Abstract: 本发明公开了一种人口健康数据集敏感度处理方法及系统,包括:获取待评估的人口健康数据集;对所述人口健康数据集的各个特征进行敏感信息识别,获得每一特征对应的敏感特征,所述特征包括元数据特征、数据项特征和数据值特征;对每一所述敏感特征进行分析,获得每一敏感特征对应的分析结果;基于每一敏感特征对应的分析结果进行计算,得到所述人口健康数据集的敏感度综合评估结果;基于所述敏感度综合评估结果,生成所述人口健康数据集的敏感度评估报告。本发明实现了敏感信息发现、识别、分析和处理,并且通过多维度分析满足了人口健康数据集敏感度评估的应用需求,以及提升了后续人口健康数据应用的效率和安全性。

    基于大数据技术的皮肤病智能监控预警系统

    公开(公告)号:CN111724898A

    公开(公告)日:2020-09-29

    申请号:CN202010544139.8

    申请日:2020-06-15

    Inventor: 谢俊祥 李勇

    Abstract: 本发明涉及皮肤病人工智能以及大数据技术领域,尤其涉及一种基于大数据技术的皮肤病智能监控预警系统;包括:数据源模块,用于接收多维皮肤病数据,并将接收到的数据按照结构化数据和非结构化数据进行标准化处理,并将处理后的数据发送给数据存储模块;数据存储模块,用于接受并存储数据源模块发送来的标注化后的数据;数据挖掘模块,用于利用数据存储模块的数据进行数据的挖掘,并将挖掘处理后的数据发送给预警模块;预警模块,用于对挖掘得到的数据进行分析处理以及预警工作。本发明所公开的基于大数据技术的皮肤病智能监控预警系统,利用大数据技术进行数据的采集及存储,整合了多维数据,为皮肤病智能预警提供了可靠保证。

    一种缩略语文档的生成方法及装置

    公开(公告)号:CN110704639A

    公开(公告)日:2020-01-17

    申请号:CN201910942205.4

    申请日:2019-09-30

    Abstract: 本发明提供了一种缩略语文档的生成方法及装置,在不同知识组织系统互操作过程中,提取不同来源词表中的术语并对其进行同义归并形成概念,生成集成词表,术语包括全称和缩略语多种形式;基于缩略语构词规则,识别集成词表中含有缩略语的目标概念;提取目标概念的全部术语及每个术语的属性,并确定每个术语的术语类型;基于ISO25964国际标准,对目标概念及目标概念的全部术语进行规范化知识表示,生成语义丰富且标准规范的缩略语文档。其中,缩略语及其所在概念继承了来源词表和集成词表的丰富语义属性信息,减少了缩略语歧义问题。

    诊疗方案预测方法及装置
    25.
    发明公开

    公开(公告)号:CN110297908A

    公开(公告)日:2019-10-01

    申请号:CN201910584729.0

    申请日:2019-07-01

    Inventor: 李姣 覃露 徐晓巍

    Abstract: 本发明提供了诊疗方案预测方法及装置,获取待预测病历文本所包含的医学实体的特征向量得到医学实体向量,同时,获取该待预测病历文本的文本特征向量。然后,将待预测病历文本对应的医学实体向量和文本特征向量输入至预先训练得到的诊疗方案预测模型中,预测得到与该待预测病历文本相匹配的诊疗方案,其中,诊疗方案包括诊疗药物、手术和检查项中的至少一种。由上述内容可知,本发明在对待预测病历文本进行特征提取时,既提取了医学实体及其关联关系的特征向量,同时提取了病历文本的语境信息,减少了信息损失,提高了待预测病历文本的特征向量的准确度,进而提高了诊疗方案的预测准确率。

    一种药物基因组学知识图谱构建方法及系统

    公开(公告)号:CN109299285A

    公开(公告)日:2019-02-01

    申请号:CN201811056554.8

    申请日:2018-09-11

    Inventor: 李姣 侯丽 康宏宇

    Abstract: 本发明公开了一种药物基因组学知识图谱构建方法及系统,该方法包括:获取与药物基因组学相匹配的初始数据信息;对所述初始数据信息进行数据抽取处理,获得目标数据信息;根据所述目标数据信息,确定分析维度以及所述分析维度之间的关联关系;基于所述分析维度和所述分析维度之间的关联关系,构建获得初始药物基因组学知识图谱;对所述初始药物基因组学知识图谱进行验证,获得目标药物基因组学知识图谱。通过本发明实现了基于药物基因组学指导精准用药,提高药物疗效的目的。

    一种药物循证数据库图表自动生成系统

    公开(公告)号:CN107861996A

    公开(公告)日:2018-03-30

    申请号:CN201710975305.8

    申请日:2017-10-16

    CPC classification number: G06F17/30339 G06F17/30424

    Abstract: 本发明涉及一种药物循证数据库图表自动生成系统,属于计算机应用技术领域。药物循证数据库、索引数据库、药物循证信息维护模块、全文检索搜索引擎模块、消息同步模块、药物循证数据关联分析模块、自动报告生成模块。本发明采用检索的同时自动生成图表的思路,使计算机能通过用户的检索行为,自动对多维数据进行图表生成判断,进而生成并向用户展示所有可能的图表,本系统即提高了药物循证数据库中数据展示的直观性,也大大提高了科研人员进行相关研究、撰写相应报告的效率。

    一种资源推送方法和装置
    28.
    发明公开

    公开(公告)号:CN107395703A

    公开(公告)日:2017-11-24

    申请号:CN201710562169.X

    申请日:2017-07-11

    Inventor: 李姣 徐晓巍

    CPC classification number: H04L67/26 H04L67/12 H04N21/25891 H04N21/4662

    Abstract: 本申请提供了一种资源推送方法和装置,其中该方法包括:获取第一用户的属性数据和所述第一用户针对第一资源产生的行为数据;根据所述属性数据和所述行为数据,分析得到与所述第一用户相关的各个兴趣项以及各个兴趣项对应的兴趣度;所述兴趣项是根据用户自身属性特征和第一资源的内容特征而确定的;根据所述兴趣项和各个兴趣项对应的兴趣度,从所述平台的资源池中选择得到第二资源;根据所述第二资源向第一用户推送资源。利用本申请提供的技术方法在为用户推送资源时,综合考虑个人属性数据和历史行为数据,这两种数据能够全面地反应出用户对资源的兴趣偏向,基于此,就能够选择出符合用户兴趣偏好的资源,推送给用户。

    一种配餐系统
    29.
    发明公开

    公开(公告)号:CN105957273A

    公开(公告)日:2016-09-21

    申请号:CN201610245257.2

    申请日:2016-04-19

    CPC classification number: G07G1/009 G06K17/00 G06Q50/12 G07G1/12

    Abstract: 本发明公开了一种配餐系统,包括:食材盛放装置,包括用于记录当前所盛放食材的食材信息的射频标签;成品菜盛放装置,用于盛放从所述食材盛放装置取出的食材,所述成品菜盛放装置存储有配制成品菜所需食材的食材信息;射频标签数据读取装置,用于在食材从所述食材盛放装置取出到所述成品菜盛放装置时,从所述食材盛放装置的射频标签中读取并记录所取出的食材的食材信息;比对单元,用于在配餐完毕后,将所述射频标签数据读取装置所记录的食材的食材信息与所述成品菜盛放装置存储的配制成品菜所需食材的食材信息相比较,在比较结果不一致时报警,由此实现了快速定量的配餐,精确的统计了食材的消耗量,从而有效的进行后厨的管理,降低管理成本。

    传染病信息知识服务系统
    30.
    发明公开

    公开(公告)号:CN102129527A

    公开(公告)日:2011-07-20

    申请号:CN201110099016.9

    申请日:2011-04-20

    Abstract: 本发明涉及一种传染病信息知识服务系统,包括:用于存放传染病相关信息知识的资源库,该资源库具有预先定义的规范的结构;用于对传染病领域的信息资源进行采集,加工成资源库所需结构,并存储到资源库中的资源获取模块;使用传染病领域相关概念对资源库中的信息进行知识标引的信息自动处理模块;针对传染病领域具体应用的应用模块。本发明基于传染病领域的数据特点和用户需求,提供了一种使用该领域的概念和关系对信息资源进行知识标引的知识服务系统,该系统集信息收集、分析、加工、整理、共享等多功能于一体,能够有效地组织该领域的信息资源,并为用户提供智能化的检索与分析服务。

Patent Agency Ranking