-
公开(公告)号:CN115098408A
公开(公告)日:2022-09-23
申请号:CN202210658236.9
申请日:2022-06-10
Applicant: 清华大学
IPC: G06F12/0862 , G06F12/0882 , G06K9/62 , G06N3/04
Abstract: 本发明提供一种数据预存取方法及装置。其中,所述方法包括以下步骤:获取待预测数据页,提取所述待预测数据页的数据特征;将所述待预测数据页的数据特征输入预先训练的预测模型中,得到数据相关值和目标数据页;确认所述数据相关值大于预设阈值,则将所述目标数据页进行预存取;其中,所述预先训练的预测模型是根据历史调用数据页样本训练得到的。本发明使用机器学习模型来获取数据页访问的模式,从而大大提高了数据页预存取的准确性,对数据库系统和大数据系统等领域的发展具有重要意义。
-
公开(公告)号:CN113988013A
公开(公告)日:2022-01-28
申请号:CN202111243214.8
申请日:2021-10-25
Applicant: 清华大学
IPC: G06F40/126 , G16H70/00 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种基于多任务学习和图注意力网络的ICD编码方法及装置,方法包括:获取至少一个编码预测任务对应的医疗文本;至少一个编码预测任务包括ICD编码任务;根据至少一个编码预测任务对应的医疗文本,构建相应的文本图;将文本图输入编码预测模型,得到编码预测结果;编码预测结果包括ICD编码结果,编码预测模型基于训练数据对图注意力网络进行训练得到。本发明提供的基于多任务学习和图注意力网络的ICD编码方法及装置,由于在编码预测前先将医疗文本转化为文本图的形式,可以缓解数据不平衡的问题,有效提高了医疗文本的自动编码效果,编码结果更加准确、可靠。
-
公开(公告)号:CN114297402B
公开(公告)日:2025-03-07
申请号:CN202111553153.5
申请日:2021-12-17
Applicant: 清华大学
IPC: G06F16/36 , G06N5/022 , G06F18/25 , G06N3/0455 , G06N3/0464 , G06N3/045 , G06N3/042 , G06N3/0895
Abstract: 本发明提供一种面向链接预测的交互式多模态融合方法及装置,方法通过获取待预测知识图谱,包括结构化模态、可视化模态和文本模态;分别提取结构化模态、可视化模态和文本模态的高层次特征信息,得到结构化模态嵌入表示、可视化模态嵌入表示和文本模态嵌入表示;对结构化模态嵌入表示、可视化模态嵌入表示和文本模态嵌入表示进行聚合,通过双线性矩阵计算得到多模态嵌入表示;分别通过各个不同的表示预测目标实体,得到结构化预测结果、可视化预测结果、文本预测结果和多模态预测结果;调整各个预测结果的权重,得到目标预测结果,通过多模态融合能够有效地保留各模态中的专有知识实现互补性链接预测,极大地提高链接预测的准确度。
-
公开(公告)号:CN114385930B
公开(公告)日:2024-12-10
申请号:CN202111627594.5
申请日:2021-12-28
Applicant: 清华大学
IPC: G06F16/9537 , G06F16/9536
Abstract: 本发明提供一种兴趣点推荐方法及系统,其中方法包括:获取目标用户的用户信息,和所述目标用户所搜索的条目信息,以作为用户条目交互数据;将所述用户条目交互数据输入兴趣点推荐模型,获得所述兴趣点推荐模型输出的为所述目标用户推荐的兴趣点条目数据;其中,所述兴趣点推荐模型是基于利用注意力机制由用户条目交互数据样本得到的用户与用户,以及条目与条目间的相似度,和按照预设规则由所述用户条目交互数据样本得到的用户与用户,以及条目与条目间的相似度训练得到的。用以解决现有技术中基于用户‑条目交互信息进行相似性度量,因数据稀疏造成推荐准确度不高的缺陷,实现为目标用户精准推荐兴趣点条目。
-
公开(公告)号:CN113988290A
公开(公告)日:2022-01-28
申请号:CN202111241439.X
申请日:2021-10-25
Applicant: 清华大学
Abstract: 本发明提供一种基于因果干预和反事实推理的自然语言理解模型去偏方法,包括根据输入数据集构建因果图,并确定输入数据集的总效应,因果图包括前提、假设和组合特征;分别对前提、假设和组合特征进行建模,得到前提模型、假设模型和组合特征模型;通过融合函数,将前提模型、假设模型和组合特征模型进行融合,得到融合模型;利用do演算去除融合模型中的混杂因素,得到初步自然语言理解模型;利用反事实推理去除初步自然语言理解模型中假设模型的自然直接影响,基于总效应和自然直接影响得到推理结果作为目标自然语言理解模型,通过因果干预和反事实推理的处理过程,可以有效地提高目标自然语言理解模型的精准度。
-
公开(公告)号:CN1262230A
公开(公告)日:2000-08-09
申请号:CN00103234.8
申请日:2000-03-17
Applicant: 清华大学
CPC classification number: Y02W10/37
Abstract: 本发明属于使用光催化剂的水处理技术领域,包括装有强制循环手段的流化床形式的反应器,该反应器被分隔成反应区和沉淀分离区,反应区位于反应器的下部,它又分为中心区域和周边区域,多个紫外灯设置在反应器内的反应区内,在反应器下部还设置有入水口。反应器顶部为沉淀分离区及出水口。本发明具有反应速率高、处理量大、操作容易且催化剂能回收再用,可连续运行的优点,可成为应用于工业化的污水处理的实用装置。
-
公开(公告)号:CN115109752A
公开(公告)日:2022-09-27
申请号:CN202210853398.8
申请日:2022-07-08
Applicant: 清华大学
IPC: C12N5/0797 , A01N1/02
Abstract: 本发明涉及一种神经干细胞培养基、冻存液以及神经干细胞的制备方法。所述神经干细胞培养基包含基础培养基以及FBS、L‑谷氨酰胺、D‑葡萄糖、ng/mL表皮生长因子、碱性成纤维细胞生长因子、转铁蛋白、孕酮、腐氨、亚硒酸钠、胰岛素、肝素、Human Noggin、SB4315422和烟酰胺;所述基础培养基包含DMEM培养基和F12培养基。采用该特定配方的神经干细胞培养基对神经干细胞进行培养,能够实现神经干细胞的高效扩增,且扩增所得神经干细胞保持良好的干性,克服传统神经干细胞存在短期扩增量低、容易分化导致干性丧失的缺陷。
-
公开(公告)号:CN114328952A
公开(公告)日:2022-04-12
申请号:CN202111562165.4
申请日:2021-12-17
Applicant: 清华大学
Abstract: 本发明提供一种基于知识蒸馏的知识图谱对齐方法、装置及设备,方法通过获取待对齐知识图谱集合,所述待对齐知识图谱集合包括至少两个不同的待对齐知识图谱,每个所述待对齐知识图谱中包括至少一个实体;输入所述待对齐知识图谱集合至知识图谱对齐模型,将不同的所述待对齐知识图谱中的相同实体进行对齐;其中,所述知识图谱对齐模型是基于知识图谱样本和预先确定的所述知识图谱样本中的实体标签进行训练后得到的,通过基于知识图谱对齐模型来进行实体对齐,与单纯的学习知识嵌入或邻域共识相比,在对齐过程中,知识图谱对齐模型由于结合具体的实体,能够更好地利用到关系语义信息,从而更好地实现实体对齐。
-
公开(公告)号:CN115786248A
公开(公告)日:2023-03-14
申请号:CN202211462653.2
申请日:2022-11-21
Applicant: 清华大学
Abstract: 本发明属于细胞培养领域,具体公开了一种滋养层细胞共培养体系培养干细胞/类器官的方法及应用,所述方法包括:利用纯化好的逆转录病毒感染小鼠胚胎成纤维细胞,形成稳定表达R‑spodin1和Noggin基因的胚胎成纤维细胞系;将胚胎成纤维细胞系进行辐照筛选出单克隆细胞系,并以单克隆细胞系为滋养层细胞与多种表达因子组合共同作为共培养体系培养干细胞或类器官。在此培养体系下,干细胞能够长期稳定的传代,干细胞的克隆形成、增殖与分化潜能没有受到影响,3D气液界面类器官培养在结构和功能上也没有受到影响。同时获得的滋养层细胞,可以节约R‑spodin1和Noggin的购买成本,削弱了实验经费对科学研究的制约。
-
公开(公告)号:CN114297402A
公开(公告)日:2022-04-08
申请号:CN202111553153.5
申请日:2021-12-17
Applicant: 清华大学
Abstract: 本发明提供一种面向链接预测的交互式多模态融合方法及装置,方法通过获取待预测知识图谱,包括结构化模态、可视化模态和文本模态;分别提取结构化模态、可视化模态和文本模态的高层次特征信息,得到结构化模态嵌入表示、可视化模态嵌入表示和文本模态嵌入表示;对结构化模态嵌入表示、可视化模态嵌入表示和文本模态嵌入表示进行聚合,通过双线性矩阵计算得到多模态嵌入表示;分别通过各个不同的表示预测目标实体,得到结构化预测结果、可视化预测结果、文本预测结果和多模态预测结果;调整各个预测结果的权重,得到目标预测结果,通过多模态融合能够有效地保留各模态中的专有知识实现互补性链接预测,极大地提高链接预测的准确度。
-
-
-
-
-
-
-
-
-