-
公开(公告)号:CN104156211A
公开(公告)日:2014-11-19
申请号:CN201410389283.3
申请日:2014-08-08
Applicant: 北京大学
Abstract: 本发明涉及一种数据接口及数据调用方法,属于传感器数据处理领域,具体涉及一种用于传感器的通用数据接口及数据调用方法。用于构建传感器服务自描述信息的服务描述模块、用于返回传感器服务自描述信息以及传感器相关数据的服务接口模块。因此,本发明具有如下优点:1.封闭效率高,能够帮助开发者迅速且规范地完成对常见传感器的软件层抽象封装;2.可扩展性强,屏蔽了传感器的类别差异和具体实现细节,使得上层应用能够方便管理和使用传感器服务。
-
公开(公告)号:CN117763200A
公开(公告)日:2024-03-26
申请号:CN202311546501.5
申请日:2023-11-20
Applicant: 北京大学
IPC: G06F16/901 , G06F16/903 , G06N5/04 , G06N5/02
Abstract: 本发明公开了一种基于模式匹配的知识图谱检索方法与系统。本方法步骤包括:对基于模式匹配的图谱查询流程进行优化,其中,对查询表达进行优化的方法为:根据用户的输入信息查询是否存在历史查询模板/记录,如果存在则将其反馈给用户,并提示是否采用或对该历史查询模板/记录进行调整,如果调整则进入查询图编辑步骤;否则为该用户创建新的查询图并进入查询图编辑步骤;查询图编辑步骤中,根据用户添加的节点、边生成查询涉及的概念、关系和属性,然后对添加的节点和边添加约束,生成该用户的查询图;对查询执行进行优化的方法为:根据该用户的查询图运用模式匹配算法在知识图谱中进行匹配处理,获取与该用户的查询图拓扑结构匹配的子图结果。
-
公开(公告)号:CN109446231B
公开(公告)日:2023-12-26
申请号:CN201811080977.3
申请日:2018-09-17
Applicant: 北京大学 , 中国电力科学研究院有限公司 , 国网江苏省电力有限公司电力科学研究院
IPC: G06F16/2458
Abstract: 本发明涉及一种基于模式关联分析的实值时间序列规则发现方法和装置。该方法包括以下步骤:1)针对一个或多个实数值的目标时间序列,利用主题发现技术从中自动提取多种长度的主题模式;2)针对每一对主题模式,根据其在时间序列中出现的位置以及间隔,分析两者之间的配对关系;3)根据一对主题模式的配对结果,对该对主题模式所构成的候选规则进行评分,并选择评分超过预设的阈值的候选规则作为规则。该装置包括主题模式发现模块、主题模式关联分析模块和规则评分模块。本发明能够高效地自动提取蕴含有意义信息的模式;可以根据使用者需求调整模式的偏好;通过模式间的关联关系能够找到有一定关联关系规则,避免了无效规则。
-
公开(公告)号:CN114297395A
公开(公告)日:2022-04-08
申请号:CN202110677637.4
申请日:2021-06-18
Applicant: 北京大学
IPC: G06F16/36 , G06F8/61 , G06F16/182 , G06F11/36 , G06F9/50
Abstract: 本发明涉及一种基于负载均衡的知识图谱分布式海量数据导入方法,属于知识图谱数据导入技术领域,所述方法包括以下步骤:S1、搭建Spark分布式计算集群;S2、解决Janusgraph与Spark的jar包依赖冲突和版本冲突,使用SparkGraphComputer接口进行连接测试;S3、调研Spark进行图数据批量导入作业所擅长处理的输入文件格式,按照所述文件格式生成数据;S4、根据数据导入完整性和数据导入速度调整对Spark集群worker节点的资源分配,优化导入速度;S5、对数据中的超级节点进行切分和负载均衡,加速对超级节点数据的导入。本发明提供的方法通过分布式计算能够大幅度提升数据导入效率,通过基于节点切分的负载均衡方法使得对于超级节点数据导入实现并行化,最终达到对于超级节点数据的高效导入。
-
公开(公告)号:CN112205965B
公开(公告)日:2022-02-22
申请号:CN202010884840.4
申请日:2020-08-28
Applicant: 北京大学
IPC: A61B5/00
Abstract: 本发明公开了一张基于时间窗口切割的健康风险关键事件检测方法及系统,方法包括:S100、将患者的电子病历输入训练好的深度学习模型中,获取患者每次就诊生理指标的重要指数和死亡风险指数;S200、将患者健康风险关键事件检测的目标按时间窗口分为四种类型,基于获取的各生理指标的重要指数和死亡风险指数,对所述四种类型分别进行检测,筛选出需要提出健康风险关键事件的生理指标;S300、基于可视化界面,展示患者健康风险关键事件检测过程以及检测结果。本发明可以从医院的病人电子病历数据中挖掘出更多有价值有参考意义的信息来帮助医生进行诊断。
-
公开(公告)号:CN106933901B
公开(公告)日:2020-07-17
申请号:CN201511032263.1
申请日:2015-12-31
Applicant: 北京大学
Abstract: 本发明提供的数据集成方法及系统,通过获取不同输入源中的每个输入源的第一数据;根据语义对所述每个输入源的第一数据进行聚类,得到每个输入源的第二数据,其中,在每个输入源的第一数据中,语义相近的元素将用相同的元素表示并被聚类;将每个输入源的第二数据中任意第一元素与其他输入源的第二数据中的各元素进行并行匹配计算,并获得所述第一元素与各元素的相似度熵;根据所述第一元素与各元素的相似度熵,确定符合预设条件的第二元素,采用目标元素对所述第一元素进行替换。从而使本发明通过聚类使整个集成过程所需的计算量减小,提高集成效率,同时通过匹配算法,使整个数据集成的质量得到保证。
-
公开(公告)号:CN108712317A
公开(公告)日:2018-10-26
申请号:CN201810264531.X
申请日:2018-03-28
Applicant: 北京大学
Abstract: 本发明涉及一种基于移动社交网络的城市人群时空动态感知方法和系统。该方法的步骤包括:1)将城市区域离散化成边长为一定值的格子,将各格子的中心位置作为候选感知位置集合;2)在候选感知位置集合中,选择当前状态下能够产生最大感知收益的位置作为感知位置,在感知位置进行感知以获取用户的距离信息;3)利用在不同感知位置获得的用户的距离信息,通过三角定位来确定每个用户的具体位置。本发明每次都是选取感知收益最大的探针进行感知,仅需较少的探针数量就能感知到整个城市中用户的具体位置,并且具有良好的扩展性,能够通过大规模地动态地获取社交网络用户的时空特征来表征整个城市人群的时空动态特征。
-
公开(公告)号:CN105933080A
公开(公告)日:2016-09-07
申请号:CN201610036013.3
申请日:2016-01-20
Applicant: 北京大学
IPC: H04B17/309
Abstract: 本发明涉及一种用于跌倒检测方法和系统。所述用于跌倒检测的方法包括:通过第一接收天线接收通过环境的第一WiFi信号流;通过第二接收天线接收通过所述环境的第二WiFi信号流;确定所述第一WiFi信号流的物理层信道状态信息流,即第一CSI流;确定所述第二WiFi信号流的物理层信道状态信息流,即第二CSI流;确定所述第一WiFi信号流的物理层信道状态信息流与所述第二WiFi信号流的物理层信道状态信息流在同一时刻的相应状态之间的相位差即CSI相位差,以便形成CSI相位差流;以及根据所述CSI流和CSI相位差流,确定跌倒事件。
-
-
公开(公告)号:CN119416878A
公开(公告)日:2025-02-11
申请号:CN202411417952.3
申请日:2024-10-11
Applicant: 北京大学(天津滨海)新一代信息技术研究院 , 燕溪智能(无锡)技术有限公司
Abstract: 本发明属于计算机自然语言技术领域,公开了一种面向政务领域大语言模型的训练数据筛选法、电子设备和存储介质,面向政务领域大语言模型的训练数据筛选法包括:获取基于政务领域的原始数据集;基于原始数据集训练得到打分模型;调用打分模型对原始数据集进行质量评估,得到质量数据集;根据质量数据集得到种子数据集;根据种子数据集得到训练数据集。本发明基于原始数据集训练打分模型,使得打分模型对大语音模型有更好的适应性,通过打分模型用于评估指令的质量,使得筛选出的训练数据更为精准。
-
-
-
-
-
-
-
-
-