-
公开(公告)号:CN101916256A
公开(公告)日:2010-12-15
申请号:CN201010225110.X
申请日:2010-07-13
Applicant: 北京大学
Abstract: 本发明提出了一种综合社会行动者兴趣和社会网络拓扑结构的社区发现方法,属于社会网络技术领域。对于一个包含了社会行动者兴趣信息的社会网络数据集,首先对行动者个人兴趣进行聚类,得到基于兴趣的行动者社区,然后使用行动者社会网络拓扑结构信息,对兴趣社区进行扩展,使之更符合社区形成和发展的规律,从而达到更好的社区发现效果。本发明文提出的方法比单纯基于兴趣聚类的方法在有效性上有较大的提高。本发明应用于社会网络、资源共享平台,可以为信息检索系统、个性化推荐系统等服务,挖掘社区结构,利用社区特性,改进个性化服务质量。
-
公开(公告)号:CN111061841B
公开(公告)日:2023-10-27
申请号:CN201911316296.7
申请日:2019-12-19
Applicant: 京东方科技集团股份有限公司 , 北京大学
Abstract: 本发明提供了一种知识图谱的构建方法及装置,属于数据处理技术领域。其中,知识图谱的构建方法,包括:获取预设领域的多组数据,每组数据包括实体名称属性和与所述实体名称属性对应的属性值;利用所述多组数据构建实体集合,所述实体集合包括预设领域的多个实体;根据所述多组数据中的属性频率设置实体类型之间的预设关系,构建包括多个所述预设关系的预设关系集合;从所述多组数据中提取知识图谱关系,建立包括多个三元组数据的三元组集合,每一所述三元组数据包括两个实体以及所述两个实体之间的关系;对所述实体集合、所述预设关系集合和所述三元组集合进行整合,得到知识图谱。本发明的技术方案能够提高知识图谱的知识准确率和召回率。
-
公开(公告)号:CN108376160B
公开(公告)日:2022-02-18
申请号:CN201810144418.8
申请日:2018-02-12
IPC: G06F16/36 , G06F16/958
Abstract: 本发明实施例公开了一种中文知识图谱构建方法和系统,包括获取一个或多个网页,所述网页包含网页名称、信息框;从信息框中提取网页属性和网页属性值;将网页与预设知识图谱中的实体进行匹配,判定网页与实体是否相同或相似,如果是,将所述网页属性值链接到网页名称与所述网页属性值相同的外部网页;根据预设知识图谱的实体和另一实体的关系和链接,建立网页和外部网页之间的映射关系;根据所述映射关系以及所述网页和所述外部网页构建中文知识图谱,本发明实施例通过借助于现有的知识图谱来构建知识图谱框架,以此来实现自动化地构建中文知识图谱,节约了人力成本,减少了错误率,提高了知识图谱的更新速度。
-
公开(公告)号:CN109767301B
公开(公告)日:2021-05-07
申请号:CN201910032524.1
申请日:2019-01-14
Applicant: 北京大学
Abstract: 本发明涉及一种推荐方法及系统,其中,推荐方法包括以下步骤:构建目标用户被消耗的物品集合对应目标用户的社交网络;根据物品集合建立目标用户的动态个人兴趣模型;根据物品集合构建社交网络的短期兴趣模型;构建社交网络的长期兴趣模型;根据短期兴趣模型和长期兴趣模型进行拼接;计算目标用户的节点表示和社交网络中朋友的节点表示;根据社交网络中朋友关于目标用户的权值计算合并特征权值;对合并特征权值进行非线性变换;根据动态个人兴趣模型计算;根据用户的最终兴趣得到推荐物品的概率;根据推荐物品的概率计算对数似然函数值;在本发明的技术方案中,其能够同时考虑用户的社交关系和用户的动态兴趣爱好因素,以提升推荐的准确性。
-
公开(公告)号:CN112085605A
公开(公告)日:2020-12-15
申请号:CN202010958810.3
申请日:2020-09-14
Applicant: 北京大学
IPC: G06Q40/04
Abstract: 本申请公开了一种动态资产组合交易方法,包括:S2:建立资本资产定价模型;S4:根据所述资本资产定价模型获得总优化模型;S6:根据所述总优化模型获得动态权重优化模型;S8:根据所述动态权重优化模型输出调整方案。本申请具有如下有益效果:本发明方案是根据市场环境实时地进行优化函数计算的,因此对于影响决策的一切因素的变化,其反应速度都是足够快的;动态资产组合方案交易决策是每时每刻都在进行的,因此冲击成本小;将不同资产间的相关关系、总持仓的beta风险指数、买卖成本函数和持仓集中风险指数在不同时刻的不同状态全部考虑在方案决策之中,并利用一个公式将他们和谐地统一在了一起,这一点也是传统资产组合方案所不具备的。
-
公开(公告)号:CN108090686A
公开(公告)日:2018-05-29
申请号:CN201711470848.0
申请日:2017-12-29
Applicant: 北京大学
Abstract: 本发明实施例公开了一种医疗事件风险评估分析方法及系统,所述方法包括:对健康电子病历数据进行预处理,生成医疗事件序列;生成所述医疗事件序列中每一医疗事件的事件向量,并根据各个医疗事件对应的统计量数值生成每一医疗事件的属性向量;将各个医疗事件的事件向量和属性向量进行合并,生成所述医疗事件序列中每一医疗事件的事件属性向量;将所述医疗事件序列对应的事件属性向量序列作为训练集输入到预设的医疗事件预测模型,通过所述医疗事件预测模型进行医疗事件风险评估。本发明实施例提供的医疗事件风险评估分析方法及系统,更充分地利用实际的电子健康记录的各类事件数据来进行风险评估或者针对病人的其他类型医疗事件预测。
-
公开(公告)号:CN101719145B
公开(公告)日:2011-08-10
申请号:CN200910238155.8
申请日:2009-11-17
Applicant: 北京大学
IPC: G06F17/30
Abstract: 本发明提供基于图书领域本体的个性化搜索方法,属于个性化网络搜索服务。该方法包括:建立领域本体,引入协同过滤思想,加入体现用户之间影响的语义联系;对日志进行分析处理,建立基于用户兴趣偏好的用户模型;个性化得分计算,基于用户模型和领域本体,通过图挖掘算法(SpreadingActivation,简称SA)来计算;以及,重排搜索结果,按照个性化得分从高到低的顺序对原搜索引擎返回的结果进行重排并返回给用户。本发明方法将协同过滤思想引入领域本体,并建立及时体现用户兴趣变化的用户模型,通过图挖掘算法准确分析用户需求,有效消除关键词歧义,大幅提高用户对搜索结果的满意度。
-
公开(公告)号:CN101944218A
公开(公告)日:2011-01-12
申请号:CN201010102050.2
申请日:2010-01-27
Applicant: 北京大学
Abstract: 本发明公开了一种社会网络下的基于图的个性化推荐方法及其系统。该方法包括:获取用户对资源的评分信息和标签标注信息;基于所述标签标注信息,计算用户和用户之间的相似度;基于所述评分信息、所述用户和用户之间的相似度构建带权的社会网络无向图;利用随机漫步的方法,确定所述社会网络无向图点中待推荐顶点到其余每一个顶点的概率,将所述顶点中代表项目的顶点按照概率排序,依照所述排序进行,生成个性化推荐项目列表。本发明通过引入相似度,能够更加准确的为不同的用户提供与其喜好相关的个性化的推荐。
-
公开(公告)号:CN101719145A
公开(公告)日:2010-06-02
申请号:CN200910238155.8
申请日:2009-11-17
Applicant: 北京大学
IPC: G06F17/30
Abstract: 本发明提供基于图书领域本体的个性化搜索方法,属于个性化网络搜索服务。该方法包括:建立领域本体,引入协同过滤思想,加入体现用户之间影响的语义联系;对日志进行分析处理,建立基于用户兴趣偏好的用户模型;个性化得分计算,基于用户模型和领域本体,通过图挖掘算法(SpreadingActivation,简称SA)来计算;以及,重排搜索结果,按照个性化得分从高到低的顺序对原搜索引擎返回的结果进行重排并返回给用户。本发明方法将协同过滤思想引入领域本体,并建立及时体现用户兴趣变化的用户模型,通过图挖掘算法准确分析用户需求,有效消除关键词歧义,大幅提高用户对搜索结果的满意度。
-
公开(公告)号:CN100461184C
公开(公告)日:2009-02-11
申请号:CN200710118591.2
申请日:2007-07-10
Applicant: 北京大学
Abstract: 本发明公开一种网络搜索中的基于链接层次分类的主题爬取方法。该方法包括以下步骤:(1)构造训练集;(2)将种子网页加入待爬队列;(3)爬取待爬队列中所有URL,解析新爬取下的网页,提取出所有的链接;(4)对于每一个新的链接根据训练集分类,然后根据所属的链接类别确定该链接的优先级,将其URL加入相应的优先队列;(5)按照顺序查看优先队列,取优先级最高的非空队列中的所有URL放入待爬队列中,跳到第(3)步,其它队列保持不变;(6)优先队列全部为空或到达指定爬取循环次数则爬取结束。本发明能够有效利用锚文字和URL等有用信息分析链接的层次性,在深层次网页拓扑上展开分析和爬取。
-
-
-
-
-
-
-
-
-