-
公开(公告)号:CN116595169A
公开(公告)日:2023-08-15
申请号:CN202310415758.0
申请日:2023-04-18
Applicant: 北京信息科技大学 , 华能煤炭技术研究有限公司
IPC: G06F16/35 , G06F16/332 , G06F40/186 , G06N3/08 , G06N3/047
Abstract: 本专利摘要涉及一种基于提示学习的煤矿生产领域问答意图分类方法。问答系统是智能化信息处理的重要领域,也是煤矿智能化建设不可或缺的一部分。在实际应用中,意图分类是智能问答的重要子任务,它可以帮助问答系统更好地理解用户查询意图并提供准确答案。本方法通过引入不同的提示模板对BERT预训练模型进行微调,从而提高问答意图分类的准确性。实验结果表明,引入提示模板后,模型的准确率、召回率和F1值均有所提高。此外,该方法还可以在少样本场景下快速适配新领域的任务,具有较好的应用价值。因此,本专利摘要所述的基于提示学习的煤矿生产领域问答意图分类方法可用于问答系统的开发和应用。
-
公开(公告)号:CN115357187A
公开(公告)日:2022-11-18
申请号:CN202210950209.9
申请日:2022-08-15
Applicant: 北京信息科技大学
Abstract: 本发明涉及存储系统领域中的绿色存储技术以及自然语言处理领域中的数据语义挖掘技术,针对存储系统中数据语义的挖掘,采用多特征融合方法,提升了现有基于单一特征在数据布局策略上的不足,包括以下步骤:(一)、设定实验所需200个访问关键词;(二)、将中国34个省级行政区,按标准划分为四季分明区、夏长冬短区、冬长夏短区和其他区;(三)、获取每个气候区中200个关键词3年每日的访问记录;(四)、利用K‑means聚类,确定关键词在不同气候区的季节属性;(五)、构建存储系统能耗和成本模型,得到不同粒度框架下的能耗和成本。本发明融合“季节+地域”特征,充分提取关键词的季节属性,能够更为有效地降低存储能耗和成本。
-
公开(公告)号:CN112785529A
公开(公告)日:2021-05-11
申请号:CN202110157624.4
申请日:2021-02-05
Applicant: 北京信息科技大学
Abstract: 本申请公开了一种模板图像匹配矫正方法,包括:矫正模板图像制作;特征点检测与特征点描述;特征点匹配;单应矩阵估计;文档图像矫正。所述矫正模板图像制作,包括:选取一张领域内的透视倾斜文档图像,通过交互式选取其四个顶点,通过透视变换将其矫正得到文档图像的正向平行视图图像。本申请实施例提供的模板图像匹配矫正方法,使用简单便捷、矫正速度快、矫正效果好、抗干扰性强且能够有效避免当文档图像倾斜角较大时引起的矫正文档图像侧立或倒立的情况,可以有效胜任领域性的文档图像矫正任务。
-
公开(公告)号:CN112417854A
公开(公告)日:2021-02-26
申请号:CN202011470330.9
申请日:2020-12-15
Applicant: 北京信息科技大学
IPC: G06F40/258 , G06F40/289 , G06F40/30 , G06N3/04
Abstract: 本申请公开了一种中文文档抽取式摘要方法,包括:文本向量化;识别基本篇章单元;抽取摘要句,所述文本向量化,包括:对输入文本进行分句、分词、标识符插入操作,使用中文Bert预处理模型,对文本进行向量化。本申请实施例提供的中文文档抽取式摘要方法,利用Bert模型进行文本向量化,更好地捕捉长文本上下文的语义,提升信息抽取的准确性;在识别中文长文本的基本篇章单元的基础上,以基本篇章单元为抽取对象,降低摘要抽取的冗余度;最后利用Transformer神经网络抽取模型,实现基本篇章单元的抽取,提升了摘要句抽取的准确率。
-
公开(公告)号:CN110516216A
公开(公告)日:2019-11-29
申请号:CN201910404549.X
申请日:2019-05-15
Applicant: 北京信息科技大学
Abstract: 本发明涉及一种体育新闻自动写作模板库构建方法包括写作模板计算、触发条件构建,首先根据已分好的类别对模板数据进行相似度计算找到相同的模板,其次是利用CRF对模板进行触发条件识别,最终形成触发条件-模板;写作模板计算包括基于余弦相似度的写作模板计算、基于Word2Vec的写作模板计算。本发明提供的体育新闻自动写作模板库构建方法,取得了极佳的正确率、召回率和F值,能够通过计算向量空间上的相似度来表示文本语义上的相似度来实现相关词扩展,为体育新闻自动写作提供强有力的支持,从而为实现准确高效地体育新闻自动写作提供极佳的条件,可以很好地满足实际应用的需要。
-
-
-
-