-
公开(公告)号:CN116958828A
公开(公告)日:2023-10-27
申请号:CN202310837597.4
申请日:2023-07-07
Applicant: 华中农业大学 , 哈尔滨工业大学人工智能研究院有限公司
IPC: G06V20/13 , G06V20/10 , G06V10/54 , G06V10/58 , G06V10/764 , G06V10/771 , G06V10/774
Abstract: 本发明公开了一种基于卫星遥感数据的作物早期识别方法,具体为一种协同光学遥感影像和SAR遥感影像的作物早期识别模型的构建方法,包括以下步骤:1)采集研究区样本数据,分为训练样本和验证样本集;2)筛选作物不同物候期的光学遥感影像和SAR遥感影像,进行预处理;3)对步骤2)预处理后的光学遥感影像和SAR遥感影像进行波段信息提取;4)提取步骤3)中SAR遥感影像和光学遥感影像的各类特征值;5)分别基于SAR数据和多源数据,采用VSURF算法,在作物不同物候期进行特征筛选;6)根据不同数据源,利用随机森林和支持向量机算法,在作物不同物候期,构建作物早期识别模型,并进行精度评估;7)根据步骤6)中的最佳作物早期识别模型,将模型迁移至其它年份。
-
公开(公告)号:CN110162749A
公开(公告)日:2019-08-23
申请号:CN201811231847.5
申请日:2018-10-22
Applicant: 哈尔滨工业大学(深圳) , 腾讯科技(深圳)有限公司
Abstract: 本发明实施例提供一种信息提取方法、装置、计算机设备及计算机存储介质,该方法包括:在字符级编码器层中,根据待提取文本的字符级信息,进行从所述字符级信息到字符特征向量、以及从所述字符特征向量到词级特征向量序列的编码;在词级编码器层中,进行从所述词级特征向量序列对应的词级信息到词特征向量,以及从所述词特征向量到片段特征向量序列的编码;在条件随机场层中接收所述片段特征向量序列并标注语义标签,确定满足概率条件的所述语义标签。
-
公开(公告)号:CN109240984A
公开(公告)日:2019-01-18
申请号:CN201811142518.3
申请日:2018-09-28
Applicant: 哈尔滨工业大学(深圳) , 腾讯科技(深圳)有限公司
Abstract: 本申请涉及一种数据处理方法、装置、计算机设备及存储介质,该方法包括:从数据库中筛选出包括敏感项集的敏感事务;在所述敏感事务中取不同的组合,得到敏感事务组合;获取多目标函数;所述多目标函数中的各子目标函数,分别用于表示在删除数据库中的事务后所产生的各负面影响的负面影响程度;从所述敏感事务组合中,筛选出分别属于多目标函数的最优解集中各最优解的一个或多个敏感事务组合;属于最优解的敏感事务组合,用于在数据库中被删除后使所述多目标函数所表示的全局负面影响程度最小;当从所述最优解集中确定出最终最优解时,在数据库中删除属于所述最终最优解的敏感事务组合中的各敏感事务。本申请的方案,降低了清洗数据库带来的负面影响。
-
公开(公告)号:CN108733705A
公开(公告)日:2018-11-02
申请号:CN201710261885.4
申请日:2017-04-20
Applicant: 哈尔滨工业大学深圳研究生院 , 腾讯科技(深圳)有限公司
IPC: G06F17/30
Abstract: 本申请公开了一种高效用序列模式挖掘方法及装置,根据序列数据库中包含的各事务,获取满足设定条件的候选序列模式集合;针对每一所述候选序列模式,确定所述候选序列模式在所述序列数据库中的效用值;将所述效用值不低于自身所对应的效用阀值的候选序列模式,确定为挖掘结果,其中,候选序列模式对应的效用阀值为该候选序列模式所包含各项目中,效用阀值最低的项目的效用阀值,序列数据库中每一项目的效用阀值由用户预先设定。本申请可以由用户根据需要对不同项目设置不同的效用阀值,基于此从序列数据库中挖掘效用值不低于自身对应的效用阀值的序列模式,在挖掘高效用模式的基础上,能够实现个性化挖掘,满足不同应用场景的需求。
-
公开(公告)号:CN106294494A
公开(公告)日:2017-01-04
申请号:CN201510310487.8
申请日:2015-06-08
Applicant: 哈尔滨工业大学深圳研究生院 , 腾讯科技(深圳)有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种项集挖掘方法及装置,属于数据挖掘技术领域。所述方法包括:获取自定义的最低效用阈值、价格表和折扣表;价格表中包含各个数据项对应的成本价和售价;折扣表中包含各个数据项对应的折扣类型和折扣参数;对于数据库中的各个项集,根据项集中包含的数据项对应的成本价、售价、折扣类型和折扣参数,计算项集的实际效用值,该项集包含至少一个数据项;当实际效用值≥最低效用阈值时,确定项集为高效用项集。本发明达到了结合数据项对应的折扣策略,使得计算出的数据库中项集的实际效用值更加准确,从而提高挖掘出的高效用项集的实际使用价值的效果。
-
公开(公告)号:CN108733705B
公开(公告)日:2023-04-04
申请号:CN201710261885.4
申请日:2017-04-20
Applicant: 哈尔滨工业大学深圳研究生院 , 腾讯科技(深圳)有限公司
IPC: G06F16/2458
Abstract: 本申请公开了一种高效用序列模式挖掘方法及装置,根据序列数据库中包含的各事务,获取满足设定条件的候选序列模式集合;针对每一所述候选序列模式,确定所述候选序列模式在所述序列数据库中的效用值;将所述效用值不低于自身所对应的效用阀值的候选序列模式,确定为挖掘结果,其中,候选序列模式对应的效用阀值为该候选序列模式所包含各项目中,效用阀值最低的项目的效用阀值,序列数据库中每一项目的效用阀值由用户预先设定。本申请可以由用户根据需要对不同项目设置不同的效用阀值,基于此从序列数据库中挖掘效用值不低于自身对应的效用阀值的序列模式,在挖掘高效用模式的基础上,能够实现个性化挖掘,满足不同应用场景的需求。
-
公开(公告)号:CN109408563B
公开(公告)日:2021-06-22
申请号:CN201811320172.1
申请日:2018-11-07
Applicant: 哈尔滨工业大学(深圳) , 腾讯科技(深圳)有限公司
IPC: G06F16/2458
Abstract: 本申请公开了一种高平均效用项集挖掘方法、装置及计算机设备,在该方法中,如果累计插入数据库的所有事务的总效用值小于效用安全值,则确定当前数据库中尚未被挖掘处理的数据集合所包含的各个1‑项集的平均效用列表,并获取存储的原始数据库中具备项集扩展条件的至少一个1‑项集的平均效用列表;依据数据集合中各个1‑项集的平均效用列表和该原始数据库中具备项集扩展条件的至少一个1‑项集的平均效用列表,确定该数据库中的高平均效用项集。本申请的方案可以降低从数据库中挖掘数据所需耗费的计算资源。
-
公开(公告)号:CN109460424A
公开(公告)日:2019-03-12
申请号:CN201811216936.2
申请日:2018-10-18
Applicant: 哈尔滨工业大学(深圳) , 腾讯科技(深圳)有限公司
IPC: G06F16/2458
Abstract: 本申请涉及一种高效用序列模式处理方法、装置和计算机设备,该方法包括:建立序列数据库中各事务的效用链表;将序列数据库中的各项目均作为当前序列模式;根据效用链表得到当前序列模式的效用值和效用上界;当效用值大于或等于效用阈值时,确定当前序列模式为高效用序列模式;当效用上界大于或等于效用阈值时,将当前序列模式作为候选序列模式;对候选序列模式进行项目连接,生成超集序列模式,将超集序列模式作为当前序列模式,并返回根据效用链表得到当前序列模式的效用值和效用上界的步骤,直至满足结束条件。通过效用链表能够快速得到当前序列模式的效用值和效用上界,提高了高效用序列模式挖掘的效率。
-
公开(公告)号:CN109446235A
公开(公告)日:2019-03-08
申请号:CN201811216190.5
申请日:2018-10-18
Applicant: 哈尔滨工业大学(深圳) , 腾讯科技(深圳)有限公司
IPC: G06F16/2458
Abstract: 本申请涉及一种多维高效用序列模式处理方法、装置和计算机设备,该方法包括:将所述多维序列数据库转换成一维序列数据库;提取所述一维序列数据库中的高效用序列模式;根据所述高效用序列模式对维度值进行处理,得到对应的维度数据;根据所述高效用序列模式以及对应的维度数据,构建多维高效用序列模式。通过对数据库进行转换,得到高效用序列模式,并对维度值进行处理得到用于构建多维高效序列模式的维度数据,从而构建得到多维高效序列模式,实现了对多维高效用序列模式的有效挖掘,挖掘结果充分体现了多个维度特征之间的联系,提高了数据挖掘质量。
-
公开(公告)号:CN110162749B
公开(公告)日:2023-07-21
申请号:CN201811231847.5
申请日:2018-10-22
Applicant: 哈尔滨工业大学(深圳) , 腾讯科技(深圳)有限公司
IPC: G06F40/126 , G06F40/30 , G06F16/33 , G06N3/08
Abstract: 本发明实施例提供一种信息提取方法、装置、计算机设备及计算机存储介质,该方法包括:在字符级编码器层中,根据待提取文本的字符级信息,进行从所述字符级信息到字符特征向量、以及从所述字符特征向量到词级特征向量序列的编码;在词级编码器层中,进行从所述词级特征向量序列对应的词级信息到词特征向量,以及从所述词特征向量到片段特征向量序列的编码;在条件随机场层中接收所述片段特征向量序列并标注语义标签,确定满足概率条件的所述语义标签。
-
-
-
-
-
-
-
-
-