一种基于大数据的短视频活跃用户预测方法

    公开(公告)号:CN109784997A

    公开(公告)日:2019-05-21

    申请号:CN201910027207.0

    申请日:2019-01-11

    Abstract: 本发明请求保护一种基于大数据的短视频活跃用户预测方法,包括:101对用户的历史行为数据进行预处理操作;102根据注册时间将用户划分成训练集候选用户和测试集候选用户103将训练集候选用户和测试集候选用户根据历史行为转化为时序序列,作为训练集和测试集;104对处理好的时序序列进行打标;105通过时序序列建立many-to-many结构的LSTM模型;106根据用户历史行为时间序列,对当月注册用户在未来一周是否会使用相应短视频APP进行预测。本发明主要是通过对用户历史数据进行预处理和分析,提取特征,转换时序序列工作,建立深度学习模型,对当月注册用户在未来一周是否会使用该短视频APP进行预测,为短视频领域寻找活跃用户提供更为精准的个性化推送服务。

    一种基于外部知识编码网络的文本纠错方法

    公开(公告)号:CN119761349A

    公开(公告)日:2025-04-04

    申请号:CN202411824578.9

    申请日:2024-12-12

    Abstract: 本发明公开了一种基于外部知识编码网络的文本纠错方法,包括:获取特定领域的待纠错文本数据,将其输入到文本纠错网络中的Bert层,得到待纠错文本的句向量表征CLS;通过外部知识编码网络得到外部知识向量表征,将其存储于向量数据库D中;计算待纠错文本的句向量表征CLS与向量数据库D中所有外部知识向量表征的相似度,得到该句向量表征CLS相对于所有外部知识向量表征的相似度得分;选取相似度得分最高的外部知识向量表征并用其替换该待纠错文本的句向量表征CLS,得到新句向量表征CLS’;将新句向量表征CLS’输入到文本纠错网络中的其他模块,该文本纠错网络输出纠错后的文本数据。本发明可以解决文本纠错模型无法利用外部知识进行事实性纠错的问题,提高文本纠错模型的性能。

    一种药物-蛋白质结合亲和力预测方法

    公开(公告)号:CN118969065A

    公开(公告)日:2024-11-15

    申请号:CN202411158582.6

    申请日:2024-08-22

    Abstract: 本发明属于数据挖掘技术领域,具体涉及一种药物‑蛋白质结合亲和力预测方法,包括:获取多模态的药物‑蛋白质数据,将其输入训练好的亲和力预测模型,得到预测值;所述亲和力预测模型的训练过程包括:获取多模态的药物‑蛋白质数据,将其输入特征提取模块,得到多模态的药物‑蛋白质特征;将多模态的药物‑蛋白质特征进行拼接,得到初始综合特征表示;将初始综合特征表示输入应用记忆模块的动态注意力模块,得到最终的综合特征;将最终的综合特征输入预测模块,得到预测结果;根据预测结果计算损失函数值,根据损失函数值更新模型参数;本发明通过注意力权重记忆机制利用历史注意力权重动态的对多模态特征进行融合,提高了预测模型的性能。

    一种基于预训练语言模型构建的双模块中文拼写纠错方法

    公开(公告)号:CN118673901A

    公开(公告)日:2024-09-20

    申请号:CN202410715839.7

    申请日:2024-06-04

    Abstract: 本发明公开了一种基于预训练语言模型构建的双模块中文拼写纠错方法,通过分离和重构预训练语言模型的内部结构,分别构建了拼写错误检测模块和拼写错误纠错模块。前者通过编码文本的向量表示,计算文本中每一字符的置信度,进而确定错别字的位置。后者结合检测结果进行有针对性的修改,通过提取纠错嵌入向量中的文本特征计算纠错策略的合理性分数,并按照得分最高的策略进行修改,以得到纠错后的文本。本申请具备更快的响应速度和更高的纠错准确率,可应用于中文文本编辑,中文语音识别和光学中文字符识别场景中。

    一种基于大数据的智能政务问答系统

    公开(公告)号:CN118410132A

    公开(公告)日:2024-07-30

    申请号:CN202310362407.8

    申请日:2023-04-07

    Abstract: 本发明属于自然语言处理领域,具体涉及一种基于大数据的智能政务问答系统,包括:文本解析模块、特征提取模块、信息交互模块、答案预测模块;文本解析模块计算用户的问题Q与文档之间的相关性,选取相关性最高的前K个文档作为召回文档P;特征提取模块提取召回文档P与用户问题Q之间的依存关系特征;所述信息交互模块将召回文档P、用户问题Q以及依存关系特征进行多重注意力信息交互,得到最终的文本向量表示;所述答案预测模块将最终的文本向量表示通过全连接层来预测最终答案的起止位置。本发明通过融入依存关系特征,深入挖掘问题与文档中答案的联系,从而提高了问答系统中标准答案的定位,提升了用户体验。

    一种基于大数据的配电网故障类型识别方法

    公开(公告)号:CN118395230A

    公开(公告)日:2024-07-26

    申请号:CN202410484894.X

    申请日:2024-04-22

    Abstract: 本发明涉及一种基于大数据的配电网故障类型识别方法,包括:获取预处理后的配电网的故障训练样本集;对故障训练样本的故障波形数据进行特征提取,得到故障训练样本的时域、频域和熵特征;对故障训练样本的时域、频域和熵特征分别进行白化处理得到故障训练样本的白化时域特征、白化频域和白化熵特征;根据所有故障训练样本的特征方差和故障类别标签对故障训练样本的白化时域特征、白化频域特征和白化熵特征进行过滤,得到故障训练样本的时域属性特征、频域属性特征和熵属性特征;根据故障训练样本的时域属性特征、频域属性特征和熵属性特征利用故障识别模型预测故障训练样本的故障类型,本发明有效提升了配电网故障预测的准确率。

    一种基于大数据的消费金融领域欺诈检测方法

    公开(公告)号:CN117408697A

    公开(公告)日:2024-01-16

    申请号:CN202311355535.6

    申请日:2023-10-19

    Abstract: 本发明属于大数据处理技术领域,具体涉及一种基于大数据的消费金融领域欺诈检测方法,包括:获取金融交易数据和用户个人数据并构建成图结构,使用图注意力网络分别提取出金融交易特征和用户特征,用稀疏交叉注意力机制进行融合后输出金融交易欺诈检测的结果;本发明在欺诈检测时引入用户之间的关系,将交易用户之间的联系以图形式进行特征提取,与金融交易特征进行融合,使得模型具有检测团伙性欺诈的能力,同时使用稀疏交叉注意力来对交易特征和用户特征进行融合,实现了高准确性的金融领域欺诈检测。

    一种基于大数据的区块链异常交易检测方法

    公开(公告)号:CN117349774A

    公开(公告)日:2024-01-05

    申请号:CN202311389790.2

    申请日:2023-10-24

    Abstract: 本发明涉及深度学习领域,特别涉及一种基于大数据的区块链异常交易检测方法,所述方法包括:将区块链交易信息原始数据作为浅层区块链特征语义向量,将其通过由ResNet‑16残差网络组成的深层特征交互模块后的向量作为深层区块链特征语义向量,将深、浅层区块链特征语义向量交错拼接后,分别输入特征聚合门控循环单元FA‑GRU与双层去噪自编码网络DDAE,并将对应的输出向量输入Cross‑Attention网络进行交互,最终得到区块链交易是否异常的检测结果。本发明融合了具有抽象特征语义的深层特征与具有原始重要信息的浅层特征,并挖掘了交叉特征的具有区分能力的特征,提升了区块链交易异常检测的性能。

    一种电商商品属性智能抽取方法

    公开(公告)号:CN115983270A

    公开(公告)日:2023-04-18

    申请号:CN202211535942.0

    申请日:2022-12-02

    Abstract: 本发明涉及自然语言处理领域,特别是涉及一种电商商品属性智能抽取方法,所述方法包括:原始文本信息与标签Query信息分别编码;融合原始文本信息与标签Query信息编码结果;采用指针网络枚举实体片段;引入动态实体片段图整合全局信息,本发明通过增强机器阅读理解MRC方法引入先验信息增强模型类别识别能力,动态实体片段图提高模型实体片段识别能力,从而提高实体识别能力。

    一种消费金融场景下的用户购买行为大数据预测方法

    公开(公告)号:CN109509033B

    公开(公告)日:2023-04-07

    申请号:CN201811535802.7

    申请日:2018-12-14

    Abstract: 本发明请求保护一种消费金融场景下的用户购买行为大数据预测方法,包括:101对用户的APP操作行为日志数据进行预处理操作;102对用户的APP操作行为日志数据进行特征工程操作;103对构建特征完成的样本集进行特征选择;104建立2个机器学习模型,并进行模型融合操作;105通过建立的模型,根据用户个人属性及其历史APP操作行为日志数据对用户在未来一个周是否购买APP上的优惠券进行预测。本发明为商家广告精准投放,个性化优惠信息推荐提供有力的决策支持。

Patent Agency Ranking