一种基于模糊聚类的图片检索方法

    公开(公告)号:CN104298713B

    公开(公告)日:2017-12-08

    申请号:CN201410472785.2

    申请日:2014-09-16

    Inventor: 刘瑞 左源 张辉

    Abstract: 本发明公开了一种基于模糊聚类的图片检索方法,包括如下步骤:S11,为图片库中图片构建特征值库,并为每张图片进行编号;S12,从图片库中选取图片间的相互距离均大于距离阙值A1的N张图片,对其余图片进行第一次归类,形成N类图片集;S13,对N类图片集中所含图片数量大于数量阙值的类执行步骤S12,直到所有的类均小于数量阙值为止,得到M个代表点;S14,对图片库中的所有图片根据与M个代表点的相似程度,划分到相似程度最高的代表点所代表的图片集中;S15,对于待检索的输入图片,对其特征值化,分别计算其与所有代表点之间的相似度,选取相似度距离最近的若干个代表点进行检索。本发明在保证检索效率的基础上缩小了检索范围,降低了检索的工作量。

    增强神经网络模型鲁棒性的训练方法及其在波动率曲面预测中的应用

    公开(公告)号:CN119671301A

    公开(公告)日:2025-03-21

    申请号:CN202411504801.1

    申请日:2024-10-27

    Abstract: 本发明公开了一种增强神经网络模型鲁棒性的训练方法及其在波动率曲面预测中的应用。增强神经网络模型鲁棒性的训练方法,其包括:步骤一、通过计算待训练的神经网络模型的输出值与真实值间的回归指标,得到第一损失值L1;步骤二、利用生成模型中计算第二损失值L2;步骤三、基于第一损失值L1和第二损失值L2,结合第三损失值L3构建损失函数;步骤四、基于构建的损失函数对待训练的神经网络模型进行迭代训练学习。本发明通过引入理论数据训练生成模型,利用生成模型计算似然值,利用似然值对神经网络模型的损失函数进行修正,最小化训练数据集的误差,降低神经网络模型受训练数据集的影响,进而达到增强神经网络模型鲁棒性的目的。

    信用债发债主体违约风险评估方法、系统及装置

    公开(公告)号:CN111598691B

    公开(公告)日:2022-09-13

    申请号:CN202010312863.8

    申请日:2020-04-20

    Abstract: 本发明公开了信用债发债主体违约风险评估方法,包括,获取与发债主体匹配的公开新闻文本数据;定义风险主题和与其对应的风险种子词;对风险种子词进行扩展,构建风险关键词典;构建关键词多维风险特征体系;构建词评分模型,对风险关键词典中的词进行风险评分;计算新闻和/或发债主体违约风险负面舆情得分;以及信用债发债主体违约风险评估系统和装置。本发明一方面获得了完整、准确、可扩展的风险关键词典,另一方面可实现对不同维度的违约风险负面舆情进行评分,以更加准确地分析发债主体的违约行为。

    信用债发债主体违约风险评估方法、系统及装置

    公开(公告)号:CN111598691A

    公开(公告)日:2020-08-28

    申请号:CN202010312863.8

    申请日:2020-04-20

    Abstract: 本发明公开了信用债发债主体违约风险评估方法,包括,获取与发债主体匹配的公开新闻文本数据;定义风险主题和与其对应的风险种子词;对风险种子词进行扩展,构建风险关键词典;构建关键词多维风险特征体系;构建词评分模型,对风险关键词典中的词进行风险评分;计算新闻和/或发债主体违约风险负面舆情得分;以及信用债发债主体违约风险评估系统和装置。本发明一方面获得了完整、准确、可扩展的风险关键词典,另一方面可实现对不同维度的违约风险负面舆情进行评分,以更加准确地分析发债主体的违约行为。

    一种基于异常处理的海量文本自动标注方法

    公开(公告)号:CN104298714B

    公开(公告)日:2017-12-08

    申请号:CN201410472856.9

    申请日:2014-09-16

    Inventor: 刘瑞 左源 王德庆

    Abstract: 本发明公开了一种基于异常处理的海量文本自动标注方法,包括如下步骤:S1,从知识库中提取命名实体以及存在关系的命名实体对,分别进行存储;S2,根据存储的命名实体,通过使用字符串匹配找出海量文本中每个句子的命名实体,根据存储的命名实体对找出文本中所有命名实体对共现的句子,进行粗标注;S3,对进行过粗标注的句子中的命名实体进行判断,当存在词对异常时,将其删除;当存在命名实体异常时,通过过滤算法将有命名实体异常的命名实体全部去除掉,得到最终的文本标注结果。本发明能够有效解决在标注过程中错误标注的问题,提高了文本标注的准确率。

    基于不同人格特征的文本观点挖掘方法

    公开(公告)号:CN110825842B

    公开(公告)日:2022-07-29

    申请号:CN201910959523.1

    申请日:2019-10-10

    Abstract: 本发明公开了一种基于不同人格特征的文本观点挖掘方法,包括以下步骤:S1、构建最大熵模型;S2、针对某个事件,将全语料依据人格特征分成多个集合语料c,并通过耦合的狄利克雷过程DP构建跨人格特征主题模型;S3、每条文档进行分词处理,将每条文档的分词组成输入列表,作为跨人格特征主题模型的输入,并初始化跨人格特征主题模型的参数;S4、根据输入内容,采用吉布斯采样法,依据跨人格特征主题模型、最大熵模型迭代计算得出最终的人格特征主题模型的参数。本发明具有自动、准确地发现事件的主要主题,并区分不同人格特征对每个主题的客观方面(属性词)和主观观点(观点词)的有益效果。

    一种基于地理主题模型的信息处理方法

    公开(公告)号:CN105512347A

    公开(公告)日:2016-04-20

    申请号:CN201610056525.6

    申请日:2016-01-27

    Inventor: 刘瑞 左源 王德庆

    CPC classification number: G06F16/30 G06F16/29 G06F17/2785 G06F2216/03

    Abstract: 本发明公开了一种基于地理主题模型的信息处理方法,包括如下步骤:S1,抽取文本数据以及其所属的地理位置信息,组成待处理的文本数据存储到数据库;S2,对数据库中待处理的文本数据进行预处理,生成处理数据;S3,根据处理数据构建地理主题模型,通过对地理主题模型求解,得到主题和地理位置的关联关系。该方法将文档中的语义信息和地理位置信息关联起来做主题的挖掘分析,进而将文档中的主题与地理位置关联起来,能准确找到主题研究的地理位置,进而获得各个地区的主要课题研究方向,从而能够为用户提供更好的决策支持。

    一种基于模糊聚类的图片检索方法

    公开(公告)号:CN104298713A

    公开(公告)日:2015-01-21

    申请号:CN201410472785.2

    申请日:2014-09-16

    Inventor: 刘瑞 左源 张辉

    CPC classification number: G06F17/30256

    Abstract: 本发明公开了一种基于模糊聚类的图片检索方法,包括如下步骤:S11,为图片库中图片构建特征值库,并为每张图片进行编号;S12,从图片库中选取图片间的相互距离均大于距离阙值A1的N张图片,对其余图片进行第一次归类,形成N类图片集;S13,对N类图片集中所含图片数量大于数量阙值的类执行步骤S12,直到所有的类均小于数量阙值为止,得到M个代表点;S14,对图片库中的所有图片根据与M个代表点的相似程度,划分到相似程度最高的代表点所代表的图片集中;S15,对于待检索的输入图片,对其特征值化,分别计算其与所有代表点之间的相似度,选取相似度距离最近的若干个代表点进行检索。本发明在保证检索效率的基础上缩小了检索范围,降低了检索的工作量。

    融合文本信息的信用债发债主体违约风险评估方法

    公开(公告)号:CN111583012A

    公开(公告)日:2020-08-25

    申请号:CN202010208514.1

    申请日:2020-03-23

    Abstract: 本发明公开了一种融合文本信息的信用债发债主体违约风险评估方法,包括:构建违约词典;计算新闻舆情负面程度值;获取宏观数据、财务数据、是否发生违约的数据;构建训练样本和测试样本;以上一季度的宏观数据、新闻舆情负面程度值和财务数据为输入值,以下一季度是否发生违约的数据为输出值,构建评估模型,训练并测试得到稳定的评估模型;将待评估发债主体的新闻舆情负面程度值、宏观数据、财务数据输入至评估模型,输出得到该发债主体在当前季度是否发生违约的评估数据。本发明具有融合文本信息,将难以利用结构化数据度量,且引入评估时存在较大的主观随意性的指标,以更为客观的方式纳入风险评估过程中,增强评估方法的可信度的有益效果。

    基于不同人格特征的文本观点挖掘方法

    公开(公告)号:CN110825842A

    公开(公告)日:2020-02-21

    申请号:CN201910959523.1

    申请日:2019-10-10

    Abstract: 本发明公开了一种基于不同人格特征的文本观点挖掘方法,包括以下步骤:S1、构建最大熵模型;S2、针对某个事件,将全语料依据人格特征分成多个集合语料c,并通过耦合的狄利克雷过程DP构建跨人格特征主题模型;S3、每条文档进行分词处理,将每条文档的分词组成输入列表,作为跨人格特征主题模型的输入,并初始化跨人格特征主题模型的参数;S4、根据输入内容,采用吉布斯采样法,依据跨人格特征主题模型、最大熵模型迭代计算得出最终的人格特征主题模型的参数。本发明具有自动、准确地发现事件的主要主题,并区分不同人格特征对每个主题的客观方面(属性词)和主观观点(观点词)的有益效果。

Patent Agency Ranking