融合文本信息的信用债发债主体违约风险评估方法

    公开(公告)号:CN111583012B

    公开(公告)日:2021-09-21

    申请号:CN202010208514.1

    申请日:2020-03-23

    Abstract: 本发明公开了一种融合文本信息的信用债发债主体违约风险评估方法,包括:构建违约词典;计算新闻舆情负面程度值;获取宏观数据、财务数据、是否发生违约的数据;构建训练样本和测试样本;以上一季度的宏观数据、新闻舆情负面程度值和财务数据为输入值,以下一季度是否发生违约的数据为输出值,构建评估模型,训练并测试得到稳定的评估模型;将待评估发债主体的新闻舆情负面程度值、宏观数据、财务数据输入至评估模型,输出得到该发债主体在当前季度是否发生违约的评估数据。本发明具有融合文本信息,将难以利用结构化数据度量,且引入评估时存在较大的主观随意性的指标,以更为客观的方式纳入风险评估过程中,增强评估方法的可信度的有益效果。

    融合文本信息的信用债发债主体违约风险评估方法

    公开(公告)号:CN111583012A

    公开(公告)日:2020-08-25

    申请号:CN202010208514.1

    申请日:2020-03-23

    Abstract: 本发明公开了一种融合文本信息的信用债发债主体违约风险评估方法,包括:构建违约词典;计算新闻舆情负面程度值;获取宏观数据、财务数据、是否发生违约的数据;构建训练样本和测试样本;以上一季度的宏观数据、新闻舆情负面程度值和财务数据为输入值,以下一季度是否发生违约的数据为输出值,构建评估模型,训练并测试得到稳定的评估模型;将待评估发债主体的新闻舆情负面程度值、宏观数据、财务数据输入至评估模型,输出得到该发债主体在当前季度是否发生违约的评估数据。本发明具有融合文本信息,将难以利用结构化数据度量,且引入评估时存在较大的主观随意性的指标,以更为客观的方式纳入风险评估过程中,增强评估方法的可信度的有益效果。

    基于关键词提取的实体名消岐方法

    公开(公告)号:CN110705295A

    公开(公告)日:2020-01-17

    申请号:CN201910859136.0

    申请日:2019-09-11

    Abstract: 本发明公开了一种基于关键词提取的实体名消岐方法,包括:文本预处理及负面词过滤阶段,词性标注及分析阶段,关键词提取组合对比三个阶段,目的是从零散且异质化严重的互联网文本中找到与实体相关且实体在文本中占有重要地位的目标文本;采用提取文本中的关键词与实体名进行组合判断是否为相关文本,在实际中可以有效的解决多个实体名出现在同一文本中时的匹配问题;本发明将多阶段处理步骤融合,极大地提升了用实体名称匹配文本的准确性。

    疑似非法集资风险的预警方法、装置、设备和存储介质

    公开(公告)号:CN110704572B

    公开(公告)日:2021-03-16

    申请号:CN201910833127.4

    申请日:2019-09-04

    Abstract: 本发明公开了疑似非法集资风险的预警方法,包括:从互联网公开数据中获取结构化数据和文本数据;根据所述结构化数据和所述文本数据,构建实体企业的多维画像;根据所述多维画像,计算实体企业的产品违约风险值、企业经营风险值、违规宣传风险值和负面舆情值;根据所述产品违约风险值、所述企业经营风险值、所述违规宣传风险值和所述负面舆情值,计算实体企业的综合风险值,若所述综合风险值大于预设值,则发出疑似非法集资风险预警。以及,疑似非法集资风险的预警装置,计算机设备和计算机可读存储介质。本发明可基于互联网公开文本实现疑似非法集资风险的早期预警。

    疑似非法集资风险的预警方法、装置、设备和存储介质

    公开(公告)号:CN110704572A

    公开(公告)日:2020-01-17

    申请号:CN201910833127.4

    申请日:2019-09-04

    Abstract: 本发明公开了疑似非法集资风险的预警方法,包括:从互联网公开数据中获取结构化数据和文本数据;根据所述结构化数据和所述文本数据,构建实体企业的多维画像;根据所述多维画像,计算实体企业的产品违约风险值、企业经营风险值、违规宣传风险值和负面舆情值;根据所述产品违约风险值、所述企业经营风险值、所述违规宣传风险值和所述负面舆情值,计算实体企业的综合风险值,若所述综合风险值大于预设值,则发出疑似非法集资风险预警。以及,疑似非法集资风险的预警装置,计算机设备和计算机可读存储介质。本发明可基于互联网公开文本实现疑似非法集资风险的早期预警。

    基于关键词提取的实体名消岐方法

    公开(公告)号:CN110705295B

    公开(公告)日:2021-08-24

    申请号:CN201910859136.0

    申请日:2019-09-11

    Abstract: 本发明公开了一种基于关键词提取的实体名消岐方法,包括:文本预处理及负面词过滤阶段,词性标注及分析阶段,关键词提取组合对比三个阶段,目的是从零散且异质化严重的互联网文本中找到与实体相关且实体在文本中占有重要地位的目标文本;采用提取文本中的关键词与实体名进行组合判断是否为相关文本,在实际中可以有效的解决多个实体名出现在同一文本中时的匹配问题;本发明将多阶段处理步骤融合,极大地提升了用实体名称匹配文本的准确性。

    互联网金融非显性广告识别方法及装置

    公开(公告)号:CN110704615B

    公开(公告)日:2021-01-26

    申请号:CN201910832504.2

    申请日:2019-09-04

    Abstract: 本发明公开了一种互联网金融非显性广告识别方法,包括:爬取互联网公开文本,过滤互联网公开文本中无意义信息;在过滤后的互联网公开文本中抽样,训练金融文本分类器,区分过滤后的互联网公开文本中的金融文本和非金融文本;将金融文本区分为长文本和短文本;在短文本和长文本中分别抽样,分别训练短文本广告分类器和长文本广告分类器,区分短文本中的广告文本和非广告文本,及区分长文本中的广告文本和非广告文本;在长文本中和短文本中的广告文本中抽样,训练广告文本煽动性分类器,区分长文本和短文本中的广告文本的煽动性程度。本发明还公开了一种互联网金融非显性广告识别装置。本发明能够对互联网金融广告精准识别以及广告内容深度分析。

    互联网金融产品宣传收益率和承诺提取方法及系统

    公开(公告)号:CN111581472A

    公开(公告)日:2020-08-25

    申请号:CN202010208512.2

    申请日:2020-03-23

    Abstract: 本发明公开了一种互联网金融产品宣传收益率和承诺提取方法,其包括:从公开互联网中获取金融类文本数据;基于所述收益率表述的规则库,通过文本匹配算法从所述金融类文本数据中提取得到收益率表述文本数据;基于预设的承诺关键词组,通过文本匹配算法从所述金融类文本数据中提取得到各类承诺表述文本数据;基于预设的收益率映射关系规则表,将所述收益率表述文本数据转换成可识别的收益率数值。本发明在提取和折算收益率的基础上进一步识别互联网金融平台的高利贷和非法集资行为,可以对其进行更好的监管。

    信用债发债主体违约风险评估方法、系统及装置

    公开(公告)号:CN111598691B

    公开(公告)日:2022-09-13

    申请号:CN202010312863.8

    申请日:2020-04-20

    Abstract: 本发明公开了信用债发债主体违约风险评估方法,包括,获取与发债主体匹配的公开新闻文本数据;定义风险主题和与其对应的风险种子词;对风险种子词进行扩展,构建风险关键词典;构建关键词多维风险特征体系;构建词评分模型,对风险关键词典中的词进行风险评分;计算新闻和/或发债主体违约风险负面舆情得分;以及信用债发债主体违约风险评估系统和装置。本发明一方面获得了完整、准确、可扩展的风险关键词典,另一方面可实现对不同维度的违约风险负面舆情进行评分,以更加准确地分析发债主体的违约行为。

    信用债发债主体违约风险评估方法、系统及装置

    公开(公告)号:CN111598691A

    公开(公告)日:2020-08-28

    申请号:CN202010312863.8

    申请日:2020-04-20

    Abstract: 本发明公开了信用债发债主体违约风险评估方法,包括,获取与发债主体匹配的公开新闻文本数据;定义风险主题和与其对应的风险种子词;对风险种子词进行扩展,构建风险关键词典;构建关键词多维风险特征体系;构建词评分模型,对风险关键词典中的词进行风险评分;计算新闻和/或发债主体违约风险负面舆情得分;以及信用债发债主体违约风险评估系统和装置。本发明一方面获得了完整、准确、可扩展的风险关键词典,另一方面可实现对不同维度的违约风险负面舆情进行评分,以更加准确地分析发债主体的违约行为。

Patent Agency Ranking