一种基于概率模型的程序错误检测方法及系统

    公开(公告)号:CN105608006B

    公开(公告)日:2018-06-08

    申请号:CN201510982321.0

    申请日:2015-12-22

    Abstract: 本发明公开了一种基于概率模型的程序错误检测方法及系统,该方法包括以下步骤:S1、获取概率模型和待检测程序,从待检测程序中提取待检测的函数调用序列集合;S2、获取单个待检测的函数调用序列,求解最相似的函数调用序列集合,并计算联合概率;S3、根据相似集合对该待检测序列进行检测并生成修复方案;S4、完成该待检测序列的检测和修复后,记录检测到的各个错误信息及修复方案;S5、对待检测集合中的所有待检测序列检测完毕后,输出程序错误报告。本发明无需处理概率模型转换到确定性模型时的阈值选择问题,能够快速的检测程序中的错误,且检测准确率高。

    一种地理本体要素实例属性相似度的计算方法

    公开(公告)号:CN107329955A

    公开(公告)日:2017-11-07

    申请号:CN201710522402.1

    申请日:2017-06-30

    Abstract: 本发明公开了一种地理本体要素实例属性相似度的计算方法,包括以下步骤:将基础地理信息数据库转换为大规模地理本体库,构造地理本体;遍历地理本体构建关键属性对集合和辅助属性对集合;分别计算两个实例中关键属性对相似度和辅助属性相似度计算两个实例的综合相似度。该方法在计算要素实例相似度方面有更高的准确性。

    一种基于贝叶斯分词算法的中文地址语义标注方法

    公开(公告)号:CN106528526A

    公开(公告)日:2017-03-22

    申请号:CN201610880863.1

    申请日:2016-10-09

    CPC classification number: G06F17/2775 G06F16/29

    Abstract: 本发明公开了一种基于贝叶斯分词算法的中文地址语义标注方法,包括步骤S1:预设置针对中文地址数据进行语义标注的标注关系表;步骤S2:获取预切分、标注好的训练语料;步骤S3:对训练语料进行统计学习得到词频词典、标注关系词典、标注模式表;步骤S4:输入待标注地址字符串进行全切分;步骤S5:根据词频词典及贝叶斯分词算法获取概率最大的分词方案;步骤S6:根据标注关系词典对分词方案进行标注得到标注结果。标注关系表设定了一个规范化的标注模板;通过统计学习训练语料获得了包含词频词典、标注关系词典以及标注模式表的数据库;根据前述训练数据库匹配得到标注好的具有语义信息的中文地址,快速准确地完成了针对中文地址数据的语义解析。

    一种基于集合运算的中文地址行政区划解析方法

    公开(公告)号:CN105677700A

    公开(公告)日:2016-06-15

    申请号:CN201510980148.0

    申请日:2015-12-23

    CPC classification number: G06F17/3087

    Abstract: 本发明公开了一种基于集合运算的中文地址行政区划解析方法,该方法包括以下步骤:首先利用行政区划字典和移动窗口最大匹配算法,从中文地址中提取所有可能的行政区划数据集,然后利用中文地址行政区划元素之间具有层次关系的特点,建立行政区划条件集合运算规则,最后对行政区划集合进行条件集合运算,得到信息量最完整最准确的中文地址的行政区划。本发明方法解决了在互联网中中文地址数据混乱无序的情况下快速解析出中文地址行政区划的问题,并能得到信息量最完整最准确的中文地址的行政区划解析结果。

    基于滑动窗口最大匹配算法的地址匹配方法

    公开(公告)号:CN104615782A

    公开(公告)日:2015-05-13

    申请号:CN201510092653.1

    申请日:2015-03-02

    Abstract: 本发明提供一种基于滑动窗口最大匹配算法的地址匹配方法,包括以下步骤:建立行政区划表;对行政区划表建立匹配查询关系;设置滑动窗口,进行匹配查询。本发明方法将地理赋值的两个环节“地址分词”与“地址匹配”整合到了一起,即在分词的同时进行数据库匹配,实现了在分词完成的同时也查找到了所匹配的记录;通过这种方法可以有效的减少数据库的查询访问次数,从而加快匹配速度。

    基于Mixup和BQRNN的法律命名实体识别方法

    公开(公告)号:CN114372465B

    公开(公告)日:2024-09-20

    申请号:CN202111152985.6

    申请日:2021-09-29

    Abstract: 本发明公开了一种基于Mixup和BQRNN的法律文书的命名实体识别方法,包括步骤:使用BERT预训练模型对训练集的法律判决文书进行向量化处理;使用Mixup数据增强方法在词向量表示层面对训练集规模进行扩充;使用BQRNN双向准循环神经网络对增强后的词向量表示进行处理,提取法律文本中带有上下文特征的深层特征向量,并输出相应的实体标签序列;使用CRF条件随机场解码,最后将概率最大的实体标签序列,作为训练结果输出,并生成相应训练模型;将训练模型在测试集上进行测试,调整训练模型参数信息,直至选取稳定前,指标性能最好的识别模型;输入中文法律文书案列,识别模型自动进行判断并输出法律文书中的法律实体。

Patent Agency Ranking