一种基于多元文本特征的中文语法查错方法及系统

    公开(公告)号:CN112183094B

    公开(公告)日:2023-06-16

    申请号:CN202011209481.9

    申请日:2020-11-03

    Abstract: 本发明公开了一种基于多元文本特征的中文语法查错方法及系统,方法包括:(1)分别利用预训练模型和语法先验知识对文本进行向量表示,得到语义特征向量和词性特征向量,词性特征向量和语义特征向量首尾拼接得到文本的向量序列;(2)利用Bi‑LSTM模型抽取文本的特征向量序列;(3)对特征向量序列进行基于语义和词性搭配信息的注意力增强;(4)对注意力增强后的特征向量序列进行线性变换,得到标签预测序列;(5)对标签预测序列进行基于词序关系特征的信息增强;(6)捕获信息增强后的标签预测序列的约束信息,基于约束信息判别语法错误边界位置。经过验证,本发明表现出较好的查错效果,优于其他现有同类方法。

    一种物流仓储中心优化选址方法及系统

    公开(公告)号:CN114742593A

    公开(公告)日:2022-07-12

    申请号:CN202210428659.1

    申请日:2022-04-22

    Abstract: 本发明公开了一种物流仓储中心优化选址方法及系统,该方法包括:获取数据集,包括目标地区各行政区域的政务中心位置数据及经济适应量;采用K均值聚类法对数据集中数据点进行基于位置数据的聚类;构建物流仓储中心的选址模型,基于选址模型,对各聚类区域分别采用帝王蝶优化法优化选取物流仓储中心地址。本发明更能契合实际问题的解决,可进一步降低物流运输时间和成本。

    一种应用程序运行、存储方法及系统

    公开(公告)号:CN112631674A

    公开(公告)日:2021-04-09

    申请号:CN202011502928.1

    申请日:2020-12-18

    Inventor: 段瑞雪

    Abstract: 本发明涉及一种应用程序运行、存储方法及系统。该方法包括:获取申请请求;根据所述申请请求获取云端中的所述应用程序;采用所述本地客户端运行所述应用程序;获取所述本地客户端运行所述应用程序的运行数据;根据所述本地客户端的ID将所述应用程序的运行数据进行标记;将标记后的运行数据发送到所述云端进行存储。本发明所提供的一种应用程序运行、存储方法及系统,在不受本地存储空间大小的限制的同时,提高响应速度。

    一种基于多元文本特征的中文语法查错方法及系统

    公开(公告)号:CN112183094A

    公开(公告)日:2021-01-05

    申请号:CN202011209481.9

    申请日:2020-11-03

    Abstract: 本发明公开了一种基于多元文本特征的中文语法查错方法及系统,方法包括:(1)分别利用预训练模型和语法先验知识对文本进行向量表示,得到语义特征向量和词性特征向量,词性特征向量和语义特征向量首尾拼接得到文本的向量序列;(2)利用Bi‑LSTM模型抽取文本的特征向量序列;(3)对特征向量序列进行基于语义和词性搭配信息的注意力增强;(4)对注意力增强后的特征向量序列进行线性变换,得到标签预测序列;(5)对标签预测序列进行基于词序关系特征的信息增强;(6)捕获信息增强后的标签预测序列的约束信息,基于约束信息判别语法错误边界位置。经过验证,本发明表现出较好的查错效果,优于其他现有同类方法。

    一种基于网络爬虫和新浪API相结合的微博数据的采集方法

    公开(公告)号:CN109241380A

    公开(公告)日:2019-01-18

    申请号:CN201810970733.6

    申请日:2018-08-24

    Abstract: 本发明公开了一种基于网络爬虫和新浪API相结合的微博数据的采集方法,基于新浪API从微博名人榜获取种子用户及其对应的粉丝用户和关注用户,加入到种子列表;将种子列表转换为种子URL,并判断种子用户列表是否为空,若为空则结束,否则遍历种子列表,采用网络爬虫的方法,爬取种子用户的相关微博信息、微博评论信息和用户个人信息,并将微博评论用户加入到种子列表中。与现有技术相比,本发明通过将新浪API和针对新浪微博平台的网络爬虫相结合,既可以获取格式比较规范的微博数据,又能进行大规模的数据爬取,并且爬取的数据格式更加规范,噪声数据比较少,进而能够为开展微博中社会安全事件的侦测提供重要的数据基础。

Patent Agency Ranking