一种基于多源域适应和强化学习的众包命名实体识别模型及系统

    公开(公告)号:CN117436449B

    公开(公告)日:2024-07-09

    申请号:CN202311442418.3

    申请日:2023-11-01

    Abstract: 一种基于多源域适应和强化学习的众包命名实体识别模型及系统,属于众包命名实体识别技术领域。本发明为了解现有的使用域适应模型解决众包问题的方法往往没有充分考虑标注者的可靠性导致低质量标注者的数据对模型训练产生负面影响、以及现有众包命名实体识别方法在处理低质量标注者提交的极低质量数据时存在困难等问题。通过考虑标注者可靠性生成合成的专家表示,并采用基于强化学习的实例选择器丢弃低质量的标注,从而提高命名实体识别模型在众包数据集上的性能,本发明加深了对众包命名实体识别领域适应方法中标注者可靠性的理解,提出了一种基于强化学习的数据预处理实例选择器,并展示了其在解决众包标注中的命名实体识别挑战方面的有效性。本发明用于在无监督众包数据中高效地提取命名实体信息。

    一种基于目标信息识别的用户生成内容立场检测方法及系统

    公开(公告)号:CN118070774A

    公开(公告)日:2024-05-24

    申请号:CN202410353286.5

    申请日:2024-03-26

    Abstract: 一种基于目标信息识别的用户生成内容立场检测方法及系统,涉及社交网络数据处理技术领域。本发明为了解决现有的用户生成内容立场检测或识别方法需要花费大量人工成本去标注目标信息,并且仅有的类似方法在目标识别阶段往往需要大规模数据对模型进行训练或微调,导致样本数据质量会直接影响目标识别的性能和准确率的问题。技术要点:首先从给定社交媒体文本中抽取出具有代表性的关键词;然后通过余弦相似度计算关键词与目标集合中特定目标之间的相似度,并根据相似度将确定文本所针对的目标对象;最后基于识别出的目标对象,采用多任务BERTweet模型来检测文本与该目标对象之间的立场关系。本发明所提出的基于目标信息识别的用户生成内容立场检测方法可有效减少人工成本,从而提高了立场检测方法在实际应用中的可行性和实用性。

    一种基于区域影响的深度矩阵分解的POI推荐方法

    公开(公告)号:CN117216397B

    公开(公告)日:2024-03-12

    申请号:CN202311237690.8

    申请日:2023-09-22

    Abstract: 本发明提出一种基于区域影响的深度矩阵分解的POI推荐方法,属于智能推荐技术领域。包括:S1.获取POI数据,进行预处理,并构建用户兴趣点矩阵;S2.对用户兴趣点进行偏置分析;S3.对用户兴趣点矩阵进行正则化处理;S4.构建POI图获取POI功能嵌入表示,构建Region图获取区域嵌入表示;S5.获取区域影响指数和关联区域特征的用户兴趣点偏置矩阵;S6.构建深度矩阵分解模型,训练模型,预测用户对未知兴趣点的兴趣程度。本发明通过学习用户和POI之间的潜在特征向量,能够更好地捕捉用户的兴趣和POI的特征。通过对用户‑POI矩阵的分解和补全,能够准确地预测用户的POI访问偏好,并生成个性化的推荐结果。

    一种基于多源域适应和强化学习的众包命名实体识别模型及系统

    公开(公告)号:CN117436449A

    公开(公告)日:2024-01-23

    申请号:CN202311442418.3

    申请日:2023-11-01

    Abstract: 一种基于多源域适应和强化学习的众包命名实体识别模型及系统,属于众包命名实体识别技术领域。本发明为了解现有的使用域适应模型解决众包问题的方法往往没有充分考虑标注者的可靠性导致低质量标注者的数据对模型训练产生负面影响、以及现有众包命名实体识别方法在处理低质量标注者提交的极低质量数据时存在困难等问题。通过考虑标注者可靠性生成合成的专家表示,并采用基于强化学习的实例选择器丢弃低质量的标注,从而提高命名实体识别模型在众包数据集上的性能,本发明加深了对众包命名实体识别领域适应方法中标注者可靠性的理解,提出了一种基于强化学习的数据预处理实例选择器,并展示了其在解决众包标注中的命名实体识别挑战方面的有效性。本发明用于在无监督众包数据中高效地提取命名实体信息。

    一种基于时空信息提取的轨迹表征挖掘方法

    公开(公告)号:CN117216614A

    公开(公告)日:2023-12-12

    申请号:CN202311237696.5

    申请日:2023-09-22

    Abstract: 本发明提出一种基于时空信息提取的轨迹表征挖掘方法,属于数据挖掘技术领域。包括:S1.获取时空轨迹数据,并对数据进行预处理;S2.将时空轨迹数据映射到对应的城市区域;S3.根据区域分布的属性和用户对每个区域的访问时间点,进行初始时空特征编码;S4.将地理编码和关联访问区域编码的时间编码拼接构成轨迹的时空特征编码,并映射为向量表示;S5.将向量输入至LSTM网络中训练,捕捉上下文信息;S6.根据上下文信息计算每个区域对于轨迹经过其他区域的动态功能权重;S7.使用注意力权重对BiLSTM的输出进行加权,生成加权的上下文表示聚合每个区域在不同时段内的特征信息。解决缺少挖掘轨迹的动态功能表征方法的问题。

    一种跨境云内部地理边界发现系统及方法

    公开(公告)号:CN115134251A

    公开(公告)日:2022-09-30

    申请号:CN202210761664.4

    申请日:2022-06-30

    Abstract: 一种跨境云内部地理边界发现系统及方法,涉及网络拓扑探测技术领域。本发明的技术要点包括:在正常拓扑探测的基础上,针对云本身的特点进行优化,其中:前缀选取即根据云流量传输的特点选择能够较多的发现云内部地理边界的前缀进行探测,减少了探测目标数量;云地理边界识别即对于探测结果能够快速准确的分析出其中云内部的地理边界,减少了分析时间;测量状态监控即时刻监控测量点状态,观察其是否异常掉线并做出相应处理。本发明在极大程度减少了测量目标及测量时间的基础上,提高了云内部地理边界的发现率。

    一种基于覆盖网的NDN网络管理系统及方法

    公开(公告)号:CN115134229A

    公开(公告)日:2022-09-30

    申请号:CN202210761619.9

    申请日:2022-06-30

    Abstract: 一种基于覆盖网的NDN网络管理系统及方法,涉及网络管理技术领域,以解决当前NDN网络部署流程复杂且监控与维护缺失的问题。本发明系统包括一个NDN管理端和多个NDN代理端,二者通过NDN网络管理协议实现通信;NDN管理端包括管理请求解析模块、配置项管理模块、代理配置模块、代理监控模块;代理配置模块用于控制NDN代理端的各项配置,代理监控模块用于定时获取所有NDN代理端当前应用的配置,并与配置档案进行比较,若配置档案未被应用则重新应用缺失的配置项;NDN代理端包括代理请求解析模块、NDN转发器、NDN转发器管理模块、NDN转发器测量模块;NDN转发器管理模块用于查询或修改NDN转发器的各项配置。本发明实现了NDN网络管理系统的解耦,增强了系统可扩展性。

    一种基于去中心化DNS根区管理的智能合约系统

    公开(公告)号:CN113067836B

    公开(公告)日:2022-04-19

    申请号:CN202110423192.7

    申请日:2021-04-20

    Abstract: 一种基于去中心化DNS根区管理的智能合约系统,涉及互联网技术领域,用以解决现有根区管理去中心化技术所带来的治理主体不明确问题、名字空间分裂问题和恶意抢注问题。本发明的技术要点包括:账簿模块将根区管理中存在的各类数据抽象为过程、协议和资源;合约模块将对协议和资源数据的更新抽象为提案‑审核‑结束三阶段模型,并使用灵活的审核策略,从而支撑根区管理的多样性。本发明解决了传统根区管理的中心化、透明性低、自动化程度低等问题,系统可以使根区管理的多个参与方均能访问全部的根区管理数据,并以高度自动化的方式来参与根区的多方管理。本发明可应用于对互联网中域名系统根区数据管理之中。

    一种基于DNS系统的通用网络标识解析方法及系统

    公开(公告)号:CN114285823A

    公开(公告)日:2022-04-05

    申请号:CN202111654983.7

    申请日:2021-12-30

    Abstract: 一种基于DNS系统的通用网络标识解析方法及系统,涉及网络标识解析技术领域,用以解决现有的多标识体系由于不能实现体系间标识数据交换而导致协同工作困难的问题。本发明的技术要点包括:获取用户输入的带有网络标识的解析请求,其中,所述解析请求为符合预定义格式的解析请求,其包括两种类型:HTTP模型和标识协议模型;对所述解析请求进行转换,获得可解析URL;基于预先部署的DNS权威服务器,根据可解析URL进行DNS解析,获取对应标识权威服务器的IP地址;基于预先部署的标识权威服务器,访问DNS解析获得的标识权威服务器的IP地址,根据可解析URL进行标识解析,获取网络标识对应的数据。本发明方便了各种标识体系的协同解析功能,降低了部署成本。

    一种隐私保护的纵向深度神经网络模型构建方法、计算机及存储介质

    公开(公告)号:CN114282652A

    公开(公告)日:2022-04-05

    申请号:CN202111578391.1

    申请日:2021-12-22

    Abstract: 本发明提出一种隐私保护的纵向深度神经网络模型构建方法、计算机及存储介质,属于隐私保护模型构建技术领域。首先,发起方和所有参与方找出共有的样本ID,生成自己的公私钥对,利用公钥对中间数据进行加密;其次,参与方基于本地数据集与发起方进行安全前向传播过程,使发起方获得深度神经网络模型交互层的真实加权值;最后,参与方和发起方进行安全反向传播过程,发起方基于加权值计算交互层中间误差,使双方各自获得更新交互层模型参数的梯度,进行深度神经网络交互层模型的更新,得到纵向深度神经网络模型。在无可信第三方的前提下保护数据隐私安全,对不同神经网络结构进行多方安全联合建模。解决构建模型成本高、风险大、结构敏感的问题。

Patent Agency Ranking