-
公开(公告)号:CN112784013A
公开(公告)日:2021-05-11
申请号:CN202110039994.8
申请日:2021-01-13
Applicant: 北京理工大学 , 北京理工大学东南信息技术研究院
Abstract: 本发明涉及一种基于上下文语义的多粒度文本推荐方法,属于计算机自然语言处理技术领域。本方法利用文档级的主题过滤方法,缩减了候选文本集合的大小,大大缩减模型推荐的时间,同时提高文本推荐的准确性。本方法首次提出了多粒度的文本推荐方法,能够在文档级、段落级和句子级等多个语言粒度上进行文本推荐,并通过单一的模型完成推荐过程,提高了用户的使用效率。
-
公开(公告)号:CN119514633A
公开(公告)日:2025-02-25
申请号:CN202411485748.5
申请日:2024-10-23
Applicant: 北京理工大学东南信息技术研究院 , 北京理工大学
IPC: G06N3/084 , G06F40/284 , G06N3/0464 , G06F40/216 , G06F40/194 , G06F21/62 , G06N3/048 , G06N3/047
Abstract: 本申请提供一种轻量级中英双语大语言模型的训练方法,方法包括:步骤1,进行中英文训练数据收集与预处理;步骤2,进行预训练;步骤21,进行文本分词;步骤22,文本编码:步骤23,旋转位置编码:在输入层采用在注意力层的旋转位置编码;步骤24,设定注意力机制、残差网络、标准化层和全连接网络输出层与自回归训练方式;步骤25,选择预训练数据;步骤26,进行预训练;每个批次使用中英文数据交叉的方式进行输入,即交叉从英文数据和中文数据中各采样一条,直到达到训练批次大小后输入到模型中进行训练。步骤3,指令微调训练。本申请极高的灵活性和适应性。
-
公开(公告)号:CN117115226B
公开(公告)日:2024-08-30
申请号:CN202311049171.9
申请日:2023-08-21
Applicant: 北京理工大学东南信息技术研究院
Abstract: 本申请提供一种基于计算机视觉的识别脚型尺寸的方法,方法包括:步骤1,图片获取:分别获取被测量者脚放置于白纸上的侧视图,以及俯视图;步骤2,进行图片缩放处理;步骤3,利用多重阈值分割法,分别对A4纸和脚部轮廓进行分割,再使用全新透视矫正法对A4纸轮廓进行矫正,使用掩码法获取目标的脚部区域图像;步骤4,进行俯视图处理获得最大脚宽:分别对A4纸和脚部轮廓进行分割,在使用简易矫正法对A4纸轮廓进行矫正,获取目标的脚部区域图像后,确定目标参数。
-
公开(公告)号:CN118153686A
公开(公告)日:2024-06-07
申请号:CN202410116003.5
申请日:2024-01-26
Applicant: 北京理工大学东南信息技术研究院
IPC: G06N5/04 , G06N5/025 , G06N3/045 , G06N3/09 , G06F16/332 , G06F16/33 , G06F16/2455
Abstract: 本发明提供一种智能政务问答的方法,包括下列步骤:S1、利用政务文件搭建政务知识库以及问答数据集;S2、通过开源模型中的指令跟随功能,对知识库文件进行提问,生成政务问答训练数据;S3、通过训练好的预训练语言模型,基于用户查询的政策问题,从政务知识数据库中粗粒度匹配相关的政策文件;S4、将政策文件切分成政策段落,并将问题和政策段落输入训练好的预训练语言模型,引导模型与问题最相关的政策段落匹配;S5、将问题和政策段落构建成提示语,并将提示语输入到训练好的大语言模型,引导训练好的大语言模型生成问题的回答。本发明可以在准确回答的基础上做到多样性生成,用户可以提问其关心的政策内容,并实时获取最新政策内容的解答。
-
公开(公告)号:CN113627158A
公开(公告)日:2021-11-09
申请号:CN202110751495.1
申请日:2021-07-02
Applicant: 南京理工大学 , 北京理工大学东南信息技术研究院
IPC: G06F40/232 , G06N3/04 , G06N3/08
Abstract: 本申请提出了基于多表征和多预训练模型的中文拼写纠错方法及装置,方法包括:将待纠错中文中的每个字进行融合词边界以及提取偏旁特征处理,获取带有特征值的待纠错中文;特征值包括词边界特征值以及偏旁特征值;将带有特征值的待纠错中文输入预先训练好的错字识别模型中,获取识别出的待纠正字;用预先设定的标记替换待纠正字,获取中间待纠错中文;将中间待纠错中文输入预先训练好的多预训练模型中,从预先设定好的混淆集中选出目标正确字替换待纠正字,获取纠正后的中文。本申请提供的方法能从多个角度识别出拼写错误,提高了拼写纠错的准确率。
-
公开(公告)号:CN119830861A
公开(公告)日:2025-04-15
申请号:CN202411683578.1
申请日:2024-11-22
Applicant: 北京理工大学东南信息技术研究院
IPC: G06F40/151 , G06N5/022
Abstract: 本申请提供一种基于大模型智能匹配招投标文件的方法,方法包括:步骤一、对招投标文件进行预处理;步骤二、对预处理后的文档进行数据清洗,以建立预训练数据集;步骤三、对数据清洗后的txt文本进行处理,将txt文本拆分成多个指标项;步骤四、利用大模型中的指令跟随功能,对指标文本中的各项指标进行提问,从而生成微调数据集;步骤五、基于基座大模型进行预训练和微调;步骤六、将提示语、指标项和对应投标文件片段构建成模板,并将模板输入到训练好的大语言模型中,引导训练好的大语言模型推理回答。本申请提升大模型在专业领域回答准确性,从而使模型在回答时表现得更为出色。
-
公开(公告)号:CN119337864A
公开(公告)日:2025-01-21
申请号:CN202411298131.2
申请日:2024-09-18
Applicant: 北京理工大学东南信息技术研究院
IPC: G06F40/232 , G06F40/30 , G06F40/186
Abstract: 本申请提供一种融合用户语义和过往纠错记录的纠错大模型迭代训练方法,方法包括:纠错元数据构造:利用大模型指令数据集的构造方式,对篇章句子在内的数据进行纠错元数据的构造;输入为用户指定的待纠错文本;通过接受批改大模型的输出,调用动态反馈模块将批阅反馈发送给用户决策模块;用户决策模块接受输出结果,进行纠错意见和纠错结果的满意度反馈,并将用户的满意度反馈结果进行记录和重新组装,返回给动态反馈模块。本申请能够更准确地识别和纠正作文中的错误。
-
公开(公告)号:CN119311797A
公开(公告)日:2025-01-14
申请号:CN202411264441.2
申请日:2024-09-10
Applicant: 北京理工大学东南信息技术研究院
IPC: G06F16/332 , G06F16/33 , G06N5/04 , G06F18/2411 , G06F18/214
Abstract: 本申请提供一种基于情感信息的人格识别方法,方法包括:步骤一,对会话中的人格识别进行定义,将会话中的人格识别问题形式化为自然语言推理I问题;步骤二,构建情感对话内容;步骤三,构建人格描述;整理并总结每个人格特质的积极和消极描述,描述用于在NLI问题中作为假设,提供关于行为特征和情感表达倾向的详细信息;步骤四,训练并推理自然语言推理。本申请提高了人机交互的互动质量和个性化体验。
-
公开(公告)号:CN118364798A
公开(公告)日:2024-07-19
申请号:CN202410514120.7
申请日:2024-04-26
Applicant: 北京理工大学 , 北京理工大学东南信息技术研究院
IPC: G06F40/186 , G06F40/205 , G06F40/126 , G06N20/00 , G06F9/448
Abstract: 本申请提供一种理解文本提高大语言模型工具学习的方法,方法包括:步骤一、API描述生成;步骤二、构建Query的上下文信息;步骤三、构建候选API集合,缩小大语言模型搜索API的范围;步骤四、利用大语言模型对Query进行回答;步骤五、设计Cos_F1对生成内容进行自动评价,利用目标Query和答案之间的余弦相似度表示一致性和差异性。创新性的加强了对开放大语言模型中AP功能的理解,并通过使用机器生成的API功能描述代替人类描述来提高API调用的准确性。
-
公开(公告)号:CN116956922A
公开(公告)日:2023-10-27
申请号:CN202310909646.0
申请日:2023-07-24
Applicant: 北京理工大学东南信息技术研究院 , 北京理工大学
IPC: G06F40/295 , G06F40/30 , G06N3/0499
Abstract: 本发明涉及一种利用大语言模型增强的生成式跨语言事件抽取方法,属于计算机人工智能和自然语言处理技术领域。本方法首先使用大语言模型,将各语言的文本信息进行事件预抽取,得到各种语言的大模型事件抽取结果,并将其解析为可用的文本提示为模型训练做准备,然后构建训练所需的文本提示,将输入的文本提示向量化表示,最后使用得到的隐藏层计算二元损失,解码隐藏层向量,将解码损失和二元损失加权相加反向传播,并将向量转化为文本。本方法有效解决了模型跨语言事件抽取困难的问题,提升了知识提示的正面效果,做到了知识提示程度的可控管理,显著增强了生成式跨语言事件的抽取性能。
-
-
-
-
-
-
-
-
-