一种结合限制数据的特征权值量化方法

    公开(公告)号:CN103544135A

    公开(公告)日:2014-01-29

    申请号:CN201310507228.5

    申请日:2013-10-24

    Abstract: 一种结合限制数据的特征权值量化方法,它涉及一种结合限制数据的特征权值量化方法,本发明是要解决现有的基于限制数据的特征权值量化方法无法处理限制数据分布不均衡和限制数据存在不一致性的问题。本发明所述一种结合限制数据的特征权值量化方法按以下步骤进行:一、合并“限制数据”和“非限制数据”进行特征权值量化;二、特征权值量化函数中结合参数分布系数;三、特征权值量化函数中结合参数置信度。本发明解决了限制数据分布不均衡和限制数据中存在不一致性的问题。技术要点在于结合限制数据和非限制数据进行特征权值量化,并提出参数分布系数和置信度,本发明可应用于网络技术领域。

    文档段落分割方法
    22.
    发明授权

    公开(公告)号:CN102004724B

    公开(公告)日:2012-06-20

    申请号:CN201010602030.1

    申请日:2010-12-23

    Abstract: 文档段落分割方法,本发明涉及文档的分割方法。用于文本分割。它解决现有技术引入与文档描述的主题无关的噪声词而增大或缩小描述不同或相同子主题的片段间的相似度,使得片段划分的结果不准确的缺陷。它通过下述步骤实现:一、对文档进行分词的操作及停用词过滤的操作;二、采用词典《知网》对文档的多义词进行消歧;三、对消歧后的词语通过词语之间的相似度构造词汇链;四、对文档构造全文词汇链;五、对文档进行划分,将其划分为多个长度相等的片段,对片段构造词汇链;六、根据片段词汇链和全文词汇链相互覆盖的程度确定片段之间的相似度;七、根据片段之间的相似度构造片段相似图,根据片段相似度图对片段进行分割。

    一种基于社会网络和人名上下文的人物信息消歧处理方法

    公开(公告)号:CN102054029A

    公开(公告)日:2011-05-11

    申请号:CN201010593747.4

    申请日:2010-12-17

    Abstract: 一种基于社会网络和人名上下文的人物信息消歧处理方法,本发明涉及一种互联网人物信息的消歧处理方法。它解决了现有技术的搜索引擎对某一特定人名的检索结果往往是共享这一人名的不同人物相关网页的混合的问题。用于网络人物信息检索。它包括下述步骤:一、用户输入一个要检索的人名,利用搜索引擎完成检索,利用下载软件把检索到的网页下载到本地计算机;二、对上述网页分别进行正文提取处理、分词处理和词性标注的处理,形成文档;三、利用人物领域信息先对文档进行分类,再利用社会网络和上下文信息对人物领域信息进行聚类处理,最终显示出每个人物领域信息与实体人物之间的对应关系,并且显示出每个实体人物存在的社会网络。

    文档段落分割方法
    24.
    发明公开

    公开(公告)号:CN102004724A

    公开(公告)日:2011-04-06

    申请号:CN201010602030.1

    申请日:2010-12-23

    Abstract: 文档段落分割方法,本发明涉及文档的分割方法。用于文本分割。它解决现有技术引入与文档描述的主题无关的噪声词而增大或缩小描述不同或相同子主题的片段间的相似度,使得片段划分的结果不准确的缺陷。它通过下述步骤实现:一、对文档进行分词的操作及停用词过滤的操作;二、采用词典《知网》对文档的多义词进行消歧;三、对消歧后的词语通过词语之间的相似度构造词汇链;四、对文档构造全文词汇链;五、对文档进行划分,将其划分为多个长度相等的片段,对片段构造词汇链;六、根据片段词汇链和全文词汇链相互覆盖的程度确定片段之间的相似度;七、根据片段之间的相似度构造片段相似图,根据片段相似度图对片段进行分割。

    语句级汉字输入方法中的用户词识别方法与在线一次性学习方法及机器学习系统

    公开(公告)号:CN102004560A

    公开(公告)日:2011-04-06

    申请号:CN201010567997.0

    申请日:2010-12-01

    Abstract: 语句级汉字输入方法中的用户词识别方法与在线一次性学习方法及机器学习系统,涉及汉字输入的机器学习技术领域。本发明解决了现有机器学习方法中存在的经常需要用户干预才能够获得最终结果的问题。用户词识别方法是采用相对位置成词能力作为评价标准来识别用户词。学习方法仅在输入法输出的最优路径与最终输出路径不一致时才启动,该方法采用基于N元文法的概率计算方法获得概率值后,采用最大后验MAP获得用户调节值CA,该调节值CA和相应的词存入用户语言模型库。机器学习系统是应用上述用户词识别方法和学习方法实现的学习系统。采用本发明技术,能减少用户输入时的干预次数,让用户更轻松地得到需要的输出结果。

    数字键盘智能拼音汉字输入方法

    公开(公告)号:CN100465860C

    公开(公告)日:2009-03-04

    申请号:CN200310121628.9

    申请日:2003-12-31

    Abstract: 数字键盘智能拼音汉字输入方法,以“语句”为单位通过数字键盘将汉字输入到手机、电话机、传真机、或掌上类信息处理设备。使用本输入法,能同时自动处理汉字输入过程中的数字键位歧义、拼音组合歧义、和同音多字歧义。用户只需输入对应汉字拼音的数字键,系统便根据上下文在整个语句范围内调整相应的汉字,保证汉字语句的正确。输入过程中数字拼音的确认可由人工操作,也可由系统自动完成,同时,可处理其他形式的拼音输入。系统能自动学习用户知识,不断提高拼音到汉字转换的准确率。本输入法操作自然,易于学习,可减少拼音输入的击键次数,提高手机类设备的汉字输入速度。

    三键输入数字键盘及应用该键盘的输入方法

    公开(公告)号:CN1246761C

    公开(公告)日:2006-03-22

    申请号:CN200410013523.6

    申请日:2004-01-15

    Abstract: 三键输入数字键盘及应用该键盘的输入方法,它涉及一种用数字键盘输入汉语拼音的键盘和方法。克服现有输入方法在输入汉语拼音时存在击键次数过多、烦琐、不易掌握等弊端。三键输入数字键盘包含数字键盘,还包含在数字键本身或在显示屏上显示的一级拼音分类布局键盘、在数字键盘本身或在显示屏上显示的二级拼音分类布局键盘、在数字键盘本身或在显示屏上显示的三级拼音分类布局键盘;步骤是:显示一级拼音分类布局键盘;输入布局中相对应的数字键;显示二级拼音分类布局键盘中相对应的子布局键盘;输入子布局中相对应的数字键;显示三级拼音分类布局键盘中相对应的子布局键盘;输入子布局中相对应的数字键;完成一个完整的汉语拼音的输入。本发明能在数字键盘上键入三次数字键输入一个拼音,不需输入确认键,具有易学性。

    基于知识增强和回溯损失的对话情绪识别网络模型、构建方法、电子设备及存储介质

    公开(公告)号:CN113987179B

    公开(公告)日:2024-03-22

    申请号:CN202111255353.2

    申请日:2021-10-27

    Abstract: 本申请公开了一种基于知识增强和回溯损失的对话情绪识别网络模型、构建方法、电子设备及存储介质,属于自然语言处理技术领域。本申请首先利用编码器,通过设计不同的掩码矩阵以实现对话中各方的交互,同时引入对话历史信息,仅在词编码阶段就考虑了情感动力学的影响。然后,本申请通过利用图注意力网络实现对外部结构化情感知识的利用,从而扩充了话语的语义信息,弥补了词编码器模块在某些特定维度上知识的缺失。最终,在任务损失函数的基础上又加入了一个回溯损失以达到在训练过程中利用过去模型状态的先验经验的效果。旨在利用先前的训练经验来指导权重更新,确保模型决策更接近真实值,而不是前一个训练步骤中表现相对较差的预测。

    一种基于文本蕴含的跨域新闻推荐系统及推荐方法

    公开(公告)号:CN116738053A

    公开(公告)日:2023-09-12

    申请号:CN202310718242.3

    申请日:2023-06-16

    Abstract: 一种基于文本蕴含的跨域新闻推荐系统及推荐方法,属于信息推荐技术领域。为解决跨域新闻的推荐的问题。本发明包括包括用户领域兴趣生成模块、基于BERT的新闻嵌入模块、基于注意力机制的用户情景兴趣生成模块、基于文本蕴含思想的兴趣融合模块、点击率预测模块、损失函数计算模块;所述基于BERT的新闻嵌入模块分别连接基于注意力机制的用户情景兴趣生成模块、点击率预测模块,所述用户领域兴趣生成模块、基于注意力机制的用户情景兴趣生成模块连接基于文本蕴含思想的兴趣融合模块、所述基于文本蕴含思想的兴趣融合模块连接点击率预测模块,所述点击率预测模块连接损失函数计算模块。本发明在新闻推荐任务中效果更明显的提升。

    文本分类模型训练方法、诉讼状分类方法及装置

    公开(公告)号:CN113344060B

    公开(公告)日:2022-07-08

    申请号:CN202110600977.7

    申请日:2021-05-31

    Abstract: 本发明提供了一种文本分类模型训练方法、诉讼状分类方法及装置,训练方法包括:获取预先根据文本信息建立的多个人物事件关系图和文本信息的标签;将各个所述人物事件关系图输入预先建立的文本分类模型,分别对各个所述人物事件关系图进行编码,获得各个所述人物事件关系图的编码结果;基于注意力机制,分别确定各个所述编码结果的权重值,根据所述权重值对各个所述编码结果进行加权求和,获得文本表征结果;根据所述文本表征结果进行分类预测,获得预测结果;根据所述文本表征结果、所述预测结果和所述标签迭代优化所述文本分类模型至收敛。本发明的技术方案能够提高文本分类准确率,获得更好的分类效果。

Patent Agency Ranking