-
公开(公告)号:CN114638233A
公开(公告)日:2022-06-17
申请号:CN202210289993.3
申请日:2022-03-22
Applicant: 中国经济信息社有限公司
IPC: G06F40/30 , G06F40/258 , G06F40/194 , G06F40/279 , G06F16/33
Abstract: 本公开提出了一种新闻稿件首发认定方法、装置和设备,该方法包括:获取待分析新闻稿件,提取出待分析新闻稿件的标题;根据标题,由新闻稿件集中进行相似稿件的筛选;在由新闻稿件集中筛选出相似稿件时,分别提取待分析新闻稿件中的实体词以及相似稿件中的实体词;对待分析新闻稿件中的实体词与相似稿件中的实体词进行匹配,并根据匹配结果确认相似稿件与待分析新闻稿件是否为同一事件的稿件;在相似稿件与待分析新闻稿件为同一事件的稿件时,由与待分析新闻稿件为同一事件的稿件中确定出首发稿件,这样,便可以提高新闻稿件首发认定结果的准确性。
-
公开(公告)号:CN114492320A
公开(公告)日:2022-05-13
申请号:CN202111163785.0
申请日:2021-09-30
Applicant: 新华融合媒体科技发展(北京)有限公司 , 新华通讯社 , 中国经济信息社有限公司
IPC: G06F40/14 , G06F40/253 , G06F40/279 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种文本处理检测方法、装置、设备及计算机存储介质。该方法包括:获取第一文本;从第一文本中确定包括数量词的目标文本片段;根据目标文本片段中的多个词的词性,对目标文本片段中的多个词进行依存语法分析,得到目标文本片段中各个词之间的第一依存语法关系;根据第一依存语法关系,构建依存语法关系树;从依存语法关系树中确定与预设的依存语法关系结构相匹配的至少一个目标依存语法关系结构;根据预设的依存语法关系结构与预设的语义关系结构的一一对应关系,确定与至少一个目标依存语法关系结构对应的目标语义关系结构。采用本申请提供的文本处理方法、装置、设备及计算机存储介质,可以准确确定数量词和其他词之间的语义关系。
-
公开(公告)号:CN114490960A
公开(公告)日:2022-05-13
申请号:CN202111343122.7
申请日:2021-11-12
Applicant: 新华通讯社 , 媒体融合生产技术与系统国家重点实验室 , 中国经济信息社有限公司
IPC: G06F16/332 , G06F16/35 , G06F16/9532 , G06F40/289
Abstract: 本申请公开了一种首发新闻稿的确定方法、装置、电子设备和存储介质。该首发新闻稿的确定方法包括:获取新闻事件的第一新闻要素信息;根据第一新闻要素信息进行新闻稿搜索,得到第一新闻稿候选集,获取第一新闻稿候选集中的各候选新闻稿的第二新闻要素信息;基于第一新闻要素信息和所述第二新闻要素信息,确定特征向量;将特征向量输入预先训练好的分类器中,得到与新闻事件相匹配的第二新闻稿候选集;基于第二新闻稿候选集中的各候选新闻稿的发布时间,确定与新闻事件对应的首发新闻稿。采用本申请提供的首发新闻稿的确定方法,可以实现高效、精确的确定报道某一事件的首发新闻稿的效果。
-
公开(公告)号:CN114282230A
公开(公告)日:2022-04-05
申请号:CN202111166778.6
申请日:2021-09-30
Applicant: 新华通讯社 , 新华融合媒体科技发展(北京)有限公司 , 中国经济信息社有限公司
Abstract: 本申请实施例提供了一种数据处理方法、装置、设备及计算机存储介质。在获取到终端发起的数据处理请求后,会根据数据处理请求中的目标算法的标识以及算法与接口的对应关系,确定与目标算法对应的目标接口,然后会将待处理数据转发至该目标接口,以使该目标接口调用对应的目标算法对待处理数据进行处理。如此,该数据数据方法中,通过预先建立算法与接口的对应关系,后续可以根据数据处理请求中的算法标识从预先建立的算法与接口的对应关系中,确定出对应的接口后,通过该接口自动调用对应的算法进行数据处理,免去了用户手动切换算法的操作,简化了用户在数据处理过程中的操作。
-
-
-