-
公开(公告)号:CN119807738A
公开(公告)日:2025-04-11
申请号:CN202411780823.0
申请日:2024-12-05
Applicant: 苏州空天信息研究院
IPC: G06F18/214 , G06F18/40
Abstract: 本发明公开了一种网页嵌入式文本标注方法,网页标注插件前端使用Javascript和Chrome浏览器原生API,通过文档对象模型元素和浏览器对象模型元素,响应标注用户对原始文本的标注指令;网页标注插件后台利用预标算法引擎库中事先预装的标注预训练模型对前端获取的原始文本语料进行识别和标注,采用分布式存储引擎Elasticsearch进行数据的存储,将模型预标结果和人工标注结果合并进行存储。本发明降低了现阶段文本采集和文本清洗工作在人力和时间方面的投入成本,简化了文本标注流程,降低了传统标注平台或工具的使用门槛,支持使用者在浏览网页的同时即可实现数据的筛选及标注。
-
公开(公告)号:CN117746236A
公开(公告)日:2024-03-22
申请号:CN202311735286.3
申请日:2023-12-15
Applicant: 苏州空天信息研究院
Abstract: 本发明公开了一种融合拍照视角和方位信息的街景图像快速搜索定位方法,针对位置街景库中的每张街景图像,使用Delf模型提取图像的深度局部特征,Delf模型检测图像中的局部关键区域,并生成对应的局部特征描述子;将不同位置的街景图像与对应的Delf特征关联起来,形成一个街景特征库,每个位置会对应一组特征,包括不同视角、不同方位的街景图像特征;根据不同视角的采样频率,确定每个视角的相似度权重,计算测试图像与位置图像特征库中街景图像的特征相似度;选择相似度最高的街景图像作为搜索结果,并获取其对应的位置信息,实现街景图像的定位。本发明能够实现高精度、高效率的图像定位,为地理信息领域的应用提供了可靠的技术支持。
-
公开(公告)号:CN116955537A
公开(公告)日:2023-10-27
申请号:CN202310978360.8
申请日:2023-08-04
Applicant: 苏州空天信息研究院
IPC: G06F16/33 , G06F16/35 , G06F40/289 , G06F40/30 , G06F40/216 , G06F18/23
Abstract: 本发明公开一种融合新闻发生时间与语义相似度的事件脉络链路生成方法,对新闻文本内容进行嵌入式表征,对新闻发生时间进行数字化表示,完成新闻集合预处理;对预处理后的新闻集合按照发生时间进行窗口划分,形成若干新闻子集合;结合新闻的发生时间和文本内容信息,对每一个窗口内的新闻子集合使用聚类算法计算事件簇结果并进行评估;在各个窗口下计算得到的事件簇结果中,选择属于同一类的簇进行融合,并在融合后的簇结果中选择事件簇代表节点形成新一轮的新闻集合;针对新形成的新闻集合,重复上述过程,直至得到最终的事件脉络结果。本发明提高了新闻事件脉络结果生成的准确性、可解释性以及高效性。
-
公开(公告)号:CN116227477A
公开(公告)日:2023-06-06
申请号:CN202310399460.5
申请日:2023-04-14
Applicant: 苏州空天信息研究院
IPC: G06F40/258 , G06F40/30
Abstract: 本发明公开一种基于抽取式的话题簇新闻标题自动生成方法,将话题簇下的所有标题按语义近似度进行分组,分组后每组的标题个数为2或1;对元素个数为2的组求取最长公共子序列和对应的贡献度,并添加到标题集中;更新最长公共子序列集合,并在标题集中删除该组所有元素;将获得的最长公共子序列集合作为候选集合,同时根据贡献度大小对该候选集进行降序排序,对排序结果再按照最长公共子序列长度升序排序;依次遍历最长公共子序列集合排序后的结果,在候选集中找到能包含最多个最长公共子序列的原始标题,如果有多个这样的标题,把长度最短的标题作为该话题簇的标题。本发明可极大提高话题簇标题的可读性、通顺度以及信息完整性。
-
-
-