-
公开(公告)号:CN112131506A
公开(公告)日:2020-12-25
申请号:CN202011013718.6
申请日:2020-09-24
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/958 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种网页分类方法、终端设备及存储介质,该方法中包括:S1:采集多种类型的网页,根据每个网页中至少两种类型的特征构建图结构,并对网页的类型进行标记后,将所有具有类型标记的图结构组成训练集;S2:构建图卷积神经网络模型,通过训练集对图卷积神经网络模型进行训练,将训练后的模型作为网页分类模型;S3:针对待分类网页,根据步骤S1所述的至少两种类型的特征构建图结构后,通过网页分类模型确定图结构对应的网页类型。本发明充分学习网页中的文本和图片等额外的异构信息来构建网页分类模型,相对现有网页分类方法,能有效的解决基于单一数据结构的网页分类方法的局限性,能够明显解决网页特征稀疏问题。
-
公开(公告)号:CN114443836A
公开(公告)日:2022-05-06
申请号:CN202111599101.1
申请日:2021-12-24
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/35 , G06F16/36 , G06F40/289
Abstract: 本发明公开了一种构建人物关系图谱的方法、装置以及存储介质,所述方法包括:获取群聊数据,群聊数据包含时间信息和文本信息;根据时间信息和文本信息,将群聊数据分为一个或多个群聊片段;提取群聊片段的话题类别,根据话题类别对群聊片段进行分类,得到一个或多个话题数据,话题数据包含一个或多个群聊片段;对话题数据包含的所有群聊片段进行分析,得到成员的人物关系,人物关系包括成员的活跃程度、成员间的互动强度和成员间的社会关系;根据成员的人物关系,构建成员的人物关系图谱。本发明提供的一种构建人物关系图谱的方法和装置,有助于进一步挖掘关键聊天内容、成员信息及成员关系。
-
公开(公告)号:CN110399489A
公开(公告)日:2019-11-01
申请号:CN201910611047.4
申请日:2019-07-08
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明公开了一种聊天数据分段方法及装置,该方法包括以下步骤:S1:对聊天数据进行切分获得多个预分段段落;S2:通过话题切换的特征语句库与预分段段落的句子向量相似度判断预分段段落是否是包含不同话题内容的段落,若是,则对预分段段落进行再分段获得再分段段落,并对再分段段落重复步骤S2,若否,则进入下一步;以及S3:通过计算相邻的再分段段落的段落向量相似度判断再分段段落是否存在内容相关的相邻的段落,若是,则对再分段段落进行合并获得终分段段落,对终分段段落重复步骤S3,若否,则将再分段段落作为终分段段落。通过此方法可以将不同话题的聊天数据进行有效的分段,提高聊天数据处理效率。
-
-