-
公开(公告)号:CN111459806B
公开(公告)日:2022-09-23
申请号:CN202010185732.8
申请日:2020-03-17
Applicant: 南京邮电大学
IPC: G06F11/36 , G06F16/958
Abstract: 本发明公开了一种基于PLSA主题模型和EM算法确定网页元素主题的方法,该方法包括:(1)选取待测网页的网页元素对应的主题,找出主题关键词集合和主题集合;(2)对待测网页的网页元素进行预处理;(3)根据获取到的所述主题集合,按照PLSA模型公式训练出主题‑词矩阵以及网页元素‑主题矩阵,(4)采用改进的EM算法求解出网页元素中对应概率最大的主题,作为该网页元素的主题;(5)当网页结构或元素属性改变而造成网页状态变化后,重新获取当前DOM,重新对当前网页内的网页元素的主题进行判定,并生成网页元素XPath定位器。本发明根据改进EM算法判定出网页元素的主题,自动生成对应的XPath绝对路径,提高了网页元素定位器在自动化测试中的鲁棒性。
-
公开(公告)号:CN111459806A
公开(公告)日:2020-07-28
申请号:CN202010185732.8
申请日:2020-03-17
Applicant: 南京邮电大学
IPC: G06F11/36 , G06F16/958
Abstract: 本发明公开了一种基于PLSA主题模型和EM算法确定网页元素主题的方法,该方法包括:(1)选取待测网页的网页元素对应的主题,找出主题关键词集合和主题集合;(2)对待测网页的网页元素进行预处理;(3)根据获取到的所述主题集合,按照PLSA模型公式训练出主题-词矩阵以及网页元素-主题矩阵,(4)采用改进的EM算法求解出网页元素中对应概率最大的主题,作为该网页元素的主题;(5)当网页结构或元素属性改变而造成网页状态变化后,重新获取当前DOM,重新对当前网页内的网页元素的主题进行判定,并生成网页元素XPath定位器。本发明根据改进EM算法判定出网页元素的主题,自动生成对应的XPath绝对路径,提高了网页元素定位器在自动化测试中的鲁棒性。
-