Playwright提取元素定位怎么实现,方法是什么
Admin 2022-06-22 群英技术资讯 414 次浏览
最近组内推行Playwright进行自动化测试,由我封装了一个简单的框架供大家使用。本意是想让大家使用Page Object模式来编写自动化代码的,可是不知道是因为大家嫌麻烦,还是Playwright自带的录制工具太好用,基本上都是先录制,再把录制好的脚本放到框架中执行,结果就是Page Object的优势完全没有享受到,另外我在页面操作中加入了自动等待、重试等优化机制也是,还得在脚本里面一个个处理。由此,我分析大家不愿意用Page Object的一个原因是自己编写元素定位比较麻烦,而录制下来的脚本里面已经包含了定位信息,那么我是不是可以将录制脚本中的定位信息解析出来,在转换成我框架里的页面基类,就可以直接使用了。
首先我想到使用读取python文件配合正则表达式的方式进行解析,但是仔细一想,如果一个表达式有多行的话就很难处理了,还需要分析语法进行拼接。后来查询到可以使用python自带的ast库将python文件转化为抽象语法树进行解析,一下子就豁然开朗了。
元素定位是元素交互的前提条件,也是自动化测试最重要的步骤之一。元素” 存在 “页面”中 ,要定位元素,就是调用“页面”的方法:
我这里主要用到了ast的 parse walk dump 三个方法, parse 方法将脚本转化为抽象语法树, walk 用来遍历整个抽象语法树(类似xml遍历), dump 用于调试和将无法解析的内容直接输出,其实这里可以使用 unparse 或通过 lineno col_offset end_lineno end_col_offset 这四个属性定位到源码,但是这些都需要较高的python版本才有,我现在项目中使用的python 3.7版本中还没有这些,只能先用 dump 代替(当然,也是我比较偷懒)。代码如下:
import ast from inspect import signature from playwright.sync_api import Page import_num = 0 dup_num = 0 result = [] with open('<playwright录制脚本>', 'rb') as f: root = ast.parse(f.read()) parse_methods = set() for i in dir(Page): if not i.startswith('_'): attr = getattr(Page, i) if callable(attr): sign = signature(attr).parameters if 'selector' in sign: parse_methods.add(i) for node in ast.walk(root): if isinstance(node, ast.Call): if isinstance(node.func, ast.Attribute) and \ node.func.attr in parse_methods: if len(node.args) == 0: continue selector = node.args[0] if isinstance(selector, ast.Str): selector = selector.s elif isinstance(selector, ast.Name): selector = f'变量: {selector.id}' else: selector = f'无法解析: {ast.dump(selector, False)}' frame_locator = None if isinstance(node.func.value, ast.Call) and \ isinstance(node.func.value.func, ast.Attribute) and \ node.func.value.func.attr == 'frame': if len(node.func.value.args) > 0: frame_locator = str(node.func.value.args[0]) else: frame_node = node.func.value.keywords[0].value if isinstance(frame_node, ast.Str): frame_locator = frame_node.s elif isinstance(frame_node, ast.Name): frame_locator = f'变量: {frame_node.id}' else: frame_locator = f'无法解析: {ast.dump(frame_node, False)}' for i in result: if selector == i[0] and frame_locator == i[1]: dup_num += 1 break else: result.append((selector, frame_locator)) print(f"{selector}, {frame_locator} {node.func.attr == 'query_selector_all'}") import_num += 1 print(f'成功解析{import_num}条定位信息, 跳过{dup_num}条重复信息')
代码中很多地方用到了 isinstance 方法来判断节点是什么类型,因为需要解析的内容都是 page.click('...')或 page.frame('...').click('...')形式,所以大多数时候需要提取 Call对象的 func的 attr属性即为所需要的定位信息。另外使用了 inspect 库来提取可能需要解析的方法,如 click fill等,直接从Playwright中提取,就不需要一个一个去找了。再加上一些重复判断,即为上述代码。
希望有了将录制脚本转换Page Object的方法之后,可以将Page Object的模式在组内推广起来吧。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
这篇文章主要介绍了Python数据结构列表,本文重点内容主要是对列表数据结构的使用,在Python中,序列是一组按顺序排列的值。Python 有 3 种内置的序列类型:字符串、 元组和列表,下面一起进入文章了解更详细内容吧,需要的小伙伴可以参考一下</P><P>
在开发自用爬虫过程中,有的网页是utf-8,有的是gb2312,有的是gbk,如果不加处理,采集到的都是乱码,解决的方法是将html处理成统一的utf-8
最近在使用pycharm安装或升级模块时出现了错误,下面这篇文章主要给大家介绍了关于Pycharm报错Non-zero exit code (2)的完美解决方案,文中通过图文介绍的非常详细,需要的朋友可以参考下
ResNet全称residual neural network,主要是解决过深的网络带来的梯度弥散,梯度爆炸,网络退化(即网络层数越深时,在数据集上表现的性能却越差)的问题
大家好,本篇文章主要讲的是python运算符号详细介绍,感兴趣的同学赶快来看一看吧,对你有帮助的话记得收藏一下,方便下次浏览
成为群英会员,开启智能安全云计算之旅
立即注册Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008