爬虫圈悄悄换了主角,没人再提 Selenium
这两年做爬虫的人,开口闭口都是 Playwright,几乎没人再提 Selenium 了。奇怪吗?Selenium 才是元老,2004 年就有了,凭什么被一个 2020 年才出生的后辈反超?
答案不在工具本身,在使用者变了。
Selenium 当年是为程序员设计的,假设是"人写脚本控制浏览器",暴露的是给人看的 API。Playwright 一开始走的也是这个路子,但从 2024 年开始,微软把它的发力点完全转向了"让 AI 控制浏览器"。
AI 用浏览器最头疼的不是点击和输入,而是"看不懂页面"。截图方案太烧 token,让大模型从像素里猜按钮在哪,又贵又容易出错。Playwright 走的是另一条路——把页面的可访问性树直接喂给 AI,每个按钮、输入框都有结构化的唯一标识。AI 拿到的不是"右下角好像有个按钮",而是"这里有个标签为 Submit 的按钮"。
再加上 MCP 协议的加持,Playwright 现在是 Claude Code、Cursor 这些 AI agent 调用浏览器的事实标准。Selenium 不是不能用,是让 AI 用它要多烧好几倍的 token。
工具的代际更替,从来都不是因为新的更好,而是因为用的人不一样了。Selenium 没做错什么,它只是没赶上使用者从人变成 AI 的那一刻。爬虫
