使用 Headless Chrome 渲染 JavaScript 前端渲染的网页(如 AngularJS)以便搜索引擎爬取。
安装 Chrome Headless
Chrome Headless 浏览器可以使用 Docker 轻松安装:
$ docker pull yukinying/chrome-headless
启动 Chrome Headless
$ docker run -i -t --shm-size=256m --rm --name=chrome-headless -p=127.0.0.1:9222:9222 yukinying/chrome-headless "about:blank"
或者可以下载 Ubuntu 16.04 的 Headless Chrome 二进制文件,并运行它:
$ wget https://github.com/bosondata/prerender/releases/download/v0.3.0/ChromeHeadless.ubuntu-16.04-x86_64.tar.gz $ tar zxvf ChromeHeadless.ubuntu-16.04-x86_64.tar.gz $ cd ChromeHeadless $ ./headless_shell --remote-debugging-port=9222 --disable-gpu "about:blank"