PhantomJS с помощью API-интерфейсов модуля веб-страниц может манипулировать веб-страницами и выполнять такие операции, как манипулирование DOM, нажатие кнопок и т. Д.
Извлекать изображения со страницы
Следующая программа показывает, как вы можете использовать PhantomJS для извлечения изображений со страницы.
var wpage = require('webpage').create(); wpage.onConsoleMessage = function(str) { console.log(str.length); } wpage.open("http://phantomjs.org", function(status) { console.log(status); var element = wpage.evaluate(function() { var imgdata = document.querySelectorAll('img'); var imgsrc = []; if (imgdata) { for (var i in imgdata) { imgsrc.push(imgdata[0].src); } } return imgsrc; }); console.log(JSON.stringify(element)); });
Вышеуказанная программа генерирует следующий вывод .
Success ["http://phantomjs.org/img/phantomjslogo.png","http://phantomjs.org/img/phantom js-logo.png","http://phantomjs.org/img/phantomjslogo.png","http://phantomjs.org /img/phantomjs-logo.png"]
Можно включить внешний JavaScript- код на страницу, используя метод веб-страницы injectJS . Существует множество свойств и методов, которые могут помочь в автоматизации страниц и во многом другом. Вы можете обратиться к модулю веб-страницы, где подробно описаны свойства и методы.