Учебники

PhantomJS — Автоматизация страниц

PhantomJS с помощью API-интерфейсов модуля веб-страниц может манипулировать веб-страницами и выполнять такие операции, как манипулирование DOM, нажатие кнопок и т. Д.

Извлекать изображения со страницы

Следующая программа показывает, как вы можете использовать PhantomJS для извлечения изображений со страницы.

var wpage = require('webpage').create();
wpage.onConsoleMessage = function(str) {
   console.log(str.length);
}
wpage.open("http://phantomjs.org", function(status) {
   console.log(status);
   var element = wpage.evaluate(function() {
      var imgdata =  document.querySelectorAll('img');
      var imgsrc = [];
      
      if (imgdata) {
         for (var i in imgdata) {
            imgsrc.push(imgdata[0].src);
         }
      }
      return imgsrc;
   });
   console.log(JSON.stringify(element));
});

Вышеуказанная программа генерирует следующий вывод .

Success 
["http://phantomjs.org/img/phantomjslogo.png","http://phantomjs.org/img/phantom 
js-logo.png","http://phantomjs.org/img/phantomjslogo.png","http://phantomjs.org 
/img/phantomjs-logo.png"]

Можно включить внешний JavaScript- код на страницу, используя метод веб-страницы injectJS . Существует множество свойств и методов, которые могут помочь в автоматизации страниц и во многом другом. Вы можете обратиться к модулю веб-страницы, где подробно описаны свойства и методы.