Javascript-форум (https://javascript.ru/forum/)
-   Ваши сайты и скрипты (https://javascript.ru/forum/project/)
-   -   Паук на JavaScript (https://javascript.ru/forum/project/42271-pauk-na-javascript.html)

juser367 20.10.2013 04:33

Паук на JavaScript
 
https://github.com/hacker1999/asdfgh...ter/crawler.js
Я использую для поиска адресов email на сайтах-каталогах. На маленьких сайтах работает как часы. На больших падает.

juser367 20.10.2013 04:39


console.log('--start');
crawler.run({
    // startUrl: '/posts',
    // filterUrlRegex: /$/,
    onMatch: function (url, content) { 
        var match = content.match(/<title>(.*)<\/title>/i);
        var title = match ? match[1] : '';
        console.log(title + ' => ' + url); 
    }, 
    onEnd: function() { 
        console.log('--end'); 
    }
});


Часовой пояс GMT +3, время: 07:26.