Паук на JavaScript
https://github.com/hacker1999/asdfgh...ter/crawler.js
Я использую для поиска адресов email на сайтах-каталогах. На маленьких сайтах работает как часы. На больших падает. |
![]()
console.log('--start');
crawler.run({
// startUrl: '/posts',
// filterUrlRegex: /$/,
onMatch: function (url, content) {
var match = content.match(/<title>(.*)<\/title>/i);
var title = match ? match[1] : '';
console.log(title + ' => ' + url);
},
onEnd: function() {
console.log('--end');
}
});
|
| Часовой пояс GMT +3, время: 22:02. |