А пользователей откуда взять? Особенно в эпоху веб два ноль, когда контент генерируется пользователями. Это раз.
А двас: сайт это не просто набор страничек, а еще и функционал (backend). Последний никаким парсерам (кроме эксплуатирующих уязвимости) украсть не дано.
P.S. Между прочим, этим уже занимается гугль, заботливо складывая сайты в свой кеш :-) И парсер dom'а ему не нужен.
|