Сообщение от Maxmaxmaximus6
|
пособ внешнему чему-то узнать список файлов на севрере.
|
Это не так уж и сложно, как кажется.
Пишем робота, который обойдет все страницы и соберет все ссылки, попутно копирую страницу на HDD для дальнейших манипуляций.
В основном сайты на HDD занимают места от 4 до 300 Мегабайт в чисто текстовом виде.
Далее если первичный парсинг не устраивает, то перепарсиваем сохраненные страницы и редактируем полученную базу. Не вручную конечно.
Страницы для удобства можно грузить в дом, запускать скрипты и т.д.
Я знаю у меня есть свой поисковик.