php - однозначно
$htm=file_get_contents('http://любой.адрес.ру');
$doc=new domDocument(`1.0`,`UTF-8`); // или какая у вас кодировка
$doc->loadHTML(mb_convert_encoding($htm,'html-entities','utf-8'));
Дальше вам сюда
php.net/dom (на русском)
Синтаксис схож с JS