Помогите вытащить java ссылку из html.
Здравствуйте.
Ни капли не шуруплю в javascript. Прошу вашей помощи. Вот эту станицу http://www.juno.co.uk/trance-music/this-week/. Парсю на PHP для того, что бы вытащить нужный мне ID релиза. Проблема в том, что эти ссылки выводятся при помощи javascript. Понимаю, что потребуется время для решения задания. Поэтому готов оплатить работу. Помогите пожалуйста. |
Цитата:
|
Правильно сказать не ID, а текст ссылки выводимой при помощи javascript. Т.е та которая видна в строке состояния в браузере при наведении курсора мыши.
|
var link = document.getElementsByTagName("a");//все ссылки в документеперебором можно все значения href сложить в массив var arr = []; arr.push(link[i].href); ... или одной по id var a_href = document.getElementById('nameID').href alert( a_href ) |
Извините не совсем понимаю. Где размещать это код?
Вот так получаю код страницы на php. <?php $content = file_get_contents("http://www.juno.co.uk/trance-music/today/"); $fd = fopen("url.txt","w"); fwrite($fd,$content); fclose($fd); ?> |
Цитата:
Код с страницы сохраняется в таком виде - <a href="javascript:MiniAddWindow('charts/add/?popup=yes&titleid=433352&productid=01');" > </a> и titleid отличается от нужного мне. Я так понимаю эта защита? Уважаемые форумчане подскажите к кому можно обратиться с решением проблемы? |
Цитата:
Цитата:
отключите яваскрипт и просмотрите в браузере -получите то как вы его получаете в рнр и решите все проблемы. а так вы ищите то что в варианте парсенья рнр просто не существует |
Цитата:
|
Если не тяжело, подскажите насколько это реализуемо средствами PHP. Т.е загружать страницу с вариантом, когда javasript выключен. Писал на форуме PHP, посоветовали использовать Selenium. Насколько это подойдет для решения проблемы?
|
Цитата:
|
Извините. Затупил конкретно:agree:
|
А нужно чтоб сам ПШП всё сделал и просто скажем гденить сохранил на сервере, или нужно чтоб по обращению клиента к серверу, пшп передал страничку с нужными ссылками. Во втором варианте можно через прокси - сервер загрузить страничку в скрытый ифрейм, и уже от туда достать всё, также при прохождении через сервер можно добавить нужный скрипт в страничку.
также вам думаю помогут: сетевые функции и особенно: CURL, Client URL Library <?php $ch = curl_init("http://www.juno.co.uk/trance-music/this-week/"); curl_exec($ch); curl_close($ch); echo '<span id="output"></span> <script type="text/javascript"> function vseeURL(){ var link = document.getElementsByTagName("a"); var text=""; for(var i in link)text+="<b><a href=\'"+link[i].href+"\'>"+link[i].href+"</a></b><br>"; document.getElementById("output").innerHTML=text;} vseeURL(); </script>'; ?> И все ссылки отображаются в низу:) А не то как в вашем куске скрипта вы грузите страничку. Вобщем решение есть короме наверно одного варианта, когда ссылки и запросы по ним обрабатывает программка, и меняет их постоянно. Кстати какова цена вопроса? |
Часовой пояс GMT +3, время: 03:06. |