Помогите вытащить java ссылку из html.
Здравствуйте.
Ни капли не шуруплю в javascript. Прошу вашей помощи. Вот эту станицу http://www.juno.co.uk/trance-music/this-week/. Парсю на PHP для того, что бы вытащить нужный мне ID релиза. Проблема в том, что эти ссылки выводятся при помощи javascript. Понимаю, что потребуется время для решения задания. Поэтому готов оплатить работу. Помогите пожалуйста. |
Цитата:
|
Правильно сказать не ID, а текст ссылки выводимой при помощи javascript. Т.е та которая видна в строке состояния в браузере при наведении курсора мыши.
|
var link = document.getElementsByTagName("a");//все ссылки в документе
перебором можно все значения href сложить в массивvar arr = []; arr.push(link[i].href); ... или одной по id
var a_href = document.getElementById('nameID').href
alert( a_href )
|
Извините не совсем понимаю. Где размещать это код?
Вот так получаю код страницы на php. <?php $content = file_get_contents("http://www.juno.co.uk/trance-music/today/"); $fd = fopen("url.txt","w"); fwrite($fd,$content); fclose($fd); ?> |
Цитата:
Код с страницы сохраняется в таком виде - <a href="javascript:MiniAddWindow('charts/add/?popup=yes&titleid=433352&productid=01');" > </a> и titleid отличается от нужного мне. Я так понимаю эта защита? Уважаемые форумчане подскажите к кому можно обратиться с решением проблемы? |
Цитата:
Цитата:
отключите яваскрипт и просмотрите в браузере -получите то как вы его получаете в рнр и решите все проблемы. а так вы ищите то что в варианте парсенья рнр просто не существует |
Цитата:
|
Если не тяжело, подскажите насколько это реализуемо средствами PHP. Т.е загружать страницу с вариантом, когда javasript выключен. Писал на форуме PHP, посоветовали использовать Selenium. Насколько это подойдет для решения проблемы?
|
Цитата:
|
Извините. Затупил конкретно:agree:
|
А нужно чтоб сам ПШП всё сделал и просто скажем гденить сохранил на сервере, или нужно чтоб по обращению клиента к серверу, пшп передал страничку с нужными ссылками. Во втором варианте можно через прокси - сервер загрузить страничку в скрытый ифрейм, и уже от туда достать всё, также при прохождении через сервер можно добавить нужный скрипт в страничку.
также вам думаю помогут: сетевые функции и особенно: CURL, Client URL Library
<?php
$ch = curl_init("http://www.juno.co.uk/trance-music/this-week/");
curl_exec($ch);
curl_close($ch);
echo '<span id="output"></span>
<script type="text/javascript">
function vseeURL(){
var link = document.getElementsByTagName("a");
var text="";
for(var i in link)text+="<b><a href=\'"+link[i].href+"\'>"+link[i].href+"</a></b><br>";
document.getElementById("output").innerHTML=text;}
vseeURL();
</script>';
?>
И все ссылки отображаются в низу:) А не то как в вашем куске скрипта вы грузите страничку. Вобщем решение есть короме наверно одного варианта, когда ссылки и запросы по ним обрабатывает программка, и меняет их постоянно. Кстати какова цена вопроса? |
| Часовой пояс GMT +3, время: 08:16. |