Javascript.RU

Создать новую тему Ответ
 
Опции темы Искать в теме
  #1 (permalink)  
Старый 27.02.2013, 17:31
Новичок на форуме
Отправить личное сообщение для JGalt Посмотреть профиль Найти все сообщения от JGalt
 
Регистрация: 12.12.2012
Сообщений: 7

Возможно ли получить данные?
Всем привет! В скриптах понимаю очень мало, и как ни пытался разобраться с этим вопросом не получается! Возможно ли со страницы http://www.wildberries.ru/catalog/1788/page.aspx достать список всех товаров. Обычным парсингом не устраивает т.к. слишком долго обрабатывается.
Ответить с цитированием
  #2 (permalink)  
Старый 27.02.2013, 17:35
Аватар для Serg_pnz
Сам по себе
Отправить личное сообщение для Serg_pnz Посмотреть профиль Найти все сообщения от Serg_pnz
 
Регистрация: 09.06.2009
Сообщений: 963

Что значит "обычным парсингом"?
Ответить с цитированием
  #3 (permalink)  
Старый 27.02.2013, 17:37
Новичок на форуме
Отправить личное сообщение для JGalt Посмотреть профиль Найти все сообщения от JGalt
 
Регистрация: 12.12.2012
Сообщений: 7

Всмысле получить код страницы и отбирать нужные данные
Ответить с цитированием
  #4 (permalink)  
Старый 27.02.2013, 17:38
Аватар для Serg_pnz
Сам по себе
Отправить личное сообщение для Serg_pnz Посмотреть профиль Найти все сообщения от Serg_pnz
 
Регистрация: 09.06.2009
Сообщений: 963

влёт открывается http://pars004.jcase.ru/
Ответить с цитированием
  #5 (permalink)  
Старый 27.02.2013, 17:46
Новичок на форуме
Отправить личное сообщение для JGalt Посмотреть профиль Найти все сообщения от JGalt
 
Регистрация: 12.12.2012
Сообщений: 7

это если там 100 или 200 товаров отображено, а если 11000 как в некоторых акциях...
Ответить с цитированием
  #6 (permalink)  
Старый 27.02.2013, 17:50
Аватар для Serg_pnz
Сам по себе
Отправить личное сообщение для Serg_pnz Посмотреть профиль Найти все сообщения от Serg_pnz
 
Регистрация: 09.06.2009
Сообщений: 963

JGalt,
так парсеру можно сказать не 30 секунд работать, а вечность О_о
set_time_limit(0);
ini_set("memory_limit", "1000M");


ну почти вечность. у меня скрипт работал минут по 30-50 не останавливаясь
Ответить с цитированием
  #7 (permalink)  
Старый 27.02.2013, 17:55
Новичок на форуме
Отправить личное сообщение для JGalt Посмотреть профиль Найти все сообщения от JGalt
 
Регистрация: 12.12.2012
Сообщений: 7

т.е. никак быстрее не получится? а каким парсером пользцетесь? (всмысле можно код)
Ответить с цитированием
  #8 (permalink)  
Старый 27.02.2013, 18:02
Аватар для Serg_pnz
Сам по себе
Отправить личное сообщение для Serg_pnz Посмотреть профиль Найти все сообщения от Serg_pnz
 
Регистрация: 09.06.2009
Сообщений: 963

Что значит "каким"? Курлами... А уж потом регулярками разбираю.
function reads($link, $proxy=0) {
	$ch = curl_init();
	if ($proxy) curl_setopt($ch, CURLOPT_PROXY, $proxy);
    curl_setopt($ch, CURLOPT_URL, $link);
    curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/534.10 (KHTML, like Gecko) Chrome/8.0.552.215 Safari/534.10');
    curl_setopt($ch, CURLOPT_HEADER, 0);
	curl_setopt($ch, CURLOPT_TIMEOUT, 30);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    $res = curl_exec($ch);
    curl_close($ch);

	//return iconv("UTF-8", "CP1251", $res);
	return $res;
}

$in = reads ('http://www.wildberries.ru/catalog/1788/page.aspx');
Ответить с цитированием
  #9 (permalink)  
Старый 27.02.2013, 18:07
Новичок на форуме
Отправить личное сообщение для JGalt Посмотреть профиль Найти все сообщения от JGalt
 
Регистрация: 12.12.2012
Сообщений: 7

а как можно еще и по внутренним страницам сразу пройтись?
Ответить с цитированием
  #10 (permalink)  
Старый 27.02.2013, 20:07
Аватар для Serg_pnz
Сам по себе
Отправить личное сообщение для Serg_pnz Посмотреть профиль Найти все сообщения от Serg_pnz
 
Регистрация: 09.06.2009
Сообщений: 963

Поэтапно. 1 - собрать урлы. 2 - пропарсить набранное
Как-то было дело гра... собирал инфу 45 тыс. предприятий с желтых страниц. Что бы не положить сервер донора скрипт делал паузы по одной секунде. На всё понадобилось где-то 5 дней практически непрерывной работы.
Ответить с цитированием
Ответ



Опции темы Искать в теме
Искать в теме:

Расширенный поиск


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Получить данные ajax запросом mue Общие вопросы Javascript 2 17.12.2012 12:49
Как получить данные из opener в open melihovgv Javascript под браузер 1 07.12.2012 10:36
$.get - получить данные hell100 Общие вопросы Javascript 2 23.02.2012 17:03
Как правильно получить введенные данные в поле? buket jQuery 11 11.04.2010 19:59
Возможно ли получить данные из файла на сервере? sdff Общие вопросы Javascript 11 19.07.2008 20:48