Javascript-форум (https://javascript.ru/forum/)
-   Оффтопик (https://javascript.ru/forum/offtopic/)
-   -   Парсинг сайта (https://javascript.ru/forum/offtopic/49901-parsing-sajjta.html)

cyber 16.09.2014 21:44

Gozar, а какие варианты?
Как мне выбрать эти элементы по другому?

Gozar 16.09.2014 21:45

Цитата:

Сообщение от cyber
Как мне выбрать эти элементы по другому?

Я должен догадаться о строении DOM в котором ты работаешь и предложить тебе новый вариант на пальцах?

cyber 16.09.2014 21:45

Цитата:

Сообщение от Gozar
А проверить сколько цикл отматывает никак нельзя?

Цикл отматывает столько сколько и элементов

cyber 16.09.2014 21:47

Gozar,

<li data-match data-league-id="126" data-start-time="Wed Sep 17 2014 16:00:00 GMT+0000 (UTC)" >
            <div class="vs-block-wrapper">
                <a href="/ru/league/silverseriessecondseasonsecondrounda/match/easy-katka-vs-spydi-on-17-09-2014" class="vs-block vs-block--small">
                    <div class="vs-block__row">
                        <div class="vs-block__column vs-block__column--logo">
                            <span class="team__icon">
                                <img src="/static/v1.4.4.0/client/images/team-logos/default-logo.svg" alt="">
                            </span>
                        </div>
                        <div class="vs-block__column vs-block__column--vs">
                            <span class="team__schedulded"></span>
                        </div>
                        <div class="vs-block__column vs-block__column--logo">
                            <span class="team__icon">
                                <img src="/media/v1.4.4.0/cache/74/9a/749afca9360ec407fcaf62dcf44b8f9b.png" alt="">
                            </span>
                        </div>
                    </div>
                    <div class="vs-block__row aligntop">
                        <div class="vs-block__column">
                            <span class="team__link">EasyKtk</span>
                        </div>
                        <div class="vs-block__column vs-block__column--vs">
                            <span class="team__vs team__vs--small">vs</span>
                        </div>
                        <div class="vs-block__column">
                            <span class="team__link">SPYDI</span>
                        </div>
                    </div>
                </a>
            </div>
            <span class="match-announce text-center">
                
                    <span class="match-announce__time">
                        <span data-match-start-time><!-- will be populated by JS --></span>
                        <span data-match-time-zone class="match-announce__time-zone"><!-- will be populated by JS --></span>
                    </span>
                
            </span>
        </li>
    
        
        
        

        <li data-match data-league-id="126" data-start-time="Wed Sep 17 2014 16:00:00 GMT+0000 (UTC)" >
            <div class="vs-block-wrapper">
                <a href="/ru/league/silverseriessecondseasonsecondrounda/match/shadows-team-vs-push-on-17-09-2014" class="vs-block vs-block--small">
                    <div class="vs-block__row">
                        <div class="vs-block__column vs-block__column--logo">
                            <span class="team__icon">
                                <img src="/static/v1.4.4.0/client/images/team-logos/default-logo-left.svg" alt="">
                            </span>
                        </div>
                        <div class="vs-block__column vs-block__column--vs">
                            <span class="team__schedulded"></span>
                        </div>
                        <div class="vs-block__column vs-block__column--logo">
                            <span class="team__icon">
                                <img src="/static/v1.4.4.0/client/images/team-logos/default-logo-right.svg" alt="">
                            </span>
                        </div>
                    </div>
                    <div class="vs-block__row aligntop">
                        <div class="vs-block__column">
                            <span class="team__link">SHADOWS</span>
                        </div>
                        <div class="vs-block__column vs-block__column--vs">
                            <span class="team__vs team__vs--small">vs</span>
                        </div>
                        <div class="vs-block__column">
                            <span class="team__link">PUSH</span>
                        </div>
                    </div>
                </a>
            </div>
            <span class="match-announce text-center">
                
                    <span class="match-announce__time">
                        <span data-match-start-time><!-- will be populated by JS --></span>
                        <span data-match-time-zone class="match-announce__time-zone"><!-- will be populated by JS --></span>
                    </span>
                
            </span>
        </li>

cyber 16.09.2014 21:56

Я думал как вариант, не парсить дом, самому написать не большой парсер который будет вытягивать нужную мне инфу.

Gozar 16.09.2014 22:07

Если он так тормозит при поиске, может он может быстрее в забеге по нодам firstChild например, childNode ...

cyber 16.09.2014 22:23

Цитата:

Сообщение от Gozar
Если он так тормозит при поиске, может он может быстрее в забеге по нодам firstChild например, childNode ...

Хм думал, щас хотел проверить. Проитесь по коллекции children

kobezzza 16.09.2014 23:32

cyber, почему phantomJS не юзаешь? Он как раз для таких задач, но это не нода, а самостоятельная сборка WebKit с JS интерфейсом, т.е. полноценный браузер со всеми вытекающими АПИ.

cyber 17.09.2014 02:44

kobezzza, а по скорости как? И в нем получиться потом спокойно записать в бд?

kobezzza 17.09.2014 09:01

Цитата:

Сообщение от cyber (Сообщение 330953)
kobezzza, а по скорости как? И в нем получиться потом спокойно записать в бд?

Я же говорю, это сборка WebKit, т.е. там всё нативно и работает супер быстро, ну т.е. также как в простом хроме.

Да-да, ты потом всё можешь записать в БД, в файл на компе и т.д.

Ты можешь загрузить сайт, выполнив тамошний ЖС, загрузить свой ЖС, загрузить любую либу и т.д. это полноценный браузер. Инструмент специально создан для написания всяких скриншотеров, граберов, тестов и т.д.


Часовой пояс GMT +3, время: 14:54.