Javascript-форум (https://javascript.ru/forum/)
-   Оффтопик (https://javascript.ru/forum/offtopic/)
-   -   Как распарсить html (https://javascript.ru/forum/offtopic/60087-kak-rasparsit-html.html)

cyber 11.12.2015 16:21

Mаxmaxmаximus, проблема в том что мне еще нужно проанализировать и не валидный xml )

cyber 11.12.2015 16:27

Просто то что я написал это верхушка айсберга)
Такое чувство что они хотят что бы я с обычно редактора xml сделал IDE в браузере.
Ребята обкурились походу)

Mаxmaxmаximus 11.12.2015 16:30

Лол стоп, если так стоит задача тогда ты определенно должен построить xml древо нормальное по тегам, и все такое. И чтобы древо имело метод "гет елемнет bay index"

у элементов будет типа innerXML и outerXML
и ты такой к главному элементу пишешь

root.getElementByCharIndex(12)

и он анализирует свой outerXML ну и выдает элемнет

то есть напиши банально парсер XML в древо и все. в чем трабл?

а по скольку ты пишешь свой парсер ты можешь всякие ошибки в коде сразу детектить

задача даже облегчается

cyber 11.12.2015 16:33

Mаxmaxmаximus, я уже написал уже, то что нужно, сейчас буду тестить.
Выложить не могу к сожеленью..

kobezzza 11.12.2015 16:33

Цитата:

Сообщение от cyber (Сообщение 399598)
Как отличить " \" " от ' " '

https://github.com/kobezzza/Escaper

Может пригодиться, писал под свои нужды.

cyber 11.12.2015 16:35

kobezzza,спасибо, у тебя либы для запуска шатлов случайно нет?)

kobezzza 11.12.2015 16:40

Цитата:

Сообщение от cyber (Сообщение 399612)
kobezzza,спасибо, у тебя либы для запуска шатлов случайно нет?)

В скрытых репозитариях ;)

cyber 11.12.2015 16:43

Цитата:

Сообщение от kobezzza
В скрытых репозитариях

Я всегда подозревал:lol:

Mаxmaxmаximus 11.12.2015 17:01

kobezzza, а у меня комментарий это такой токен)) и я их регуляркой паршу, строка тоже токин, число тоже. это сильно ускоряет парсинг.

kobezzza 11.12.2015 17:31

Цитата:

Сообщение от Mаxmaxmаximus (Сообщение 399618)
kobezzza, а у меня комментарий это такой токен)) и я их регуляркой паршу, строка тоже токин, число тоже. это сильно ускоряет парсинг.

Ну у тебя парсер языка, а тут просто утилитка для экранирования.


Часовой пояс GMT +3, время: 06:34.