Javascript.RU

Создать новую тему Ответ
 
Опции темы Искать в теме
  #1 (permalink)  
Старый 01.11.2012, 18:08
Новичок на форуме
Отправить личное сообщение для -Lesnik- Посмотреть профиль Найти все сообщения от -Lesnik-
 
Регистрация: 01.11.2012
Сообщений: 3

Парсер html страницы
Доброго времени суток)

Начинаю разбираться с jquery.
Надо с внешней странички достать несколько строк кода.
Текст страницы примерно такой:
<body>
....не нужный код...

<span></span> <img /> <b> текст1 </b> текст2 <a> </a> [текст3] <br>

</body>

Надо вытащить такую строку. Их может быть несколько, идут друг за другом. Хочется вытащить не больше 10.
Ни один тег не отмечен 'id'.

Что делаю:
$().load('url span.class:lt(10), img[src*=inf], b, a, ,br');

Две проблемы: теряются текст2 и [текст3], а также попадают не нужные теги, в частности <b>какой то текст из шапки</b>.

Ну и код мне кажется не правильным. Корявым что ли.

Что делаю не так?
Ответить с цитированием
  #2 (permalink)  
Старый 02.11.2012, 02:21
Аватар для NikolasGrad
Аспирант
Отправить личное сообщение для NikolasGrad Посмотреть профиль Найти все сообщения от NikolasGrad
 
Регистрация: 12.04.2012
Сообщений: 49

По моему можно адекватно получить только "текст1"
text1 = $('span + img + b').text();

По вашему коду "текст2" и "[текст3]" вообще не обернуты и находятся в <body>.

Последний раз редактировалось NikolasGrad, 02.11.2012 в 02:25.
Ответить с цитированием
  #3 (permalink)  
Старый 02.11.2012, 09:19
Новичок на форуме
Отправить личное сообщение для -Lesnik- Посмотреть профиль Найти все сообщения от -Lesnik-
 
Регистрация: 01.11.2012
Сообщений: 3

Сообщение от NikolasGrad
text1 = $('span + img + b').text();
Таким образом я получу все мои строки, правильно? Могу ли я и как между этими строками вставить свой код?

А насчет текст2 и текст3 - возможно ли взять body без всех тегов и тогда там останется то, что мне нужно? Правда, как этим потом пользоваться?

И вопрос общий: может эта задача легче и проще решается средствами javascript?
Ответить с цитированием
  #4 (permalink)  
Старый 02.11.2012, 18:03
Аватар для vadim5june
Студент
Отправить личное сообщение для vadim5june Посмотреть профиль Найти все сообщения от vadim5june
 
Регистрация: 30.04.2012
Сообщений: 1,113

Сообщение от -Lesnik-
И вопрос общий: может эта задача легче и проще решается средствами javascript?
В библиотеке Prototype есть такой код для удаления тэгов
String.prototype.stripTags= function() {
    return this.replace(/<\/?[^>]+>/gi, '');}

а для выделения нужной области удобно пользоваться методом split
например txt.split('<span>');
Ответить с цитированием
Ответ



Опции темы Искать в теме
Искать в теме:

Расширенный поиск


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Получить html код удаленной страницы AntonP Общие вопросы Javascript 19 02.05.2012 16:15
невидимые html страницы GRean (X)HTML/CSS 6 15.07.2010 10:04
Поиск слова в исходном коде html страницы klsorat2010 Ваши сайты и скрипты 1 20.05.2010 23:46
как привязать ссылку с Html страницы на вынесенный в отдельную папку js скрипт? TIIIMOXAN Общие вопросы Javascript 2 09.11.2009 19:23
WYSIWYG редактор текста HTML страницы на javascript Дмитри Чижиков Ваши сайты и скрипты 4 14.09.2009 17:05