Подскажите регулярку. Нужно вырезать tr и всё их содержимое.
Подскажите регулярку. Нужно вырезать все <tr></tr>, в плане того, что нужны только <tr>содержимое</tr>, со страницы и всё их содержимое, и убрать все встречающиеся теги <p> и </p> без их содержимого.
Таблиц на странице несколько. Заранее не известно сколько. В каждой таблице всё это дело находится между тегами <tbody>. |
re=/<tr>.*?<\/tr>/g s="<body><tr><span>foo</span></tr>foo<div>foo</div><tr>bar</tr></body>" alert(s.match(re).join("")) // <tr><span>foo</span></tr><tr>bar</tr> Цитата:
re=/<p>([^>]+)<\/p>/g s="<div><p>foo</p></div><p>bar</p>" alert(s.replace(re, "$1")) // <div>foo</div>bar А остальные теги оставлять? |
Не получается. Тут запускаю всё ок, а у себя нет. Не пойму в чём дело.
function readTextFile(file) { var rawFile = new XMLHttpRequest(); rawFile.open("GET", file, false); rawFile.onreadystatechange = function () { if(rawFile.readyState === 4) { if(rawFile.status === 200 || rawFile.status == 0) { var allText = rawFile.responseText; allText.match(/<tr>.*?<\/tr>/g); alert(allText); } } } rawFile.send(null); } А с джойном вообще ничего не выводит. |
SokDobriy,
Вот так попробуй, видимо там проблемы с переносом строк: re=/<tr>[\s\S]*?<\/tr>/gm s="<body>\n<tr><span>foo\n</span></tr>\nfoo<div>foo</div>\n<tr>bar</tr><tr>baz</tr></body>" alert(s.match(re).join("")) |
Вложений: 1
Блин, всё равно(
Да, остальные теги, которые между tr нужны. Просто стереть сам тег <p> и </p>. Вот сам файл |
SokDobriy,
Слушай, он ж у тебя бинарный, или хз. Его к текстовому виду надо как то приводить. |
krutoy,
Я просто запаковал, там html внутри. Я этот html открываю как файл юзерскриптом и читаю его. |
SokDobriy,
я распаковал его, само сабой, это буфер какой-то, это не текстовый файл |
krutoy,
Это html файл, который функцией читается как текстовый. |
Или я что-то недопетриваю
|
Часовой пояс GMT +3, время: 19:56. |