Подскажите регулярку. Нужно вырезать tr и всё их содержимое.
Подскажите регулярку. Нужно вырезать все <tr></tr>, в плане того, что нужны только <tr>содержимое</tr>, со страницы и всё их содержимое, и убрать все встречающиеся теги <p> и </p> без их содержимого.
Таблиц на странице несколько. Заранее не известно сколько. В каждой таблице всё это дело находится между тегами <tbody>. |
re=/<tr>.*?<\/tr>/g
s="<body><tr><span>foo</span></tr>foo<div>foo</div><tr>bar</tr></body>"
alert(s.match(re).join(""))
// <tr><span>foo</span></tr><tr>bar</tr>
Цитата:
re=/<p>([^>]+)<\/p>/g s="<div><p>foo</p></div><p>bar</p>" alert(s.replace(re, "$1")) // <div>foo</div>bar А остальные теги оставлять? |
Не получается. Тут запускаю всё ок, а у себя нет. Не пойму в чём дело.
function readTextFile(file)
{
var rawFile = new XMLHttpRequest();
rawFile.open("GET", file, false);
rawFile.onreadystatechange = function ()
{
if(rawFile.readyState === 4)
{
if(rawFile.status === 200 || rawFile.status == 0)
{
var allText = rawFile.responseText;
allText.match(/<tr>.*?<\/tr>/g);
alert(allText);
}
}
}
rawFile.send(null);
}
А с джойном вообще ничего не выводит. |
SokDobriy,
Вот так попробуй, видимо там проблемы с переносом строк:
re=/<tr>[\s\S]*?<\/tr>/gm
s="<body>\n<tr><span>foo\n</span></tr>\nfoo<div>foo</div>\n<tr>bar</tr><tr>baz</tr></body>"
alert(s.match(re).join(""))
|
Вложений: 1
Блин, всё равно(
Да, остальные теги, которые между tr нужны. Просто стереть сам тег <p> и </p>. Вот сам файл |
SokDobriy,
Слушай, он ж у тебя бинарный, или хз. Его к текстовому виду надо как то приводить. |
krutoy,
Я просто запаковал, там html внутри. Я этот html открываю как файл юзерскриптом и читаю его. |
SokDobriy,
я распаковал его, само сабой, это буфер какой-то, это не текстовый файл |
krutoy,
Это html файл, который функцией читается как текстовый. |
Или я что-то недопетриваю
|
| Часовой пояс GMT +3, время: 03:44. |