Хехе, я помнится по молодости поднимал вопрос парсинга ~1мег произвольно оформленного(в т.ч. и лицами далёкими от веба) при помощи html текста с приведением выходного результата к единому виду.(удаление недопустимых тегов и атрибутов и аккуратное форматирование)
Тогда я решил это регулярками, но честно говоря в код заглядывать боюсь ибо там ужасЪ.
Интересно, можно ли было бы решить эту задачу иным способом и без медленных надмозгов?)
__________________
29375, 35
|