Лол стоп, если так стоит задача тогда ты определенно должен построить xml древо нормальное по тегам, и все такое. И чтобы древо имело метод "гет елемнет bay index"
у элементов будет типа innerXML и outerXML
и ты такой к главному элементу пишешь
root.getElementByCharIndex(12)
и он анализирует свой outerXML ну и выдает элемнет
то есть напиши банально парсер XML в древо и все. в чем трабл?
а по скольку ты пишешь свой парсер ты можешь всякие ошибки в коде сразу детектить
задача даже облегчается
|