Показать сообщение отдельно
  #1 (permalink)  
Старый 14.05.2010, 20:32
Интересующийся
Отправить личное сообщение для Don_Julio Посмотреть профиль Найти все сообщения от Don_Julio
 
Регистрация: 03.05.2009
Сообщений: 10

Парсинг выделенного фрагмента [текста] на веб-странице.
Здравствуйте!

Пишу скрипт под Greasemonkey, который должен помочь мне в копи-паст делах

Что я хочу:

Есть сайт-источник и сайт-цель.
Статьи на разных СИ оформлены по-разному.
На СЦ они все приводятся к одному виду, который предусматривает наличие нескольких составных частей у статьи.
Если константы я получаю из "базы", то с переменными данными (датой, краткой версией, преамбулой, основным текстом) - морока.
Приходится "скакать" по вкладкам и переносить все эти части по очереди.

Во-первых, думаю над тем, как собрать все переменные части и потом разом перенести на страницу с формой.
Пока решил делать так: выделять по очереди все части и нажатиями хот-кеев - добавлять их в строку, отформатированную специально "под массив", которую потом просто скопировать в буфер и перенести на страницу с формой. Тут, хотя бы идея есть.

Но основной камень преткновения - Основной текст.
На сайте источнике он отформатирован по-разному, а на сайте-цели его нужно перенести в BB-кодах.

Как подойти к решению этого вопроса не знаю.

Ну, выделил я нужный фрагмент текста (с ссылками, болдами, италиками) ... и как его "отпарсить"?

Думал про парсинг исходного кода - но там часто "страшная каша" бывает.
И я еще не знаю как "добираться" до исходного кода через Javascript.

Может быть есть возможность отпарсить выделенный фрагмент как DOM-элементы? Тем более тогда, как я понимаю, будет доступен т.н. скомпилированный стиль и не нужно копаться в <i> <em> <b> <strong>.

Подскажите, возможно-ли такое?
На какие функции обратить внимание?

Спасибо.

P.S.
Забыл написать, что в Javascript - я совсем чайнег.
Ответить с цитированием