Chertenok.ru - все о программировании
Вход  |  Регистрация  |  Поиск 
Праздник
Завтра :

День славянской письменности и культуры


Парсер для обработки тагов


Новая тема  Ответить  Печать Предыдущая тема  Следующая тема
Автор Сообщение
Пол:Муж Deadangel
Новичок




Зарегистрирован: 26.10.2007
Сообщения: 2

СообщениеСб, 27-Окт-2007 17:34    Заголовок сообщения: Парсер для обработки тагов
Цитата

Всем привет,

прошу Вас помочь в одной деликатной ситуации. Ситуация такая:

есть некоторый текст из N символов. В этом тексте содержатся разные таги (<table>, <tr>, <td>, <img>, <a>). Нужно этот текст разделить на несколько равных частей, т.е сделать постраничный вывод для этого текста. Возникают такие ситуации, когда при разделении текста половина тага находится в одной части, другая половина находится в другой. Чтобы этого избежать, нужно обрабатывать эти таги. Может быть кто-нибудь подскажет, есть ли готовые решения подобных парсеров или же может кто делал что-то подобное. Буду признателен за любую информацию.


Спасибо.
В начало
Посмотреть профиль Отправить личное сообщение
DrPass
Знающий :)
/Почетный Модератор/


Возраст: 31
Знак зодиака: Лев
Зарегистрирован: 02.05.2002
Сообщения: 5709
Откуда: Донецк
СообщениеСб, 27-Окт-2007 18:48 
Цитата

А для чего разделять? Чтобы вывести на экран или распечатать? В этом случае, думаю, самый разумный способ - использовать TWebBrowser или TEmbeddedWB
_________________
Да пребудет с вами Сила!
В начало
Посмотреть профиль Отправить личное сообщение
Пол:Муж Deadangel
Новичок




Зарегистрирован: 26.10.2007
Сообщения: 2

СообщениеСб, 27-Окт-2007 19:01 
Цитата

Разделять нужно для постраничного вывода на экран, ну и для печати - тоже.

Например, у нас есть статья из 10000 символов (в ней содержатся <img>, <table>, etc.). Нам нужно разделить статью на страницы, длина страницы 1000 символов, т.е получается в итоге 10 страниц. А теперь, допустим, при копировании первых 1000 символов, мы попали в то место, где обрываются теги <img>, <table>, <tr>, <td>, <b>, <strong>.

Суть парсера в том, что при копировании 1000 символов, он проверяет не обрезал ли он таг. Если обрезал, то длина страницы уменьшается или увеличивается до последнего закрывающего тега на этой странице.

Так понятнее ?
В начало
Посмотреть профиль Отправить личное сообщение
Показать сообщения:   
Страница 1 из 1
Перейти:  
Новая тема  Ответить  Печать

Вы можете начинать темы
Вы можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете присоединять файлы в этом форуме
Вы можете скачивать файлы в этом форуме
хостинг от .masterhost 
Rambler's Top100