| Автор
| Сообщение |
 Deadangel
Новичок

Зарегистрирован: 26.10.2007
Сообщения: 2
|
|
|
Цитата |
|
Всем привет,
прошу Вас помочь в одной деликатной ситуации. Ситуация такая:
есть некоторый текст из N символов. В этом тексте содержатся разные таги (<table>, <tr>, <td>, <img>, <a>). Нужно этот текст разделить на несколько равных частей, т.е сделать постраничный вывод для этого текста. Возникают такие ситуации, когда при разделении текста половина тага находится в одной части, другая половина находится в другой. Чтобы этого избежать, нужно обрабатывать эти таги. Может быть кто-нибудь подскажет, есть ли готовые решения подобных парсеров или же может кто делал что-то подобное. Буду признателен за любую информацию.
Спасибо. |
|
| В начало |
|
 |
|
|
 |
DrPass
Знающий :) /Почетный Модератор/

Возраст: 31
Знак зодиака: 
Зарегистрирован: 02.05.2002
Сообщения: 5709
Откуда: Донецк
|
|
|
Цитата |
|
А для чего разделять? Чтобы вывести на экран или распечатать? В этом случае, думаю, самый разумный способ - использовать TWebBrowser или TEmbeddedWB _________________ Да пребудет с вами Сила! |
|
| В начало |
|
 |
 Deadangel
Новичок

Зарегистрирован: 26.10.2007
Сообщения: 2
|
|
|
Цитата |
|
Разделять нужно для постраничного вывода на экран, ну и для печати - тоже.
Например, у нас есть статья из 10000 символов (в ней содержатся <img>, <table>, etc.). Нам нужно разделить статью на страницы, длина страницы 1000 символов, т.е получается в итоге 10 страниц. А теперь, допустим, при копировании первых 1000 символов, мы попали в то место, где обрываются теги <img>, <table>, <tr>, <td>, <b>, <strong>.
Суть парсера в том, что при копировании 1000 символов, он проверяет не обрезал ли он таг. Если обрезал, то длина страницы уменьшается или увеличивается до последнего закрывающего тега на этой странице.
Так понятнее ? |
|
| В начало |
|
 |
|