November 2019

S M T W T F S
      12
34 5 678 9
10111213141516
17181920212223
24252627282930

Style Credit

Expand Cut Tags

No cut tags
Friday, November 25th, 2005 12:37 pm
Задача: зачитать XML (лучше, если при этом будут допускаться небольшие ошибки в виде тегов, закрытых в неправильном порядке. или так не бывает?)
кое-что поудалять, для некоторых поддеревьев выколупать значения и выдать их наружу. В базу.
Всё, ничего более сложного не требуется.

Upd: xml - не самоцель, это промежуточный способ хранения данных, выколупанных из pdf. Если есть возможность работать непосредственно с pdf, то она тоже подойдёт.
Friday, November 25th, 2005 03:02 pm (UTC)
Если тэги закрываются в неправильном порядке, то это что угодно, но не XML.
Friday, November 25th, 2005 03:09 pm (UTC)
Да я понимаю, но так уж склалось :)
Saturday, November 26th, 2005 12:29 pm (UTC)
...значит работать с этой разметкой как с xml сходу не получится.

Если то, что насоветовали будет валиться с ошибками (или потерей содержимого в теех местах где перепутаны теги), то прийдется искать что-то, чем можно ненапряжно пропарстть markup