Zdar,
mam tu par XML souboru, u kterych zel bud chybi, nebo neni dodrzena dokumentace. Potreboval bych se v nich zorientovat, idealne nejakym poloautomatickym rezimem. Napadlo me udelat jakousi utilitku, kterou bych XML prohnal, a co jiz znam vynechal. Tim padem by mi v soubouru zbyvalo cim dal mene dat, ktera bych vzdy rune analyzoval a opet zaradil do utilitky. Napada me nejakej zpusob SAX parseru s tim, to pak prohnat DOM filtrem a prazdne nodes odmazavat.
S XML jsem snad nikdy nedelal, ale poridil jsem oXML s tim, ze se v tom nejako zorientuju. Bohuzel, nejak me furt v hlave nesedi ten postup tak, aby to bylo relativne jednoduche - pridat dalsi vec co znam, a zaroven odmazat z vystupu.
Tech souboru je cca 8 typu, data se meni vicemene porad (i pribyvaji dalsi nodes, nebo naopak nekde nejsou, atributy nekdy jsou, nekdy ne), navic velikost je kolem par desitek MB, takze nejak jednorazove zpracovani asi nehrozi.
Tuhle utilitku bych mrsknul na vstup a pokud (po zakladnim naprogramovani) nebude po parsingu vysledek prazdnej (tzn mam zpracovany vsechny data), poslal bych to obsluze, at si poradi.
Tzn cosi jako inteligentnejsi filtr v XML souboru, kde co znam z nej zmizim, co neznam v nem necham.
Neresil jste nekdo neco podobneho ?