HTML to XML: Rozšíření značkovacího jazyka
Velká většina lidí, kteří jsou v počítačovém průmyslu, ví, co je HTML (Hypertext Markup Language). Existuje již velmi dlouho a široce se používá v designu webových stránek, že ačkoli je již vzácné vidět webové stránky psané výhradně v HTML, považuje se za základní znalost celého procesu vytváření webových stránek..
XML (Extensible Markup Language) je na druhou stranu ve srovnání s HTML novější a mnohem méně známou technologií. XML bylo vytvořeno v roce 1996 skupinou 11 lidí jako adaptace SGML (Standard Generalized Markup Language) pro použití ve World Wide Web. XML je strukturovanější a přísnější značkovací jazyk ve srovnání s HTML, který uživatelům umožňoval vytvářet vlastní definice a modularizovaný kód. Byl vytvořen k vytvoření standardizovaných specifikací pro vytváření vlastních značkovacích jazyků, které se nyní nazývají dialekty XML. Nemusí to být okamžitě zřejmé, ale vlastní značkovací jazyky jako HTML, RSS a Atom byly vytvořeny z XML jako metoda zvyšující použitelnost internetu..
Vzhledem k tomu, že XML bylo upraveno z SGML, obsahuje mnoho kódů a technik, které byly původně z SGML, jako je jeho přísnost a tzv. Dobře formovaná podoba. Vlastnosti, které sahají až k potomkům XML. Při vytváření kódu založeného na XML by měla být vždy zohledněna určitá pravidla. U každého dokumentu je dokonce dobře tvarované prohlášení, ve kterém je uvedeno, jaký typ dokumentu je a na jakých pravidlech by mělo být zpracování založeno. To je velmi odlišné od velmi uvolněného kódování, které se používá v HTML.
Při zpracování stránky HTML byste měli jakýkoli výsledek bez ohledu na to, jaký vstup byl. HTML procesor se snaží pochopit, co bylo v dokumentu, a vytvoří výstup, o kterém si myslí, že nejlépe představuje vstupní data. To není pravda, přijde do XML. XML používá mechanismus zpracování chyb, který je považován za „drakonický“. Kdykoli procesor XML narazí na něco, čemu nerozumí, pouze vytvoří chybovou zprávu a ukončí zpracování souboru. To vám ponechá chybové pole a žádný výsledek na rozdíl od HTML.
Z hlediska perspektivy je HTML značkovacím jazykem, který se používá k rychlému a snadnému zobrazení určitého způsobu výstupu. Nezabývá se správností vstupu a pouze se pokouší vytvořit výstup na základě vstupního souboru. XML je naopak velmi přísný značkovací jazyk, který se obvykle k vytváření obsahu obvykle nepoužívá. Jeho primární použití je jako nástroj pro vytváření dalších značkovacích jazyků, které vytvářejí potřebný obsah.