XML vs. XHTML
Rozšiřitelný značkovací jazyk (známý také jako XML) je sada pravidel. Tato pravidla jsou specifická pro dokumenty kódující elektronicky. Hlavním cílem XML je zdůraznit jednoduchost, obecnost a použitelnost přes internet. XML je označován jako textový datový formát, který podporuje Unicode, aby byl snadno čitelný ve všech jazycích. Přestože hlavním cílem návrhu XML je zaměřit se konkrétně na dokumenty, často se používá také k reprezentaci libovolných datových struktur (například webových služeb). V současné době existuje celá řada programovacích rozhraní, která jsou vývojáři schopni použít pro přístup k datům XML. Existuje také celá řada schématických systémů, které jsou navrženy speciálně pro definování jazyků založených na XML.
Extensible Hypertext Markup Language (také známý jako XHTML) je součástí rodiny značkovacích jazyků XML. Ve skutečnosti simuluje nebo jednoduše působí jako rozšíření jazyka Hypertext Markup Language (nebo HTML). XHTML funguje jako aplikace z rodiny XML a je restriktivnější podmnožinou SGML. V důsledku dobře tvarované povahy dokumentů XHTML je možné je analyzovat pomocí analyzátoru XML, který dále odlišuje XHTML od HTML.
Dokument XML se skládá výhradně ze znaků nalezených v Unicode. Existuje několik řídících znaků, které jsou vyloučeny z Unicode; ty, které se nacházejí v Unicode, se však mohou stát obsahem v XML dokumentu. Existuje celá řada zařízení, která identifikují kódování znaků Unicode v dokumentu XML. Existují také zařízení, která vyjadřují ty postavy, které nelze použít. Unicode je kódován do bajtů, aby byl uložen nebo přenesen - tyto přeložené výrazy Unicode jsou známé jako kódování. XML používá libovolná, ne-li všechna, kódování definovaná Unicode a také řadu různých kódování, jejichž znaky se objevují v Unicode. Poskytuje mechanismus, který umožňuje procesoru XML určit, které kódování se používá.
Existují tři konkrétní verze XHTML: XHTML 1.0 Strict, který zahrnuje prvky a vlastnosti, které nejsou označeny jako zastaralé v HTML 4.01; XHTML 1.0 Transitional, který obsahuje prvky specifické pro prezentace (například 'font' a 'strike'); a XHTML 1.0 Frameset, který umožňuje definovat dokumenty sady rámců. XHTML může být také modularizován, což poskytuje abstraktní sbírku atributů, které je XHTML možné podmnožit a rozšířit. Toto je jednoduše prostředek, jak pomoci XHTML při rozšiřování jeho působnosti na další významné platformy (například mobilní zařízení a internetová televize).
Souhrn:
1. XML je sada pravidel, která jsou nastavena pro kódování dokumentů; XHTML je XML ekvivalent HTML, což je více omezující podmnožina SGML.
2. XML se skládá výhradně z Unicode; XHTML je dodáván ve třech verzích: XHTML 1.0 Strict, XHTML 1.0 Transitional a XHTML 1.0 Frameset.