Rozdíl mezi GZIP a BZIP2

GZIP vs. BZIP2

GNU zip (také známý jako GZIP) je softwarová aplikace, jejímž účelem je komprimovat soubory. Původně měl nahradit komprimační program používaný v raných Unixových systémech - pro použití v projektu GNU (projekt svobodného softwaru).

BZIP2 je algoritmus bezeztrátové komprese dat s otevřeným zdrojovým kódem - v zásadě třída algoritmů komprese dat, která umožňuje úplné rekonstrukce původních dat komprimovaného souboru z komprimovaných dat..

GZIP je založen na algoritmu známém jako DEFLATE. To je také bezeztrátový algoritmus komprese dat. Používá jak algoritmus LZ77, tak Huffmanovo kódování. V zásadě se GZIP týká formátu souboru se stejným názvem. Tento formát je záhlaví 10 bajtů, které obsahuje magické číslo (což znamená číselnou nebo textovou hodnotu, která se nikdy nemění a používá se k označení formátu souboru nebo protokolu, nepojmenovaná číselná hodnota, která se nikdy nemění, nebo odlišné hodnoty, které nelze zaměnit). pro cokoli jiného), nadbytečná záhlaví, která mohou nebo nemusí být ve skutečnosti nutná (například původní název souboru), tělo, které obsahuje DEFLATE-komprimované užitečné zatížení (což jsou data, která hlavičky nesou), a 8-bajtový zápatí který obsahuje kontrolní součet CRC-32 a skutečnou délku původních nekomprimovaných dat.

Existuje celá řada technik komprese, které formát BZIP2 používá, které jsou naskládány na sebe v několika vrstvách. Vyskytují se ve velmi rozlišujícím pořadí: kódování run-length (což je jakákoli sekvence čtyř až 255 duplikovaných symbolů, která je nahrazena prvními čtyřmi symboly, a délka kódování, která se opakuje mezi 0 a 251), Burrows-Wheelerova transformace ( což je reverzibilní blokové řazení, které tvoří samotné jádro BZIP2), Přesunout dopředu (ponechá velikost zpracovaného bloku nezměněné), kódování Run-length (které se skládá z dlouhých řetězců symbolů - obvykle nul), které neustále opakují se na výstupu a jsou nahrazeny symbolem a sledem dvou kódů), Huffmanovo kódování (což je proces, který nahrazuje symboly s pevnou délkou 8-bitových bytů změnami délkových kódů), vícenásobné Hoffmanovo kódování (které se skládá z více Hoffmanových tabulek stejné velikosti), kódování Unary base 1, kódování Delta a řídké bitové pole.

Souhrn:

1. GZIP je bezplatná aplikace používaná ke kompresi souborů; BZIP2 je algoritmus bezeztrátové komprese dat s otevřeným zdrojovým kódem, který umožňuje načíst původní data komprimovaného souboru.

2. GZIP se skládá z 10bajtového záhlaví, volitelných záhlaví, těla a zápatí o velikosti 8 bajtů; BZIP2 sestává z ne méně než devíti vrstev kompresních technik.