Diskussion:Bzip2

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Kompressionsalgorithmus bzip2[Quelltext bearbeiten]

Ist bzip2 nun ein Kompressionsalgorithmus oder ein Kompressionsprogramm? Bisher dachte ich, nur das Programm heißt so und in diesem Artikel steht das auch so. In en:bzip2 heißt's nun aber „algorithm and program“ und die Artikel Burrows-Wheeler-Transformation und David Wheeler schreiben auch von bzip2 als „Kompressionstechnik“ bzw. „Kompressionsalgorithmus“. Auf der bzip2-Homepage steht nur „bzip2 is a freely available, patent free (see below), high-quality data compressor“. --jailbird 18:31, 19. Dez 2004 (CET)

bzip2 ist das Programm, würde ich mal meinen. Das sagt mein Debian dazu:

bzip2 (1)                     - a block-sorting file compressor, v1.0.2
(...)
DESCRIPTION
       bzip2  compresses  files  using the Burrows-Wheeler block sorting text
       compression algorithm, and Huffman coding.  Compression  is  generally
       considerably   better   than   that   achieved  by  more  conventional
       LZ77/LZ78-based compressors, and approaches the performance of the PPM
       family of statistical compressors.

Und damit kann man tatsächlich Dateien komprimieren... --Lennex 23:35, 3. Mär 2005 (CET)

Es ist beides. Der bzip2 Algo ist ein mehrstufiges Verfahren, steht doch alles im englischen Artikel. Das gelichnamige Programm setzt diesen mehrstufigen Algo um.

Also, wie es in dem Artikel steht, die Endung .tbz sei gebräuchlich, ist einfach nicht richtig. .tbz2 ist richtig. Oder aber .tb2. .tbz hab ich noch nie gehört oder gesehen! Falls hier in der nächsten Zeit niemand widerspricht, änder ich das mal. Realbuzz 02:44, 14. Okt. 2006 (CEST)[Beantworten]

Vielleicht trügt mich meine Erinnerung auch, aber an .tbz2- oder .tb2-Dateien kann ich mich nicht erinnern. bzip2-komprimierte Archive kommen mir allgemein selten unter, aber wenn dann .tbz (so beispielsweise die FreeBSD-Packages [1]). Daß diese zumindest nicht unüblich ist, bestätigen [2] und [3], die beide .tbz nennen, erstere sogar als übliche. --jailbird 12:05, 14. Okt. 2006 (CEST)[Beantworten]
Ich glaube es ist einfach üblich das tar dateien noch mal mit Bzip2 komprimiert werden. z.B. ich habe mir grad von Gimp "http://www.gimp.org/downloads/" eine 15MB Datei mit der Datei-endung ".tar.bz2" runtergeladen, um sie zu entcomprimieren musste ich erst mit Bzip2 dekomprimieren, dann mit einem Programm das tar dekomprimieren kann (ps: die Datei ist jetzt enpackt und es sind insgesamt 120MB).--Nizu Kazushi 05:37, 7. Feb. 2009 (CET)[Beantworten]
Naja, GNU tar kann on-the-fly bzip2-komprimierte tar-Archive auspacken. Viele Windows-Packprogramme (WinRar z.B.) ebenso. --RokerHRO 08:45, 11. Dez. 2009 (CET)[Beantworten]
Zur Endung .tbz vielleicht ist das ja eine aus DOS-kompatibilitätsgründen gekürzte Dateiendung? Obwohl... nee, die Dateinamen selbst sind ja auch länger als 8 Buchstaben. Hm. Kannst ja mal bei den FreeBSD-Leuten anfragen, wieso die das so machen. --RokerHRO 08:45, 11. Dez. 2009 (CET)[Beantworten]

Von wann ist denn das Programm ? Im Artikel steht nur, von wann die neueste Version ist. -- Juergen 91.52.172.75 16:02, 13. Mär. 2010 (CET)[Beantworten]

Irgendwie wäre ein klitzekleiner Hinweis, wie man die so komprimierten Daten wieder entkomprimiert vielleicht doch hilfreich? (nicht signierter Beitrag von 85.178.11.214 (Diskussion) 19:45, 18. Apr. 2011 (CEST)) [Beantworten]

Mit dem selben Programm, es erkennt automatisch mit bzip2 gepackte Dateien und packt diese aus. Nat. kann man explizit einen Schalter setzen: bzip2 -d. bunzip2 ist das selbe Programm das beim Start seinen Namen prüft und wenn er "bunzip2" ist, schaltet es automatisch in den Entpackmodus, also identisch mit dem Aufruf von bzip2 mit dem Entpackschalter.

Die folgende Tabelle habe ich entfernt weil sie komplett bezugslos im Artikel herumstand

VarName Bits Description
.magic 2 *8 'BZ' signature/magic number
.version 1 *8 'h' for Bzip2 ('H'uffman coding), '0' for Bzip1 (deprecated)
.hundred_k_blocksize 1 *8 '1'..'9' block-size 100 kB .. 900 kB (uncompressed)
.compressed_magic 6 *8 '1AY&SY' -> 0x314159265359 (BCD (pi))
.crc 4 *8 checksum for this block
.randomised 1 (! Bit) 0 => normal, 1 => randomised (deprecated)
.origPtr 3 *8 starting pointer into BWT for after untransform
.huffman_used_map 2 *8 bitmap for following 'huffman_used_bitmaps', of ranges of 16 bytes, present/not present
.huffman_used_bitmaps (0..32) *8 bitmap, of symbols used, present/not present (multiples of 16)
.huffman_groups 3 2..6 number of different Huffman tables in use
.selectors_used 15 number of times that the Huffman tables are swapped (each 50 bytes)
*.selector_list 1..6 zero-terminated bit runs (0..62) of MTF'ed Huffman table (*selectors_used)
.start_huffman_length 5 0..20 starting bit length for Huffman deltas
*.delta_bit_length (1..5) *8 0 => next symbol; 1 => alternated length
{ 1 => decrement length; 0 => increment length } ( *(symbols + 2) * groups )
.contents 2..900 KB Huffman encoded data stream until end of block (max. 900 * 1024 * 8 => 7372800 bit)
.eos_magic 6 *8 \x17 'rE8P' \x90 -> 0x177245385090 (BCD sqrt(pi))
.crc 4 *8 checksum for whole stream
.padding 0..7 align to whole byte


--kostenloses Arbeitspferd ... itu (Disk) 14:53, 18. Mai 2015 (CEST)[Beantworten]