BZ2 (сжатие Bzip2)
BZ2 (Bzip2) — формат сжатия, обеспечивающий более высокую степень сжатия по сравнению с gzip за счёт скорости. Он использует блочную сортировку Берроуза-Уилера и кодирование Хаффмана для достижения сжатия, близкого к оптимальному.
MIME-тип
application/x-bzip2
Тип
Бинарный
Сжатие
Без потерь
Преимущества
- + Better compression ratio than gzip (typically 10-20% smaller)
- + Built-in data integrity checking per block
- + Widely available on Unix/Linux systems
Недостатки
- − Significantly slower than gzip for both compression and decompression
- − Higher memory usage than gzip
- − Largely superseded by xz and Zstandard for new projects
Когда использовать .BZ2
Используйте bzip2, когда степень сжатия важнее скорости, для архивирования больших датасетов и дистрибуции пакетов исходного кода.
Технические детали
Bzip2 обрабатывает данные блоками (100–900 КБ), применяя преобразование Берроуза-Уилера (BWT), преобразование «move-to-front», кодирование длин серий (RLE) и код Хаффмана. Блочная архитектура обеспечивает параллельное сжатие (pbzip2) и восстановление после повреждений. Bzip2 обычно обеспечивает на 10–20% лучшее сжатие, чем gzip, но медленнее в 2–6 раз.
История
Джулиан Сьюард создал bzip2 в 1996 году как свободную альтернативу с лучшим сжатием, чем gzip. Последнее обновление — версия 1.0.8 (2019). Bzip2 активно используется в дистрибуции пакетов и научных данных.