calcal.ru
Data Compression Tools v1.0

Калькулятор сжатия данных

Шесть профессиональных инструментов для анализа компрессии: коэффициент сжатия, сравнение алгоритмов, экономия трафика, энтропия Шеннона, оценка архивов и веб-оптимизация.

6
Инструментов
Коэффициент, алгоритмы, трафик, энтропия, архивы, веб
6
Алгоритмов
Gzip, Brotli, Zstandard, LZ4, Snappy, Deflate
4
Типа данных
Текст, JSON, бинарные, изображения
3
Формата архивов
ZIP (Deflate), TAR.GZ (Gzip), 7z (LZMA2)

Сжатие данных: основы

Компрессия данных позволяет уменьшить объём хранимой и передаваемой информации. От веб-серверов до архивов - сжатие экономит терабайты трафика и дисковое пространство.

~

Без потерь (Lossless)

Gzip, Brotli, Zstd, LZ4 и Deflate - алгоритмы сжатия без потерь. Исходные данные полностью восстанавливаются при распаковке. Используются для текстов, кода, JSON, архивов и веб-ресурсов.

@

Энтропия Шеннона

Энтропия определяет теоретический предел сжатия. Чем меньше энтропия (больше повторений), тем лучше данные сжимаются. Случайные данные имеют максимальную энтропию и практически не сжимаются.

!

HTTP-компрессия

Современные веб-серверы (Nginx, Apache) поддерживают Content-Encoding: gzip и br (Brotli). Brotli обеспечивает на 15-25% лучшее сжатие для веб-ресурсов (HTML, CSS, JS), чем gzip.

Возможности калькулятора

Профессиональные инструменты для анализа компрессии данных: от теоретических основ до практической оптимизации.

~

Коэффициент сжатия

Рассчитайте коэффициент компрессии, процент экономии и освобождённое пространство. Поддержка байтов, КБ, МБ, ГБ.

@

Сравнение алгоритмов

Таблица сравнения 6 алгоритмов: gzip, brotli, zstd, lz4, snappy, deflate. Типичные коэффициенты для текста, JSON, бинарных данных и изображений.

#

Экономия трафика

Расчёт экономии при передаче данных: время загрузки, месячный и годовой объём трафика, финансовая экономия на разных скоростях сети.

%

Энтропия Шеннона

Анализ частотного распределения символов и расчёт информационной энтропии. Определение теоретического предела сжатия для любого текста.

!

Размер архивов

Оценка размера ZIP, TAR.GZ и 7z архивов для разных типов файлов. Время сжатия и распаковки, сравнение форматов.

*

Веб-сжатие

Сравнение Content-Encoding: gzip vs br (Brotli) для веб-ресурсов. Расчёт месячного трафика и экономии для сайтов любого масштаба.

Алгоритмы сжатия/ как это работает

Все алгоритмы сжатия без потерь основаны на двух принципах: устранение избыточности (повторяющиеся паттерны) и энтропийное кодирование (частые символы получают короткие коды).

LZ77 / LZ78 (основа Gzip, Deflate)

Алгоритмы семейства Lempel-Ziv ищут повторяющиеся подстроки в скользящем окне и заменяют их ссылками (смещение, длина). Deflate комбинирует LZ77 с кодированием Хаффмана. Gzip = Deflate + заголовки + контрольная сумма CRC32.

ABCABCABC -> ABC(3,3)(3,6)
Gzip: LZ77 + Huffman + CRC32
Deflate window: 32 КБ (стандарт)

Brotli (Google, RFC 7932)

Brotli использует LZ77 с окном до 16 МБ, контекстное моделирование и статический словарь из 13 000+ слов (HTML-теги, CSS-свойства, JS-ключевые слова). Даёт на 15-25% лучшее сжатие для веб-контента, чем gzip.

Content-Encoding: br
Уровни: 0 (быстрый) - 11 (максимум)
Словарь: 13 504 слова (HTML/CSS/JS)

Zstandard (Facebook/Meta)

Zstd сочетает LZ77 с Finite State Entropy (tANS) кодированием. Отличается высокой скоростью при хорошем сжатии. Поддерживает словари для малых данных, потоковое сжатие и 22 уровня компрессии. Используется в ядре Linux, базах данных и хранилищах.

zstd -19 data.bin -o data.zst
Уровни: 1 (быстро, ~500 МБ/с) - 22 (макс.)
Распаковка: ~1700 МБ/с (всегда быстрая)

LZ4 / Snappy: Алгоритмы для реального времени. LZ4 (Yann Collet) сжимает до 500 МБ/с, распаковывает до 1.8 ГБ/с. Snappy (Google) оптимизирован для BigTable и MapReduce. Компрессия слабее, но скорость критична.

Nginx + Brotli в России: Для российских сайтов рекомендуется включить brotli_static on для предварительно сжатых ресурсов и gzip как fallback. Yandex, VK и Mail.ru активно используют Brotli для веб-ресурсов.

Часто задаваемые вопросы

Brotli (Content-Encoding: br) для статических ресурсов - он даёт на 15-25% лучшее сжатие, чем gzip. Для динамического контента используйте gzip или zstd, так как Brotli на высоких уровнях медленнее. В Nginx: brotli_static on для прекомпрессии, gzip как fallback.
JPEG и PNG уже содержат встроенную компрессию. JPEG использует DCT + Huffman, PNG - Deflate. Повторное сжатие даёт прирост 1-5%. Для уменьшения изображений лучше конвертировать в WebP/AVIF или уменьшить разрешение.
Энтропия Шеннона измеряет среднее количество бит информации на символ. Чем ниже энтропия, тем больше в данных повторений и тем лучше они сжимаются. Для ASCII текста типичная энтропия 4-5 бит/символ (из 8 максимальных), что даёт теоретический предел сжатия ~1.6-2:1.
Zstd превосходит gzip практически по всем параметрам: сжатие на 10-20% лучше при одинаковой скорости, а на одинаковом уровне сжатия Zstd в 3-5 раз быстрее. Распаковка Zstd в 2-3 раза быстрее gzip. Zstd поддерживается в HTTP (Content-Encoding: zstd, RFC 8878) и активно внедряется.
7z (LZMA2) обеспечивает лучшее сжатие, чем ZIP (Deflate): на 20-50% меньше размер архива для текстовых данных. Но 7z медленнее при сжатии (в 3-4 раза) и не поддерживается нативно во многих ОС. ZIP универсальнее и быстрее. Для максимального сжатия - 7z, для совместимости - ZIP.
В среднем gzip уменьшает HTML/CSS/JS на 60-80%, JSON на 80-85%. Для сайта с 100K просмотров в месяц и 2 МБ ресурсов на страницу это экономит ~120-160 ГБ трафика ежемесячно. Brotli добавляет ещё 15-25% экономии сверху. Включение - одна строка в конфиге Nginx.
LZ4 обычно лучше: выше коэффициент сжатия (2.1:1 vs 1.8:1 для текста) при сопоставимой скорости. LZ4 используется в ClickHouse, RocksDB, Kafka. Snappy - в Cassandra и BigTable. Оба обеспечивают скорость распаковки >1 ГБ/с, что критично для баз данных.
Нет, повторное сжатие почти не даёт результата и может даже увеличить размер из-за метаданных. Хорошо сжатые данные имеют энтропию, близкую к максимуму. Исключение: можно сменить алгоритм (например, с gzip на zstd) для лучшего результата, но это перекомпрессия, а не дополнительное сжатие.
Лиана Арифметова
Создатель

Лиана Арифметова

Миссия: Демократизировать сложные расчеты. Превратить страх перед числами в ясность и контроль. Девиз: «Любая повторяющаяся задача заслуживает своего калькулятора».

⚖️

Отказ от ответственности

Только для информационных целей. Все расчёты, результаты и данные, предоставляемые данным инструментом, носят исключительно ознакомительный и справочный характер. Они не являются профессиональной консультацией — медицинской, юридической, финансовой, инженерной или иной.

Точность результатов. Калькулятор основан на общепринятых формулах и методиках, однако фактические результаты могут отличаться в зависимости от индивидуальных условий, исходных данных и применяемых стандартов. Мы не гарантируем полноту, точность или актуальность приведённых расчётов.

Медицинские, финансовые и профессиональные решения должны приниматься исключительно на основании консультации с квалифицированными специалистами — врачом, финансовым советником, инженером или другим профессионалом в соответствующей области. Не используйте результаты данного инструмента как единственное основание для принятия важных решений.

Ограничение ответственности. Авторы и разработчики сервиса не несут никакой ответственности за прямой или косвенный ущерб, возникший в результате использования данных расчётов. Пользователь принимает на себя всю ответственность за интерпретацию и применение полученных результатов.

Похожие инструменты

💰

Калькулятор амортизации основных средств

Рассчитайте амортизацию по ФСБУ 6/2020 и НК РФ: линейный, уменьшаемого остатка, по сумме чисел лет. Сравнение методов и график начислений.

💰

Калькулятор зарплаты (НДФЛ, взносы, на руки)

Рассчитайте зарплату на руки, НДФЛ по прогрессивной шкале 2025, страховые взносы, вычеты на детей и полную стоимость сотрудника.

💻

Unix Timestamp Converter (перевод времени)

Конвертер Unix Timestamp в дату и обратно. Текущее время Unix, live-режим, форматы ISO 8601, UTC.

🏠

Калькулятор туриста: бюджет, валюта и виза

Конвертер валют, расчет бюджета поездки и стоимости визы/страховки. Универсальный инструмент планирования путешествий.

🏥

Калькулятор степени потери слуха (PTA)

Расчёт степени тугоухости по аудиограмме. PTA, классификация ВОЗ, визуальная аудиограмма, бинауральная оценка.

🏠

Калькулятор топлива и поездок

Конвертер расхода (MPG ↔ л/100км), расчет стоимости поездки и калькулятор выгоды (акции 2+1, скидки).

🏥

Стоматологический калькулятор: КПУ, OHI-S, CPI, анестезия и протезирование

Стоматологические расчёты онлайн: индекс КПУ (DMFT), гигиена OHI-S, пародонтальный CPI, доза анестетика, стоимость протезирования, IOTN.

🏠

Калькулятор фрахтового класса (Freight Class)

Рассчитайте класс NMFC для вашего груза на основе плотности. Необходим для определения стоимости перевозки сборных грузов (LTL).

🏥

Калькулятор кофеина и привычек

Узнайте свою смертельную дозу кофеина и сколько лет жизни тратите на игры, соцсети и сон. Научный подход к привычкам.

🧮

Генератор CSS box-shadow

Визуальный редактор теней CSS. Offset, blur, spread, цвет. Множественные тени, inset. Копирование кода.

⚗️

Калькулятор электрохимии

Расчёты по уравнению Нернста, законам Фарадея, ЭДС гальванического элемента, электролиз и электроосаждение.

⚙️

Калькулятор ковки и штамповки

Расчёты ковки: усилие, температурный режим, заготовка, штамп, оборудование, стоимость

🏥

Калькулятор физиологии растений

Скорость фотосинтеза, водный потенциал, транспирация, устьичная проводимость, LAI, содержание хлорофилла, RGR.

🏥

Калькулятор нормы калорий (зигзаг)

Рассчитайте суточную норму калорий, настройте дефицит для похудения и используйте схему Зигзаг для разгона метаболизма.

🏥

Зубная нумерация (универсальная ↔ FDI)

Конвертер систем нумерации зубов: универсальная (США, 1-32) и международная (FDI, 11-48). Схемы для взрослых и детей.