Калькулятор SLA
и стоимости простоя
Что такое SLA и Uptime
SLA (Service Level Agreement) — это соглашение об уровне обслуживания между провайдером услуги и клиентом. Одним из ключевых параметров SLA является Uptime — гарантированный процент времени, в течение которого сервис будет доступен. Чем больше «девяток» в показателе SLA, тем меньше допустимого времени простоя и тем выше требования к инфраструктуре.
Uptime (время работы)
Uptime — это процент времени, когда система доступна и работает штатно. Например, SLA 99.9% означает, что сервис может быть недоступен не более 8 часов 45 минут в год. Этот показатель измеряется внешними системами мониторинга, которые регулярно проверяют доступность сервиса.
Downtime (простой)
Downtime — это период, когда сервис недоступен пользователям. Включает плановые работы (обновления, миграции) и внеплановые инциденты (сбои оборудования, DDoS-атаки, ошибки конфигурации). В SLA обычно учитывается только внеплановый простой, плановые работы выносятся в отдельное окно обслуживания.
«Девятки» (Nines)
В индустрии уровни SLA принято считать в «девятках»: 99% — две девятки, 99.9% — три, 99.99% — четыре, 99.999% — пять. Каждая дополнительная девятка уменьшает допустимый простой в 10 раз, но экспоненциально увеличивает стоимость инфраструктуры и сложность поддержки.
Где применяется SLA
Соглашения об уровне обслуживания являются стандартом для любого IT-сервиса, от хостинга до облачных платформ.
Хостинг и дата-центры
Провайдеры веб-хостинга и колокации гарантируют доступность серверов на уровне 99.9-99.99%. Нарушение SLA влечёт компенсацию в виде кредитов на обслуживание. При выборе хостинга SLA — один из ключевых параметров.
Облачные платформы (Cloud)
AWS, Google Cloud, Yandex Cloud, Selectel — все крупные облачные провайдеры публикуют SLA для каждого сервиса. Виртуальные машины обычно имеют SLA 99.95%, управляемые базы данных — 99.99%, а CDN — 99.999%.
SaaS-сервисы
Программы как услуга (CRM, ERP, мессенджеры) указывают SLA в договорах с корпоративными клиентами. Для бизнес-критичных систем (платёжные шлюзы, медицинские системы) стандартом является SLA 99.99% и выше.
DevOps и SRE
Команды Site Reliability Engineering используют SLA для определения Error Budget — бюджета ошибок. Если простой за месяц укладывается в бюджет, команда может выпускать новые фичи. Если бюджет исчерпан — фокус переключается на надёжность.
Бизнес-планирование
Финансовые аналитики используют калькулятор SLA для оценки потенциальных потерь от простоя. Это помогает обосновать инвестиции в резервирование, мониторинг и disaster recovery перед руководством.
Управление инцидентами
При возникновении сбоя важно быстро оценить, укладывается ли инцидент в допустимый бюджет простоя. Обратный калькулятор позволяет мгновенно перевести фактический даунтайм в процент SLA.
Справочная таблица SLA/ стандартные уровни
Ниже приведены стандартные уровни SLA, используемые в индустрии. Каждый уровень указывает максимально допустимое время простоя за различные периоды. Данные помогают быстро сориентироваться при составлении или анализе SLA-контрактов.
| SLA % | Девятки | Простой / год | Простой / месяц | Простой / неделя | Применение |
|---|---|---|---|---|---|
| 99% | 2 | 3 дня 15 ч | 7 ч 12 мин | 1 ч 41 мин | Некритичные сервисы |
| 99.5% | 2.5 | 1 день 19 ч | 3 ч 36 мин | 50 мин | Внутренние системы |
| 99.9% | 3 | 8 ч 46 мин | 43 мин | 10 мин | Стандартный SLA |
| 99.95% | 3.5 | 4 ч 23 мин | 21 мин | 5 мин | Облачные сервисы |
| 99.99% | 4 | 52 мин | 4 мин 19 сек | 1 мин | Финансовые системы |
| 99.999% | 5 | 5 мин 15 сек | 26 сек | 6 сек | Телеком, медицина |
Заметка: каждая дополнительная «девятка» в SLA стоит примерно в 10 раз дороже предыдущей из-за необходимости дополнительного резервирования, автоматизации и инженерных ресурсов.
Совет: не стремитесь к 99.999% для всех сервисов. Определите критичность каждого компонента и выставите SLA, соответствующий бизнес-требованиям. Избыточная надёжность — это переплата.
Как повысить Uptime
Для достижения высокого уровня доступности необходимо системно работать над каждым звеном инфраструктуры. Ниже — ключевые стратегии повышения uptime.
Резервирование (Redundancy)
Дублирование критических компонентов: серверов, сетевых каналов, баз данных, систем хранения. Используйте кластеризацию (Active-Active или Active-Passive), мультизональное развёртывание и балансировку нагрузки. Каждый единичный компонент (Single Point of Failure) должен быть устранён.
Мониторинг и алертинг
Внедрите многоуровневый мониторинг: внешние проверки доступности (Uptime Robot, Pingdom), метрики приложения (Prometheus, Grafana), логирование (ELK Stack). Настройте эскалацию алертов: если инцидент не закрыт за 5 минут — уведомление уходит следующему уровню поддержки.
Disaster Recovery план
Разработайте и регулярно тестируйте план восстановления после катастрофы. Определите RPO (допустимую потерю данных) и RTO (время восстановления). Автоматизируйте переключение на резервную площадку. Проводите учения (Game Day) минимум раз в квартал, имитируя отказ компонентов.
CI/CD и автоматизация
Автоматизируйте развёртывание через CI/CD-пайплайны с Blue-Green или Canary-деплоями. Используйте Infrastructure as Code (Terraform, Ansible) для воспроизводимости среды. Автоматические откаты при обнаружении ошибок после деплоя значительно сокращают время инцидентов.
Советы по работе с SLA
Практические рекомендации для IT-менеджеров, DevOps-инженеров и владельцев бизнеса при составлении и контроле SLA.
1Определите критичность сервисов
Не все сервисы требуют одинакового SLA. Платёжный шлюз может требовать 99.99%, а внутренний wiki — 99.5%. Составьте матрицу критичности: разделите сервисы на категории (Tier 1, Tier 2, Tier 3) и назначьте соответствующий SLA для каждого уровня.
2Считайте композитный SLA
Если сервис зависит от нескольких компонентов последовательно, общий SLA равен произведению SLA каждого. Например, приложение (99.99%) + база данных (99.99%) + сеть (99.99%) = 99.97%. Учитывайте это при проектировании архитектуры и не обещайте больше, чем может обеспечить самое слабое звено.
3Используйте Error Budget
Бюджет ошибок — это допустимое количество минут простоя за период. Например, при SLA 99.9% в месяц бюджет составляет 43 минуты. Пока бюджет не исчерпан, команда может выпускать обновления. Если бюджет заканчивается, все силы направляются на стабилизацию.
4Фиксируйте метод измерения
В SLA-контракте чётко опишите, как измеряется доступность: с каких точек, с какой частотой, что считается инцидентом. Без этого SLA превращается в формальность. Определите, включаются ли в расчёт плановые работы и частичная деградация сервиса.
Связанные понятия
SLA тесно связан с другими метриками надёжности и производительности сервисов.
SLO (Service Level Objective)
Внутренняя цель по качеству сервиса. SLO обычно строже, чем внешний SLA: если SLA = 99.9%, то SLO может быть 99.95%. Это даёт запас для выявления проблем до нарушения контракта.
SLI (Service Level Indicator)
Конкретная метрика, по которой измеряется качество: процент успешных запросов, задержка p99, доля ошибок. SLI — это данные, SLO — целевое значение, SLA — юридическое обязательство.
MTTR (Mean Time To Recovery)
Среднее время восстановления после сбоя. Чем ниже MTTR, тем выше фактический SLA. Сокращается через автоматизацию отката, подготовленные runbook-инструкции и обученных дежурных инженеров.
MTBF (Mean Time Between Failures)
Среднее время между отказами. Показывает надёжность системы. Увеличивается через резервирование, качественное тестирование, постепенный rollout обновлений и анализ постмортемов.
RPO (Recovery Point Objective)
Допустимая потеря данных при катастрофе, выраженная во времени. RPO = 1 час означает, что допустима потеря данных за последний час. Определяет частоту бэкапов и стратегию репликации.
RTO (Recovery Time Objective)
Целевое время восстановления после катастрофы. RTO = 15 минут означает, что сервис должен быть восстановлен за четверть часа. Влияет на выбор архитектуры DR: hot standby vs cold backup.
Как пользоваться калькулятором
Три режима работы для решения любых задач, связанных с SLA и доступностью сервисов.
SLA -> Простой
Выберите уровень SLA (99%, 99.9%, 99.99% и т.д.) или введите свой процент. Калькулятор рассчитает допустимое время простоя за год, месяц, неделю и день в часах, минутах и секундах.
Простой -> SLA
Введите фактический простой (часы и минуты) за выбранный период. Калькулятор определит, какому уровню SLA соответствует ваш реальный uptime и покажет количество «девяток».
Стоимость простоя
Укажите выручку компании в час. Калькулятор покажет стоимость каждой минуты простоя и сравнительную таблицу финансовых потерь для разных уровней SLA.
Часто задаваемые вопросы
Был ли этот калькулятор полезен?
Инструмент справочный — не заменяет эксперта
Только для информационных целей. Все расчёты, результаты и данные, предоставляемые инструментом, носят исключительно ознакомительный и справочный характер. Они не являются профессиональной консультацией — медицинской, юридической, финансовой, инженерной или иной.
Точность результатов. Калькулятор основан на общепринятых формулах и методиках, однако фактические результаты могут отличаться в зависимости от индивидуальных условий, исходных данных и применяемых стандартов. Мы не гарантируем полноту, точность или актуальность приведённых расчётов.
Профессиональные решения — медицинские, финансовые, инженерные — должны приниматься только после консультации с квалифицированным специалистом. Не используйте автоматический расчёт как единственное основание для важных решений.
Ограничение ответственности. Авторы и разработчики сервиса не несут ответственности за прямой или косвенный ущерб, возникший из-за использования данных расчётов. Пользователь принимает на себя всю ответственность за интерпретацию результатов.
Похожие калькуляторы
Генератор systemd unit-файла
Создание .service и .timer unit-файлов с настройками безопасности. 5 типов сервиса, 5 политик Restart, готовые bash-команды установки.
/generator-systemd-unit-fajlaГенератор Cron-выражений
Визуальный конструктор cron-расписаний с переводом на русский язык. Создайте cron-выражение для планировщика задач Linux, настройте расписание и посмотрите ближайшие запуски.
/generator-cronКонвертер Unix Timestamp ↔ дата
Онлайн конвертер Unix Timestamp в дату и обратно. Текущий Unix-таймстемп, конвертация с учётом часовых поясов России, форматы ISO 8601 и RFC 2822.
/konverter-unix-timestampYAML валидатор и форматтер
Онлайн проверка и форматирование YAML-файлов. Валидация синтаксиса, конвертация YAML ↔ JSON, подсветка ошибок с номерами строк.
/yaml-validatorКалькулятор размера Docker-образа
Оценка размера Docker-образа по базовому образу и зависимостям. Сравнение base images, советы по оптимизации и multi-stage сборке.
/razmer-docker-obrazaГенератор nginx конфига
Server-блок nginx с SSL Let’s Encrypt, HTTP/2, gzip, HSTS, CSP, кешированием и rate limit. 4 сценария: proxy, статика, PHP, SPA.
/generator-nginx-konfiga-server-blockКалькулятор контейнеров (Docker)
Расчёты контейнеров: ресурсы, образы, Docker Compose, реестр, оркестрация, стоимость
/container-calculatorКалькулятор подсетей CIDR/IP
Онлайн калькулятор подсетей IPv4. Расчёт маски подсети, диапазона IP-адресов, количества хостов по CIDR-нотации. Бесплатный инструмент для сетевых инженеров.
/kalkulyator-podsetej-cidrОбъединить PDF онлайн — без загрузки на сервер
Склейка PDF в браузере через pdf-lib. До 20 файлов, до 50 МБ каждый. Локально, без отправки на сервер (152-ФЗ).
/obyedinit-pdf-onlajn-besplatnoСжать PDF онлайн — уменьшить размер локально
Сжатие PDF в браузере без потери качества. 3 уровня (object streams, удаление метаданных). До 50 МБ. Через pdf-lib, локально.
/szhat-pdf-onlajn-umenshit-razmerРазделить PDF на страницы — извлечь нужные онлайн
Разделение PDF на страницы локально: каждая страница отдельным файлом, диапазон или группами. Через pdf-lib, без отправки на сервер.
/razdelit-pdf-na-stranicy-onlajnJPG в PDF — конвертер с объединением
Конвертация JPG/PNG в PDF в браузере: до 30 картинок в один документ. Форматы A4/A3/Letter или подгонка под изображение.
/jpg-v-pdf-konverterПовернуть страницы PDF онлайн
Поворот всех или указанных страниц PDF на 90/180/270° за миллисекунды. Lossless. Через pdf-lib, без отправки на сервер.
/povernut-pdf-stranitsy-onlajnВодяной знак на PDF онлайн (кириллица)
Нанесение текстового знака («КОНФИДЕНЦИАЛЬНО», «ЧЕРНОВИК») на все страницы PDF. Поддержка русского текста через Canvas. 4 положения, регулировка прозрачности.
/dobavit-vodyanoj-znak-na-pdfНумерация страниц PDF онлайн
Проставьте номера страниц PDF в браузере: 4 формата, 6 положений, пропуск титульной, кастомный старт. Поддержка кириллицы. Через pdf-lib + Canvas.
/numerovat-stranitsy-pdf-onlajn