Инструмент для DevOps и IT-менеджеров

Калькулятор SLA
и стоимости простоя

Рассчитайте допустимый простой по уровню SLA, узнайте стоимость каждой минуты даунтайма и определите фактический SLA по реальному времени недоступности сервиса.

Выберите уровень SLA

Количество «девяток»

3.0

Год

8 ч 45 мин 58 сек

Месяц (30 д.)

43 мин 12 сек

0 ч 43 мин 12 сек

Неделя

10 мин 5 сек

0 ч 10 мин 5 сек

День

1 мин 26 сек

0 ч 1 мин 26 сек

Сравнительная таблица SLA

SLA	Девятки	Простой / год	Простой / месяц	Простой / день
99%	2 девятки	87 ч 39 мин 36 сек	7 ч 12 мин	14 мин 24 сек
99.5%	2.5 девятки	43 ч 49 мин 48 сек	3 ч 36 мин	7 мин 12 сек
99.9%	3 девятки	8 ч 45 мин 58 сек	43 мин 12 сек	1 мин 26 сек
99.95%	3.5 девятки	4 ч 22 мин 59 сек	21 мин 36 сек	43 сек
99.99%	4 девятки	52 мин 36 сек	4 мин 19 сек	9 сек
99.999%	5 девяток	5 мин 16 сек	26 сек	1 сек

99.9%

Стандарт индустрии

Базовый SLA для облачных сервисов

8.76 ч

Простой при 99.9%

Допустимый даунтайм в год

5.26 мин

Простой при 99.999%

Пять девяток — золотой стандарт

24/7

Мониторинг

Непрерывный контроль доступности

Что такое SLA и Uptime

SLA (Service Level Agreement) — это соглашение об уровне обслуживания между провайдером услуги и клиентом. Одним из ключевых параметров SLA является Uptime — гарантированный процент времени, в течение которого сервис будет доступен. Чем больше «девяток» в показателе SLA, тем меньше допустимого времени простоя и тем выше требования к инфраструктуре.

📋

Uptime (время работы)

Uptime — это процент времени, когда система доступна и работает штатно. Например, SLA 99.9% означает, что сервис может быть недоступен не более 8 часов 45 минут в год. Этот показатель измеряется внешними системами мониторинга, которые регулярно проверяют доступность сервиса.

🔴

Downtime (простой)

Downtime — это период, когда сервис недоступен пользователям. Включает плановые работы (обновления, миграции) и внеплановые инциденты (сбои оборудования, DDoS-атаки, ошибки конфигурации). В SLA обычно учитывается только внеплановый простой, плановые работы выносятся в отдельное окно обслуживания.

🎯

«Девятки» (Nines)

В индустрии уровни SLA принято считать в «девятках»: 99% — две девятки, 99.9% — три, 99.99% — четыре, 99.999% — пять. Каждая дополнительная девятка уменьшает допустимый простой в 10 раз, но экспоненциально увеличивает стоимость инфраструктуры и сложность поддержки.

Где применяется SLA

Соглашения об уровне обслуживания являются стандартом для любого IT-сервиса, от хостинга до облачных платформ.

🌐

Хостинг и дата-центры

Провайдеры веб-хостинга и колокации гарантируют доступность серверов на уровне 99.9-99.99%. Нарушение SLA влечёт компенсацию в виде кредитов на обслуживание. При выборе хостинга SLA — один из ключевых параметров.

☁️

Облачные платформы (Cloud)

AWS, Google Cloud, Yandex Cloud, Selectel — все крупные облачные провайдеры публикуют SLA для каждого сервиса. Виртуальные машины обычно имеют SLA 99.95%, управляемые базы данных — 99.99%, а CDN — 99.999%.

💻

SaaS-сервисы

Программы как услуга (CRM, ERP, мессенджеры) указывают SLA в договорах с корпоративными клиентами. Для бизнес-критичных систем (платёжные шлюзы, медицинские системы) стандартом является SLA 99.99% и выше.

⚙️

DevOps и SRE

Команды Site Reliability Engineering используют SLA для определения Error Budget — бюджета ошибок. Если простой за месяц укладывается в бюджет, команда может выпускать новые фичи. Если бюджет исчерпан — фокус переключается на надёжность.

📈

Бизнес-планирование

Финансовые аналитики используют калькулятор SLA для оценки потенциальных потерь от простоя. Это помогает обосновать инвестиции в резервирование, мониторинг и disaster recovery перед руководством.

🚨

Управление инцидентами

При возникновении сбоя важно быстро оценить, укладывается ли инцидент в допустимый бюджет простоя. Обратный калькулятор позволяет мгновенно перевести фактический даунтайм в процент SLA.

Справочная таблица SLA/ стандартные уровни

Ниже приведены стандартные уровни SLA, используемые в индустрии. Каждый уровень указывает максимально допустимое время простоя за различные периоды. Данные помогают быстро сориентироваться при составлении или анализе SLA-контрактов.

SLA %	Девятки	Простой / год	Простой / месяц	Простой / неделя	Применение
99%	2	3 дня 15 ч	7 ч 12 мин	1 ч 41 мин	Некритичные сервисы
99.5%	2.5	1 день 19 ч	3 ч 36 мин	50 мин	Внутренние системы
99.9%	3	8 ч 46 мин	43 мин	10 мин	Стандартный SLA
99.95%	3.5	4 ч 23 мин	21 мин	5 мин	Облачные сервисы
99.99%	4	52 мин	4 мин 19 сек	1 мин	Финансовые системы
99.999%	5	5 мин 15 сек	26 сек	6 сек	Телеком, медицина

Заметка: каждая дополнительная «девятка» в SLA стоит примерно в 10 раз дороже предыдущей из-за необходимости дополнительного резервирования, автоматизации и инженерных ресурсов.

Совет: не стремитесь к 99.999% для всех сервисов. Определите критичность каждого компонента и выставите SLA, соответствующий бизнес-требованиям. Избыточная надёжность — это переплата.

Как повысить Uptime

Для достижения высокого уровня доступности необходимо системно работать над каждым звеном инфраструктуры. Ниже — ключевые стратегии повышения uptime.

🔁

Резервирование (Redundancy)

Дублирование критических компонентов: серверов, сетевых каналов, баз данных, систем хранения. Используйте кластеризацию (Active-Active или Active-Passive), мультизональное развёртывание и балансировку нагрузки. Каждый единичный компонент (Single Point of Failure) должен быть устранён.

📡

Мониторинг и алертинг

Внедрите многоуровневый мониторинг: внешние проверки доступности (Uptime Robot, Pingdom), метрики приложения (Prometheus, Grafana), логирование (ELK Stack). Настройте эскалацию алертов: если инцидент не закрыт за 5 минут — уведомление уходит следующему уровню поддержки.

🗺️

Disaster Recovery план

Разработайте и регулярно тестируйте план восстановления после катастрофы. Определите RPO (допустимую потерю данных) и RTO (время восстановления). Автоматизируйте переключение на резервную площадку. Проводите учения (Game Day) минимум раз в квартал, имитируя отказ компонентов.

🚀

CI/CD и автоматизация

Автоматизируйте развёртывание через CI/CD-пайплайны с Blue-Green или Canary-деплоями. Используйте Infrastructure as Code (Terraform, Ansible) для воспроизводимости среды. Автоматические откаты при обнаружении ошибок после деплоя значительно сокращают время инцидентов.

Советы по работе с SLA

Практические рекомендации для IT-менеджеров, DevOps-инженеров и владельцев бизнеса при составлении и контроле SLA.

1Определите критичность сервисов

Не все сервисы требуют одинакового SLA. Платёжный шлюз может требовать 99.99%, а внутренний wiki — 99.5%. Составьте матрицу критичности: разделите сервисы на категории (Tier 1, Tier 2, Tier 3) и назначьте соответствующий SLA для каждого уровня.

2Считайте композитный SLA

Если сервис зависит от нескольких компонентов последовательно, общий SLA равен произведению SLA каждого. Например, приложение (99.99%) + база данных (99.99%) + сеть (99.99%) = 99.97%. Учитывайте это при проектировании архитектуры и не обещайте больше, чем может обеспечить самое слабое звено.

3Используйте Error Budget

Бюджет ошибок — это допустимое количество минут простоя за период. Например, при SLA 99.9% в месяц бюджет составляет 43 минуты. Пока бюджет не исчерпан, команда может выпускать обновления. Если бюджет заканчивается, все силы направляются на стабилизацию.

4Фиксируйте метод измерения

В SLA-контракте чётко опишите, как измеряется доступность: с каких точек, с какой частотой, что считается инцидентом. Без этого SLA превращается в формальность. Определите, включаются ли в расчёт плановые работы и частичная деградация сервиса.

Связанные понятия

SLA тесно связан с другими метриками надёжности и производительности сервисов.

SLO (Service Level Objective)

Внутренняя цель по качеству сервиса. SLO обычно строже, чем внешний SLA: если SLA = 99.9%, то SLO может быть 99.95%. Это даёт запас для выявления проблем до нарушения контракта.

SLI (Service Level Indicator)

Конкретная метрика, по которой измеряется качество: процент успешных запросов, задержка p99, доля ошибок. SLI — это данные, SLO — целевое значение, SLA — юридическое обязательство.

MTTR (Mean Time To Recovery)

Среднее время восстановления после сбоя. Чем ниже MTTR, тем выше фактический SLA. Сокращается через автоматизацию отката, подготовленные runbook-инструкции и обученных дежурных инженеров.

MTBF (Mean Time Between Failures)

Среднее время между отказами. Показывает надёжность системы. Увеличивается через резервирование, качественное тестирование, постепенный rollout обновлений и анализ постмортемов.

RPO (Recovery Point Objective)

Допустимая потеря данных при катастрофе, выраженная во времени. RPO = 1 час означает, что допустима потеря данных за последний час. Определяет частоту бэкапов и стратегию репликации.

RTO (Recovery Time Objective)

Целевое время восстановления после катастрофы. RTO = 15 минут означает, что сервис должен быть восстановлен за четверть часа. Влияет на выбор архитектуры DR: hot standby vs cold backup.

Как пользоваться калькулятором

Три режима работы для решения любых задач, связанных с SLA и доступностью сервисов.

SLA -> Простой

Выберите уровень SLA (99%, 99.9%, 99.99% и т.д.) или введите свой процент. Калькулятор рассчитает допустимое время простоя за год, месяц, неделю и день в часах, минутах и секундах.

Простой -> SLA

Введите фактический простой (часы и минуты) за выбранный период. Калькулятор определит, какому уровню SLA соответствует ваш реальный uptime и покажет количество «девяток».

Стоимость простоя

Укажите выручку компании в час. Калькулятор покажет стоимость каждой минуты простоя и сравнительную таблицу финансовых потерь для разных уровней SLA.

ЧАСТЫЕ ВОПРОСЫ

Часто задаваемые вопросы

SLA 99.9% (три девятки) означает, что сервис может быть недоступен не более 8 часов 45 минут в год, или примерно 43 минуты в месяц. Это стандартный уровень для большинства облачных сервисов. На практике это значит, что за месяц допускается один инцидент длительностью до 43 минут или несколько коротких сбоев суммарно не превышающих это время.

SLA (Service Level Agreement) — это юридический контракт с клиентом, за нарушение которого предусмотрены штрафы или компенсации. SLO (Service Level Objective) — внутренняя цель команды, обычно строже SLA, чтобы иметь запас. SLI (Service Level Indicator) — конкретная метрика, которая измеряется (процент успешных запросов, задержка, доступность). SLI — это данные, SLO — цель, SLA — обязательство.

Если компоненты системы расположены последовательно (каждый обязателен для работы), общий SLA равен произведению SLA каждого компонента. Например: веб-сервер (99.99%) x база данных (99.99%) x сеть (99.9%) = 99.88%. Если компоненты параллельны (резервируют друг друга), формула: 1 - (1-SLA_1) * (1-SLA_2). Два сервера с SLA 99% дают композитный SLA = 99.99%.

Error Budget — это допустимое количество минут простоя за определённый период, рассчитанное из SLA. При SLA 99.9% месячный бюджет ошибок составляет 43 минуты. Пока бюджет не исчерпан, команда может выпускать новые функции и обновления. Когда бюджет заканчивается, все ресурсы перенаправляются на повышение надёжности. Этот подход был популяризирован Google в рамках методологии SRE.

Зависит от условий контракта. В большинстве SLA-соглашений плановое обслуживание (maintenance window) исключается из расчёта доступности, если провайдер уведомляет клиента заранее (обычно за 48-72 часа). Однако лучшие провайдеры проводят обновления без простоя (zero-downtime deployment), и плановое окно используется только для редких крупных миграций.

Для среднего интернет-магазина оптимален SLA 99.9% (три девятки). Это допускает примерно 43 минуты простоя в месяц. Для крупных e-commerce площадок с выручкой более 1 млн рублей в час рекомендуется SLA 99.95-99.99%. Важно помнить, что в пиковые периоды (распродажи, праздники) каждая минута простоя стоит в разы дороже, поэтому SLA можно дифференцировать по сезону.

Uptime измеряется системами внешнего мониторинга, которые с заданной периодичностью (обычно каждые 1-5 минут) отправляют запросы к сервису из разных географических точек. Если сервис не отвечает или отвечает с ошибкой в течение нескольких проверок подряд, фиксируется инцидент. Популярные инструменты: Uptime Robot, Pingdom, Better Stack, Datadog, а также российские — Мониторус, Host-tracker.

SLA 99.999% допускает только 5 минут 15 секунд простоя в год. Для достижения этого уровня необходимо: мультизональное или мультирегиональное развёртывание, автоматическое переключение при отказе за секунды, дублирование каждого компонента, круглосуточная дежурная смена SRE-инженеров. Стоимость инфраструктуры и команды может быть в 10-100 раз выше, чем для трёх девяток.

При нарушении SLA провайдер обычно предоставляет компенсацию в виде кредитов на обслуживание (SLA Credits). Типичная схема: при downtime 99.0-99.9% — кредит 10% месячной стоимости, при 95-99% — 25%, ниже 95% — 50%. Важно: компенсация редко покрывает реальные потери бизнеса от простоя, поэтому не стоит полагаться только на SLA провайдера — нужна собственная стратегия отказоустойчивости.

MTTR (Mean Time To Recovery) — среднее время восстановления после сбоя. Чем ниже MTTR, тем быстрее система возвращается в рабочее состояние и тем выше фактический SLA. Для SLA 99.99% (4 минуты 19 секунд в месяц) MTTR должен быть менее 5 минут. Снижение MTTR достигается через автоматизацию: auto-scaling, self-healing, automated rollback и подготовленные runbook-инструкции для дежурных инженеров.

Был ли этот калькулятор полезен?

ревизия · 13 июня 2026

ОТКАЗ ОТ ОТВЕТСТВЕННОСТИ

Инструмент справочный — не заменяет эксперта

Только для информационных целей. Все расчёты, результаты и данные, предоставляемые инструментом, носят исключительно ознакомительный и справочный характер. Они не являются профессиональной консультацией — медицинской, юридической, финансовой, инженерной или иной.

Точность результатов. Калькулятор основан на общепринятых формулах и методиках, однако фактические результаты могут отличаться в зависимости от индивидуальных условий, исходных данных и применяемых стандартов. Мы не гарантируем полноту, точность или актуальность приведённых расчётов.

Профессиональные решения — медицинские, финансовые, инженерные — должны приниматься только после консультации с квалифицированным специалистом. Не используйте автоматический расчёт как единственное основание для важных решений.

Ограничение ответственности. Авторы и разработчики сервиса не несут ответственности за прямой или косвенный ущерб, возникший из-за использования данных расчётов. Пользователь принимает на себя всю ответственность за интерпретацию результатов.

СМЕЖНЫЕ ИНСТРУМЕНТЫ

Калькулятор SLA и стоимости простоя

Выберите уровень SLA

Сравнительная таблица SLA

Что такое SLA и Uptime

Uptime (время работы)

Downtime (простой)

«Девятки» (Nines)

Где применяется SLA

Хостинг и дата-центры

Облачные платформы (Cloud)

SaaS-сервисы

DevOps и SRE

Бизнес-планирование

Управление инцидентами

Справочная таблица SLA/ стандартные уровни

Как повысить Uptime

Резервирование (Redundancy)

Мониторинг и алертинг

Disaster Recovery план

CI/CD и автоматизация

Советы по работе с SLA

1Определите критичность сервисов

2Считайте композитный SLA

3Используйте Error Budget

4Фиксируйте метод измерения

Связанные понятия

SLO (Service Level Objective)

SLI (Service Level Indicator)

MTTR (Mean Time To Recovery)

MTBF (Mean Time Between Failures)

RPO (Recovery Point Objective)

RTO (Recovery Time Objective)

Как пользоваться калькулятором

SLA -> Простой

Простой -> SLA

Стоимость простоя

Часто задаваемые вопросы

Лиана Арифметова

Инструмент справочный — не заменяет эксперта

Похожие калькуляторы

Генератор systemd unit-файла

Генератор Cron-выражений

Конвертер Unix Timestamp ↔ дата

YAML валидатор и форматтер

Калькулятор размера Docker-образа

Генератор nginx конфига

Калькулятор контейнеров (Docker)

Калькулятор подсетей CIDR/IP

Объединить PDF онлайн — без загрузки на сервер

Сжать PDF онлайн — уменьшить размер локально

Разделить PDF на страницы — извлечь нужные онлайн

JPG в PDF — конвертер с объединением

Повернуть страницы PDF онлайн

Водяной знак на PDF онлайн (кириллица)

Нумерация страниц PDF онлайн

Выберите уровень SLA

Сравнительная таблица SLA

Калькулятор SLA
и стоимости простоя