Конвертер кодировок
текста
Что такое кодировки текста
Кодировка текста определяет, какому символу соответствует каждый байт в файле. Когда текст открывается не в той кодировке, в которой он был сохранен, вместо букв появляются нечитаемые символы. В русском интернете это явление получило название «кракозябры» (в международной терминологии — mojibake).
Однобайтовые кодировки
Windows-1251, KOI8-R, CP866 и ISO-8859-5 используют один байт (0-255) на символ. Каждая может представить не более 256 символов, поэтому они заточены под конкретный язык. Для русского создали несколько несовместимых кодировок, что и породило проблему кракозябр.
Unicode и UTF-8
Unicode решил проблему, присвоив уникальный номер каждому символу всех языков мира (более 150 000 символов). UTF-8 — самый популярный способ записи Unicode: латиница занимает 1 байт, кириллица — 2 байта, иероглифы — 3. Это стандарт современного веба.
Почему возникают кракозябры
Кракозябры появляются, когда программа читает файл не в той кодировке. Байт 0xCF в UTF-8 — часть двухбайтовой буквы «П», а в Windows-1251 — самостоятельный символ «П». Если прочесть UTF-8 текст как Windows-1251, каждая русская буква превращается в два непонятных символа.
Возможности конвертера
Полный набор инструментов для работы с кодировками текста, востребованный разработчиками, вебмастерами и системными администраторами.
Исправление кракозябр
Автоматическое определение и исправление типичных искажений русского текста. Пробует все комбинации кодировок и показывает наиболее вероятный результат с процентом уверенности.
Миграция баз данных
При переносе данных из старых систем (MySQL в latin1, legacy-приложения на Windows-1251) текст часто повреждается. Конвертер помогает понять, какая цепочка перекодировок произошла, и восстановить данные.
Работа с legacy-системами
Многие серверы 1С, банковские системы и государственные порталы до сих пор используют Windows-1251 или KOI8-R. Конвертер помогает подготовить данные для обмена между современными и устаревшими системами.
Конвертация файлов
Субтитры в SRT, файлы CSV из Excel, конфигурационные файлы — часто приходят в неожиданной кодировке. Вставьте содержимое в конвертер и получите текст в нужной кодировке за секунду.
Проблемы с email
Письма с кракозябрами — классическая проблема почтовых серверов. Конвертер поможет прочитать такое письмо, определив исходную кодировку отправителя и применив правильную перекодировку.
Hex-дамп и анализ
Просмотр байтового представления текста в каждой кодировке. Незаменимо для отладки проблем с кодировками в протоколах, API-ответах и бинарных файлах. Сравнивайте размер текста в разных кодировках.
Сравнение кодировок/ таблица совместимости
Все пять кодировок поддерживают базовую латиницу (ASCII, байты 0x00-0x7F) одинаково. Различия начинаются в верхней половине таблицы (0x80-0xFF), где размещены кириллица и специальные символы.
| Характеристика | UTF-8 | Win-1251 | KOI8-R | ISO-8859-5 | CP866 |
|---|---|---|---|---|---|
| Байт на кириллицу | 2 | 1 | 1 | 1 | 1 |
| Максимум символов | 1.1M+ | 256 | 256 | 256 | 256 |
| Украинские буквы | Да | Да | Нет | Да | Частично |
| Псевдографика | Да | Нет | Да | Нет | Да |
| Год создания | 1993 | 1996 | 1993 | 1988 | 1986 |
| Применение сегодня | Везде | Legacy | Редко | Редко | DOS |
| Совместимость с ASCII | Полная | Полная | Полная | Полная | Полная |
Рекомендация: всегда используйте UTF-8 для новых проектов. Это стандарт W3C, WHATWG и де-факто стандарт всех современных веб-платформ.
Факт: по данным W3Techs, более 98% всех сайтов в мире используют UTF-8. Для русскоязычных сайтов этот показатель превышает 95%.
История кодировок кириллицы
Путь от хаоса несовместимых кодировок к единому стандарту Unicode занял почти 30 лет. За это время русскоязычный интернет пережил настоящую «войну кодировок».
CP866 и эпоха DOS
Кодировка CP866 была создана IBM для MS-DOS. Она включала кириллицу и символы псевдографики для рисования рамок и таблиц в текстовом режиме. На ней работали Norton Commander, Lexicon, а позже — ранние BBS-сети в России. CP866 до сих пор используется в командной строке Windows.
KOI8-R и UNIX-мир
KOI8-R стала стандартом для русскоязычных UNIX-систем и раннего интернета (RFC 1489). Её главное достоинство — при потере старшего бита (частая проблема 7-битных каналов связи) кириллица превращалась в читаемую транслитерацию: «П» (0xF0) становилась «p» (0x70). Сети FIDO и Relcom активно использовали KOI8-R.
Windows-1251 и эра Windows
С массовым распространением Windows 95/98 в России кодировка Windows-1251 (CP1251) стала доминировать. Буквы в ней расположены в алфавитном порядке, что удобно для сортировки. К началу 2000-х большинство русскоязычных сайтов использовали именно Windows-1251. «Войны кодировок» между KOI8-R и Win-1251 были повседневной реальностью веб-мастеров.
Переход на UTF-8
Постепенный переход на UTF-8 начался с международных проектов. Русская Википедия перешла на UTF-8 в 2005 году, LiveJournal — в 2006. Gmail изначально использовал UTF-8. К 2010 году большинство новых сайтов создавались уже в UTF-8. Однако старые системы, базы данных и почтовые серверы продолжают хранить данные в Windows-1251, создавая проблемы при интеграции.
UTF-8 как стандарт
Сегодня UTF-8 — абсолютный стандарт. HTML5 рекомендует его по умолчанию. Современные базы данных (PostgreSQL, MySQL 8+) используют utf8mb4. Однако проблемы с кодировками не исчезли полностью: старые дампы, импорт из 1С, электронные документы и субтитры к фильмам регулярно требуют перекодировки.
Как избежать проблем с кодировками
Практические советы для разработчиков, вебмастеров и всех, кто работает с текстовыми данными.
1Указывайте кодировку явно
Всегда добавляйте <meta charset="UTF-8"> в HTML, Content-Type: text/html; charset=utf-8 в HTTP-заголовках, и BOM-метку при необходимости. Не полагайтесь на автоопределение браузера — оно часто ошибается.
2Настройте базу данных правильно
В MySQL используйте utf8mb4 (не utf8, который не поддерживает 4-байтовые символы). В PostgreSQL — стандартный UTF-8. Убедитесь, что соединение к базе данных также использует UTF-8 (SET NAMES utf8mb4).
3Проверяйте кодировку файлов
Используйте утилиты вроде file (Linux/macOS) или Notepad++ (Windows) для определения текущей кодировки файла перед обработкой. В hex-редакторе UTF-8 кириллица начинается с байтов 0xD0-0xD1.
4Не перекодируйте дважды
Типичная ошибка — конвертировать текст, который уже в нужной кодировке. Двойная UTF-8 конвертация (UTF-8 прочитан как Windows-1251, затем снова сохранён в UTF-8) создаёт «двойные кракозябры», исправить которые значительно сложнее.
5Единая кодировка в проекте
Настройте IDE, систему контроля версий (git) и CI/CD на использование UTF-8 без BOM. В .editorconfig укажите charset = utf-8. Это предотвратит случайное создание файлов в других кодировках.
6Тестируйте на реальных данных
При импорте данных из внешних источников (CSV, XML, API) всегда проверяйте кириллицу в первую очередь. Используйте тестовые строки с буквами «ё», «Ё», «щ», «ъ» — они чаще всего страдают от некорректной конвертации.
Как пользоваться конвертером
Простая инструкция для двух режимов работы: конвертация кодировок и исправление кракозябр.
Выберите режим
Конвертация — для перекодировки текста из одной кодировки в другую. Исправить кракозябры — для восстановления повреждённого текста.
Введите текст
Вставьте текст в поле ввода. В режиме конвертации — обычный читаемый текст. В режиме исправления — текст с кракозябрами.
Укажите кодировки
В режиме конвертации выберите исходную и целевую кодировки из списка. В режиме исправления кодировки определяются автоматически.
Скопируйте результат
Нажмите кнопку «Копировать» рядом с результатом. Включите hex-дамп для просмотра байтового представления текста.
Часто задаваемые вопросы

Лиана Арифметова
Миссия: Демократизировать сложные расчеты. Превратить страх перед числами в ясность и контроль. Девиз: «Любая повторяющаяся задача заслуживает своего калькулятора».
Был ли этот калькулятор полезен?
Отказ от ответственности
Только для информационных целей. Все расчёты, результаты и данные, предоставляемые данным инструментом, носят исключительно ознакомительный и справочный характер. Они не являются профессиональной консультацией — медицинской, юридической, финансовой, инженерной или иной.
Точность результатов. Калькулятор основан на общепринятых формулах и методиках, однако фактические результаты могут отличаться в зависимости от индивидуальных условий, исходных данных и применяемых стандартов. Мы не гарантируем полноту, точность или актуальность приведённых расчётов.
Медицинские, финансовые и профессиональные решения должны приниматься исключительно на основании консультации с квалифицированными специалистами — врачом, финансовым советником, инженером или другим профессионалом в соответствующей области. Не используйте результаты данного инструмента как единственное основание для принятия важных решений.
Ограничение ответственности. Авторы и разработчики сервиса не несут никакой ответственности за прямой или косвенный ущерб, возникший в результате использования данных расчётов. Пользователь принимает на себя всю ответственность за интерпретацию и применение полученных результатов.
Похожие инструменты
Калькулятор нотариальных услуг
Расчёт стоимости нотариальных услуг: тариф + УПТХ. Доверенности, договоры, наследство, согласия. Ст. 22.1 Основ о нотариате.
Калькулятор обоев
Рассчитайте количество рулонов обоев: с учётом дверей, окон, раппорта рисунка и типа обоев.
Калькулятор косметического производства
Расчёты косметики: эмульсия HLB, SPF, консерванты, pH, масштабирование, себестоимость
Видео калькулятор: FPS и битрейт
Конвертер FPS в МС, расчет битрейта и размера видеофайла. Инструмент для стримеров и монтажеров.
Калькулятор оптики (линзы, преломление, DoF)
Расчет фокусного расстояния, закон Снеллиуса и глубина резкости (DoF). Калькулятор для физики и фотографии.
Калькулятор доступности (Accessibility): WCAG 2.1, контрастность, ARIA, скринридер
Комплексный калькулятор веб-доступности: проверка контрастности цветов (WCAG AA/AAA), конвертер размеров шрифтов (rem/em/px), оценка ARIA-совместимости, аудит клавиатурной навигации, готовность к скринридерам и соответствие WCAG 2.1 (ГОСТ Р 52872).
Калькулятор нейропсихологии: MMSE, MoCA, FAB и тест Струпа
Нейропсихологическая оценка онлайн: подсчёт баллов MMSE, MoCA, FAB, тест рисования часов, интерференция Струпа, индекс латерализации.
Калькулятор CSS единиц (PX, REM, EM, %)
Конвертер пикселей в rem/em и генератор calc(). Удобный инструмент для верстки и адаптивного дизайна.
Калькулятор фитотерапии: лекарственные растения, настои, настойки и сборы
Фитотерапевтические расчёты: справочник растений, расчёт настоя и настойки, совместимость трав, календарь сбора, дозировка фитопрепаратов.
Калькулятор операционных показателей: точка безубыточности, маржа
Операционный анализ бизнеса: точка безубыточности, маржинальность, запас финансовой прочности и оборачиваемость запасов.
Калькулятор нормы сахара в крови
Определите норму глюкозы в крови по возрасту. Натощак, после еды, гликированный гемоглобин.
Калькулятор пищевого производства
Расчёты пищевого производства: пастеризация, сушка, холодильная цепь, рецептура, ХАССП
Калькулятор размера бюстгальтера
Определите размер бюстгальтера по обхвату груди и обхвату под грудью. Таблица размеров RU, EU, UK, US. Подбор чашки и пояса.
Ветеринарный калькулятор: дозировка, кормление, BCS и инфузия
Ветеринарные расчёты онлайн: дозировка лекарств, суточная норма кормления (RER/MER), упитанность BCS, инфузионная терапия, анестезия.
Калькулятор габионов
Расчёт габионных конструкций: количество корзин, объём и вес камня, площадь геотекстиля. Смета на материалы, монтаж и доставку.