Калькулятор психометрики
и тестологии
Основы психометрики
Психометрика — наука об измерении психологических свойств. Она обеспечивает строгую математическую основу для разработки тестов, оценки их качества и интерпретации результатов. Без психометрических характеристик психологический тест является лишь опросником, а не научным инструментом.
Надёжность
Надёжность показывает, насколько стабильны результаты теста при повторном измерении. Коэффициент альфа Кронбаха измеряет внутреннюю согласованность — степень, в которой все пункты теста измеряют одно и то же конструкт. Приемлемый порог — α ≥ 0.70, для диагностических решений — α ≥ 0.85.
Валидность
Валидность — основной критерий качества теста: измеряет ли он то, для чего предназначен. Различают содержательную валидность (охват конструкта), конструктную (соответствие теоретической модели) и критериальную (связь с внешним критерием). Надёжность — необходимое, но недостаточное условие валидности.
Стандартизация
Стандартизация — процесс создания норм для интерпретации первичных баллов. Нормы разрабатываются на репрезентативной выборке и позволяют сравнить результат конкретного человека с популяцией. Российские тесты должны иметь отечественные нормы — зарубежные нормы неприменимы напрямую.
Возможности калькулятора
Полный психометрический инструментарий для разработки и оценки психологических тестов.
α Кронбаха (внутренняя согласованность)
Расчёт коэффициента альфа Кронбаха по числу пунктов k и средней межпунктовой корреляции. Диаграмма кривой альфа от длины теста. Формула Спирмена-Брауна для планирования длины теста.
SEM — стандартная ошибка измерения
Вычисление SEM = SD × √(1−r). Доверительные интервалы 68% и 95% для истинного балла. Визуализация распределения вероятности истинного балла.
Нормирование баллов
Перевод первичного балла в z, T-балл, стэнайн, процентиль, IQ-шкалу и SAT одновременно. Позиционирование на кривой нормального распределения.
Дифференцирующая способность
Индекс трудности p и индекс дифференциации d по методу 27% групп. Интерпретация и рекомендации по каждому пункту теста.
Конструктная валидность
Оценка структуры теста через конфирматорный факторный анализ. Взаимосвязь надёжности и валидности. Рекомендации по улучшению психометрических характеристик.
Нормы для российской выборки
Ориентация на требования РПО (Российского психологического общества) и российского легислативства. Разработка норм на отечественных выборках.
Теории и стандарты психометрики/ полное руководство
Современная психометрика опирается на две основные теоретические парадигмы: классическую теорию теста (CTT) и теорию ответа на задание (IRT). Для работы с данными тестирования также используют описательную статистику. Российское профессиональное сообщество руководствуется стандартами РПО и международными требованиями к психологическому тестированию.
Классическая теория теста (CTT)
CTT основана на модели: наблюдаемый балл X = истинный балл T + ошибка измерения E. Ключевые характеристики: надёжность как корреляция между параллельными формами, SEM, коэффициент Кронбаха.
X = T + E (модель CTT)α = k̲r̄ / [1 + (k-1)̲r̄] (α Кронбаха)SEM = SD × √(1 - r) (стандартная ошибка)Преимущества CTT: простота расчёта, широкая применимость, не требует специального ПО. Ограничения: характеристики заданий зависят от выборки, характеристики испытуемых — от теста.
IRT — Теория ответа на задание (модели Раша, 2PL, 3PL)
IRT моделирует вероятность правильного ответа как функцию латентной черты испытуемого и параметров задания. Основные модели:
Модель Раша (1PL)
P(θ) = exp(θ-b) / [1 + exp(θ-b)]Один параметр — трудность задания b. Строгая модель, удобна для конструирования шкал (батареи Раша). Широко применяется в образовательном тестировании (ЕГЭ, ОГЭ в России).
Двухпараметрическая модель (2PL)
P(θ) = 1 / [1 + exp(-a(θ-b))]Параметры: a (дифференцирующая способность) и b (трудность). Гибче модели Раша, применяется в психологических тестах.
Трёхпараметрическая модель (3PL)
P(θ) = c + (1-c) / [1 + exp(-a(θ-b))]Добавляет параметр угадывания c. Применяется в тестах с множественным выбором, где случайный ответ возможен.
Типы валидности
Валидность — степень, в которой тест измеряет именно то, для чего предназначен. Различают три основных типа согласно APA Standards (2014):
Содержательная валидность (Content Validity)
Степень охвата тестом всего содержания измеряемого конструкта. Оценивается экспертным путём (коэффициент CVR Лоше) или анализом таблицы спецификаций. Обязательна для тестов достижений и профессиональных экзаменов.
Конструктная валидность (Construct Validity)
Соответствие теста теоретической модели конструкта. Проверяется конфирматорным факторным анализом, мультитрейт-мультиметодными матрицами, дифференциальной валидностью. Ключевой тип в психологии.
Критериальная валидность (Criterion Validity)
Связь результатов теста с внешним критерием. Конкурентная (одновременная) — критерий измеряется сейчас, прогностическая — в будущем. Выражается коэффициентом валидности (обычно корреляция r ≥ 0.30 считается значимой).
Требования к тестам в России (стандарты РПО)
Российское психологическое общество и законодательство предъявляют конкретные требования к психодиагностическим методикам.
Стандарты РПО (2008, редакция 2019)
Требуют документирования психометрических характеристик: надёжность (α ≥ 0.70), конструктная и критериальная валидность, российские нормы на репрезентативной выборке не менее 200 чел. Для клинического применения — нормы на клинических группах.
ГОСТ Р 56827-2015 (психологическое тестирование)
Устанавливает требования к условиям проведения, квалификации психологов, документированию результатов. Обязателен для государственных организаций и образовательных учреждений.
Адаптация зарубежных тестов
Прямой перевод недопустим. Требуются: лингвистическая эквивалентность (обратный перевод), пилотажное исследование, сбор российских норм, подтверждение факторной структуры на отечественной выборке. Процедура занимает 1-3 года.
Минимальные требования надёжности: α ≥ 0.70 для групповых исследований; α ≥ 0.80 для индивидуальной диагностики; α ≥ 0.90 для клинических и юридически значимых решений.
Нормирование для России: Зарубежные нормы (США, Европа) не подходят для российской популяции из-за культурных и лингвистических различий. Всегда создавайте отечественные нормы.
Ключевые концепции
Фундаментальные понятия классической теории теста и теории ответа на задание.
CTT — Классическая теория теста
Classical Test TheoryОснована на модели X = T + E. Вся дисперсия наблюдаемых баллов делится на истинную и ошибочную составляющие. Надёжность — доля истинной дисперсии. Простота расчётов делает CTT доступной без специального ПО. Ограничение: параметры теста и испытуемых взаимозависимы. CTT является стандартом в большинстве российских исследований.
IRT — Теория ответа на задание
Item Response TheoryМоделирует вероятность правильного ответа через характеристическую кривую задания (ICC). Параметры инвариантны к выборке — главное преимущество над CTT. Требует специального ПО (R, SPSS, Winsteps) и крупных выборок (от 200-500 чел.). Применяется в ЕГЭ, международных тестах (PISA, TIMSS), адаптивном тестировании.
Валидность теста
Test ValidityВалидность — важнейшая характеристика теста, показывающая, измеряет ли он то, что должен измерять. Надёжность является необходимым, но недостаточным условием валидности: тест может быть надёжным, но невалидным. Современная концепция рассматривает валидность как унитарную характеристику с разными свидетельствами (содержательные, структурные, внешние, последствия).
Стандартизация и нормирование
Standardization & NormsСтандартизация включает унификацию процедуры и разработку нормативных таблиц. Нормы могут быть возрастными (в детской психологии), профессиональными (для отбора персонала), клиническими (для психиатрии). Тип нормы определяет сравнительную группу. Важно: нормы устаревают (эффект Флинна) и требуют периодического обновления.
Советы по разработке психологического теста
Практические рекомендации для создания надёжного и валидного психологического инструмента.
1Начните с чёткого определения конструкта
Перед написанием пунктов точно определите, что именно измеряет тест. Создайте таблицу спецификаций, отражающую все аспекты конструкта. Неопределённость конструкта — главная причина низкой валидности. Используйте теоретические модели и литературный обзор.
2Генерируйте пункты с запасом
Создавайте в 2-3 раза больше пунктов, чем нужно в финальном тесте. Это позволит отобрать лучшие по психометрическим показателям. Формулировки должны быть однозначными, без двойных отрицаний, культурно нейтральными. Избегайте наводящих вопросов и социально желательных ответов.
3Проведите пилотажное исследование
Пилотаж на 30-100 чел. позволяет выявить непонятые инструкции, технические ошибки, пункты с экстремальными показателями трудности (p < 0.15 или p > 0.85). Проведите когнитивные интервью — попросите участников вслух объяснять своё понимание вопросов.
4Рассчитайте психометрические показатели
Для каждого пункта вычислите индекс трудности p и дифференциации d. Исключите пункты с d < 0.20. Рассчитайте коэффициент α Кронбаха, SEM, корреляцию "пункт-тест". Используйте анализ "альфа при исключении пункта" для оптимизации теста.
5Стандартизируйте на репрезентативной российской выборке
Нормативная выборка должна репрезентировать целевую популяцию по полу, возрасту, образованию, региону. Минимальный объём — 200-300 чел. для исследовательских норм, 500+ — для клинических. Обновляйте нормы каждые 10-15 лет или при значительных культурных изменениях.
6Документируйте и публикуйте данные
Подготовьте технический мануал с описанием разработки, психометрическими характеристиками, нормативными таблицами и инструкцией. Публикация в рецензируемом журнале обеспечивает независимую экспертизу. Соблюдайте стандарты РПО (2019) и этический кодекс психолога.
Как пользоваться калькулятором
Пошаговая инструкция для психометрического анализа вашего теста.
Выберите вкладку
Определите, какой аспект нужно рассчитать: надёжность (α Кронбаха), ошибку измерения (SEM), нормирование баллов или дифференцирующую способность заданий.
Введите параметры
Укажите характеристики вашего теста: число пунктов, корреляции, стандартное отклонение, надёжность или баллы верхней и нижней 27%-групп.
Изучите результаты
Калькулятор мгновенно рассчитывает показатели с интерпретацией. Для α Кронбаха показывает уровень надёжности и рекомендуемое число пунктов по формуле Спирмена-Брауна.
Используйте для оптимизации
Экспериментируйте с параметрами для планирования теста: подберите оптимальное число пунктов, оцените ДИ для нужной надёжности, сравните шкалы нормирования.
Часто задаваемые вопросы
Похожие инструменты
RPG калькулятор (DnD 5e): кубики, урон и вероятность
Калькулятор для настольных ролевых игр: расчет вероятности попадания (d20), среднего урона и шанса критического удара.
Калькулятор гляциологии
Масс-баланс ледника, водный эквивалент снега SWE, закон течения Глена, толщина льда, ELA, вклад в подъём уровня моря.
Калькулятор теории IRT (Раш, 2PL, 3PL)
Расчёт кривых ICC, информационных функций пунктов (IIF) и теста (TIF) по моделям Раша, 2PL и 3PL. Для ЕГЭ, PISA, адаптивного тестирования.
Калькулятор pH раствора
Расчёт pH по концентрации ионов водорода. Конвертация [H⁺] в pH и обратно. Кислоты и основания.
Геотермальный калькулятор
Расчёты геотермальной энергии: тепловые насосы, градиент, скважины, экономика
Калькулятор срока действия SSL сертификата
Проверка срока действия SSL/TLS сертификата. Рассчитайте дни до истечения, узнайте статус и получите рекомендации по продлению.
Калькулятор доходности аренды
Чистая и валовая доходность аренды, окупаемость, ROI, Cap Rate, Cash-on-Cash. Для инвесторов.
Калькулятор M&A (слияния и поглощения)
Enterprise Value, Equity Value, NPV синергий, срок окупаемости. По РСБУ и МСФО.
Калькулятор плитки
Количество плитки, клей и затирка для ванной, кухни или пола. Учёт подрезки, запаса и раскладки.
Калькулятор фармацевтического производства
Расчёты фармпроизводства: таблетирование, растворение, стабильность, чистые помещения, валидация
Калькулятор вирусологии
TCID50 по Риду-Мюнху, бляшкообразующие единицы PFU, MOI, вирусная нагрузка, IC50 антивирусных, burst size.
Калькулятор общественного здравоохранения: DALY, QALY, NNT и вакцинация
Расчёты общественного здравоохранения: DALY, QALY, эффективность вакцинации (VE, NNV), NNT/NNH, демография, ICER.
Калькулятор движения снаряда (кинематика)
Моделирование траекторий с аэродинамическим сопротивлением, нелинейные колебания и анализ столкновений.
Калькулятор биомеханики: нагрузка на позвоночник, прыжок, бег и мышцы Хилла
Биомеханические расчёты: модель Чаффина, кинетика прыжка и бега, центр масс (Де Лева), сила удара, модель мышцы Хилла.
Калькулятор подиатрии: диабетическая стопа, ABI, плоскостопие и размер обуви
Подиатрические расчёты онлайн: классификация Вагнера, лодыжечно-плечевой индекс (ABI), индекс плоскостопия, конвертер размера обуви, тест Тинетти.

Лиана Арифметова
Миссия: Демократизировать сложные расчеты. Превратить страх перед числами в ясность и контроль. Девиз: «Любая повторяющаяся задача заслуживает своего калькулятора».
Отказ от ответственности
Только для информационных целей. Все расчёты, результаты и данные, предоставляемые данным инструментом, носят исключительно ознакомительный и справочный характер. Они не являются профессиональной консультацией — медицинской, юридической, финансовой, инженерной или иной.
Точность результатов. Калькулятор основан на общепринятых формулах и методиках, однако фактические результаты могут отличаться в зависимости от индивидуальных условий, исходных данных и применяемых стандартов. Мы не гарантируем полноту, точность или актуальность приведённых расчётов.
Медицинские, финансовые и профессиональные решения должны приниматься исключительно на основании консультации с квалифицированными специалистами — врачом, финансовым советником, инженером или другим профессионалом в соответствующей области. Не используйте результаты данного инструмента как единственное основание для принятия важных решений.
Ограничение ответственности. Авторы и разработчики сервиса не несут никакой ответственности за прямой или косвенный ущерб, возникший в результате использования данных расчётов. Пользователь принимает на себя всю ответственность за интерпретацию и применение полученных результатов.