Калькулятор психометрики
и тестологии
Основы психометрики
Психометрика — наука об измерении психологических свойств. Она обеспечивает строгую математическую основу для разработки тестов, оценки их качества и интерпретации результатов. Без психометрических характеристик психологический тест является лишь опросником, а не научным инструментом.
Надёжность
Надёжность показывает, насколько стабильны результаты теста при повторном измерении. Коэффициент альфа Кронбаха измеряет внутреннюю согласованность — степень, в которой все пункты теста измеряют одно и то же конструкт. Приемлемый порог — α ≥ 0.70, для диагностических решений — α ≥ 0.85.
Валидность
Валидность — основной критерий качества теста: измеряет ли он то, для чего предназначен. Различают содержательную валидность (охват конструкта), конструктную (соответствие теоретической модели) и критериальную (связь с внешним критерием). Надёжность — необходимое, но недостаточное условие валидности.
Стандартизация
Стандартизация — процесс создания норм для интерпретации первичных баллов. Нормы разрабатываются на репрезентативной выборке и позволяют сравнить результат конкретного человека с популяцией. Российские тесты должны иметь отечественные нормы — зарубежные нормы неприменимы напрямую.
Возможности калькулятора
Полный психометрический инструментарий для разработки и оценки психологических тестов.
α Кронбаха (внутренняя согласованность)
Расчёт коэффициента альфа Кронбаха по числу пунктов k и средней межпунктовой корреляции. Диаграмма кривой альфа от длины теста. Формула Спирмена-Брауна для планирования длины теста.
SEM — стандартная ошибка измерения
Вычисление SEM = SD × √(1−r). Доверительные интервалы 68% и 95% для истинного балла. Визуализация распределения вероятности истинного балла.
Нормирование баллов
Перевод первичного балла в z, T-балл, стэнайн, процентиль, IQ-шкалу и SAT одновременно. Позиционирование на кривой нормального распределения.
Дифференцирующая способность
Индекс трудности p и индекс дифференциации d по методу 27% групп. Интерпретация и рекомендации по каждому пункту теста.
Конструктная валидность
Оценка структуры теста через конфирматорный факторный анализ. Взаимосвязь надёжности и валидности. Рекомендации по улучшению психометрических характеристик.
Нормы для российской выборки
Ориентация на требования РПО (Российского психологического общества) и российского легислативства. Разработка норм на отечественных выборках.
Теории и стандарты психометрики/ полное руководство
Современная психометрика опирается на две основные теоретические парадигмы: классическую теорию теста (CTT) и теорию ответа на задание (IRT). Для работы с данными тестирования также используют описательную статистику. Российское профессиональное сообщество руководствуется стандартами РПО и международными требованиями к психологическому тестированию.
Классическая теория теста (CTT)
CTT основана на модели: наблюдаемый балл X = истинный балл T + ошибка измерения E. Ключевые характеристики: надёжность как корреляция между параллельными формами, SEM, коэффициент Кронбаха.
X = T + E (модель CTT)α = k̲r̄ / [1 + (k-1)̲r̄] (α Кронбаха)SEM = SD × √(1 - r) (стандартная ошибка)Преимущества CTT: простота расчёта, широкая применимость, не требует специального ПО. Ограничения: характеристики заданий зависят от выборки, характеристики испытуемых — от теста.
IRT — Теория ответа на задание (модели Раша, 2PL, 3PL)
IRT моделирует вероятность правильного ответа как функцию латентной черты испытуемого и параметров задания. Основные модели:
Модель Раша (1PL)
P(θ) = exp(θ-b) / [1 + exp(θ-b)]Один параметр — трудность задания b. Строгая модель, удобна для конструирования шкал (батареи Раша). Широко применяется в образовательном тестировании (ЕГЭ, ОГЭ в России).
Двухпараметрическая модель (2PL)
P(θ) = 1 / [1 + exp(-a(θ-b))]Параметры: a (дифференцирующая способность) и b (трудность). Гибче модели Раша, применяется в психологических тестах.
Трёхпараметрическая модель (3PL)
P(θ) = c + (1-c) / [1 + exp(-a(θ-b))]Добавляет параметр угадывания c. Применяется в тестах с множественным выбором, где случайный ответ возможен.
Типы валидности
Валидность — степень, в которой тест измеряет именно то, для чего предназначен. Различают три основных типа согласно APA Standards (2014):
Содержательная валидность (Content Validity)
Степень охвата тестом всего содержания измеряемого конструкта. Оценивается экспертным путём (коэффициент CVR Лоше) или анализом таблицы спецификаций. Обязательна для тестов достижений и профессиональных экзаменов.
Конструктная валидность (Construct Validity)
Соответствие теста теоретической модели конструкта. Проверяется конфирматорным факторным анализом, мультитрейт-мультиметодными матрицами, дифференциальной валидностью. Ключевой тип в психологии.
Критериальная валидность (Criterion Validity)
Связь результатов теста с внешним критерием. Конкурентная (одновременная) — критерий измеряется сейчас, прогностическая — в будущем. Выражается коэффициентом валидности (обычно корреляция r ≥ 0.30 считается значимой).
Требования к тестам в России (стандарты РПО)
Российское психологическое общество и законодательство предъявляют конкретные требования к психодиагностическим методикам.
Стандарты РПО (2008, редакция 2019)
Требуют документирования психометрических характеристик: надёжность (α ≥ 0.70), конструктная и критериальная валидность, российские нормы на репрезентативной выборке не менее 200 чел. Для клинического применения — нормы на клинических группах.
ГОСТ Р 56827-2015 (психологическое тестирование)
Устанавливает требования к условиям проведения, квалификации психологов, документированию результатов. Обязателен для государственных организаций и образовательных учреждений.
Адаптация зарубежных тестов
Прямой перевод недопустим. Требуются: лингвистическая эквивалентность (обратный перевод), пилотажное исследование, сбор российских норм, подтверждение факторной структуры на отечественной выборке. Процедура занимает 1-3 года.
Минимальные требования надёжности: α ≥ 0.70 для групповых исследований; α ≥ 0.80 для индивидуальной диагностики; α ≥ 0.90 для клинических и юридически значимых решений.
Нормирование для России: Зарубежные нормы (США, Европа) не подходят для российской популяции из-за культурных и лингвистических различий. Всегда создавайте отечественные нормы.
Ключевые концепции
Фундаментальные понятия классической теории теста и теории ответа на задание.
CTT — Классическая теория теста
Classical Test TheoryОснована на модели X = T + E. Вся дисперсия наблюдаемых баллов делится на истинную и ошибочную составляющие. Надёжность — доля истинной дисперсии. Простота расчётов делает CTT доступной без специального ПО. Ограничение: параметры теста и испытуемых взаимозависимы. CTT является стандартом в большинстве российских исследований.
IRT — Теория ответа на задание
Item Response TheoryМоделирует вероятность правильного ответа через характеристическую кривую задания (ICC). Параметры инвариантны к выборке — главное преимущество над CTT. Требует специального ПО (R, SPSS, Winsteps) и крупных выборок (от 200-500 чел.). Применяется в ЕГЭ, международных тестах (PISA, TIMSS), адаптивном тестировании.
Валидность теста
Test ValidityВалидность — важнейшая характеристика теста, показывающая, измеряет ли он то, что должен измерять. Надёжность является необходимым, но недостаточным условием валидности: тест может быть надёжным, но невалидным. Современная концепция рассматривает валидность как унитарную характеристику с разными свидетельствами (содержательные, структурные, внешние, последствия).
Стандартизация и нормирование
Standardization & NormsСтандартизация включает унификацию процедуры и разработку нормативных таблиц. Нормы могут быть возрастными (в детской психологии), профессиональными (для отбора персонала), клиническими (для психиатрии). Тип нормы определяет сравнительную группу. Важно: нормы устаревают (эффект Флинна) и требуют периодического обновления.
Советы по разработке психологического теста
Практические рекомендации для создания надёжного и валидного психологического инструмента.
1Начните с чёткого определения конструкта
Перед написанием пунктов точно определите, что именно измеряет тест. Создайте таблицу спецификаций, отражающую все аспекты конструкта. Неопределённость конструкта — главная причина низкой валидности. Используйте теоретические модели и литературный обзор.
2Генерируйте пункты с запасом
Создавайте в 2-3 раза больше пунктов, чем нужно в финальном тесте. Это позволит отобрать лучшие по психометрическим показателям. Формулировки должны быть однозначными, без двойных отрицаний, культурно нейтральными. Избегайте наводящих вопросов и социально желательных ответов.
3Проведите пилотажное исследование
Пилотаж на 30-100 чел. позволяет выявить непонятые инструкции, технические ошибки, пункты с экстремальными показателями трудности (p < 0.15 или p > 0.85). Проведите когнитивные интервью — попросите участников вслух объяснять своё понимание вопросов.
4Рассчитайте психометрические показатели
Для каждого пункта вычислите индекс трудности p и дифференциации d. Исключите пункты с d < 0.20. Рассчитайте коэффициент α Кронбаха, SEM, корреляцию "пункт-тест". Используйте анализ "альфа при исключении пункта" для оптимизации теста.
5Стандартизируйте на репрезентативной российской выборке
Нормативная выборка должна репрезентировать целевую популяцию по полу, возрасту, образованию, региону. Минимальный объём — 200-300 чел. для исследовательских норм, 500+ — для клинических. Обновляйте нормы каждые 10-15 лет или при значительных культурных изменениях.
6Документируйте и публикуйте данные
Подготовьте технический мануал с описанием разработки, психометрическими характеристиками, нормативными таблицами и инструкцией. Публикация в рецензируемом журнале обеспечивает независимую экспертизу. Соблюдайте стандарты РПО (2019) и этический кодекс психолога.
Как пользоваться калькулятором
Пошаговая инструкция для психометрического анализа вашего теста.
Выберите вкладку
Определите, какой аспект нужно рассчитать: надёжность (α Кронбаха), ошибку измерения (SEM), нормирование баллов или дифференцирующую способность заданий.
Введите параметры
Укажите характеристики вашего теста: число пунктов, корреляции, стандартное отклонение, надёжность или баллы верхней и нижней 27%-групп.
Изучите результаты
Калькулятор мгновенно рассчитывает показатели с интерпретацией. Для α Кронбаха показывает уровень надёжности и рекомендуемое число пунктов по формуле Спирмена-Брауна.
Используйте для оптимизации
Экспериментируйте с параметрами для планирования теста: подберите оптимальное число пунктов, оцените ДИ для нужной надёжности, сравните шкалы нормирования.
Часто задаваемые вопросы
Похожие инструменты
Калькулятор CURB-65 (пневмония)
Оценка тяжести внебольничной пневмонии по шкале CURB-65. Определение тактики: амбулаторно, госпитализация или ОРИТ.
Калькулятор продлённого дня
Расчёт стоимости продлёнки: питание, секции, кружки. Сравнение вариантов.
Калькулятор пенсии РФ (ИПК, страховая, накопительная)
Рассчитайте будущую пенсию по формуле СФР: ИПК, фиксированная выплата, накопительная часть. Учет стажа и зарплаты.
Калькулятор молекулярной массы
Молекулярная масса любого соединения. Формула (H2O, NaCl, C6H12O6) → масса и массовые доли элементов.
Калькулятор схемы посадки растений
Расчёт расстояния между растениями, количества рассады на грядку и расхода семян. Схемы для овощей и ягод.
Калькулятор щебня и гравия
Щебень для подушки, дорожки или фундамента. Объём в м³, вес в тоннах, количество машин.
Калькулятор расхода дров
Расчёт объёма дров на отопительный сезон. По площади дома, виду древесины и теплопотерям.
Кредитный калькулятор онлайн
Рассчитайте ежемесячный платёж по кредиту, переплату и график погашения. Аннуитетный и дифференцированный платежи.
Калькулятор триатлона: время гонки, питание, зоны, план
Калькулятор для триатлона. Прогноз времени (Sprint/Olympic/70.3/Ironman), калории, тренировочные зоны, питание на гонке, план подготовки.
Генератор Cron-выражений
Визуальный конструктор cron-расписаний с переводом на русский язык. Создайте cron-выражение для планировщика задач Linux, настройте расписание и посмотрите ближайшие запуски.
Калькулятор накопителей энергии
Расчёты систем накопления энергии: аккумуляторы, ГАЭС, маховики, водород, тепловые накопители
Калькулятор расхода ткани на шторы: тюль, портьеры, рулонные
Рассчитайте расход ткани на шторы онлайн. Тюль, портьеры, рулонные и римские шторы. Учёт коэффициента сборки, подгибов, раппорта рисунка и ширины рулона.
Калькулятор интересных фактов
Генератор интересных фактов и занимательных вычислений. Для развлечения и расширения кругозора.
Калькулятор акустики помещения (RT60)
Время реверберации RT60 по формуле Сабина. Подбор акустической обработки для студии и кинотеатра.
Калькулятор CSS единиц (PX, REM, EM, %)
Конвертер пикселей в rem/em и генератор calc(). Удобный инструмент для верстки и адаптивного дизайна.

Лиана Арифметова
Миссия: Демократизировать сложные расчеты. Превратить страх перед числами в ясность и контроль. Девиз: «Любая повторяющаяся задача заслуживает своего калькулятора».
Был ли этот калькулятор полезен?
Отказ от ответственности
Только для информационных целей. Все расчёты, результаты и данные, предоставляемые данным инструментом, носят исключительно ознакомительный и справочный характер. Они не являются профессиональной консультацией — медицинской, юридической, финансовой, инженерной или иной.
Точность результатов. Калькулятор основан на общепринятых формулах и методиках, однако фактические результаты могут отличаться в зависимости от индивидуальных условий, исходных данных и применяемых стандартов. Мы не гарантируем полноту, точность или актуальность приведённых расчётов.
Медицинские, финансовые и профессиональные решения должны приниматься исключительно на основании консультации с квалифицированными специалистами — врачом, финансовым советником, инженером или другим профессионалом в соответствующей области. Не используйте результаты данного инструмента как единственное основание для принятия важных решений.
Ограничение ответственности. Авторы и разработчики сервиса не несут никакой ответственности за прямой или косвенный ущерб, возникший в результате использования данных расчётов. Пользователь принимает на себя всю ответственность за интерпретацию и применение полученных результатов.