Оценка вида распределения
Оценка вида распределения в непараметрическом случае не требуется. Хотя существуют одновыборочные критерии, проверяющие гипотезы о совпадении наблюдаемого распределения с ожидаемым, например, распределением Пуассона, равномерным или экспоненциальным распределением. В случае малых групп (меньше 20-30 пациентов) оценку распределения не проводят.
Описание данных
Описать параметр - указать необходимый и достаточный набор числовых характеристик параметра (переменной) для данной выборки, позволяющий в необходимом объеме восстановить вид распределения описываемого параметра в данной выборке. Использование непараметрических статистических процедур предполагает, что распределение количественных данных или не известно, или не соответствует нормальному. В этом случае для описания не достаточно указать среднее значение (М или μ) и среднеквадратическое отклонение (CKO, S или σ). В таком случае используют несколько различных вариантов меры центральной тенденции и меры рассеяния данных.
Меры центральной тенденции
В параметрическом случае - среднее значение.
В непараметрическом случае:
◊ Мода;
◊ Медиана.
Мода - Мо - значение в выборке, которое встречается наиболее часто. Мод может быть несколько для одной выборки - тогда говорят о мультимодальном распределении. Иногда говорят о локальных модах -наиболее частых значениях признака в некотором диапазоне.
Медиана - Me - такое значение признака в выборке, что ровно половина из элементов выборки больше него, а другая половина меньше него.
В случае нормального распределения мода, медиана и среднее значение совпадают.
Меры рассеяния данных
В параметрическом случае - средне-квадратическое отклонение, дисперсия.
В непараметрическом случае:
• квартили (нижняя, средняя, верхняя),
• интерквантильный размах,
• процентили (5-ый, 15-ый, 87-ый и др.),
• максимум и минимум.
Максимум - наибольшее значение в выборке.
Минимум - наименьшее значение в выборке.
Квартили - значения параметра, разбивающие упорядоченный ряд на 4 равные части. Нижняя или первая квартиль (1Q) отделяет 25% наименьших значений, верхняя или третья квартиль (3Q) отделяет 25% наибольших значений. Средняя квартиль является медианой и разбивает ряд ровно пополам.
Интерквартильный размах (IQR) - разница между верней и нижней квартилью.
Процентили, или центили, - значения отделяющие соответствующий процент наименьших значений признака: 5-тый процентиль отделяет 5% наименьших значений, 85-тый процентиль отделяет 85% наименьших значений (т.е. 15% наибольших).
Взаимоотношение параметрических и непараметрических характеристик
Однозначный переход между параметрическим и непараметрическим описанием данных возможен только в случае нормального распределения. В остальных случаях однозначного соответствия нет. В случае нормального распределения мода (Мо), медиана (Me) и среднее значение (М) совпадают. Нижняя квартиль соответствует М-0,6745*СКО, верхняя квартиль соответствует М+0,6745*СКО.
Запись непараметрической описательной статистики
Необходимый набор описательных статистик определяется исследователем исходя из задач.
Обычно ограничиваются указанием медианы и квартилей в следующий форме:
Me [1Q; 3Q]
Так же довольно часто указывают максимальное и минимальное значение признака.
Например:
«В исследовании приняли участие добровольцы в возрасте от 20 до 45 лет. Медиана возраста составила 32 года».
Доверительный интервал медианы
Как и для среднего, для медианы и квартилей могут быть вычислены доверительные интервалы.
Доверительный интервал - интервал, в который попадает истинное значение измеряемой величины с заданной вероятностью.
Доверительная вероятность - вероятность того, что истинное значение измеряемой величины попадает в данный доверительный интервал (100%*(1 - α)).
Корреляционный анализ
Часто исследователя интересует характеристика тесноты (силы) связи между параметрами, при этом выраженная одним числом. Эта характеристика называется коэффициентом корреляции, обычно её обозначают буквой r.
Свойства коэффициента корреляции
Коэффициент корреляции может принимать значения от -1 до +1. Знак коэффициента корреляции показывает направление связи (прямая или обратная), а абсолютная величина - тесноту связи. Коэффициент, равный -1, определяет столь же жесткую связь, что и равный +1. В отсутствие связи коэффициент корреляции равен нулю. Коэффициент корреляции оценивает только линейную связь.
Коэффициент корреляции Спирмена
Если хотя бы один из двух исследуемых количественных параметра имеют распределение, отличающееся от нормальное, то для описания линейной связи использовать коэффициент корреляции Пирсона уже нельзя и следует воспользоваться ранговым коэффициентом корреляции Спирмена. Коэффициент корреляции Спирмена вычисляется по формуле:
RANGXi - ранг (порядковый номер) значения Xi.
Принято говорить о силе линейной связи параметров при определённых значениях модуля коэффициента корреляции Спирмена.
Коэффициент корреляции Спирмена на письме может обозначаться ρ, R, r.
Сила коэффициента корреляции | |
---|---|
|ρ| | Сила связи |
<0,25 | слабая |
0,25-0,75 | умеренная |
>0,75 | сильная |
Представление результатов корреляционного анализа
Результаты корреляционного анализа приято приводить с указанием значения коэффициента корреляции, числа наблюдений и уровнем р-значения, а также словесной оценки силы связи:
«Между параметрами А и Б обнаружена сильная отрицательная корреляционная связь: R= -0,89 (n=76, р=0,012)».
В данном случае, p-значение проявляется при проверки нулевой гипотезы «R=0», т.е. об отсутствии корреляции, в противовес альтернативной «R≠0».
Большинство программ для статистического анализы выводят эти данные по умолчанию.
Важное замечание о корреляционном анализе
Корреляция лишь статистическое явление, наличие корреляции не означает определённой связанности событий. Возможно:
1. Переменная А влияет на переменную В: чем выше рост человека, тем больше его вес.
2. Переменная В влияет на переменную А.
3. На переменные А и В влияет переменная С: чем старше ребёнок, тем больше его вес и рост
4. Обнаруженные корреляции могут быть случайны и не объяснимы.
U-Критерий Манна-Уитни
Критерий был предложен Фрэнком Уилкоксоном, а затем переработан Х.Б. Манном (Н.В. Mann) и Д.Р. Уитни (D.R. Whitney).
Применимость:
• Не требует наличия нормального распределения параметра в сравниваемых выборках.
• Подходит для сравнения малых выборок: минимальный набор данных - по 3 значения в каждой из выборок или 2 значения в одной выборке и 5 во второй.
• Требуется отсутствие в сравниваемых группах совпадающих значений признака (все числа - разные) или очень малое число таких совпадений.
Принцип использования U-критерия Манна-Уитни
Ряд данных ранжируется без учета отношения к выборке.
Затем для каждой выборки находится сумма рангов Т1 и Т2 Выбирается наибольшее значение Тх. Рассчитывается U-статистика по формуле:
где n1 и n2 - число наблюдений в первой и второй выборке, а Tх - наибольшая из сумм рангов выборки с числом наблюдений nх.
Интерпретация результатов U-критерия Манна-Уитни
Расчётное значение U сравнивают с взятым из таблицы критическим значением Uкp n1,n2,α для соответствующего выбранным уровня значимости α и числа наблюдений n1 , n2.
• Если рассчитанное значение U-статистики равно или больше критического, найденного по таблице, делаем вывод о статистической значимости различий между сравниваемыми выборками.
• Если значение U-статистики меньше табличного, значит различия сравниваемых величин статистически не значимы.
Таблица критических значений U-статистики Манна-Уитни
Табличные значения U-статистики Манна-Уитни можно найти в справочниках и интернет-источниках. На практике сейчас крайне редко используется ручной расчет U-критерия Манна-Уитни, поскольку он реализован во многих статистических пакетов в виде, не требующем обращения к таблицам.
Представление результатов применения U-критерия Манна-Уитни
С помощью U-критерия Манна-Уитни исследователь отвечает на вопрос «Различаются ли статистически значимо значения исследуемого признака в двух группах».
При этом как правило исследователя интересует какое значение принимает параметр в каждой из групп.
При расчете U-статистики исследователь не опирается на значения, т.е. описательную статистику для каждой группы следует формировать дополнительно.
При представлении результатов такого исследования принято указывать:
• Описательную статистику количественного признака для каждой группы (например, в виде Me [1Q; 3Q], n).
• P-значение в виде р<0,05 / р>0,05, если использовались таблицы, или р=0,*** (точное значение), если такую информацию выводит статистический пакет.
Используемые названия U-критерия Манна-Уитни
Русскоязычные
◊ U-критерий Манна-Уитни
◊ критерий Манна-Уитни-Уилкоксона
◊ критерий суммы рангов Уилкоксона
◊ критерий Уилкоксона-Манна-Уитни
Англоязычные
◊ Mann-Whitney-Wilcoxon
◊ Wilcoxon rank-sum test
◊ Wilcoxon-Mann-Whitney test
Аббревиатуры
◊ MWW
◊ WMW
Критерий Уилкоксона (для связанных выборок)
Критерий был впервые предложен в 1945 году американским статистиком и химиком Фрэнком Уилкоксоном, одновременно с критерием для независимых выборок.
Применимость:
◊ Не требует наличия нормального распределения параметра в сравниваемых выборках.
◊ Подходит для сравнения малых выборок: от 5 наблюдений.
◊ Подходит для количественных и порядковых признаков.
◊ Используется только в случае сравнения двух рядов измерений.
Используемые названия:
◊ Критерий Уилкоксона для связных выборок
◊ Критерий Вилкоксона для связных выборок
◊ Т-критерий Уилкоксона для связанных выборок
◊ Wilcoxon signed-rank test
Принцип использования критерия Уилкоксона
Для каждого наблюдения находится разница между значениями парных измерений. Если значение получается нулевым, то наблюдение в дальнейшем не учитывается. По знаку разниц определяется типичный сдвиг: положительный или отрицательный. Ряд полученных значений ранжируется без учета знака (по модулю):
Затем находится сумма рангов нетипичных сдвигов (разниц) Т.
Интерпретация результатов критерия Уилкоксона
Расчётное значение Т сравнивают с взятым из таблицы критическим значением Ткр n,α для соответствующего выбранным уровня значимости α и числа наблюдений n.
◊ Если рассчитанное значение Т-статистики равно или меньше критического, найденного по таблице, делаем вывод о статистической значимости различий между сравниваемыми выборками - преобладает сдвиг в типичную сторону.
◊ Если значение Т-статистики больше табличного, значит различия сравниваемых величин статистически не значимы.
Табличные значения можно найти в справочниках и интернет-источниках.
Но на практике сейчас крайне редко используется ручной расчет, поскольку он реализован во многих статистических пакетов в виде, не требующем обращения к таблицам.
Представление результатов применения критерия Уилкоксона
⛳ Приводят описательную статистику количественного признака для каждой группы, реже - для рассчитанной разницы, в выбранном виде
🔥 Me [1Q; 3Q], n
🔥 Me [1Q; 3Q], min, max, n
⛳ Указывают p-значение в виде р<0,05 / р>0,05 или р=0,*** (точное значение), если такую информацию выводит статистический пакет.
Критерий Краскела-Уоллиса
Критерий Краскела-Уоллиса предназначен для сравнения нескольких групп по количественному признаку вне зависимости от типа его распределения. Критерий Краскела-Уоллиса является многомерным обобщением критерия Уилкоксона-Манна-Уитни (U-критерия Манна-Уитни). Так же как и критерий Манна-Уитни, критерий Краскела-Уоллиса является ранговым.
Названия критерия Краскела-Уоллиса
В русских текстах используется два варианта транслитерации: «Kruskal» записывают как «Краскел» или «Крускал».
Русскоязычные источники могут использовать следующие варианты названия:
• Критерий Краскела-Уоллиса;
• Н-критерий Краскела-Уоллиса;
• односторонний дисперсионный анализ Краскела-Уоллиса;
• тест Крускала-Уоллиса;
Англоязычные:
• Kruskal-Wallis one-way analysis of variance;
• Kruskal-Wallis test.
Принцип использования критерия Краскела-Уоллиса
Ряд данных ранжируется без учета отношения к выборке.
Затем для каждой из k выборок находится сумма рангов R1, R2, ... , Rk. Рассчитывается Н-статистика по формуле:
где ni - число наблюдений каждой выборке, n - общее число наблюдений во всех выборках.
Интерпретация результатов критерия Краскела-Уоллиса
Расчётное значение Н сравнивают с взятым из таблицы критическим значением Н кр n1,n2,...,nk,α для соответствующего выбранным уровням значимости α и числа наблюдений n1, n2,..., nk.
🔥 Если рассчитанное значение Н-статистики равно или больше критического, найденного по таблице, делаем вывод о статистической значимости различий между сравниваемыми выборками.
🔥 Если значение Н-статистики меньше табличного, значит различия сравниваемых величин статистически не значимы.
Таблица критических значений Н-статистики Краскела-Уоллиса
Табличные значения Н-статистики Краскела-Уоллиса можно найти в справочниках и интернет-источниках. На практике сейчас крайне редко используется ручной расчет Н-критерия Краскела-Уоллиса, поскольку он реализован во многих статистических пакетов в виде, не требующем обращения к таблицам.
Представление результатов применения критерия Краскела-Уоллиса
• Приводят описательную статистику количественного признака для каждой группы в выбранном виде
🔥 Me [1Q; 3Q], n
🔥 Me [1Q; 3Q], min, max, n
• Указывают p-значение в виде р<0,05 / р>0,05 или р=0,*** (точное значение), если такую информацию выводит статистический пакет.
Важное замечание о критерии Краскела-Уоллиса
Критерии Краскела-Уоллиса проверяет нулевую гипотезу об отсутствии различий между группами. Альтернативная гипотеза предполагает наличие статистически значимых различий между группами, но не уточняет между какими группами. Принятие альтернативной гипотезы говорит о том, что какие-то различия между группами есть. Для того, чтобы выяснить какие именно группы отличают, нужно проводить попарные сравнения. При попарных сравнениях повышается риск ошибок при отвержении нулевой гипотезы. Для снижения такого риска часто используют поправку Бонферрони: снижение уровня значимости при попарных сравнения кратно числу проводимых сравнений. Например, при попарных сравнениях 3 групп, уровень значимости в соответствии с поправкой Бонферрони следует установить 0,05/3≈0,017.
Критерий Фридмана
Критерий Фридмана предназначен для анализа нескольких повторных измерений количественного признака вне зависимости от типа его распределения.
Нулевая гипотеза: «между полученными в разные моменты времени измерениями имеются лишь случайные различия». Т.е. нулевая гипотеза - гипотеза об отсутствии различий между связанными выборками.
Принцип использования критерия Фридмана
Ряд из с повторных измерений для каждого из n наблюдений ранжируется: каждому значению j-того наблюдения присваивается ранг rij. Затем подсчитывают сумму рангов для каждой выборки (столбца) Ri и следующие величины:
Представление результатов применения критерия Фридмана
Интерпретация:
Расчётное значение S-статистики сравнивают с критическим значением, найденным по таблице в соответствии с уровнем значимости. Если расчётное S больше или равно критическому, делается вывод о наличии статистически значимых различий между сравниваемыми выборками. Если расчётное S меньше критического, то считают, что различия не значимы.
Представление результатов:
🔥 Приводят описательную статистику количественного признака для каждой группы в выбранном виде:
• Me [1Q; 3Q], n или др.
🔥 Указывают P-значение в виде р<0,05 / р>0,05 или р=0,*** (точное значение), если такую информацию выводит статистический пакет.