Входе социологических исследований, касающихся отношения к реформе медицинского образования, проведенных в пермском крае и нижегородской области были получены следующие результаты: субъект федерации доволен недоволен пермский край 21 115 нижегородская область 11 165 по имеющимся данным построить таблицу сопряженности и по ней 1) оценить тесноту связи между признаками; 2) при уровне значимости а(альфа)=0,05 проверить нулевую гипотезу о независимости исследуемых признаков.
Довольны Недовольны
Пермский край 21 115 ?
Нижегородская область 11 165 ?
Из условия задачи видно, что количество недовольных в пермском крае не указано. Поэтому, чтобы найти недостающее значение, нужно вычислить разницу между общим количеством субъектов федерации и количеством довольных субъектов федерации:
Количество недовольных в пермском крае = Общее количество субъектов федерации - Количество довольных в пермском крае
= 21 115 + ? - 21 115
Так как нам также дано общее количество субъектов федерации в нижегородской области, мы можем рассчитать количество недовольных субъектов федерации в этом регионе:
Количество недовольных в нижегородской области = Общее количество субъектов федерации - Количество довольных в нижегородской области
= 11 165 + ? - 11 165
Теперь, когда у нас есть все данные, мы можем создать полную таблицу сопряженности:
Довольны Недовольны
Пермский край 21 115 ?
Нижегородская область 11 165 ?
Для оценки тесноты связи между признаками можно использовать коэффициент V Крамера. Данный коэффициент представляет собой меру ассоциативной связи между признаками и принимает значения от 0 до 1. Чем ближе значение V Крамера к 1, тем сильнее связь между признаками.
Формула для вычисления V Крамера для таблицы сопряженности размером 2x2 следующая:
V Крамера = корень из (χ^2 / (n * (min(k, r) - 1)))
где
χ^2 - хи-квадрат статистика (вычисляется далее),
n - общее количество наблюдений (сумма всех ячеек в таблице сопряженности),
k - количество строк в таблице,
r - количество столбцов в таблице.
Давайте продолжим решение задачи и выполним расчеты. Добавим в таблицу сопряженности количества недовольных субъектов федерации:
Довольны Недовольны
Пермский край 21 115 ?
Нижегородская область 11 165 ?
Теперь у нас есть два наблюдения в каждой ячейке таблицы.
Общее количество наблюдений:
n = 21 115 + ? + 11 165 + ? = 32 280 + 2?
Количество строк в таблице:
k = 2
Количество столбцов в таблице:
r = 2
Теперь мы можем рассчитать хи-квадрат статистику (χ^2). Формула для ее вычисления для таблицы сопряженности размером 2x2 следующая:
χ^2 = n * [(ад - ед)^2 / ед + (ад - ен)^2 / ен]
где
ад - наблюдаемое количество в ячейке (actual),
ед - ожидаемое количество в ячейке при независимости признаков (expected),
ен - ожидаемое количество в ячейке при независимости признаков (expected).
Для начала, нам нужно найти ожидаемые значения, используя следующую формулу:
ожидаемое количество = (сумма по строке * сумма по столбцу) / общее количество наблюдений
Рассчитаем ожидаемые значения для каждой ячейки таблицы:
Если мы предполагаем, что признаки независимы, то ожидаемое количество в ячейке "Довольны" и "Пермский край" будет:
ожидаемое количество = (сумма по строке * сумма по столбцу) / общее количество наблюдений
= (21115 * (21115 + ?)) / (32280 + 2?)
= (21115 * 21115 + 21115 * ?) / (32280 + 2?)
Аналогично, ожидаемое количество в ячейке "Недовольны" и "Пермский край" будет:
ожидаемое количество = (сумма по строке * сумма по столбцу) / общее количество наблюдений
= (ед - ен) + ен
= (21115 + ?) - (21115 + ?)
= ?
Аналогично, ожидаемое количество в ячейке "Довольны" и "Нижегородская область" будет:
ожидаемое количество = ?
Аналогично, ожидаемое количество в ячейке "Недовольны" и "Нижегородская область" будет:
ожидаемое количество = ?
Подставим ожидаемые значения в формулу для χ^2 и выполним вычисления:
χ^2 = n * [(ад - ед)^2 / ед + (ад - ен)^2 / ен]
= (32280 + 2?) * [((21115 - ожидаемое количество в ячейке "Довольны" и "Пермский край")^2 / ожидаемое количество в ячейке "Довольны" и "Пермский край") + (? - ожидаемое количество в ячейке "Недовольны" и "Пермский край")^2 / ожидаемое количество в ячейке "Недовольны" и "Пермский край") + ((21115 - ожидаемое количество в ячейке "Довольны" и "Нижегородская область")^2 / ожидаемое количество в ячейке "Довольны" и "Нижегородская область") + (? - ожидаемое количество в ячейке "Недовольны" и "Нижегородская область")^2 / ожидаемое количество в ячейке "Недовольны" и "Нижегородская область")]
Теперь, когда у нас есть значение хи-квадрат статистики (χ^2), а также значения для n, k и r, мы можем рассчитать коэффициент V Крамера:
V Крамера = корень из (χ^2 / (n * (min(k, r) - 1)))
Подставим значения и выполним вычисления:
V Крамера = корень из (χ^2 / (32280 + 2?))