Длительность лечения 10 больных пневмонией школьников (в днях): 23; 24; 21; 22; 21; 23; 23; 22; 24; 14. Выполните статистическую обработку данных по следующей схеме:
1. Представьте выборку в виде вариационного ряда.
2. Определите моду, медиану и размах.
3. Постройте дискретный статистический ряд частот и относительных частот.
4. Постройте полигон относительных частот.
5. Найдите числовые характеристики статистического распределения: выборочное среднее, выборочную дисперсию, среднее квадратическое отклонение, коэффициент вариации.
1. Представление выборки в виде вариационного ряда:
Длительность лечения больных пневмонией: 14, 21, 21, 22, 22, 23, 23, 23, 24, 24.
2. Определение моды, медианы и размаха:
Мода – значение, которое встречается наиболее часто. В данной выборке наиболее часто встречается значение 23, поэтому мода равна 23.
Медиана – среднее значение двух средних вариантов. Для нашей выборки, отсортированной по возрастанию, медиана равна среднему между 22 и 23, то есть (22+23)/2 = 22.5.
Размах – разница между наибольшим и наименьшим значениями. В данном случае размах равен 24 -14 = 10.
3. Построение дискретного статистического ряда частот и относительных частот:
Частота – количество повторений каждого значения. Для нашей выборки получаем следующие значения:
14 (1), 21 (2), 22 (2), 23 (3), 24 (2), где числа в скобках обозначают частоту каждого значения.
Относительная частота – отношение частоты каждого значения к общему количеству наблюдений (в нашем случае 10). Вычислим относительные частоты:
Для 14: 1 / 10 = 0.1
Для 21: 2 / 10 = 0.2
Для 22: 2 / 10 = 0.2
Для 23: 3 / 10 = 0.3
Для 24: 2 / 10 = 0.2
4. Построение полигона относительных частот:
Для построения полигона относительных частот необходимо использовать координатную плоскость, где по оси абсцисс откладываются значения, а по оси ординат – относительные частоты. На графике мы будем иметь следующие точки:
(14, 0.1), (21, 0.2), (22, 0.2), (23, 0.3), (24, 0.2).
Соединяем эти точки ломаной линией и получаем полигон относительных частот.
5. Вычисление числовых характеристик статистического распределения:
Выборочное среднее – среднее арифметическое значений выборки. Для нашей выборки:
(14 + 21 + 21 + 22 + 22 + 23 + 23 + 23 + 24 + 24) / 10 = 217 / 10 = 21.7.
Выборочная дисперсия – мера разброса значений выборки относительно их среднего значения. Вычисляется по формуле:
D = ((x1 - Х)^2 + (x2 - Х)^2 + ... + (xn - Х)^2) / (n - 1),
где xi – каждое значение выборки, Х – выборочное среднее, n – количество наблюдений.
В нашем случае:
D = ((14 - 21.7)^2 + (21 - 21.7)^2 + (21 - 21.7)^2 + (22 - 21.7)^2 + (22 - 21.7)^2 + (23 - 21.7)^2 + (23 - 21.7)^2 + (23 - 21.7)^2 + (24 - 21.7)^2 + (24 - 21.7)^2) / (10 - 1)
= (49.21 + 0.49 + 0.49 + 0.09 + 0.09 + 1.69 + 1.69 + 1.69 + 5.29 + 5.29) / 9
= 13.82 / 9 = 1.53 (округленно до двух знаков после запятой).
Среднее квадратическое отклонение – корень из дисперсии. В нашем случае:
√1.53 ≈ 1.24 (округленно до двух знаков после запятой).
Коэффициент вариации – отношение среднего квадратического отклонения к выборочному среднему, выраженное в процентах. В нашем случае:
(1.24 / 21.7) * 100 ≈ 5.71% (округленно до двух знаков после запятой).
Таким образом, проведя статистическую обработку данных по заданной схеме, мы получили все необходимые числовые характеристики и построили графическую и дискретную статистическую информацию по длительности лечения больных пневмонией.