Класс 11

Класс 11Вероятность и статистикаФигуры


Меры центральной тенденции


Меры центральной тенденции — это статистические инструменты, используемые для измерения центрального или типичного поведения набора данных. Эти меры позволяют резюмировать большой набор данных единственным центральным значением, которое представляет всю распределение. Три наиболее распространенные меры центральной тенденции — это среднее, медиана и мода. Каждая из этих мер предоставляет различный тип информации о наборе данных, и их полезность варьируется в зависимости от природы данных.

Значение

Среднее, часто называемое средним арифметическим, это сумма всех значений данных, деленная на количество данных. Оно предоставляет меру центра данных, балансируя отклонения от этого центрального значения. Формула для вычисления среднего:

Среднее (μ) = (ΣX) / N

Где:

  • ΣX — сумма всех значений данных
  • N — количество значений данных

Пример

Рассмотрим набор оценок: 70, 85, 78, 92, 88.

Среднее = (70 + 85 + 78 + 92 + 88) / 5 = 413 / 5 = 82.6

Визуальный пример

70 85 78 92 88 82.6 (среднее)

Здесь оценки показаны в виде линий, и среднее отмечено красным кругом на значении 82.6 на числовой линии.

Медиана

Медиана — это среднее значение в наборе данных, когда они расположены в порядке возрастания или убывания. Когда количество наблюдений (N) нечетное, это среднее значение. Если N четное, медиана — это среднее значение двух средних чисел. Когда N нечетное, формула для медианы следующая:

Медиана = X(N+1)/2

Для четного количества наблюдений:

Медиана = (X(N/2) + X(N/2 + 1)) / 2

Пример

Рассмотрим следующий список возрастов: 22, 27, 25, 24, 23.

Сначала расположите их в порядке: 22, 23, 24, 25, 27. Среднее значение или Медиана = 24.

Предположим, что список расширен до 22, 27, 25, 24, 23, 30.

В последовательности: 22, 23, 24, 25, 27, 30.

Медиана = (24 + 25) / 2 = 24.5

Визуальный пример

22 23 24 (медиана) 25 27

Для первоначального списка с нечетным количеством членов медиану символизирует третья точка.

Мода

Мода — это значение, которое встречается наиболее часто в наборе данных. Если число не повторяется, набор данных не имеет моды. Набор может иметь одну моду (унимодальный), две моды (бимодальный) или более двух мод (мультимодальный).

Пример

Рассмотрим набор данных: 2, 4, 4, 6, 8.

Его мода 4, так как оно встречается дважды чаще, чем любое другое число.

Визуальный пример

2 4(мода) 4(мода) 6 8

Особенности мер центральной тенденции

Среднее

  • Чувствительно к экстремальным значениям или исключениям.
  • Лучше всего подходит для симметричных распределений без выбросов.
  • Часто это представляет собой 'точку равновесия' набора данных.

Медиана

  • Устойчива к выбросам.
  • Полезна для скошенных распределений.
  • Центральное значение, только когда данные являются порядковыми.

Мода

  • Может использоваться с категориальными данными.
  • Указывает на наиболее распространенное значение в наборе данных.
  • Нечувствительна к внешним элементам.

Какое решение следует принять?

Выбор правильной меры центральной тенденции в значительной степени зависит от характера набора данных и исследовательского вопроса. Вот некоторые общие рекомендации:

  • Используйте среднее для данных, которые симметрично распределены без выбросов, так как оно учитывает все точки данных.
  • Если данные скошены или содержат выбросы, выберите медиану для лучшего представления центрального значения.
  • Рассмотрите моду, когда необходимо определить наиболее распространенный диапазон или оценку в распределении.

Заключение

Меры центральной тенденции являются фундаментальными концепциями в статистике, которые помогают описать набор данных в целом и позволяют производить сравнения между различными наборами данных. Понимая среднее, медиану и моду, можно эффективно анализировать данные и предавать результаты значимым образом. Независимо от того, работаете ли вы с большими наборами данных в бизнес-анализе или с меньшими наборами в академических исследованиях, важно понимать эти концепции. Как всегда, правильный выбор меры зависит от контекста и специфической природы вовлеченных данных.


Класс 11 → 6.4.1


U
username
0%
завершено в Класс 11


комментарии