Способы представления вариационного ряда

Графическое представление вариационных рядов

Для повышения наглядности вариационных рядов, используется их графическое представление. Наиболее распространенными способами графического представления являются гистограмма и полигон частот.

Гистограмма

Гистограмма используется для графического представления распределений непрерывно варьирующих признаков и состоит из примыкающих друг к другу прямоугольников. Основание каждого прямоугольника равно ширине интервала группировки, а высота его такова, что площадь прямоугольника пропорциональна частоте (или относительной частоте) попадания в данный интервал. Если ряд безинтервальный, то ширина всех столбцов выбирается произвольной, но одинаковые.

На графике гистограммы основание прямоугольников откладывается по оси x, а высота — по оси у прямоугольной системы координат.

Рис 7.1. Гистограмма количества нарушений скорости (пример 6.3.)

Рис. 7.2. Гистограмма итогов сдачи экзамена (пример 6.4.)

Полигон частот

Полигон частот образуется ломаной линией, соединяющей точки, соответствующие срединным значениям интервалов группировки и частотам этих интервалов, срединные значения откладываются по оси х, а частоты – по оси у.

Из сравнения двух рассмотренных способов графического представления эмпирических распределений следует, что для получения полигона частот из построенной гистограммы нужно середины вершин прямоугольников, образующих гистограмму, соединить отрезками прямых.

Полигончастот используется для представления распределений как непрерывных, так и дискретных признаков. В случае непрерывного распределения полигон частот является более предпочтительным способом графического представления, чем гистограмма, если график эмпирического распределения описывается плавной зависимостью.

Рис. 7.3. Полигон частот итогов сдачи экзамена (пример 6.4.)

Эмпирическая функция распределения

Эмпирической функцией распределения называется функция F*(х), определяющая для каждого значения х относительную частоту события X 10.

при х 10.

Построим график полученной функции.

Рис. 7.4 График эмпирической функции

Числовые характеристики выборки

Вариационные ряды и графики эмпирических распределений дают наглядное представление о том, как варьирует признак в выборочной совокупности. Но они недостаточны для полной характеристики выборки, поскольку содержат много деталей, охватить которые невозможно без применения обобщающих числовых характеристик.

Числовые характеристики выборки дают количественное представление об эмпирических данных и позволяют сравнивать их между собой.

Характеристики положения

Чаще всего употребляются такие характеристики положения, как среднее арифметическое, медиана и мода.

Среднее арифметическое

Среднее арифметическое, или просто среднее, — одна из основных характеристик выборки.

Среднее арифметическое – такое значение признака, сумма отклонений от которого выборочных значений признака равна нулю (с учетом знака отклонения).

Среднее принято обозначать той же буквой, что и варианты выборки, с той лишь разницей, что над буквой ставится символ усреднения — черта. Например, если обозначить исследуемый признак через X, а его числовые значения — через xi, то среднее арифметическое имеет обозначение .

Среднее арифметическое, как и другие числовые характеристики выборки, может вычисляться как по необработанным первичным данным, так и по результатам группировки этих данных.

Читайте также:  Способ приготовления этого салата

Для несгруппированных данных среднее арифметическое определяется по следующей формуле:

где n — объем выборки;

Если данные сгруппированы, то

где n — объем выборки;

k — число интервалов группировки;

хi — срединное значение i-ого интервала.

Среднее арифметическое – величина того же наименования, что и значения признаков.

Нахождение среднего арифметического непрерывного вариационного ряда осложняется, если крайние интервалы не замкнуты (то есть имеют вид «менее 10» или «более 60»). В этом случае считается, что ширина первого интервала равна ширине второго, а ширина последнего – ширине предпоследнего.

Среднее арифметическое, вычисленное по формуле называют также взвешенным средним, подчеркивая этим, что в формуле xi, суммируются с коэффициентами (весами), равными частотам попадания в интервалы группировки.

Медиана

Медианой (Ме) называется такое значение признака X, когда ровно половина значений экспериментальных данных меньше ее, а вторая половина — больше.

Если данных немного (объем выборки невелик), медиана вычисляется очень просто. Для этого выборку ранжируют, т. е. располагают данные в порядке возрастания или убывания, и в ранжированной выборке, содержащей n членов, ранг R (порядковый номер) медианы определяется как

Пример 7.8. Имеется ранжированная выборка, содержащая нечетное число членов n = 9:

12, 14, 14, 18, 20, 22, 22, 26, 28.

Тогда ранг медианы:

и медиана совпадает с пятым членом ряда: Ме = 20.

Если выборка содержит четное число членов, то медиана не может быть определена столь однозначно.

Пример 7.9. Имеется ранжированная выборка, содержащая 10 членов:

6, 8, 10, 12, 14, 16, 18, 20, 22, 24.

Ранг медианы оказывается равным:

Медианой в этом случае может быть любое число между 14 и 16 (5-м и 6-м членами ряда). Для определенности принято считать в качестве медианы среднее арифметическое этих значений, т. е.:

Если необходимо найти медиану для сгруппированных данных, то поступают следующим образом. Вначале находят интервал группировки, в котором содержится медиана, путем подсчета накопленных частот или накопленных относительных частот.

Медианным будет тот интервал, в котором накопленная частота впервые окажется больше или накопленная относительная частота — больше 0,5. Внутри медианного интервала медиана определяется по следующей формуле:

где — нижняя граница медианного интервала;

hme — ширина медианного интервала;

— накопленная частота интервала, предшествующего медианному,

— частота медианного интервала.

Пример 7.10. Найти медиану для интервального ряда примера 6.3.

Превышение разрешенной скорости движения (км/ч) 20 – 30 30 – 40 40 – 50 50 – 60 больше 60
Количество нарушений

Объем выборки равен п = 50 + 32 + 26 + 11 + 5 = 124.

Найдем медианный интервал – интервал, в котором накопленная частота впервые окажется больше или накопленная относительная частота — больше 0,5.

Так как, накопительная частота второго интервала 50 + 32 = 82 > 62, то следовательно интервал (30; 40) будет медианным и = 30, hme = 40 – 30 = 10, = 50, = 32.

Читайте также:  Способы управления карьерой персонала

Медиана обычно несколько отличается от среднего арифметического. Так бывает всегда, когда имеет место несимметричная форма эмпирического распределения.

Мода

Мода (Мо) представляет собой значение признака, встречающееся в выборке наиболее часто.

Ряд называется унимодальным, если в нем только одно модальное значение и полимодальным, если есть несколько значений признака, которые встречаются одинаково часто. Для полимодального ряда моду не вычисляют.

Для дискретного ряда мода находится по определению.

Интервал группировки с наибольшей частотой называется модальным.

Для определения моды в интервальном ряду используется следующая формула:

где — нижняя граница модального интервала;

h — ширина интервала группировки;

nMo — частота модального интервала;

nMo-1 — частота интервала, предшествующего модальному;

nMo+1 — частота интервала, следующего за модальным.

Характеристики рассеяния

Средние значения не дают полной информации о варьирующем признаке. Нетрудно представить себе два эмпирических распределения, у которых средние одинаковы, но при этом у одного из них значения признака рассеяны в узком диапазоне вокруг среднего, а у другого – в широком. Поэтому наряду со средними значениями вычисляют и характеристики рассеяния выборки. Рассмотрим наиболее употребительные из них.

Размах вариации

Размах вариации – разность между максимальной и минимальной вариантами выборки:

.

Как видим, размах вычисляется очень просто, и в этом его главное и единственное достоинство. Информативность этого показателя невелика. Можно привести очень много распределений, сильно отличающихся по форме, но имеющих одинаковый размах. Размах вариации используется иногда в практических исследованиях при малых (не более 10) объемах выборки, Например, по размаху вариации легко оценить, насколько различаются лучший и худший результаты в группе спортсменов. При больших объемах выборки к его использованию надо откоситься с осторожностью.

Источник

14.Понятие вариационного ряда. Виды вариационных рядов. Правила построения и графического отображения.

Ряд распределения – перечневая таблица, содержащая полный перечень изучаемых единиц с указанием значений изучаемого признака у каждой единицы.

Для удобства проведения анализа единицы упорядочивают либо по возрастанию значений признака, либо по их убыванию. В этом случае ряд распределения называется ранжированием. Однако, если совокупность единиц велика по объему, то форма ряда распределения будет неудобной для проведения анализа. В этом случае единицы совокупности группируют и представляют в виде вариационного ряда. Вариационный ряд (группировка)- таблица, содержащая в подлежащем группы единиц с заданными значениями признака и с указанием в сказуемом числа единиц в каждой группировке(частот), либо числа единиц в % к итогу (частости).

Правила построения вариационного ряда: 1) в интервал нижняя граница включается, а верхняя не включается; 2) если в интервале указаны обе границы, то он называется закрытым.Если указана одна граница-интервал открытый. 3) величина интервала для конкретного вар. ряда является постоянной. 4) для вар. ряда характерно достаточно большое число групп. Наилучшим считается выделение от 4 до 12-15групп. 5)необходима хорошая заполненность каждой группы единицами совокупности, чтобы работал закон больших чисел. 6) распределение частот или частостей по группам должно носить моновершинный характер, т.е. наибольшая частота или частость должна наблюдаться в одной группе и плавно убывать к концам распределения.

Читайте также:  Наиболее распространенный способ отпугивания птиц

Любой интервальный вар. ряд можно привести к виду, схожему с дискретным путем определении середины интервала. Тогда вар. ряду можно дать графическое отображение в виде полигона распределения.

Интервальный ряд распределения отображается в виде гистограммы распределения.S гистограммы = S полигона

15.Показатели размера вариации: порядок их расчета и анализа.

Размеры вариаций оцениваются с помощью абсолютных и относительных показателей вариации.

Абсолют. пок-ли оценивают вариацию в абсолют. выражении, т.е. дают её абсолют. размеры, поэтому они имеют ту же единицу измерения, что и сам варьирующий признак. В силу этой особенности они несравнимы по разным признакам.

К абсолют. пок-лям относятся:1. Размах вариации определяется как разница между max и min значениями признака.

2. Среднее линейное отклонение в своей формуле использует форму средней арифметической величины, причем для ряда распределения, т.е. для негруппированных данных – простую среднюю , а для группированного ряда – взвешенную среднюю .

3. Среднее квадратичное отклонение

Для негруппированных данных

Для группированных данных

Ср. линейное и ср. квадратичное отклонения показывают на какую абсолютную величину в среднем по совокупности индивидуальные значения признака xi отличаются от ср. значения.

Предпочтение отдается ср. квадратич. отклонению, кот. явл. главнейшим пок-лем в статистике.

Ещё одним важным показателем вариации явл. показатель дисперсии (подкоренное выражение).

С целью сопоставимости вариации разных признаков используются относительные пок-ли вариации. В этих пок-лях сопоставляются пок-ли абсолютных размеров вариации со ср. величиной изучаемого варьирующего признака.

Относит. пок-ли вариации говорят о том сколько % от средней величины составляют характеристики абсолютных размеров вариации. Чем больше значение относительных пок-лей вариации, тем сильнее вариация значений признака, тем менее однородны совокупность единиц по данному признаку и тем нетипичнее и ненадежнее является ср. величина признака.

1. Относительный размах вариации

2. Относит. линейное отклонение

3. Коэффициент вариации

Самым важным из относ. пок-лей является коэф-т вариации. По его значению дается оценка степени вариации признака и делается вывод об однородности или неоднородности единиц, и типичности или нетипичности ср. значения признака.

Если , делается вывод о небольшой степени вариации. Говорят об однородности сов-ти единиц по данному признаку, а его ср. значение признается надежным и типичным.

Если , делается вывод о достаточной однородности сов-ти. Однако в этой сов-ти присутствуют единицы с аномальными значениями признака. Такую сов-ть можно привести к однородному виду если из нее изъять указанные единицы с аномальными значениями признака, оставшаяся будет однородной.

Если коэффициент вариации , говорят о завышенной вариации. Сов-ть считается неоднородной, а ср. значение признака не является типичным и надежным.

Тут вы можете оставить комментарий к выбранному абзацу или сообщить об ошибке.

Источник

Оцените статью
Разные способы