Составить закон распределения выборки тремя способами

Выборка, закон распределения выборки

При изучении качественного и количественного признака, характеризующего множество некоторых однородных элементов, не всегда имеется возможность исследовать каждый из них. Поэтому в целях получения информации об этом множестве исследуют только некоторую небольшую часть ее элементов, отобранных совершенно случайно. Практика подтверждает, что выводы, сделанные в результате анализа этой части элементов, бывают достаточно объективными и для всего изучаемого множества.

Множество всех элементов, подлежащих изучению, называют генеральной совокупностью. В отличие от нее выборка – конечная совокупность элементов, отбираемых из генеральной совокупности, для статистического вывода о свойствах генеральной совокупности на основании свойств отобранных элементов.

Любое статистическое исследование всегда связано с производством выборки. Выборка должна быть представительной, т.е. такой, чтобы любой элемент генеральной совокупности мог попасть в нее с вероятностью, не зависящей от характеристик подлежащих измерению.

Число элементов генеральной совокупности (выборки) называют ее объемом.

Пример 1.Из партии, содержащей 10000 деталей, отобрали случайным образом для проверки 80 деталей.

Объем генеральной совокупности в данном примере равен 10000, а объем выборки – 80.

Очевидно, что чем больше объем выборки, тем более полное представление можно получить о генеральной совокупности.

Исследование выборки сводится к отысканию ее статистик (функций выборки), к которым относят: вариационный ряд, статистическое распределение выборки, эмпирическую функцию распределения, гистограмму, среднее арифметическое результатов наблюдений и т. п.Статистики, используемые для приближенной оценки параметров генеральной совокупности, называют также статистическими оценками.

Статистическое распределение выборки отражает соответствие между наблюдаемыми значениями и их частотами или относительными частотами.

Пусть из генеральной совокупности извлечена выборка объема n, причем наблюдалось раз, раз, …, , где .

Наблюдаемые значения называют вариантами, последовательность же вариантов, расположенных в возрастающем порядке, — вариационным рядом.

Число , показывающее, сколько раз встречается вариант в выборке, называют частотой варианта.

Отношение частоты варианта к объему выборки n называют относительной частотой: .

С учетом этих определений под статистическим распределением выборки понимают перечень вариант и соответствующих им частот или относительных частот .

Пример 2Задано статистическое распределениечастот (Таблица 5.1):

Объем выборки n=10. Находим относительные частоты:

и составляем статистическое распределение относительных частот (таблица 5.2):

0.1 0.3 0.6

В целях наглядности соответствия между наблюдаемыми вариантами и частотами или относительными частотами распределение выборки изображают графически.

Для этого точки последовательно соединяют отрезками прямой. Получающаяся при этом ломаная линия называется полигоном частот; если же последовательно соединить отрезками прямой точки , то – полигоном относительных частот.

Эмпирическую функцию распределения также как статистическое распределение выборки и полигон применяют для изображения дискретного вариационного ряда. Эмпирической функцией распределения называют отношение числа вариант, значения которых меньше некоторого фиксированного значения варианта, к объему выборки, т.е.

,

где — число вариант, значения которых меньше некоторого фиксированного значения варианта.

Пусть произведено n независимых опытов и по данным выборки сформирован вариационный ряд . Для построения графика эмпирической функции распределения определяют ее значения в точках следующим образом. .

Рис.5.1 – График эмпирической функции распределения

График эмпирической функции распределения (рис.5.1) является случайным. Для уменьшения случайности функции график сглаживают. По этому графику приближенно определяют вид истинной функции распределения случайной величины.

Гистограмма частот или относительных частот. Если выборочные данные относятся к непрерывной случайной величине, то интервал, в котором заключены все наблюдаемые значения, разбивают на частичные интервалы длиной h и находят для каждого частичного интервала сумму частот вариант , попавших в i – й интервал.

Читайте также:  Гипсокартон способы монтажа потолка

Затем строят ступенчатую фигуру, состоящую из прямоугольников, основаниями которых являются частичные интервалы длиной и высотой, равной отношению или .

Отношение называют плотностью частоты, а отношение называют плотностью относительной частоты, поэтому и, построенная таким образом, ступенчатая фигура носит название гистограммы частот или гистограммы относительных частот.

Для построения гистограммы частот или относительных частот (рис.5.2) по статистическому распределению выборки необходимо составить таблицу 5.3, в которой отобразить номера и положение частичных интервалов, суммы частот вариант, плотности частот и относительных частот в этих частичных интервалах.

Номер частичного интервала Частичный интервал Сумма частот вариант Плотность частот Плотность относительных частот
1 – 5 2.5 0.025
5 – 9 0.05
9 – 13 12.5 0.125
13 – 17 0.03
17 – 21 0.02

Рисунок 5.2 – Гистограмма частот (а) и относительных частот (б)

Обе гистограммы (рис.5.2) по форме одинаковы и отличаются лишь масштабом по оси ординат. Площадь гистограммы относительных частот, как и площадь плотности распределения случайной величины, равна единице, что позволяет определять вероятность попадания случайной величины в заданный интервал путем вычисления площади части гистограммы, ограниченной этим интервалом.

Источник

18.6.2. Статистическое распределение выборки

Пусть из генеральной совокупности извлечена выборка объ­ема П, в которой значение X1 некоторого исследуемого призна­ка Х наблюдалось П1 раз, значение X2 — п2 раз, . значение XKNk раз. Значения Xi называются Вариантами, а их после­довательность, записанная в возрастающем порядке,— Вариационным рядом. Числа Ni называются Частотами, а их отно­шения к объему выборки

Относительными частотами. При этом Ni = П. Модой Мo называется варианта, имеющая наибольшую частоту. Ме­дианой те называется варианта, которая делит вариационный ряд на две части с одинаковым числом вариант в каждой. Если число вариант нечетно, т. е. K = 2L + 1, то Me = Xl+1; если же число вариант четно (k = 2L), То те = (Xl + Xl+1)/2. Разма­хом варьирования называется разность между максимальной и минимальной вариантами или длина интервала, которому принадлежат все варианты выборки:

Перечень вариант и соответствующих им частот называ­ется Статистическим распределением выборки. Здесь имеет­ся аналогия с законом распределения случайной величины: в теории вероятностей — это соответствие между возможными значениями случайной величины и их вероятностями, а в математической статистике — это соответствие между наблюда­емыми вариантами и их частотами (относительными частота­ми). Нетрудно видеть, что сумма относительных частот равна единице: Wi = 1.

Пример 2. Выборка задана в виде распределения частот:

Найти распределение относительных частот и основные харак­теристики вариационного ряда.

Решение. Найдем объем выборки: П = 2 + 4 + 5 + 6 + 3 = 20. Относительные частоты соответственно равны W1 = 2/20 = 0,1; W2 = 4/20 = 0,2; W3 = 5/20 = 0,25; W4 = 6/20 = 0,3; W5 = 3/20 = 0,15. Контроль: 0,1 + 0,2 + 0,25 + 0,3 + 0,15 = 1. Искомое распределение относительных частот имеет вид

Мода этого вариационного ряда равна 12. Число вариант в дан­ном случае нечетно: K = 2 ∙ 2 + 1, поэтому медиана Me = X3 = 8. Размах варьирования, согласно формуле (18.48), R = 17 – 4 = 13.

Источник

Законы распределения дискретных случайных величин

Можно выделить наиболее часто встречающиеся законы распределения дискретных случайных величин:

  • Биномиальный закон распределения
  • Пуассоновский закон распределения
  • Геометрический закон распределения
  • Гипергеометрический закон распределения

Для данных распределений дискретных случайных величин расчет вероятностей их значений, а также числовых характеристик (математическое ожидание, дисперсия, и т.д.) производится по определенных «формулам». Поэтому очень важно знать данные типы распределений и их основные свойства.

Читайте также:  Как вылечить грибок ногтей народными способом

1. Биномиальный закон распределения.

Дискретная случайная величина $X$ подчинена биномиальному закону распределения вероятностей, если она принимает значения $0,\ 1,\ 2,\ \dots ,\ n$ с вероятностями $P\left(X=k\right)=C^k_n\cdot p^k\cdot <\left(1-p\right)>^$. Фактически, случайная величина $X$ — это число появлений события $A$ в $n$ независимых испытаний Бернулли. Закон распределения вероятностей случайной величины $X$:

$\begin<|c|c|>
\hline
X_i & 0 & 1 & \dots & n \\
\hline
p_i & P_n\left(0\right) & P_n\left(1\right) & \dots & P_n\left(n\right) \\
\hline
\end$

Для такой случайной величины математическое ожидание $M\left(X\right)=np$, дисперсия $D\left(X\right)=np\left(1-p\right)$.

Пример. В семье двое детей. Считая вероятности рождения мальчика и девочки равными $0,5$, найти закон распределения случайной величины $\xi $ — числа мальчиков в семье.

Пусть случайная величина $\xi $ — число мальчиков в семье. Значения, которые может принимать $\xi :\ 0,\ 1,\ 2$. Вероятности этих значений можно найти по формуле $P\left(\xi =k\right)=C^k_n\cdot p^k\cdot <\left(1-p\right)>^$, где $n=2$ — число независимых испытаний, $p=0,5$ — вероятность появления события в серии из $n$ испытаний. Получаем:

Тогда закон распределения случайной величины $\xi $ есть соответствие между значениями $0,\ 1,\ 2$ и их вероятностями, то есть:

Сумма вероятностей в законе распределения должна быть равна $1$, то есть $\sum _^P(\xi _<<\rm i>> )=0,25+0,5+0,25=1 $.

Математическое ожидание $M\left(\xi \right)=np=2\cdot 0,5=1$, дисперсия $D\left(\xi \right)=np\left(1-p\right)=2\cdot 0,5\cdot 0,5=0,5$, среднее квадратическое отклонение $\sigma \left(\xi \right)=\sqrt=\sqrt<0,5>\approx 0,707$.

2. Закон распределения Пуассона.

Если дискретная случайная величина $X$ может принимать только целые неотрицательные значения $0,\ 1,\ 2,\ \dots ,\ n$ с вероятностями $P\left(X=k\right)=<<<\lambda >^k>\over >\cdot e^<-\lambda >$, то говорят, что она подчинена закону распределения Пуассона с параметром $\lambda $. Для такой случайной величины математическое ожидание и дисперсия равны между собой и равны параметру $\lambda $, то есть $M\left(X\right)=D\left(X\right)=\lambda $.

Замечание. Особенность этого распределения заключается в том, что мы на основании опытных данных находим оценки $M\left(X\right),\ D\left(X\right)$, если полученные оценки близки между собой, то у нас есть основание утверждать, что случайная величина подчинена закону распределения Пуассона.

Пример. Примерами случайных величин, подчиненных закону распределения Пуассона, могут быть: число автомашин, которые будут обслужены завтра автозаправочной станцией; число бракованных изделий в произведенной продукции.

Пример. Завод отправил на базу $500$ изделий. Вероятность повреждения изделия в пути равна $0,002$. Найти закон распределения случайной величины $X$, равной числу поврежденных изделий; чему равно $M\left(X\right),\ D\left(X\right)$.

Пусть дискретная случайная величина $X$ — число поврежденных изделий. Такая случайная величина подчинена закону распределения Пуассона с параметром $\lambda =np=500\cdot 0,002=1$. Вероятности значений равны $P\left(X=k\right)=<<<\lambda >^k>\over >\cdot e^<-\lambda >$. Очевидно, что все вероятности всех значений $X=0,\ 1,\ \dots ,\ 500$ перечислить невозможно, поэтому мы ограничимся лишь первыми несколькими значениями.

Закон распределения случайной величины $X$:

Для такой случайной величины математическое ожидание и дисперсия равным между собой и равны параметру $\lambda $, то есть $M\left(X\right)=D\left(X\right)=\lambda =1$.

3. Геометрический закон распределения.

Если дискретная случайная величина $X$ может принимать только натуральные значения $1,\ 2,\ \dots ,\ n$ с вероятностями $P\left(X=k\right)=p<\left(1-p\right)>^,\ k=1,\ 2,\ 3,\ \dots $, то говорят, что такая случайная величина $X$ подчинена геометрическому закону распределения вероятностей. Фактически, геометрическое распределения представляется собой испытания Бернулли до первого успеха.

Читайте также:  Ректальный способ введения перекиси водорода по неумывакину

Пример. Примерами случайных величин, имеющих геометрическое распределение, могут быть: число выстрелов до первого попадания в цель; число испытаний прибора до первого отказа; число бросаний монеты до первого выпадения орла и т.д.

Математическое ожидание и дисперсия случайной величины, подчиненной геометрическому распределению, соответственно равны $M\left(X\right)=1/p$, $D\left(X\right)=\left(1-p\right)/p^2$.

Пример. На пути движения рыбы к месту нереста находится $4$ шлюза. Вероятность прохода рыбы через каждый шлюз $p=3/5$. Построить ряд распределения случайной величины $X$ — число шлюзов, пройденных рыбой до первого задержания у шлюза. Найти $M\left(X\right),\ D\left(X\right),\ \sigma \left(X\right)$.

Пусть случайная величина $X$ — число шлюзов, пройденных рыбой до первого задержания у шлюза. Такая случайная величина подчинена геометрическому закону распределения вероятностей. Значения, которые может принимать случайная величина $X:$ 1, 2, 3, 4. Вероятности этих значений вычисляются по формуле: $P\left(X=k\right)=pq^$, где: $p=2/5$ — вероятность задержания рыбы через шлюз, $q=1-p=3/5$ — вероятность прохода рыбы через шлюз, $k=1,\ 2,\ 3,\ 4$.

Тогда ряд распределения случайной величины $X$:

$\begin<|c|c|>
\hline
X_i & 1 & 2 & 3 & 4 \\
\hline
P\left(X_i\right) & 0,4 & 0,24 & 0,144 & 0,216 \\
\hline
\end$

$M\left(X\right)=\sum^n_=1\cdot 0,4+2\cdot 0,24+3\cdot 0,144+4\cdot 0,216=2,176.$

Среднее квадратическое отклонение:

4. Гипергеометрический закон распределения.

Если $N$ объектов, среди которых $m$ объектов обладают заданным свойством. Случайных образом без возвращения извлекают $n$ объектов, среди которых оказалось $k$ объектов, обладающих заданным свойством. Гипергеометрическое распределение дает возможность оценить вероятность того, что ровно $k$ объектов в выборке обладают заданным свойством. Пусть случайная величина $X$ — число объектов в выборке, обладающих заданным свойством. Тогда вероятности значений случайной величины $X$:

Замечание. Статистическая функция ГИПЕРГЕОМЕТ мастера функций $f_x$ пакета Excel дает возможность определить вероятность того, что определенное количество испытаний будет успешным.

$f_x\to $ статистические $\to $ ГИПЕРГЕОМЕТ $\to $ ОК. Появится диалоговое окно, которое нужно заполнить. В графе Число_успехов_в_выборке указываем значение $k$. Размер_выборки равен $n$. В графе Число_успехов_в_совокупности указываем значение $m$. Размер_совокупности равен $N$.

Математическое ожидание и дисперсия дискретной случайной величины $X$, подчиненной геометрическому закону распределения, соответственно равны $M\left(X\right)=nm/N$, $D\left(X\right)=<\over >\right)\left(1-<\over >\right)>\over >$.

Пример. В кредитном отделе банка работают 5 специалистов с высшим финансовым образованием и 3 специалиста с высшим юридическим образованием. Руководство банка решило направить 3 специалистов Для повышения квалификации, отбирая их в случайном порядке.

а) Составьте ряд распределения числа специалистов с высшим финансовым образованием, которые могут быть направлены на повышение квалификации;

б) Найдите числовые характеристики этого распределения.

Пусть случайная величина $X$ — число специалистов с высшим финансовым образованием среди трех отобранных. Значения, которые может принимать $X:0,\ 1,\ 2,\ 3$. Данная случайная величина $X$ распределена по гипергеометрическому распределению с параметрами: $N=8$ — размер совокупности, $m=5$ — число успехов в совокупности, $n=3$ — размер выборки, $k=0,\ 1,\ 2,\ 3$ — число успехов в выборке. Тогда вероятности $P\left(X=k\right)$ можно рассчитать по формуле: $P(X=k)=^ \cdot C_^ \over C_^ > $. Имеем:

Тогда ряд распределения случайной величины $X$:

$\begin<|c|c|>
\hline
X_i & 0 & 1 & 2 & 3 \\
\hline
p_i & 0,018 & 0,268 & 0,536 & 0,179 \\
\hline
\end$

Рассчитаем числовые характеристики случайной величины $X$ по общим формулам гипергеометрического распределения.

Источник

Оцените статью
Разные способы