- Средняя выборки: генеральная, выборочная
- Генеральная средняя
- Выборочная средняя
- Готовые работы на аналогичную тему
- Примеры задач на нахождение средней выборки
- § 3. Генеральная средняя
- § 4. Выборочная средняя
- Статистические оценки параметров генеральной совокупности
- Определение статистической оценки
- Точечные статистические оценки
- Интервальные оценки
Средняя выборки: генеральная, выборочная
Вы будете перенаправлены на Автор24
Генеральная средняя
Пусть нам дана генеральная совокупность относительно случайной величины $X$. Для начала напомним следующее определение:
Генеральная совокупность — совокупность случайно отобранных объектов данного вида, над которыми проводят наблюдения с целью получения конкретных значений случайной величины, проводимых в неизменных условиях при изучении одной случайной величины данного вида.
Генеральная средняя — среднее арифметическое значений вариант генеральной совокупности.
Пусть значения вариант $x_1,\ x_2,\dots ,x_k$ имеют, соответственно, частоты $n_1,\ n_2,\dots ,n_k$. Тогда генеральная средняя вычисляется по формуле:
Рассмотрим частный случай. Пусть все варианты $x_1,\ x_2,\dots ,x_k$ различны. В этом случае $n_1,\ n_2,\dots ,n_k=1$. Получаем, что в этом случае генеральная средняя вычисляется по формуле:
Выборочная средняя
Пусть нам дана выборочная совокупность относительно случайной величины $X$. Для начала напомним следующее определение:
Выборочная совокупность — часть отобранных объектов из генеральной совокупности.
Выборочная средняя — среднее арифметическое значений вариант выборочной совокупности.
Пусть значения вариант $x_1,\ x_2,\dots ,x_k$ имеют, соответственно, частоты $n_1,\ n_2,\dots ,n_k$. Тогда выборочная средняя вычисляется по формуле:
Рассмотрим частный случай. Пусть все варианты $x_1,\ x_2,\dots ,x_k$ различны. В этом случае $n_1,\ n_2,\dots ,n_k=1$. Получаем, что в этом случае выборочная средняя вычисляется по формуле:
Готовые работы на аналогичную тему
. В случае, когда значение вариант не являются дискретными, а представляют из себя интервалы, то в формулах для вычисления генеральной или выборочной средних значений за значение $x_i$ принимается значение середины интервала, которому принадлежит $x_i.$
Примеры задач на нахождение средней выборки
В магазин завезли 10 видов шоколадных конфет. По ним проведена следующая выборка по цене за килограмм: 70, 65, 97, 83, 120, 107, 77, 88, 100, 86. Построить ряд распределения данной генеральной совокупности и найти её генеральное среднее.
Видим, что все значения вариант различны, поэтому частоты равны единице. Ряд распределения можно записать следующим образом, перечислив значения вариант в порядке возрастания:
Так как наша совокупность является генеральной и все варианты различны, то мы будем пользоваться следующей формулой:
Выборочная совокупность задана следующей таблицей распределения:
Найти среднее выборочное данной совокупности.
Для нахождения значения выборочной средней будем пользоваться следующей формулой:
Обычно, для наглядности и удобности вычислений составляется расчетная таблица, в которую входят необходимые промежуточные вычисления. В нашем случае составим таблицу со следующей «шапкой»:
Внизу таблицы также добавляется строка «итог», в которой подсчитывается сумма по всем значениям столбцов. Проведя необходимые вычисления, получим следующую расчетную таблицу:
Используя формулу, получим:
Проводится социальный опрос среди 100 пенсионеров об уровне их пенсии. Получена следующая таблица распределения результатов опроса (размер пенсии указан в тысячах рублей):
Найти среднее выборочное данной совокупности.
Данная совокупность является выборочной, поэтому будем пользоваться следующей формулой:
Источник
§ 3. Генеральная средняя
Пусть изучается дискретная генеральная совокупность относительно количественного признака X.
Генеральной средней называют среднее арифметическое значений признака генеральной совокупности.
Если все значения x1, х2, …, xN признака генеральной совокупности объема N различны, то
.
,
т. е. генеральная средняя есть средняя взвешенная значений признака с весами, равными соответствующим частотам.
Замечание. Пусть генеральная совокупность объема N содержит объекты с различными значениями признака X, равными x1, х2, …, xN. Представим себе, что из этой совокупности наудачу извлекается один объект. Вероятность того, что будет извлечен объект со значением признака, например x1 очевидно, равна 1/N. С этой же вероятностью может быть извлечен и любой другой объект. Таким образом, величину признака X можно рассматривать как случайную величину, возможные значения которой x1, х2, …, xn имеют одинаковые вероятности, равные 1 /N. Найдем математическое ожидание М(Х):
Итак, если рассматривать обследуемый признак X генеральной совокупности как случайную величину, то математическое ожидание признака равно генеральной средней этого признака:
.
Этот вывод мы получили, считая, что все объекты генеральной совокупности имеют различные значения признака. Такой же итог будет получен, если допустить, что генеральная совокупность содержит по нескольку объектов с одинаковым значением признака.
Обобщая полученный результат на генеральную совокупность с непрерывным распределением признака X, и в этом случае определим генеральную среднюю как математическое ожидание признака:
.
§ 4. Выборочная средняя
Пусть для изучения генеральной совокупности относительно количественного признака X извлечена выборка объема п.
Выборочной средней называют среднее арифметическое значение признака выборочной совокупности.
,
,
т.е. выборочная средняя есть средняя взвешенная значений признака с весами, равными соответствующим частотам.
Замечание. Выборочная средняя, найденная по данным одной выборки, есть, очевидно, определенное число. Если же извлекать другие выборки того же объема из той же генеральной совокупности, то выборочная средняя будет изменяться от выборки к выборке. Таким образом, выборочную среднюю можно рассматривать как случайную величину, а следовательно, можно говорить о распределениях (теоретическом и эмпирическом) выборочной средней и о числовых характеристиках этого распределения (его называют выборочным), в частности о математическом ожидании и дисперсии выборочного распределения.
Заметим, что в теоретических рассуждениях выборочные значения x1, х2, …, xn признака X, полученные в итоге независимых наблюдений, также рассматривают как случайные величины Xl, X2, . Хn, имеющие то же распределение и, следовательно, те же числовые характеристики, которые имеют X.
Источник
Статистические оценки параметров генеральной совокупности
Определение статистической оценки. Точечные статистические оценки: смещенные и несмещенные, эффективные и состоятельные. Интервальные статистические оценки. Точность и надежность оценки; определение доверительного интервала; построение доверительных интервалов для средней при известном и неизвестном среднеквадратическом отклонении.
Определение статистической оценки
Пусть требуется изучить количественный признак генеральной совокупности. Допустим, что из теоретических соображений удалось установить, какое именно распределение имеет признак. Возникает задача оценки параметров, которыми определяется это распределение. Например, если известно, что изучаемый признак распределен в генеральной совокупности по нормальному закону, то необходимо оценить математическое ожидание и среднеквадратическое отклонение, так как эти два параметра полностью определяют нормальное распределение. Если имеются основания считать, что признак имеет распределение Пуассона, то необходимо оценить параметр , которым это распределение определяется. Обычно имеются лишь данные выборки, полученные в результате наблюдений: . Через эти данные и выражают оцениваемый параметр. Рассматривая как значения независимых случайных величин можно сказать, что найти статистическую оценку неизвестного параметра теоретического распределения означает найти функцию от наблюдаемых случайных величин, которая и дает приближенное значение оцениваемого параметра.
Точечные статистические оценки
Статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин. Статистическая оценка неизвестного параметра генеральной совокупности одним числом называется точечной . Рассмотрим следующие точечные оценки : смещенные и несмещенные, эффективные и состоятельные.
Для того чтобы статистические оценки давали хорошие приближения оцениваемых параметров, они должны удовлетворять определенным требованиям. Укажем эти требования. Пусть есть статистическая оценка неизвестного параметра теоретического распределения. Допустим, что по выборке объема найдена оценка . Повторим опыт, т. е. извлечем из генеральной совокупности другую выборку того же объема и по ее данным найдем оценку и т. д. Получим числа , которые будут различаться. Таким образом, оценку можно рассматривать как случайную величину, а числа — как возможные ее значения.
Если оценка дает приближенное значение с избытком, то найденное по данным выборок число будет больше истинного значения . Следовательно, и математическое ожидание (среднее значение) случайной величины будет превышать , то есть \Theta» png;base64,iVBORw0KGgoAAAANSUhEUgAAAGcAAAAXBAMAAADkTUwLAAAAMFBMVEVHcEwAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAlTPQ5AAAAD3RSTlMAwYEpXRBBkaHQCfCx4HH7NQOIAAACB0lEQVQ4y61Tv0sjURD+Nm8TE+IlWRQ5G11SXOveIVikyA+0NieCCh7ZLpXsFsc1V+ihiGCh+AMFEf8GDcJdJ4LXXGEQOwuvOGx1vajNne9mdjch2XCQwle8NzNvvnkz38wDXnCFO3f92JAUo1lrX+k0OeBdWkfCBiJf+heBaH7WQMxs881rF0VXKEud9sFLAxkyfDZxm4NY/Q6IShAzs4lpz5g4J1BonrYBeuIRUGtQ908pwEqw0D0y/uC8ELVSwMi8CfEAsIxrI/Q+QXcZN5VPDVCoRlu2yuKrODmeHQBddJ7nyDJkI8rxkqxgYqsOiv9mihiJt8od1DEHiBEPcpjSs6o+hQvwUF7xsCpUbfmJxUL3A2bVewqsIywVTdOsOz+dlHdObHio8b5DrT/tsLgcesRiFxFQorKkIqXTAPknVA811Cel9EBVtRbRY3RvUV/kFNXWBoK6yyirx4Yo/CFJpCL3CkqUSZZAB9zQ25M20GsGlVjvfmZdF09vME5tSpoucT6FLentuM1xiYsfc5tM/LWxRoDkT+ADmYRT78u6d076RET4gsMjY+CqiGsORK+Ib0XMbNen9qSFPAIsQHzlBksHvWGizGd4+qh8VPfhp5ubC6H9Ws21jhaPETB80zBk3UqWml1GjeAQ9wb0lU7+4Fzg5UonINVuUZVcR9996T+f/yXWPxABhZZDOY0/AAAAAElFTkSuQmCC» style=»vertical-align: middle;»/>. Если дает приближенное значение с недостатком, то .
Использование статистической оценки, математическое ожидание которой не равно оцениваемому параметру, приводит к систематическим ошибкам. Поэтому нужно потребовать, чтобы математическое ожидание оценки было равно оцениваемому параметру. Соблюдение требования устраняет систематические ошибки.
Несмещенной называют статистическую оценку , математическое ожидание которой равно оцениваемому параметру , то есть .
Смещенной называют статистическую оценку , математическое ожидание которой не равно оцениваемому параметру.
Однако ошибочно считать, что несмещенная оценка всегда дает хорошее приближение оцениваемого параметра. Действительно, возможные значения могут быть сильно рассеяны вокруг своего среднего значения, т. е. дисперсия величины может быть значительной. В этом случае найденная по данным одной выборки оценка, например , может оказаться удаленной от своего среднего значения , а значит, и от самого оцениваемого параметра . Приняв в качестве приближенного значения , мы допустили бы ошибку. Если потребовать, чтобы дисперсия величины была малой, то возможность допустить ошибку будет исключена. Поэтому к статистической оценке предъявляются требования эффективности.
Эффективной называют статистическую оценку, которая (при заданном объеме выборки ) имеет наименьшую возможную дисперсию. При рассмотрении выборок большого объема к статистическим оценкам предъявляется требование состоятельности.
Состоятельной называют статистическую оценку, которая при стремится по вероятности к оцениваемому параметру. Например, если дисперсия несмещенной оценки при стремится к нулю, то такая оценка оказывается также состоятельной.
Рассмотрим вопрос о том, какие выборочные характеристики лучше всего в смысле несмещённости, эффективности и состоятельности оценивают генеральную среднюю и дисперсию.
Пусть изучается дискретная генеральная совокупность относительно количественного признака. Генеральной средней называется среднее арифметическое значений признака генеральной совокупности. Она вычисляется по формуле
где — значения признака генеральной совокупности объема ; — соответствующие частоты, причем
Пусть из генеральной совокупности в результате независимых наблюдений над количественным признаком извлечена выборка объема со значениями признака . Выборочной средней называется среднее арифметическое значений признака выборочной совокупности и вычисляется по формуле
где — значения, признака в выборочной совокупности объема ; — соответствующие частоты, причем
Если генеральная средняя неизвестна и требуется оценить ее по данным выборки, то в качестве оценки генеральной средней принимают выборочную среднюю, которая является несмещенной и состоятельной оценкой. Отсюда следует, что если по нескольким выборкам достаточно большого объема из одной и той же генеральной совокупности будут найдены выборочные средние, то они будут приближенно равны между собой. В этом состоит свойство устойчивости выборочных средних .
Если дисперсии двух совокупностей одинаковы, то близость выборочных средних к генеральным не зависит от отношения объема выборки к объему генеральной совокупности. Она зависит- от объема выборки: чем больше объем выборки, тем меньше выборочная средняя отличается от генеральной.
Для того чтобы охарактеризовать рассеяние значений количественного признака генеральной совокупности вокруг своего среднего значения, вводят сводную характеристику — генеральную дисперсию. Генеральной дисперсией называется среднее арифметическое квадратов отклонений значений признака генеральной совокупности от их среднего значения , которое вычисляется по формуле
Для того чтобы охарактеризовать рассеяние наблюденных значений количественного признака выборки вокруг своего среднего значения хв, вводят сводную характеристику — выборочную дисперсию. Выборочной дисперсией называется среднее арифметическое квадратов отклонений наблюденных значений признака от их среднего значения , которое вычисляется по формуле
Кроме дисперсии для характеристики рассеяния значений признака генеральной (выборочной) совокупности вокруг своего среднего значения используют сводную характеристику — среднее квадратическое отклонение. Генеральным средним квадратическим отклонением называют квадратный корень из генеральной дисперсии: . Выборочным средним квадратическим отклонением называют квадратный корень из выборочной дисперсии: .
Пусть из генеральной совокупности в результате независимых наблюдений над количественным признаком извлечена выборка объема . Требуется по данным выборки оценить неизвестную генеральную дисперсию . Если в качестве оценки генеральной дисперсии принять выборочную дисперсию, то эта оценка приведет к систематическим ошибкам, давая заниженное значение генеральной дисперсии. Объясняется это тем, что выборочная дисперсия является смещенной оценкой . Другими словами, математическое ожидание выборочной дисперсии не равно оцениваемой генеральной дисперсии, а равно .
Легко исправить выборочную дисперсию так, чтобы ее математическое ожидание было равно генеральной дисперсии. Для этого нужно умножить на дробь . В результате получим исправленную дисперсию , которая будет несмещенной оценкой генеральной дисперсии:
Интервальные оценки
Наряду с точечным оцениванием, статистическая теория оценивания параметров занимается вопросами интервального оценивания. Задачу интервального оценивания можно сформулировать так: по данным выборки построить числовой интервал, относительно которого с заранее выбранной вероятностью можно сказать, что внутри него находится оцениваемый параметр. Интервальное оценивание особенно необходимо при малом количестве наблюдений, когда точечная оценка малонадежна.
Доверительным интервалом для параметра называется такой интервал, относительно которого с заранее выбранной вероятностью , близкой к единице, можно утверждать, что он содержит неизвестное значение параметра , то есть . Чем меньше для выбранной вероятности число , тем точнее оценка неизвестного параметра . И, наоборот, если это число велико, то оценка, проведенная с помощью данного интервала, малопригодна для практики. Так как концы доверительного интервала зависят от элементов выборки, то значения и могут изменяться от выборки к выборке. Вероятность принято называть доверительной (надежностью). Обычно надежность оценки задается наперед, причем в качестве берут число, близкое к единице. Выбор доверительной вероятности не является математической задачей, а определяется конкретной решаемой проблемой. Наиболее часто задают надежность, равную 0,95; 0,99; 0,999.
Доверительный интервал для генеральной средней при известном значении среднего квадратического отклонения и при условии, что случайная величина (количественный признак ) распределена нормально, задается выражением
где — наперед заданное число, близкое к единице, а значения функции приведены в таблице прил. 2.
Смысл этого соотношения заключается в следующем: с надежностью можно утверждать, что доверительный интервал покрывает неизвестный параметр , точность оценки . Число определяется из равенства , или . По прил. 2 находят аргумент , которому соответствует значение функции Лапласа, равное .
Пример 1. Случайная величина имеет нормальное распределение с известным средним квадратическим отклонением . Найти доверительные интервалы для оценки неизвестной генеральной средней по выборочным средним, если объем выборок и надежность оценки .
Решение. Найдем . Из соотношения получим, что . По прил. 2 находим . Найдем точность оценки . Доверительные интервалы будут таковы: . Например, если , то доверительный интервал имеет следующие доверительные границы: . Таким образом, значения неизвестного параметра , согласующиеся с данными выборки, удовлетворяют неравенству .
Доверительный интервал для генеральной средней нормального распределения признака при неизвестном значении среднего квадратического отклонения задается выражением
Отсюда следует, что с надежностью можно утверждать, что доверительный интервал покрывает неизвестный параметр .
Существуют таблицы (прил. 4), пользуясь которыми, по заданным и находят вероятность и, наоборот, по заданным и находят .
Пример 2. Количественный признак генеральной совокупности распределен нормально. По выборке объема найдены выборочная средняя и исправленное среднеквадратическое отклонение . Оценить неизвестную генеральную среднюю с помощью доверительного интервала с надежностью .
Решение. Найдем . Пользуясь прил. 4 по и находим . Найдем доверительные границы:
Итак, с надежностью неизвестный параметр заключен в доверительном интервале .
Источник