√ ∫ , является следующее условие (Линдеберга):
∑ ∫| | (7.3) Примечание. Условие выполняется, в частности, если все Х имеют оди- наковое распределение, у которого первый и второй моменты конечны.
Условие (7.3) означает, что отдельные слагаемые
из которых, согласно формуле (7.2), состоит , равномерно малы. В этом случае смысл центральной предельной теоремы состоит в следующем:
если случайную величину можно представить как сумму большого числа не зависящих друг от друга слагаемых, каждое из которых вносит в сумму лишь незначительный вклад, то эта сумма распределена приблизительно нормально.
Пример 7.1. Пусть проводится измерение и Х - случайная ошибка изме- рения. Случайная величина Х появляется в результате аддитивного наложения большого числа не зависящих друг от друга факторов, порождающих ошибки;
каждый из этих факторов оказывает на ошибку малое влияние. Таким обра- зом, величину Х можно считать распределенной нормально.
Пример 7.2. Пусть Х - длина березового листка, случайно выбранного из некоторого множества сорванных листков. Тогда Х есть случайная величина, получающаяся наложением многих малых, не зависящих друг от друга факто- ров. Поэтому для Х может быть принято нормальное распределение.
Предметом изучения математической статистики являются законы и за- кономерности, обоснованные теорией вероятностей. Математическая стати- стика делает выводы о признаках или виде распределения случайных величин по совокупности наблюдений над ними. На практике экономически не выгод- но производить обследование всей совокупности, если по результатам изуче- ния сравнительно небольшой ее части можно получить с достаточной для практики достоверностью необходимую информацию о всей совокупности.
Такой метод исследования называется выборочным.
Задачи математической статистики состоят в том, чтобы на основании знания некоторых свойств подмножества элементов, взятых из некоторого множества, сделать утверждения о свойствах этого множества, называемого генеральной совокупностью. В генеральной совокупности нас обычно интере- сует некоторый признак, который обусловлен случайностью и может иметь качественный или количественный характер.
Пример 8.1. Завод производит станки. Множество всех станков, произ- веденных при определенных, остающихся неизменными производственных условиях, образует генеральную совокупность. Если интересующим призна- ком является, например, размер станка, то этот признак имеет количествен- ный характер.
Пример 8.2. Автомат производит детали. Множество всех деталей, про- изведенных при некоторых, остающихся неизменными условиях, составляет генеральную совокупность. Здесь качественным признаком является признак:
деталь – стандартная или деталь - бракованная.
Вся подлежащая изучению совокупность объектов называется генераль- ной совокупностью. Та часть объектов, которая исследуется, называется вы- борочной совокупностью или выборкой. Необходимый параметр некоторой генеральной совокупности может быть представлен в математической модели некоторой случайной величиной Х.
Под случайной выборкой объема n понимается выбор n объектов из ге- неральной совокупности, причем выбор каждого объекта производится неза- висимо один от другого. Результатом случайной выборки объема n является совокупность значений признака.
Пусть имеется генеральная совокупность, в которой признак Х имеет распределение , тогда n-мерный случайный вектор , в кото- ром величины независимы друг от друга и все имеют распределение , называется выборкой объема n:
∑
Пример 8.3. Если признак: деталь стандартная принять за 1, а признак:
деталь бракованная принять за 0, то совокупность является
выборкой объема партии деталей. В данной выборке 9 стандартных деталей и 1 деталь бракованная.
Число наблюдений называют частотами, а их отношение к объему вы- борки - относительными частотами.
Различные значения признака X, наблюдающиеся у элементов сово- купности, называются вариантами.
Вариационным рядом называется ранжированный в порядке возрастания или убывания ряд вариантов, с соответствующими им частотами.
Пример 8.4. Построить вариационный ряд, если из 2000 абитуриентов (генеральной совокупности), поступивших на специальность «Автоматизация и управление», были отобраны (сделана выборка) студенты, набравшие 110 и более баллов.
Таблица 8.1
112 110 140 134 110 125 125 114 138 125 110 110 138 115 118 122 118 133 118 129 132 132 138 128 122 128 118 126 132 134
Объем данной выборки . Заданную выборку упорядочим по воз- растанию, тогда получим вариационный ряд вида:
Таблица 8.2
110 110 110 110 112 114 115 118 118 118 118 122 122 125 125 125 126 128 128 129 132 132 132 133 134 134 138 138 138 1380
В зависимости от значений, которые может принимать признак, вариа- ционные ряды могут быть дискретные или интервальные.
Вариационный ряд называется дискретным, если значения признака от- личаются друг от друга не менее чем на некоторую постоянную величину.
Вариационный ряд называется интервальным, если значения признака могут отличаться на сколь угодно малую величину.
Например, распределение абитуриентов по группам – это дискретный ряд. Распределение абитуриентов по их росту – это интервальный ряд.
Статистическим распределением выборки называют перечень вариант вариационного ряда и соответствующих им частот . Статистическое рас- пределение выборки можно задать в виде последовательности интервалов и соответствующих им частот.
Для построения интервального ряда необходимо определить наимень- шую варианту, наибольшую варианту, размах выборки, величину интервалов по формуле Стерджеса, число интервалов, начальное значение интервала (ве- личина интервала и число интервалов округляются до целого значения):
наименьшая варианта ,
наибольшая варианта , размах выборки , формула Стерджеса
, число интервалов ,
начальное значение интервала .
Пример 8.5. Построить интервальный ряд для примера 8.4.
Определим наименьшую варианту , наибольшую варианта , размах выборки .
Вычислим величину интервала по формуле Стерджеса:
, число интервалов:
,
начальное значение интервала:
.
Следовательно, интервальный ряд для примера 8.4 имеет вид:
Таблица 8.3
[108,113) [113,118) [118,123) [123,128) [128,133) [133,138]
5 2 6 4 6 7
0,1667 0,0667 0,2 0,1333 0,2 0,233 При построении интервального ряда надо учитывать, что каждому ин- тервалу принадлежит лишь один из его концов – либо во всех случаях правые, либо во всех случаях левые, а также частоты, принадлежащие только задан- ному интервалу.
На основании интервального ряда можно построить дискретный ста- тистический ряд. Величина (шаг интервала) h при этом не меняется. Значе- ния вариант для дискретного статистического ряда находят по формуле:
Пример 8.6. Построить дискретный статистический ряд для примера 8.4.
Вычислим средние значения вариант и заполним таблицу:
Таблица 8.4
111 116 121 126 131 136
5 2 6 4 6 7
0,1667 0,0667 0,2 0,1333 0,2 0,2333 Полигон и гистограмма. Статистическое распределение можно предста- вить в виде графиков, а именно, как полигон и гистограмму частот. В графи- ках по горизонтальной оси откладывают значения признака – варианты, по вертикальной оси – частоты.
Полигоном частот называют ломаную, отрезки которой соединяют точки , i=1,2,…,k (рисунок 8.1). Полигоном относительных частот называют ломаную, отрезки которой соединяют точки , i=1,2,…,k.
Полигон частот и полигон относительных частот строятся по дискрет- ному статистическому ряду.
Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы дли- ною h, а высоты равны отношению (плотность частоты).
Гистограмма строится для интервальных рядов (Рис. 8.2).
Рисунок 8.1 - Полигон частот Рисунок 8.2 - Гистограмма частот Эмпирическая функция распределения. Наглядным способом получить представление о распределении Х является построение эмпирической функ- ции распределения. Для данного действительного числа х подсчитывается число выборочных значений, меньших х. Если обозначить это число через , то для значений функция
называется эмпирической функцией распределения, где - число вариант, меньших х;
n - объем выборки.
Свойства эмпирической функции распределения:
1) значения эмпирической функции распределения лежат на отрезке .
2) - неубывающая функция.
3) если - наименьшая варианта, то при ; если - наибольшая варианта, то при .
Пример 8.7. По данным заданной таблицы построить эмпирическую функцию распределения.
Решение. Вычислим эмпирическую функцию распределения для всех значений х:
для значений , получим , для значений , получим:
, для значений , получим:
, для значений , получим:
, для значений , получим:
, для значений , получим:
, для значений , получим:
Окончательно запишем эмпирическую функцию распределения в виде:
{