1.2. Интервальный вариационный ряд

Непрерывный признак X(xi), iÎ[1,n] может принимать любые значения в некотором числовом интервале, отличаясь один от другого на сколь угодно малую величину. Количество возможных значений непрерывного признака бесконечно. Значения непрерывного признака задаются интервалами, которые характеризуются интервальной частотой m. По данным наблюдений за непрерывным признаком строят интервальный вариационный ряд вида табл. 3.

Таблица 3 Интервальный вариационный ряд

Номер интервала

1

2

j

(q<n)

Границы интервала (aj-1;aj)

(a0;a1)

(a1;a2)

(aj-1;aj)

(aq-1;aq)

Средняя точка интервала

a1

a2

 

aj

 

aq

Частота интервала mj

m1

m2

mj

mq

Относительная частота wj

w1

w2

wj

wq

Преобразование простого (ранжированного) ряда значений непрерывного признака в интервальный вариационный ряд

Для построения интервального вариационного ряда на основе простого (ранжированного) ряда значений непрерывного признака необходимо выполнить следующие действия: заполнить ряд полной шкалы интервалов; определить для каждого интервала частоту попадания значения признака в заданный интервал.

Алгоритм 5. Построение ряда «Границы интервала» (полная шкала интервалов непрерывного признака)

Шкала интервалов непрерывного признака A = 0, a1, …, aj, …aq) характеризуется следующими вычисляемыми параметрами:

Наибольшему (xmax) и наименьшему (xmin) значениям признака в ранжированном "по возрастанию значения" ряде соответствуют значения первого и последнего элементов ряда "Значения признака".

Для определения оптимального значения величины интервала в первом приближении можно воспользоваться формулой Стерджеса

        (17)

Если h окажется дробным числом, то за значение величины шага интервала следует взять либо ближайшее целое число, либо ближайшую несложную десятичную дробь, например 0,5 и др.

Заполнение ряда "Границы интервала"

За начало первого интервала принимается значение величины a0, которая определяется формулой

,         (18)

где h – длина интервала (17).

За конец j-го интервала (начало (j+1)-го) принимается значение величины aj, которая определяется формулой

,         (19)

Построение шкалы интервалов на основе вычисления границ интервалов по формуле (19) продолжается до тех пор, пока величина aj удовлетворяет соотношению aj <  xmax + h/2.

Ряд значений "Границы интервалов" представляет собой последовательность числовых значений вида арифметическая прогрессия от a0 до xmaх+h/2 с шагом h. Ячейки диапазона для ряда "Границы интервала" могут быть заполнены одним из известных способов: с помощью команды Прогрессия (меню Правка, подменю Заполнить, команда Прогрессия, опция Арифметическая); с помощью ввода двух чисел в первые две ячейки диапазона и использования опции (переключатель) Автозаполнение в окне диалога Прогрессия или расширения ряда с помощью "мышки" (установить указатель "мышки" на маркере заполнения второй ячейки в правом нижнем углу ячейки и перетащить его в направлении расширения ряда).

Группирование признаков по интервалам. Интервальная частота

В соответствии со шкалой интервалов A = (a0, a1, …, aj, …, aq) производится группирование значений признака - определение интервальной частоты mj (относительной частоты wj) попадания его значения в заданный интервал.

,        (20)

Относительная частота wj попадания значения непрерывного признака в заданный интервал определяется как отношение соответствующей частоты mj к общему количеству наблюдений n по следующей формуле:

,         (21)

где mj – частота интервала (20).

Сложные логические выражения. Логические функции И, ИЛИ, НЕ

Сложные условия ветвления алгоритма вычислений частоты интервала включают более одной операции сравнения. Например, в формуле (20): ki = 1, если выполняется условие - первая (xi > aj-1) и вторая (xiaj) операции сравнения дают результат ИСТИНА при заданных значениях операндов xi, aj-1, aj; ki = 0, если выполняется условие - первая (xiaj-1) или вторая (xi > aj) операции сравнения дают значение ИСТИНА.

Сложные логические выражения создаются с применением логических функций И, ИЛИ, НЕ. Например, условие, при котором ki=1 (20), можно представить логическим выражением с применени-ем логической функции И, которое имеет следующий синтаксис:

 =И(xi>aj-1; xiaj)         (22)

Логическое выражение возвратит значение ИСТИНА в ячейке электронной таблицы, если обе операции сравнения (аргументы функции И) примут значение ИСТИНА, и ЛОЖЬ - в противном случае.

Условие, при котором ki=0, можно представить логическим вы-ражением с применением логической функции ИЛИ в виде

=ИЛИ(xiaj-1; xi>aj)         (23)

Логическое выражение возвратит значение ЛОЖЬ в ячейке электронной таблицы, если обе операции сравнения одновременно (аргументы функции ИЛИ) примут значение ЛОЖЬ, и ИСТИНА - в противном случае.

Логическое выражение (операция сравнения) = xiaj можно записать с применением логической функции НЕ в эквивалентном виде

НЕ(xi > aj)         (24)

Пример. Введем числовые значения операндов логических выражений (22) в ячейки электронной таблицы: в М1 значение aj-1, равное 0,5; в М2 значение aj, равное 1,5; в H1 значение xi, равное 0,75; в H2 значение xi, равное 1,75.

Введем в ячейку H3 формулу (22) с использованием абсолютных и относительных адресных ссылок в виде =И(H1>$M$1;H1 $M$2). Формула возвратит логическое значение ИСТИНА, так как первая операция сравнения (0,75>0,5) и вторая опе-рация сравнения (0,751,5) дадут результат - логическое значение ИСТИНА.

Введем в ячейку H4 формулу (22) с использованием адрес-ных ссылок в виде =И(H2>$M$1;H2<=$M$2). Формула возвратит логическое значение ЛОЖЬ, так как первая операции сравнения (1,75>0,5) даст результат логическое значение ИСТИНА, а вторая операция сравнения (1,751,5) даст результат логическое значение ЛОЖЬ.

Форматирование ячейки, в которой отображается логическое значение ИСТИНА или ЛОЖЬ, не требуется.

Аргументами логических функций И, ИЛИ, НЕ могут быть логические выражения, встроенные логические функции, массивы или ссылки на ячейки, содержащие логические значения.

Логические выражения с применением логических функций могут использоваться во встроенной логической функции ЕСЛИ  (алгоритм 6).

В табл. 4 приведены эквивалентные по значению варианты записи условий при вычислениях по формуле (20), которые необходимо представить в виде логических выражений с применением логических функций И, ИЛИ, НЕ. Примеры записи логических выражений (ЛВ) приведены в (23), (25), (26).

Таблица 4. Эквивалентные по значению варианты записи условия (20)

Номер варианта

kj=1

Номер варианта

kj=0

1

если НЕ((xiaj-1)
ИЛИ (xi>aj))
Пример записи ЛВ
см. (32)

5

 если НЕ((xi>aj-1)
И (
xiaj))

2

если НЕ(xiaj-1)
И (
xiaj)

6

если (НЕ(xi>aj-1))
ИЛИ (xi>aj)

3

если (xi>aj-1)
И (НЕ (xi>aj))

7

если (xiaj-1) ИЛИ (НЕ(xiaj))

4

если НЕ((НЕ(xi>aj-1)) ИЛИ (НЕ(xiaj)))

8

если НЕ((НЕ(xiaj-1))
И (НЕ(xi>aj)))

9

если (xi>aj-1) И (xiaj)
Пример записи ЛВ  см. (22), (25))

10

если (xiaj-1) ИЛИ (xi>aj)
Пример записи ЛВ см.(23), (26))

Алгоритм 6. Определение (накопление) количества членов ряда xi, принадлежащих j-му интервалу (aj-1<xi aj), c применением встроенной логической функции ЕСЛИ и сложных логических выражений

Для определения (накопления) количества членов ряда xi, принадлежащих j-му интервалу (aj-1< xiaj) по формуле (20), которое равно значению частоты mj непрерывного признака для заданного интервала, можно воспользоваться алгоритмом 2 "Счет по условию", применив логические функции для записи сложного логического выражения во встроенной логической функции ЕСЛИ.

Примем, что n=30 и q=5 (ряд значений непрерывного признака xi группируется по пяти интервалам). Для вычисления частоты непрерывного признака для заданного интервала с применением встроенной логической функции ЕСЛИ необходимо выполнить следующую последовательность операци

=ЕСЛИ(И(C2>$D$1;C2$D$2);E1+1;E1)         (25)

соответствующую проверке условия k1=1 (формула (20)), попа-дания первого значения непрерывного признака (ячейка C2) в первый интервал (границы D1,D2), с использованием абсолютных ссылок на диапазон ячеек "Граница интервала" и относительной ссылки на ячейку диапазона "Значения признака"; если логическое выражение примет значение ИСТИНА, то значение в ячейке E2 будет на 1 боль-ше, чем значение в ячейке E1.

Формула в ячейку E2 может быть введена в форме, соответст-вующей проверке условия k1=0 (см. табл.4, вариант 10), в виде

=ЕСЛИ(ИЛИ(C2 $D$1; C2>D$2);E1;E1+1)         (26)

Если логическое выражение примет значение ЛОЖЬ, то значение в ячейке E2 будет на 1 больше, чем значение в ячейке E1;

Алгоритм 7.Вычисление интервальных частот непрерывного признака c применением встроенной логической функции СЧЕТЕСЛИ

В конструкции встроенной статистической функции СЧЕТЕСЛИ (диапазон; критерий) критерий не является логическим выражением и не допускает применения сложных конструкций, включающих более одной операции сравнения. Например, критерий, соответствующий сложному условию проверки попадания значения признака xi в заданный интервал (aj-1<xi   aj,), можно записать с помощью двух простых критериев, проверяющих каждую из частей условия независимо, в виде (">aj-1"); (" aj"), где aj-1 и aj - числовые значения.

Для определения количества членов ряда xi, принадлежащих j-му интервалу (aj-1<xi   aj), по формуле (20) необходимо составить формулу с применением встроенной функции СЧЕТЕСЛИ на основе проверки простых критериев и арифметических операторов "сложить" (+), "вычесть" (-).

Примем, что n=30 и q=5 (ряд значений непрерывного признака xi группируется по пяти интервалам. Выполним последовательность операций по планировки рабочего листа электронной таблицы и вводу значений исходных данных в ячейки диапазона (см. алгоритм 5):

=ABS(C1-(СЧЕТЕСЛИ($C$2:$C$31;"> 0,5")+СЧЕТЕСЛИ($C$2:$C$31;" 1,5")))         (27)

Первая функция СЧЕТЕСЛИ($C$2:$C$31;">0,5") определяет количество u1 членов ряда "Значение признака", которые больше по значению нижней границы первого интервала. Вторая функция СЧЕТЕСЛИ ($C$2:$C$31;"1,5") определяет количество u2 членов ряда "Значение признака", которые не больше по значению верхней границы первого интервала. Сумма (u1+u2) больше величины n (n=30) на величину частоты первого интервала m1, что можно записать с помощью арифметических операторов в виде

m1= abs(n- (u1+ u2))      (28)

произвести копирование формулы в ячейке E1 на весь диапазон E2:E6. При этом абсолютная ссылка на диапазон ячеек "Значения признака" не изменится. В ячейках Е2:Е6 в формулах необходимо вручную подставить (скопировать) из ряда D2:D6 числовые значения соответствующих границ интервалов.

Упражнение

В табл. 5 приведены различные варианты записи простых критериев при вычислениях по формуле (20) с применением встроенной функции СЧЕТЕСЛИ и дано геометрическое представление формульной записи условия (20) в виде графика неравенства. Необходимо составить формулы вида (27, (28).

Таблица 5 Варианты простых критериев

п/п

Критерии

Геометрическое представление условия

1

(">aj-1"); ("£aj")

аj-1               aj

2

("£aj-1"); (">aj")

аj-1             aj

3

(">aj-1"); (">aj");

аj-1             aj

4

("£aj-1"); ("£aj")

аj-1            aj

Статистические характеристики интервального вариационного ряда

В качестве характеристик интервального вариационного ряда в элементарной математической статистике применяют средние величины и показатели вариации. Формулы для расчета статистических характеристик дискретного вариационного ряда приведены в табл. 6.

Рассмотрим алгоритмы вычисления статистических характеристик интервального вариационного ряда с применением встроенной математической функции СУММ и Массивов в качестве ее аргументов на примере вычисления значения средней арифметической членов интервального вариационного ряда (29).

Алгоритм 8. Вычисление статистических характеристик интервального вариационного ряда с примене-нием встроенной математической функции СУММ и Массивов в качестве ее аргументов

Формула (29) для вычисления средней арифметической интервального вариационного ряда представляет собой сумму произведе-ний элементов с одинаковыми индексами для двух рядов - среднего значения признака на заданном интервале и соответствующей ему частоты интервала, деленную на количество признаков в простом статистическом ряду (n=30).

Для вычисления средней арифметической значение непрерывного признака с применением встроенной математической функции СУММ необходимо выполнить следующую последовательность операций:

Таблица 6 Формулы для расчета статистических характеристик интервального вариационного ряда

Средние величины

1. Средняя арифметическая - сумма произведений средних точек интервалов и cоответствующих частот mj (wj), деленная на количество признаков n

        (29)

    (30)

где mj и wj определяются по формулам (20), (21) соответст-венно.

2. Средняя гармоническая - обратное значение средних величин mj/ (wj/ ).

        (31)

        (32)

где mj и wj определяются по формулам (20) и (21) соответственно.

3. Логарифм из средней геометрической - средняя арифметиче-ская из произведений логарифмов средних точек интервалов и соответствующих им частот mj. (wj).

        (33)

        (34)

где mj и wj определяются по формулам (20) и (21) соответственно.

Показатели вариации

1. Среднее линейное отклонение - средняя арифметическая абсо-лютных величин отклонений средних значений интервалов от среднего арифметического .

        (35)

        (36)

где ,mj и wj определяются по формулам (19), (30), (20), (21) соответственно.

2. Дисперсия - средняя арифметическая квадратов отклонений средних значений интервалов от среднего арифметического .

        (37)

        (38)

где , mj и wj определяются по формулам (19), (30), (20), (21) соответственно.

3. Среднее квадратическое отклонение - корень квадратный от дисперсии.

        (39)

        (40)

        (41)

         (42)

где , mj и wj определяются по формулам (29), (30), (20), (21) соответственно.