Модуль "Математические и статистические методы анализа данных в MS Excel" , страница 8
- доверительный интервал для среднего генеральной совокупности, учитывает уровень значимости - альфа, надежность попадания случайной величины в интервал: [средняя-доверит; средняя+доверит ] определяется по формуле 100*(1-альфа), функция ДОВЕРИТ;
- средняя квадратическая ошибка, отношение СТАНДОТКЛОН к квадратному корню числа элементов выборки;
- минимальное значение случайной величины, функция МИН;
- максимальное значение случайной величины, функция МАКС;
- интервал — размах вариации, разность максимального и минимального значения переменной (МАКС–МИН);
- порядковое наибольшее значений, функция НАИБОЛЬШИЙ;
- порядковое наименьшее значение, функция НАИМЕНЬШИЙ.
3. Характеристика распределения:
- мода — наиболее часто встречающееся или повторяющееся значение в массиве или интервале данных, функция МОДА;
- медиана — середина множества значений для массива, функция МЕДИАНА;
- эксцесс — остроконечность/сглаженность распределения (по сравнению с нормальным распределением), положительное значение эксцесса — остроконечность, отрицательное значение — сглаженность, функция ЭКСЦЕСС;
- асимметричность распределения относительно среднего: положительная асимметрия отклонение в строну больших среднего значений, отрицательная асимметрия — отклонение в сторону меньших среднего значений, функция СКОС.
Команда Сервис, Анализ данных запускает Пакет анализа, в диалоговом окне «Инструменты анализа» выбирается Описательная статистика. Исходные данные для анализа располагаются в ячейках строк или столбцов таблицы, результаты описательной статистики выводятся в указанное место (текущий лист, другой лист, новая книга).
1. Открыть рабочую книгу MATSTAT.xls.
2. Вставить лист — СТАТИСТИКА.
3. Подготовить вектор-столбец значений показателя - ДОХОД фирмы (25–30 значений).
4. Команда Сервис, Анализ данных. Выбрать инструмент — «Описательная статистика». Задать параметры описательной статистики:
§ Входной интервал – блок ячеек значений показателя;
§ Группирование – по столбцам. Выбрать флажок Метки в первой строке, если диапазон ячеек содержит название столбца («Доход»).
§ Выходной интервал – определенная ячейка текущего листа.
§ Указать флажок Итоговая статистика (вывод всей описательной статистики).
§ Уровень надежности – 95%, k-й наименьший – 2, k-й наибольший – 2. Нажать кнопку ОК.
5. Проанализировать описательную статистику и повторить получение статистических оценок с помощью встроенных функций категории Статистические.
6. Сохранить рабочую книгу MATSTAT.xls.
Подготовка данных для статистических моделей
Данные для моделирования могут быть подготавливаться с помощью генератора случайных чисел.
Функция СЛЧИСФункция СЛЧИС категории "Математические"возвращает случайное число, значение которого находится в интервале [0, 1], функция не использует аргументов. Для получения числа, принадлежащего интервалу [число1, число2] используется формула:
=СЛЧИС()*(число2-число1)+число1
Функция СЛУЧМЕЖДУФункция СЛУЧМЕЖДУ категории "Математические" возвращает случайное число, находящееся в заданном интервале чисел [число1, число2]:
=СЛУЧМЕЖДУ(число1; число2)
Если заданы целые числа, функция возвращает целое число.
При каждом перевычислении в электронной таблице значения случайных чисел будут обновляться. Для того, чтобы зафиксировать полученное случайное число следует при редактировании формулы, содержащей эти функции, нажать клавишу F9. В этом случае происходит замена формулы на результат вычисления.
Пример 26 с помощью встроенных функций
Создать два массива значений из 20 случайных чисел, распределенных в интервале [1, 10].
1. Открыть рабочую книгу — MATSTAT.xls.
2. Вставить лист — СЛУЧАЙНЫЕ ЧИСЛА.
3. Ввести название столбцов: столбец А— СЛЧИС, столбец В — СЛУЧМЕЖДУ.
4. В ячейку А2 ввести формулу: =СЛЧИС()*9+1 В ячейку В2 ввести формулу: =СЛУЧМЕЖДУ(1;10)
5. Размножить формулы ячеек А2, В2 в ячейки А2:В21.
6. Получить описательную статистику для массивов значений. Сравнить полученные результаты.
7. Сохранить рабочую книгу MATSTAT.xls.
Генерация случайных чисел с помощью Пакета анализаИнформационная технология Пакета анализа «Генерация случайных чисел» предназначена для автоматической генерации массивов случайных чисел заданной размерности, имеющих определенный закон распределения:
равномерное — равновероятные значения в заданном интервале чисел;
обычное — с заданными параметрами распределения (обычно среднее значение равно 0, стандартное отклонение — 1);
Бернулли — бинарные значений (0 или 1), которые появляются с заданной вероятностью успеха;
биномиальное — с заданной вероятностью успеха и фиксированным числом попыток сумма случайных величин распределения Бернулли;
Пуассона — распределение с заданным параметром случайного потока λ (обратная величина среднего значения потока);
модельное — распределение в пределах нижней и верхней границ с заданным шагом и числом повторений последовательности чисел;
дискретное — распределение согласно заданному соответствию между значениями и вероятностями.
1. Открыть рабочую книгу — MATSTAT.xls.
2. Создать лист — ГЕНЕРАЦИЯ СЛУЧАЙНЫХ ЧИСЕЛ.
3. Указать в ячейке А1 название распределения — Равномерное.