<<
>>

2.4. Инструментарий, применяемый в системе анализа МИС

Классификация задач анализа данных

Данные можно представить в виде таблицы «объект - свойство - время» (ТОСВ) («куб данных» - рис. 2.3). Анализ такого рода данных включает в себя решение задач двух направлений:

Обнаружение закономерных связей между элементами таблицы (в т.

ч. группировка объектов).

Использование обнаруженных закономерностей для представления (прогнозирования) значений одних элементов таблицы по известным значениям других элементов.

Бывают случаи, когда требуется решить задачу только одного из этих направлений, но чаще встречается необходимость в комбинации задач обоих направлений. Последний случай наиболее общий, по-этому рассмотрим классификацию задач для этой комбинации.

32 Таблица "объект-свойство-время" (ТОСВ)

Рис. 2.3. Куб данных

Задачи предсказания элементов в двухмерной таблице типа «объект - свойство» ТОС/В.

Задачи предсказания элементов в двухмерной таблице типа «объект - время» ТОВ/С.

Задачи предсказания элементов в двухмерной таблице типа «свойство - время» ТСВ/О.

Задачи, рассматривающие куб в целом.

Анализ Парето

Закон Парето иначе называют «правилом 20/80»: 20% потребителей обеспечивают 80% дохода.

Дополнение Уильяма Шердена «80/20/30»: 80% прибыли приносит 20% потребителей, половина из которой теряется при обслуживании 30% наименее выгодных поку-пателей. В общем случае закон Парето говорит о неравномерности распределения показателей.

В маркетинге анализ Парето используется для классификации и выявления основных и малозначимых потребителей, сегментов рынка, товаров и товарных групп. Для этого оценивается их вклад в товарооборот или доход предприятия.

33

Анализ Парето проводится следующим образом.

Входящими данными является дискретный ряд, определяющий значения результативного показателя (например, прибыли) для каждого элемента системы (например, сегмента рынка).

Ряд сортируется в порядке убывания показателя.

Определяется сумма результативного признака по всем эле-ментам (общая прибыль по всем сегментам рынка).

Определяется доля каждого элемента (сумма признака принимается за 100%).

Рассчитывается доля каждого элемента нарастающим итогом.

Отмечается достижение критических точек (обычно 50%, 80% результативного признака) нарастающим итогом долей элементов.

Проводится классификация элементов, определяется количество и процент элементов в каждом классе.

Строится диаграмма Парето (рис.

2.4).

Дается характеристика каждому классу, рассматриваются различные варианты маркетинговой политики для каждого класса элементов.

Товарная группа

Товарооборот (%) —|— Товарооборот нар ит.

Рис. 2.4. Диаграмма Парето

34 Средняя арифметическая взвешенная

При расчете средних величин отдельные значения осредняе- мого признака могут встречаться по несколько раз. В подобных случаях расчет средней производится по сгруппированным данным.

Средняя арифметическая взвешенная определяется по следующей формуле:

k

Е Ximi

1=1

X =

k

Е mi

1 =1

где x - осредняемый признак, mi - вес,

ki - число вариантов.

Пример. Требуется определить средний курс продажи одной акции (табл. 2.1).

Таблица 2.1.

Курс продаж акций Сделка Кол-во проданных акций, шт. (mi) Курс продажи, руб. (xi) 1 500 1080 2 300 1050 3 1100 1145

_ 1080 • 500 +1050 • 300 +1145 • 1100 2114500 „„„„„, гч X = = = 1112,9 (руб.)

500 + 300 +1100 1900 ™

Средняя арифметическая взвешенная может применяться при оценке различных объектов, если свойства, определяющие эти объекты, неравнозначны. Например, при оценке потребительских свойств товаров весовые коэффициенты значимости этих свойств могут определяться с помощью метода экспертных оценок.

Метод корреляционного анализа

Одним из основных показателей взаимосвязи между двумя случайными величинами является коэффициент парной корреляции, служащий мерой линейной статической зависимости между двумя величинами. По выборке данных определяется выборочный

35

коэффициент парной корреляции r для n количества наблюдений. По этому коэффициенту оценивается взаимосвязь параметров во всей совокупности. 1

-Е (xi- х)(Уі - У)

xy - X • y

sx • sy

к

i=1

r = r = r = -

' xy 1 yx 1

sx • sy 1 1 1

x=- Е хі'У=~ Е УІ'хУ=~ Е хІУІ' it її її

n

1=1

n

1=1

n

1=1 - Е (xi- x) 2

1Е у - У)2

її

'sy =

1

1=1

1=1

Пределы изменения r от -1 до 1.

Если r = 0, то взаимосвязи между параметрами нет. Если \ r\ = 1, то связь функциональная. Каче-ственные характеристики связи и граничные значения коэффициентов корреляции представлены в табл. 2.2.

Таблица 2.2.

Качественные характеристики связи Значение r Связь От 0 до +/-0,3 Практически отсутствует От +/-3 до+/-0,5 Слабая От +/-0,5 до +/-0,7 Умеренная От +/-0,7 до +/-1 Сильная

Метод регрессионного анализа

После того, как с помощью корреляционного анализа выявлено наличие статистических связей между переменными и оценена степень их тесноты, обычно переходят к математическому описанию конкретного вида зависимостей с помощью регрессионного анализа. Для этого подбирают класс функций, связывающий результативный показатель y и аргументы x1r x2,..., xk, отбирают наиболее информативные аргументы, вычисляют оценки неизвестных значений параметров уравнения и анализируют свойства полученного уравнения. Функция f(xi, X2,..., Xk), описывающая зависимость среднего значения результативного признака у от заданных значений аргументов, назы-вается уравнением регрессии.

36

Оценку адекватности выбранной модели можно проводить с помощью критерия Дарбина-Уотсона (см. ниже).

Двумерное линейное уравнение регрессии Пусть на основании анализа исследуемого явления предполагается, что в «среднем» у есть линейная функция от x.

С помощью метода наименьших квадратов можно определить оценку уравнения регрессии:

у = b0 + b1 x;

n 1 n n

xiyi nxi Уі 1 n 1 n

b1 = —n , i=1n i=1 ;b0 = -S Уі - b1 nSxi = У -b1x

S x2 - n (S xt)2 "i=1 "" i=1 i=1 Анализ временных рядов (ряды динамики) Модель линейной двумерной регрессии можно использовать для определения оценки линейной тенденции (тренда) в рядах динамики. В этом случае значение параметра x заменяется на значение времени t.

у = a0 + a1t;

n 1 n n

ііУі n ti Уі 1 n 1 n

a1 = —n , i=1n i=1 ;a0 = n S Уі - a1 n S ti = У -a1t

S t2 - n (S ti)2 "i=1 "i=1 i=1 i=1

Оценка адекватности и точности выбранной модели Проверка адекватности выбранной модели реальному процессу строится на анализе остаточной компоненты.

Остаточная компонента получается после выделения из исследуемого ряда систематической составляющей (тренда и периодической составляющей, если она присутствует во временном ряду).

Если исходный временной ряд описывает процесс, не подверженный сезонным колебаниям, применим гипотезу об аддитивности модели ряда, содержащую трендовую и случайную компоненты. Тогда ряд остатков будет получен как отклонения фактических уровней временного ряда (yt) от расчетных (yt):

et = УІ - уt

37 Если вид функции, описывающий систематическую составляю-щую, выбран неудачно, то последовательные значения ряда остатков могут не обладать свойствами независимости, и могут коррелировать между собой. В этом случае имеет место автокорреляция остатков.

Наиболее распространенный метод обнаружения автокорреляции предложен Дарбином и Уотсоном. Критерий Дарбина-Уотсона

связан с проверкой гипотезы об отсутствии автокорреляции первого порядка, т. е. автокорреляции между соседними остаточными членами ряда. Значение этого критерия определяется по формуле:

S(et- et-1) d= e2

z t=1

Можно доказать, что величина d приближенно равна: d = 2 • (1 - r1),

где r - коэффициент автокорреляции первого порядка (т. е. парный коэффициент корреляции между двумя рядами ei, e2,..., e n-1 и Є2, Єз,..., en).

Из последней формулы видно, что если в значениях et имеется сильная положительная автокорреляция (r1 «1), то величина d « 0 .

В случае сильной отрицательной автокорреляции (r1 « -1) d ~ 4 . При отсутствии автокорреляции (r1 « 0) d « 2 . Следовательно, идеально значение статистики, когда d равно 2.

Модель считается адекватной по этому критерию, если расчетное значение критерия «не слишком» отличается от 2.

Применение на практике критерия Дарбина-Уотсона основано на сравнении величины d, рассчитанной по формуле с теоретическими значениями d1 и d2, взятыми из таблицы (рис. 2.5, табл. 2.3). Большинство программных пакетов статистической обработки данных осуществляет расчет именно этого критерия.

В табл.

2.3 d1 и d2 - соответственно нижняя и верхняя довери-тельные границы критерия Дарбина-Уотсона, k - число переменных в модели, N - длина временного ряда.

38

Таблица 2.3 Критические значения при 5% ^ критерия Дарбина-Уотсона di и d2 фовне значимости N к' = 1 к' = 2 к' = 3 di d2 Di d2 di d2 15 1.08 1.36 0.95 1.54 0.82 1.75 20 1.20 1.41 1.10 1.54 1.00 1.68 25 1.29 1.45 1.21 1.55 1.12 1.66 30 1.35 1.49 1.28 1.57 1.21 1.65 35 1.40 1.52 1.34 1.58 1.28 1.65

Критические значения критерия Дарбина-Уотсона

Рис. 2.5. Схема применения критерия Дарбина-Уотсона

Анализ временных рядов проводится для определения тенденций в этих рядах и прогнозирования. Из существующих методов, используемых в прогнозировании, наиболее часто используются регрессионные модели (трендовые модели - частный случай регрессии). На рисунке 2.6 представлена схема выбора метода прогнозирования.

39 >t- o

"d а

п ю Ь\

h X <ъ

и

М

Е

о

и

ft н о

а ч о ч

а

о

W

а ч о

DS U

а

»

к

Я

<\>

к

Я

¦е-

1 а л к о я

я §

Схема выбора метода прогнозирования

(ЕМ. Четыркин "Статистические методы прогнозирования")

<< | >>
Источник: С.В. Мхитарян. Маркетинговая информационная система. 2008

Еще по теме 2.4. Инструментарий, применяемый в системе анализа МИС:

  1. ТЕМА 2. Принципы построения и инструментарий системы анализа МИС
  2. 2.3. Принципы объектно-ориентированного проектирования, их применение в МИС. Достижение эффекта синергии между модулями системы анализа МИС
  3. ТЕМА 1. Понятие маркетинговой информационной системы (МИС
  4. ОБЪЕКТЫ, МЕТОДЫ И ЗАДАЧИ УПРАВЛЕНЧЕСКОГО АНАЛИЗА, ЕГО МЕСТО В СИСТЕМЕ ЭКОНОМИЧЕСКОГО АНАЛИЗА ПРЕДПРИНИМАТЕЛЬСКОЙ ДЕЯТЕЛЬНОСТИ
  5. 2. МЕТОДИЧЕСКИЙ ИНСТРУМЕНТАРИЙ К КУРСОВОМУ ПРОЕКТИРОВАНИЮ
  6. 1.2. Понятие и цель МИС
  7. Особенности реализации языка UML в CASE-инструментарии Rational Rose 98/200
  8. 6. ЭТАПЫ АНАЛИЗА ЛОГИСТИЧЕСКОЙ СИСТЕМЫ
  9. ТЕМА 3. Задачи, решаемые системойанализа МИС
  10. 5. ЦЕЛИ И ЗАДАЧИ АНАЛИЗА ЛОГИСТИЧЕСКИХ СИСТЕМ
  11. 1.3. Функциональная структура МИС и информационные потоки
  12. Система комплексного экономического анализа
  13. 2.1. МИС и децентрализованное управление предприятием
  14. 3.5. Анализ валютно-финансовой системы
  15. § 3. Автоматизированные информационные системы анализа и аудита