Опубликован: 09.11.2009 | Доступ: свободный | Студентов: 3994 / 952 | Оценка: 4.66 / 4.45 | Длительность: 54:13:00
Специальности: Экономист
Лекция 11:

Статистика нечисловых данных

11.4. Метод парных сравнений

Пример практического применения метода парных сравнений. Деятельность предприятия по реализации услуг всегда сопряжена с рядом проблем, от качества решения которых зависит его будущее. Руководителю службы маркетинга необходимо знать факторы, сдерживающие продажи, и оценить степень важности каждого из них. При кажущейся очевидности и простоте решения далеко не вся управленческая команда дает однозначный ответ: какая из проблем на текущий момент является наиболее важной. Необходим экспертный опрос на эту тему.

Целью исследования факторов, влияющих на объемы продаж, является их ранжирование по степени важности. Для этого среди 25 сотрудников отдела сбыта, а также 10 руководителей завода ГАРО (Великий Новгород) А.А. Пивнем был проведен опрос, в котором предлагалось сравнить попарно факторы, определив более важный среди двух. Итог определялся как среднее арифметическое сумм баллов, набранных каждым фактором у всех опрашиваемых.

Были проанализированы следующие 15 факторов:

  • потребительские свойства изделий (качество, надежность, показатели назначения и т.д.);
  • уровень цен;
  • срок поставки продукции;
  • информация о предлагаемых к продаже изделиях;
  • уровень гарантийного и сервисного обслуживания;
  • работа дилеров, представительств;
  • рекламная деятельность;
  • численность персонала;
  • мотивация труда;
  • инициативность персонала;
  • маркетинговая деятельность;
  • оснащенность техническими средствами;
  • квалификация персонала;
  • корпоративная культура;
  • репутация компании.

В результате анализа результатов парных сравнений построена структурная схема, показывающая степень влияния факторов на объемы продаж ( рис. 11.1).

Наибольшую значимость на сегодняшний день имеет срок поставки продукции и квалификация персонала. Меняются подходы к продвижению товаров на рынке. Ранее успешно применяемые способы продаж (почтовая рассылка рекламы, участие в специализированных выставках, публикации в газетах и специализированных изданиях, конференции и т.д.) сегодня требуют иного качественного подхода. Срок поставки продукции, как правило, связан с производственно-технологическим циклом изготовления и настройки изделий. Мотивация труда, равно как и уровень гарантийного и сервисного обслуживания, имеют также большое значение. Разрабатывается и утверждается новая система оплаты труда, которая позволяет устранить возникающие противоречия. Отдел сервисного обслуживания гаражного оборудования должен разработать концепцию развития сервисной сети с целью наиболее полного удовлетворения потребителя, а значит и завоевания преимуществ в конкурентной борьбе.

Распределение факторов по их значимости

Рис. 11.1. Распределение факторов по их значимости

Среди проблем более низкого уровня значимости необходимо отметить место корпоративной культуры. Понимание и осознание себя, как части сплоченного коллектива - сложный процесс. Достижение синергетического эффекта возможно только в коллективе, в котором отдельный сотрудник понимает и делает свою работу через понимание целей и задач всей компании. Формированию корпоративной культуры следует уделить особое внимание.

Проведенный анализ дает возможность компании сосредоточить свои усилия на наиболее важных на данный момент обозначенных проблемах. Выбор пути решения каждой из них определяется возможностями компании и опытом руководителей.

Вероятностное моделирование парных сравнений. Напомним общую модель парных сравнений, введенную в 5.4.

Пусть t объектов A_1,A_2,...,A_t сравниваются попарно каждым из n экспертов. Следовательно, возможных пар для сравнения имеется s=t(t-1)/2. Эксперт с номером \gamma делает r_{\gamma} повторных сравнений для каждой из s возможностей. Пусть X(i,j,\gamma,\delta),\; i,j=1, 2, ..., t, i\ne j,\gamma=1,2,...,n; \delta=1,2,..., r_{\gamma}, - случайная величина, принимающая значения 1 или 0 в зависимости от того, предпочитает ли эксперт \gamma объект A_i или объект A_j в \delta -м сравнении двух объектов. Обычно принимают, что все сравнения проводятся независимо друг от друга, так что случайные величины X(i,j,\gamma,\delta) независимы в совокупности, если не считать того, что X(i,j, \gamma, \delta)+X(i,j, \gamma, \delta)=1. Положим

P(X(i,j,\gamma,\delta)=1)=\pi(i,j,\gamma,\delta).

Ясно, что описанная модель парных сравнений представляет собой частный случай люсиана (в другой терминологии - бернуллиевского вектора). В этой модели число наблюдений равно числу неизвестных параметров, поэтому для получения статистических выводов необходимо наложить те или иные априорные условия на \pi(i,j,\gamma,\delta), например:

\pi(i,j,\gamma,\delta)=\pi(i,j,\gamma) (нет эффекта от повторений);

\pi(i,j,\gamma,\delta)=\pi(i,j) (нет эффекта от повторений и от экспертов).

Теорию независимых парных сравнений целесообразно разделить на две части - непараметрическую, в которой статистические задачи ставятся непосредственно в терминах \pi(i,j,\gamma,\delta), и параметрическую, в которой вероятности \pi(i,j,\gamma,\delta) выражаются через меньшее число иных параметров. Ряд результатов непараметрической теории парных сравнений непосредственно вытекает из теории люсианов.

В параметрической теории парных сравнений наиболее популярна линейная модель, в которой предполагается, что каждому объекту A_i можно приписать некоторую "ценность" V_i так, что вероятность предпочтения \pi(i,j) (т.е. предполагается дополнительно, что эффект от повторений и от экспертов отсутствует) будет выражаться следующим образом:

=H(V_i-V_j), ( 1)
где H(x) - функция распределения, симметричная относительно 0, т.е.
H(-x)=1-H(x) ( 2)
при всех x.

Широко применяются модели Терстоуна-Мостеллера и Брэдли-Терри, в которых H(x) - соответственно функции нормального и логистического распределений. С прикладной точки зрения эти две модели практически совпадают. Действительно, поскольку функция \Phi(x) стандартного нормального распределения с математическим ожиданием 0 и дисперсией 1 и функция

\Psi(x)=e^x(1+e^x)^{-1}
стандартного логистического распределения удовлетворяют соотношению (см. 5.4)
\sup_{x\in R^1}|\Phi(x)-\Psi(1,7x)|<0,01,
то для обоснованного выбора по статистическим данным между моделями Терстоуна-Мостеллера и Брэдли-Терри необходимо не менее тысячи наблюдений. Ясно, что при реальном проведении экспертного опроса число наблюдений по крайней мере на порядок меньше.

Соотношение (1) вытекает из следующей модели поведения эксперта: он измеряет "ценность" V_i и V_j объектов A_i и A_j, но с ошибками \varepsilon_i и \varepsilon_j соответственно, а затем сравнивает свои оценки ценности объектов y_i=V_i+\varepsilon_i и y_j=V_j+\varepsilon_j. Если y_i>y_j то он предпочитает A_i, в противном случае - A_j. Тогда

\pi(i,j)=P(\varepsilon_i-\varepsilon_j<V_i-V_j)=H(V_i-V_j). ( 3)

Обычно предполагают, что субъективные ошибки эксперта и независимы и имеют одно и то же непрерывное распределение. Тогда функция распределения H(x) из соотношения (3) непрерывна и удовлетворяет функциональному уравнению (2).

Пример. При опросе экспертов (август 2001 г.) попарно сравнивались четыре компании ТНК, Лукойл, Юкос, Татнефть, продающие автомобильное топливо. Сравнение проводилось по качеству бензина. При t = 4 пар для сравнения имеется s=t(t-1)/2 = 6.

Результаты парных сравнений приведены в табл.1. По ним необходимо определить взаимное положение четырех компаний на оси "качество бензина", т.е. найти их "ценности" V_1, V_2, V_3, V_4.

Таблица 11.1. Сравнение компаний по качеству бензина
Пары Частота выбора первого элемента пары Частота выбора второго элемента пары
ТНК - Лукойл \pi(1,2) = 0,508 \pi(2,1) = 0,492
ТНК - Юкос \pi(1,3) = 0,331 \pi(3,1) = 0,669
ТНК - Татнефть \pi(1,4) = 0,990 \pi(4,1) = 0,010
Лукойл - Юкос \pi(2,3) = 0,338 \pi(3,2) = 0,662
Лукойл - Татнефть \pi(2,4) = 0,990 \pi(4,2) = 0,010
Юкос - Татнефть \pi(3,4) = 0,997 \pi(4,3) = 0,003

Применим модель Терстоуна-Мостеллера, согласно которой погрешности мнений экспертов \varepsilon_i являются независимыми нормально распределенными случайными величинами с нулевым математическим ожиданием и дисперсией \sigma^2.

Легко видеть, что "ценности" V_1, V_2, V_3, V_4 измерены в шкале интервалов. Начало координат можно выбрать произвольно, поскольку вероятности результатов сравнения зависят только от попарных разностей "ценностей" V_1, V_2, V_3, V_4. Например, можно положить V_4=0. Единицу измерения также можно выбрать произвольно. При изменении единицы измерения меняется \sigma^2, точнее, единица измерения однозначно связана с величиной \sigma. Дисперсия разности \varepsilon_i - \varepsilon_j равна 2\sigma^2. В соответствии с формулой (3) удобно выбрать единицу измерения так, чтобы 2\sigma^2 = 1, т.е. \sigma=1/\sqrt{2}. Тогда Н в формуле (3) - это функция \Phi стандартного нормального распределения с математическим ожиданием 0 и дисперсией 1.

В соответствии с (3) имеем систему шести уравнений с тремя неизвестными:

\begin{aligned}
&\Phi (V_1 - V_2) = \pi (1, 2) = 0,508,\\
&\Phi (V_1 - V_3) = \pi (1, 3) = 0,331, \\
&\Phi (V_1) = \pi (1, 4) = 0,990,\\
&\Phi (V_2 - V_3) = \pi (2, 3) = 0,338,\\
&\Phi (V_2) = \pi (2, 4) = 0,990,\\
&\Phi (V_3) = \pi (3, 4) = 0,997.
\end{aligned}

Применяя к каждому их этих уравнений преобразование \Phi^{-1}, получаем систему шести линейных уравнений с тремя неизвестными:

\begin{aligned}
V_1 - V_2 = a_1 = \Phi^{-1}(0,508) = 0,020054,\\
V_1 - V_3 = a_2 = \Phi^{-1}(0,331) = - 0,437154, \\
V_1 = a_3 = \Phi^{-1}(0,990) = 2,326348,\\
V_2 - V_3 = a_4 = \Phi^{-1}(0,338) = - 0,417928,\\
V_2 = a_5 = \Phi^{-1}(0,990) = 2,326348,\\
V_3 = a_6 = \Phi^{-1}(0,997) = 2,747781.\\
\end{aligned}

(Значения \Phi^{-1} взяты из таблицы 1.3 сборника [ [ 2.1 ] ].)

В полученной системе число уравнений больше числа неизвестных, т.е. система переопределена. Дальнейшие расчеты могут проводиться разными способами. Простейший из них состоит в том, чтобы выбрать три уравнения, а именно, третье, пятое и шестое, которые и дают искомые значения:

V_1=V_2=2,326348,\; V_3=2,747781.

Таким образом, качество бензина лучше всего у Юкоса, оно несколько хуже у ТНК и Лукойла, одинаковых по этому показателю, а у Татнефти - значительно хуже тройки лидеров. Можно показать, что если модель Терстоуна-Мостеллера верна и число экспертов достаточно велико, то отбрасывание "лишних" уравнений является корректным способом обработки экспертных данных, поскольку дает состоятельные оценки "ценностей" V_1, V_2, ..., V_n.

Однако ясно, что при отбрасывании трех уравнений из шести часть информации теряется. Например, первое уравнение показывает, что по мнению экспертов качество бензина у ТНК несколько лучше, чем у Лукойла. Поэтому целесообразно применить метод наименьших квадратов для оценивания V_1, V_2, V_3, V_4. А именно, рассмотрим функцию трех переменных

\begin{gathered}
f(V_1, V_2, V_3) = (V_1 - V_2 - a_1)^2 + (V_1 - V_3 - a_2)^2 + (V_1 - a_3)^2 +
+(V_2 - V_3 - a_4)^2 +(V_2 - a_5)^2 +(V_3 - a_6)^2 .
\end{gathered}

Оценки по методу наименьших квадратов - это результат минимизации функции f(V_1, V_2, V_3) по совокупности переменных V_1, V_2, V_3. Как и в "Многомерный статистический анализ" , для минимизации этой функции достаточно приравнять 0 частные производные этой функции по V_1, V_2, V_3. Имеем:

\begin{gathered}
\frac{\partial f}{\partial V_1}=2(V_1-V_2-a_1)+2(V_1-V_3-a_2)+2(V_1-a_3),\\
\frac{\partial f}{\partial V_2}=-2(V_1-V_2-a_1)+2(V_2-V_3-a_4)+2(V_2-a_5),\\
\frac{\partial f}{\partial V_3}=-2(V_1-V_3-a_2)-2(V_2-V_3-a_4)+2(V_3-a_6).
\end{gathered}

Приравнивая частные производные 0, деля на 2, раскрывая скобки и перенося свободные члены в правую часть, получаем систему трех линейных уравнений с тремя неизвестными

\begin{aligned}
&3V_1-V_2-V_3=a_1+a_2+a_3,\\
&-V_1+3V_2-V_3=-a_1+a_4+a_5,\\
&-V_1-V_2+3V_3=-a_2-a_4+a_6.
\end{aligned}

Решение этой системы не представляет трудностей.

Вообще говоря, не всегда сравниваемые объекты можно представить точками на прямой, т.е. не всегда их можно линейно упорядочить. Возможно, более соответствует данным опроса экспертов представление объектов точками на плоскости или в пространстве большей размерности. В статистике парных сравнений [ [ 1.5 ] ] разработаны методы проверки адекватности модели Терстоуна-Мостеллера и других параметрических моделей. Для этого обычно используются статистики типа хи-квадрат.

Анастасия Маркова
Анастасия Маркова

Здравствуйте!

4 июня я записалась на курс Прикладная статистика. Заплатила за получение сертификата. Изучала лекции, прошла Тест 1.

Сегодня вижу, что я вне курса! Почему так произошло?