Классификация на основе байесовской теории решений
2.3. Минимизация среднего риска
Вероятность ошибки классификации – не всегда лучший критерий проверки классификатора. В том случае, когда цена ошибок различного типа существенно различается, лучше использовать другой критерий качества классификации – минимум среднего риска.
Рассмотрим задачу классификации по классам. – области предпочтения классов . Предположим, что вектор из класса лежит в , т.е. классификация происходит с ошибкой. Свяжем с этой ошибкой штраф называемый потерями в результате того, что объект из класса был принят за объект из класса . Обозначим через матрицу потерь.
Определение. Выражение называется риском при классификации объекта класса .
Определение. Выражение называется общим средним риском.
Теперь мы можем поставить задачу о выборе классификатора, минимизирующего этот риск. Преобразуем выражение общего среднего риска:
Из этого выражения видно, что риск минимален, когда каждый из интегралов в данной сумме минимален, т.е. , если , при , где .
Пример. Рассмотрим ситуацию радиолокационной разведки. На экране радара отражаются не только цели, но и помехи. Такой помехой может служить стая птиц, которую можно принять за небольшой самолет. В данном случае это двухклассовая задача.
Рассмотрим матрицу штрафов: . – это штраф за принятие объекта из класса за объект класса . Тогда
Пусть относится у классу , если , т.е. Т.к. и , тоСтоящее в левой части неравенства отношение называется отношением правдоподобия. Неравенство описывает условие предпочтения класса классу .
Пример. Рассмотрим двухклассовую задачу, в которой для единственного признака известна плотность распределения:
Пусть, также, априорные вероятности .Задача – вычислить пороги для
a) минимальной вероятности ошибки
b) минимального риска при матрице риска
Решение задачи a):
Решение задачи b):
Пример. Рассмотрим двухклассовую задачу с Гауссовскими плотностями распределения и и матрицей потерь .
Задача – вычислить порог для проверки отношения правдоподобия.
Решение. С учетом матрицы потерь отношение правдоподобия
запишется в видеЗапишем плотности распределения
Пример. Рассмотрим двухклассовую задачу с матрицей потерь . Пусть – вероятность ошибки, соответствующая вектору из класса и – вероятность ошибки, соответствующая вектору из класса . Задача – найти средний риск.
Решение.
Пример. Доказать, что в задаче классификации по классам, вероятность ошибки классификации ограничена: .
Указание: показать, что .