Опубликован: 29.10.2019 | Уровень: для всех | Доступ: платный
Лекция 9:

Развиваемая логическая нейронная сеть для распознавания объектов временного ряда по заданному набору признаков

< Лекция 8 || Лекция 9: 123 || Лекция 10 >
Аннотация: Рассматривается возможность распознавания и выбора объектов временного ряда по значениям множества признаков. Аппарат логических нейронных сетей позволяет производить параллельное, одновременное сравнение значений всех признаков с эталонными, на основе расчёта функции активации нейронов. Демонстрируется постепенное усложнение сети в процессе эксплуатации, введение новых признаков и решений, а также введение обратных связей.

А г а ф ь я Т и х о н о в н а. ...Если бы губы Никанора Ивановича да приставить к носу Ивана Кузьмича, да взять сколько-нибудь развязности, какая у Балтазара Балтазарыча, да, пожалуй, прибавить к этому ещё дородности Ивана Павловича – я бы тогда тотчас же решилась.

Н.В. Гоголь. Женитьба.

Детерминированные оценки объектов временного ряда

Важным объектом анализа и исследования в области информационных технологий являются временные ряды. Временной ряд характеризуется реальным временем поступления данных, например, - от регистрирующей аппаратуры при проведении испытаний сложных систем, и столь же оперативной обработкой этих данных. Обработка возможна и с меньшим темпом – при частичном накоплении информации. Однако всегда можно выделить ту первичную обработку, которая проводится в темпе поступления информации, т.е. в реальном масштабе времени.

Первичная обработка временного ряда связана с распознаванием и классификацией данных для запуска средств последующей их обработки. Это порождает надежду на эффективное применение на данном этапе таких средств искусственного интеллекта, как логические нейронные сети.

Маша хочет замуж... Нескончаемой чередой мимо её окошка по городской улице проходят мужчины... Идеал настоящего мужчины, достойного стать её мужем, Маша определила по следующим свойствам – признакам:

  • Он брюнет;
  • Его рост – не менее 180 см;
  • Он обладатель длинного носа;
  • Он должен носить шляпу.

Поток мужчин настолько интенсивен, что Маша принимает единственно правильное решение: она должна автоматизировать процесс селекции мужчин, обладающих указанными признаками, для того чтобы в реальном времени, с применением методов распараллеливания, проводить (в своих мечтах) обработку встретившегося "кандидата".

Итак, имеется временной ряд – поток объектов, характеризующийся набором данных по каждому из них. Необходимо так же в реальном времени решать задачи обработки этих объектов. Эти задачи разнообразны: аппроксимация функциями времени, вероятностная обработка результатов испытаний, обработка динамики состояния фондового рынка, динамический контроль состояния сложной системы и т.д.

Среди этих задач важное место занимает задача селекции и идентификации – задача ассоциативного поиска по эталону. Такая задача возникает, например, при сопровождении спутника, вновь появившегося в секторе обзора.

В простейшей постановке задача формулируется следующим образом.

Объекты, составляющие временной ряд, т.е. последовательно предъявляемые для обработки, обладают множеством признаков A = {a1, …, am}. Задан эталон, соответствующий фиксированному значению этих признаков В = {b1, …, bm}. Необходимо в динамике последовательного анализа объектов временного ряда выделять (и направлять на специальную обработку) те объекты, где все значения признаков совпадают с эталонными, ai = bi, i = 1, …, m.

Обобщением постановки этой задачи, превращающим её в задачу классификации, является следующее дополнение: Произвести распознавание каждого возможного набора значений признаков A = {a1, …, am} для принятия решения по дальнейшей обработке объекта, признаки которого обладают этими значениями. Очевидно, решение данной задачи включает в себя решение задачи, поставленной ранее.

Основным элементом данной задачи является распознавание. В общем случае оно усложняется тем, что точное совпадение признаков с эталонными маловероятно. В этом случае можно говорить лишь о допустимой степени достоверности этого совпадения. Правомочен вопрос: "На какой эталон в значительной степени похож анализируемый объект?" Это указывает на эффективность применения параллельных нейросетевых технологий, опирающихся на несложный расчёт значений функции активации нейроподобного элемента, лежащий в основе модели ассоциативного мышления и адекватно отображаемый логической нейронной сетью.

Конечно, Маша могла бы построить традиционный алгоритм последовательного анализа признаков проходящих мужчин. Затем бы она решила проблему минимизации сложности полученного алгоритма. Она бы догадалась, что минимизировать количество основных операций сравнения можно, если проводить это сравнение, упорядочив признаки по не убыванию частоты появления интересующего значения.

Например, она заметила, что реже всего появляются мужчины в шляпах. Тогда, если она увидит мужчину в шляпе, это повлечёт анализ других признаков. Значит, чем реже будут встречаться мужчины в шляпах, тем реже придётся отвлекаться на дополнительное сравнение. В то же время, сокращение затрат на последующий анализ мужчины в шляпе требует, чтобы интересующее значение признака, с которого этот анализ начинается, также был редко встречающимся и т.д.

Однако такой порядок анализа признаков требует периодического исследования выборок из временного ряда для выявления частоты появления требуемых значений признаков. В комплексе, исследование ряда и частотный анализ значений признаков (по каждому эталону!) можно рассматривать как путь построения самонастраивающегося (по минимуму требуемой производительности) алгоритма поиска с помощью последовательного сравнения значений признаков с эталонными.

Машу такой путь не устраивает. Ей хочется получить алгоритм параллельного анализа всех признаков сразу, методом, подобным методу ассоциативного мышления – для дальнейшего обоснования применения параллельных вычислительных средств: многопроцессорного суперкомпьютера, кластера локальной вычислительной сети или нейрокомпьютера. Кроме того, она рассчитывает в дальнейшем принимать решения не по единственному эталону и даже – не по единственному идеалу.

Приступим к формированию логической нейронной сети – основы машиной системы принятия решений (рис. 9.1).

Для формирования нейронов рецепторного слоя произведём градацию "мужских" признаков па основе понятия исчерпывающего множества событий.

  1. Пусть в Машином представлении мужчины бывают брюнеты, блондины, прочие. Это требует введения трёх нейронов-рецепторов.
  2. В области интересов, касающихся роста, Маша выделила четыре исчерпывающих диапазона, которым соответствуют высказывания: "ниже 180 см", "180 – 190 см", "190 – 200 см", "выше 2 м". Это требует использования ещё четырёх нейронов рецепторного слоя.
    Система принятия решений

    увеличить изображение
    Рис. 9.1. Система принятия решений
  3. В части длины носа у Маши выработался свой стереотип, в соответствии с которым она делит носы на "короткие", "картошечкой" и "длинные", также предполагая, что все возможности исчерпаны, и трёх рецепторов ей достаточно.
  4. Наличию шляпы соответствует булевы переменные "шляпа есть" и "шляпы нет". (Не забывать, что они задаются значениями истинности соответствующих высказываний!) Значения этих переменных преобразуются в действительные. Для данных переменных необходимы два рецептора.

Для краткого описания системы принятия решений (СПР) введём обозначения всех фигурирующих высказываний (это отражено на рис. 2.1):

	x1 = "Брюнет";
	x2 = "Блондин";
	x3 = "Прочий";
	y1 = "Ниже 180 см";
	y2 = "Между 180 и 190 см";
	y3 = "Между 190 см и 2 м";
	y4 = "Выше 2 м";
	z1 = "Нос короткий";
	z2 = "Нос картошечкой";
	z3 = "Нос длинный";
	k1 = "Шляпа есть";
	k2 = "Шляпы нет".

Маша создаёт уже обученную сеть, вводя необходимые связи с единичными весами. Прежде всего она формирует нейрон выходного слоя Вых1, который будет максимально возбуждаться при появлении идеального мужчины. Маша связывает с этим нейроном все рецепторы, реагирующие на интересующие её значения признаков.

Предположим, что кроме "идеальной" комбинации, Машу интересуют не все возможные комбинации признаков проходящих мужчин. Некоторые комбинации она вовсе не удостаивает вниманием. Однако по некоторым она готова сделать замечания, хотя бы связанные с сожалением о близком счастье. Поэтому создаваемая Машей нейронная сеть содержит несколько нейронов выходного слоя, соответствующих лишь тем решениям, замечаниям и сожалениям, которые готовы слететь с губ за чашкой чая у раскрытого окна.

Тогда логическое описание СПР имеет вид:


	x_1\land (y_2\lor y_3)\land z_3\land k_1 \to R_1 = \text{<Сладко помечтать о возможном счастье>;}
	x_1\land y_4\land z_3\land k_1 \to R_2 = \text{<Воскликнуть: "Ну почему он такой высокий!" >;}
	x_2\land (y_1\lor y_4)\land (z_1\lor z_2)\land k_2 \to R_3 = \text{<Воскликнуть: "Как только таких на улицу выпускают!" >;}
	x_3\land y_4\land z_3\land k_2 \to R_4 = \text{<Воскликнуть: "А ведь хорош! Но..." >}

Необходимо отметить, что при решении общей задачи анализа всех возможных ситуаций количество N нейронов выходного слоя в данном случае должно составлять 3x4x3x2 = 72. Каждый нейрон выходного слоя в этом случае указывал бы на решение, принимаемое для соответствующей ему комбинации значений признаков. В общем случае обработки временного ряда справедливо учитывать все возможные ситуации, принимая по каждой из них отдельное решение.

Учёт не всех комбинаций признаков приводит к необходимости тщательного подбора параметров функции активации. Ведь решение должно приниматься не просто по максимальному возбуждению нейронов выходного слоя (оно существует всегда!), а по возбуждению, превысившему достаточно высокий порог.

Маша выбирает функцию активации на основе счёта значений следующих выражений:

f_i = \sum_{j} V_j;

f_\text{Вых i} = \left \{ 
f_i \text{ если }f_i \geq h\\ 
 \text{0, в противном случае}
 \right ( 9.1)

Здесь Vj – значение возбуждения на j-м входе нейрона выходного слоя, поступившего от связанного с ним рецептора. На этапе обучения значение возбуждения рецептора принимается равным единице, если значение высказывания о наличии соответствующего признака является истинным, и равным нулю в противном случае.

Порог h выбирается из следующих соображений. Поскольку возбуждение нейрона выходного слоя должно быть высоким только в случае поступления на его вход ровно четырёх единиц, следует выбрать значение 4 > h > 3. Легко проверить, что все ситуации, по которым предусмотрено решение, обнаруживаются с помощью высокого возбуждения единственного нейрона выходного слоя. Если ситуация относится к тем, по которым решение не предусмотрено, то ни один нейрон выходного слоя не возбудится, и Маша просто проигнорирует появление на улице очередного мужчины.

На рис. 9.1 система принятия решений представлена полностью.

Конечно, в виде, представленном на рисунке, нейронная сеть не обрабатывается компьютером. Информационная технология обработки логической нейронной сети основана на представлении её матрицей связей (табл. 9.1). Каждая строка и столбец соответствуют нейрону, а связи показаны их единичными весами в том столбце, который соответствует их исходу.

Таблица 9.1. Матрица связей
x1 x2 x3 y1 y2 y3 y4 z1 z2 z3 k1 k2
Вых1 1 1 1 1 1
Вых2 1 1 1 1
Вых3 1 1 1 1 1 1
Вых4 1 1 1 1

Однако, несколько подумав, Маша приходит к выводу, что наличие длинного носа чревато серьёзными последствиями в семейной жизни. Нос "картошечкой", несомненно, благотворнее влияет на мягкость нрава. Тогда Маша решает, что при последующей модификации она обязательно введёт в рассмотрение веса связей. Она положит вес \omega_{z3}\to \text{Вых 1} связи, ведущей из нейрона-рецептора z3 к нейрону Вых1, равным 0,5. В то же время она введёт новую связь, соединяющую нейрон z2 с нейроном Вых1. Вес этой связи \omega_{z2}\to \text{Вых 1} она выберет также равным 0,5. Приведённый проект не отражён на рисунке. Он лишь иллюстрирует прекрасные возможности взвешенного учёта различных факторов при модификации и развитии логической нейронной сети, что будет рассмотрено ниже.

Очевидно, что с помощью построенной однослойной логической нейронной сети можно параллельно (!) исследовать значения всех признаков проходящих мужчин (в общем случае – всего множества признаков каждого объекта временного ряда). Это отражает тот факт, что искусственная нейронная сеть, как и естественная, имитирует параллельную обработку сигналов, одновременно поступивших на все рецепторы, то есть производит распараллеливание выполнения сложных логических конструкций вида "если - то". Относительно матрицы следования это означает возможность параллельной обработки всех строк, соответствующих нейронам выходного слоя, с помощью функции активации. В общем случае эта обработка параллельно-последовательная. Элемент последовательности возникает в связи с преемственностью информации внутри длинных логических цепочек, когда выходной слой нейронов одной логической сети становится рецепторным слоем другой.

Однако при программном исполнении на компьютере непараллельной архитектуры обработка нейроподобных элементов сети производится последовательно. Этого вполне достаточно для Маши, но крайне затруднительно в общем случае обработки временного ряда.

Поэтому построение нейрокомпьютера, допускающего параллельную обработку многих нейронов по SPMD-технологии [15], следует считать обоснованным и актуальным.

< Лекция 8 || Лекция 9: 123 || Лекция 10 >
Ирина Шевченко
Ирина Шевченко
Россия
Таня Михайлова
Таня Михайлова
Россия