"Тогда как задать возбуждение рецепторов, если инспектор точно установил, что скорость автомобиля при наезде на пешехода была равна 114 км/час? Вопрос по расчёту скорости и сумме достоверности: этот математический (приведенный выше в виде контекста из материала лекции 1, страницы 3) метод справедлив к скоростным показателям выходящим за рамки диапазона 100-120. |
Медицинские информационно-справочные системы на логических нейронных сетях
Факторное пространство событий
Так-с... со справочником я расставаться не буду... Если что выписать, можно, пока руки моешь, обдумать. Справочник будет раскрытым лежать прямо на книге для записей больных. Буду выписывать полезные, но нетрудные рецепты. Ну, например, натри салицилици 0,5 по одному порошку три раза в день...
Трудно предположить, что рекомендации по лечению больного можно бы было описать математическими зависимостями от симптомов, жалоб и результатов анализа. Эти трудности связаны не только с огромным количеством исходных факторов и с проблемами математической аппроксимации опыта, но и с развитием экспериментальных исследований, появлением новых методик лечения, развитием фармакологии и физико-технических средств. Главным в практике врача, даже врача-исследователя, остается опыт всей человеческой медицины, обращенный в опыт личный.
Но как познать этот колоссальный опыт, пусть даже узко профессиональной ориентации? Как хранить его и целенаправленно пользоваться им? Как использовать его в том случае, когда симптомы болезни и результаты анализов проявляются с долей неопределенности и требуется консилиум? Продолжать исследование заболевания и принимать решение по лечению следует на основе поиска приоритета решений, опираясь на принцип ассоциативного мышления: на какую известную ситуацию больше всего похожа сложившаяся ситуация.
Следовательно, говоря об информационной технологии автоматизации обработки опыта, мало записать опыт лечения в огромную базу знаний (БЗ). Следует организовать выборку из нее по ассоциативному принципу, позволяющему входить в БЗ с не отраженными в ней ситуациями, а также с ситуациями, содержащими неопределенность, а выходить – с рекомендациями на основе того, на какую известную ситуацию более всего похожа данная и, следовательно, какое решение наиболее справедливо. Однако не только таким может быть выход из БЗ. Выходное решение может быть получено на основе усреднения нескольких "близких" решений с учетом автоматически полученных весов.
Задача построения простой и доступной информационной технологии, автоматизирующей труд врача, исключающей ошибочность его действий хотя бы на уровне современных знаний, является трудно формализуемой. Для решения таких задач целесообразно использовать средства искусственного интеллекта (ИИ).
Предлагается реализовать БЗ с ассоциативной выборкой не широко применяемыми средствами баз данных, а использовать аппарат логических нейронных сетей, в наибольшей степени адекватный работе мозга. Он позволяет элементарно просто описывать и обрабатывать системы принятия решений (СПР).
В основе логической нейронной сети лежат начальные сведения из математической логики и теории вероятностей. Это соответствует тому важному факту, что мозг обрабатывает сигнальную информацию. Поэтому значения факторов на рецепторном слое нейронов задаются в виде достоверности высказываний об их принадлежности; возбуждение нейронов выходного слоя указывает на соответствующие им решения. Величина возбуждения соответствует весу решения. Это означает, что на принимаемое пользователем решение может указывать максимально "возбудившийся" (по введенной ситуации) нейрон, либо усредненное решение может быть принято на основе возбуждения нескольких нейронов, преодолевших порог возбуждения.
Всякая СПР требует четкой формализации исходных данных – представления факторного пространства событий, определяющих решения. Факторное пространство формируется на основе специализации СПР.
Точки факторного пространства событий представляют собой ситуации. Ситуации характеризуются набором значений каждого фактора, таких, например, как пол, возраст, температура тела, количество эритроцитов, клубочковая фильтрация и т.д.
БЗ формируется на этапе обучения на основе тех ситуаций (или их объединения), для каждой из которых в результате успешного применения известна оптимальная стратегия лечения, то есть известен успешный врачебный опыт.
Под оптимальной стратегией лечения здесь понимается не формализованное выполнение некоторой целевой функции: полное выздоровление, улучшение самочувствия, повышение качества жизни, максимальное приведение к норме результатов анализа, продление жизни и др.
Факторное пространство событий X определяется множеством компонент – факторов:
( 11.1) |
Например, может соответствовать возрасту, – полу, – количеству эритроцитов в крови и т.д.
СПР должна удовлетворять требованиям полноты и непротиворечивости. Поэтому каждый фактор должен принимать конкретное значение на основе исчерпывающего множества событий
( 11.2) |
так, что сумма вероятностей наступления этих событий, а точнее, сумма достоверностей высказываний о наступлении этих событий, равна единице.
Например, пол бывает мужской и женский. Значит, если высказано предположение, что пациент – мужчина с вероятностью 0,8, то с вероятностью 0,2 он женщина. (Это актуально в наш век трансвестиции и авиа- и автокатастроф.) Третьего в практике анкетирования граждан не дано. На этом примере показана возможность использования нечетких данных, достоверность которых меньше единицы.
Другой способ представления некоторого фактора иллюстрирует практика разбиения возраста на диапазоны, например, до 10 лет (включительно), от 10 до 20 лет (включительно), от 20 до 40 лет (включительно), свыше 40 лет. Если необходимо зафиксировать конкретное значение фактора, для которого (в комплексе со значениями других факторов) известно рекомендуемое лечение, то разбиение по возрасту (это пример, аналогично – и для других факторов) может быть смешанным: указание точного количества лет может перемежаться указанием диапазонов. Например, для г. Иванова, 36 лет, наряду со значениями других факторов, найдена оптимальная стратегия лечения. Справедливо желание зафиксировать данные по лечению г. Иванова в БЗ. Однако если ранее уже был введен обоснованный диапазон возраста, например, 30 – 40 лет, то необходимо либо разбить этот диапазон на части, выделив отдельно точку 36 лет (т.е. указав диапазон 30 - 35 лет, 36 лет, 37 – 40 лет), либо включить г. Иванова в этот диапазон, исключив отдельное рассмотрение значения фактора возраста 36 лет.
Если фактор представлен известными точками, подобно возрасту г. Иванова, то они могут рассматриваться как условные границы тех диапазонов, на которые разбивается данный фактор, образуя исчерпывающее множество событий .
Таким образом, факторное пространство в любом случае должно отображать исчерпывающее множество событий , но исключать их избыточность. В противном случае нарушится принцип "равноправия" ситуаций. СПР утратит полноту и непротиворечивость выводов.
Так формируются исчерпывающие множества событий по каждому фактору.
В целом же построение факторного пространства событий преследует ту цель, чтобы каждый больной или пациент мог быть полностью и однозначно охарактеризован точкой факторного пространства – ситуацией. Для СПР по его лечению эта ситуация является запросом.
Отсюда уже следует, что методика лечения болезни является хорошо изученной в том случае, если факторное пространство событий достаточно плотно покрыто такими точками – ситуациями, для которых известно, как надо правильно лечить. Оно не должно содержать "белых пятен" - областей, где опыт лечения отсутствует. Так что формализация опыта, объединение его в БЗ, помогает (подобно таблице Менделеева) определить направление дальнейших исследований.
Решения, принимаемые при обращении к базе знаний и их усреднение
Итак, БЗ, и основанная на ней СПР, формируется на основе точек факторного пространства событий – ситуаций, для которых известны решения – оптимальные стратегии лечения. Что собой представляют эти решения?
Пусть современная врачебная практика в соответствии со специализацией создаваемой СПР "знает" некоторое количество т взаимно отличных решений – оптимальных стратегий лечения . Одно решение соответствует одной или некоторому множеству ситуаций (см. эпиграф). Каждая стратегия лечения представляет собой вектор:
( 11.3) |
Здесь компонента решения может представлять собой количество сеансов, процентный состав лекарственных составляющих, вес применяемых доз, вид физиотерапии, рекомендуемый санаторий и т.д. (Yk – формально вектор; пользователь же должен в качестве рекомендуемого решения получать текст, в который "вплетены" компоненты этого вектора.) Тип данных, указанных в решении, может быть различным: булевым, действительным, целым, объектом и даже текстом.
На основе компонент нескольких "близких" решений с учетом их веса может быть рекомендовано усредненное решение. Такое усреднение имеет смысл для таких компонент, как процентный состав, вес применяемых доз, количества сеансов физиотерапии и др. Таким образом, усреднение может касаться тех компонент решения, которые принадлежат одному типу данных – "целое" или "действительное".
Пусть СПР обратилась к БЗ с некоторым запросом – ситуацией. Предположим, что при обработке этого запроса рекомендованы несколько "близких" решений – стратегий оптимального лечения, превысивших порог допустимости с некоторыми весами, которые можно рассматривать как приоритетный ряд. Тогда решение с максимальным весом может быть принято к исполнению. Однако по желанию пользователя может быть произведено усреднение ряда компонент "близких" решений. Другие же компоненты берутся из решения с максимальным весом.
Например, пусть индекс в выражении (11.3) пробегает несколько "близких" решений, полученных по некоторой ситуации и преодолевших порог допустимости. Пусть – веса этих решений. Пусть, далее, индекс j пробегает те компоненты решений, для которых имеет смысл усреднение. Тогда усредненные значения в составе окончательного решения находятся:
( 11.4) |
Построение базы знаний по технологии логической нейронной сети
В практическом аспекте не все возможные факторы интересуют врача – в соответствии с его специализацией, специализацией медицинского учреждения или с основным диагнозом болезни. Например, температура тела больного может быть не актуальной, если врача интересуют лишь результаты вполне определенных анализов. То есть, в общем случае точка факторного пространства, как рассматриваемая сложившаяся ситуация формируется на основе значений лишь факторов, интересующих пользователя БЗ. Тогда говорят об исследованных ситуациях , отображаемых в БЗ. Формально точка факторного пространства – k-я исследованная ситуация - характеризуется высказываниями о принадлежности интересующих факторов определенным значениям, объединенным операцией И:
( 11.5) |
Здесь r(k) – число интересующих факторов, индексация k означает "пробег" по интересующим факторам, индекс l соответствует значениям этих факторов.
В общем случае одно и то же решение (об оптимальной стратегии лечения) может приниматься по нескольким () исследованным ситуациям . Высказывания об этом образуются с помощью операции ИЛИ, и окончательное логическое выражение для указания стратегии лечения имеет вид:
( 11.6) |
Рекомендуется упрощать подобного рода логические выражения способом "размножения" решений, когда отдельно используется каждая конъюнкция вида (11.5) в выражении (11.6):
( 11.7) |
Такое повторение операции следования позволяет, во-первых, сводить формируемые в дальнейшем логические нейронные сети к простейшим однослойным, а, во-вторых, модифицировать каждое решение (из первоначально одинаковых) таким образом, чтобы в выдаваемом пользователю тексте указывалась хотя бы подробная причина принятия этого решения.
Предположим, что для большого, постоянно расширяемого множества больных или групп больных, характеризующихся значениями факторов и порождающих ситуации, в результате опыта лечения, анализа учебной и справочной литературы и обмена информацией, накопился достаточный объем сведений о стратегии успешного лечения. То есть, известно достаточное число сведений "если ... то...", образующих множество логических выражений – связей вида (11.7).
( 11.8) |
Множество таких связей и образует БЗ. Очевидно, такая БЗ должна быть модифицируемой и развиваемой.
Формирование БЗ для любой системы ИИ соответствует режиму обучения этой системы.
Как такая система должна работать в рабочем режиме? Ведь в ней фигурирует множество отдельных опытов, т.е. конечное множество точек факторного пространства событий, для которых заданы отношения вида (11.8). Формируемый же запрос может (и, скорее всего) не совпадать по всем значениям факторов ни с одной из отображенных в БЗ точек.
Это говорит о необходимости ассоциативной выборки решения при обращении к БЗ с запросом по сложившейся ситуации в соответствии с требованиями, изложенными ранее.
Выполнение этих требований в наибольшей степени адекватно такому средству ИИ, как логические нейронные сети, которые "оживляют" БЗ посредством имитации путей возбуждения взаимосвязанных нейронов. Возбуждение нейронов имитируется с помощью простейшей пороговой функции активации. Начальное возбуждение, соответствующее образу ситуации, сообщается рецепторам. Это возбуждение обусловлено достоверностью высказываний о принадлежности компонент входной ситуации значениям компонент, отображенных в БЗ. Обучение сети совпадает с этапом ее формирования. Это означает, что нейронная сеть создается обученной в соответствии с той БЗ, которая накоплена к текущему моменту. А именно, она запоминает все известные связи вида (11.8). В предполагаемом применении, как говорилось выше, представляется достаточным, чтобы логическая нейронная сеть была однослойной. В ней сигналы от рецепторов, в соответствии с их связями, сразу же поступают на нейроны выходного слоя, которые указывают на решения. В перспективе развития технологии представляется неизбежным применение логических нейронных сетей с обратными связями.
Количество возбуждаемых рецепторов по разным "абсолютно" достоверным ситуациям, отображенным в БЗ, может быть не одинаково. То есть, разные ситуации могут учитывать разное количество факторов. Поэтому логическая нейронная сеть не является совершенной [5]. Например, если больная – женщина, то важным дополнительным фактором может являться ответ на вопрос: наблюдается ли до- или послеклимактерический период? При рассмотрении мужчин такой фактор отсутствует.
В общем случае необходимо допустить возможность уточнения, в процессе клинических исследований, весов влияния хотя бы каждого фактора в целом (а то и каждого его значения) на принимаемое решение.
На раннем этапе исследований и познания, во избежание психологических трудностей внедрения предлагаемых методов, целесообразно принять для всех i и j, что и будет использовано далее.
Представим начальный этап формирования БЗ, когда еще не получены обобщения на некоторые диапазоны значений факторов. БЗ формируется на известных фактах, для "точечных" значений факторов. Тогда примерный вид логической нейронной сети для "медицинских" применений представлен на рис.11.1. Отображена база знаний на основе опыта успешного лечения пяти больных (две из них женщины). Для мужчин факторное пространство событий ограничено двумя факторами, для женщин – тремя.
Как говорилось ранее, значениями возбуждения рецепторов (с тем же именем) является достоверность высказывания о том, что значение i-го фактора запросной ситуации совпадает с j-м значением этого фактора, отображенным на рецепторном слое.
В соответствии с предположением, наличие стрелки на рисунке, ведущей от одного из рецепторов i-го фактора к нейрону, соответствующему k-му решению, говорит о единичном весе связи (), отсутствие стрелок говорит о нулевых весах связей.
Пользователь работает с логической нейронной сетью, как с СПР, в диалоговом режиме с "дружественным" интерфейсом. Например, разъясняя действия по вводу данных – значений возбуждения рецепторов, - система предлагает вопросы вида: "Каким весом от 0 до 1 Вы оцениваете тот факт, что температура тела больного принадлежит диапазону ?" Таким образом, задавая исходное возбуждение каждого нейрона-рецептора, следует отвечать на вопрос: Какова, на Ваш взгляд, достоверность высказывания о том, что значение фактора запросной ситуации равно или принадлежит диапазону значений, предусмотренному в БЗ? Такого рода вопросы должны обеспечить задание возбуждений всех рецепторов.
"Оживление" схемы логической нейронной сети производится с помощью функции активации. Расчет ее значения для всех нейронов выходного слоя позволяет произвести как бы "голосование" в пользу того решения, которое соответствует максимальному возбуждению нейрона.
Представляется справедливым проводить это "голосование" по среднему значению сигнала на входе нейрона. Тогда функция активации нейрона находится по следующему алгоритму:
- Находится значение
( 11.9)
Здесь – величина возбуждения j-го рецептора, связанного с k-м нейроном, – синапсический вес связи, индекс j пробегает по связям, ведущим к k-му нейрону.
Если все веса связей единичные, знаменатель выражения (11.9) обращается в количество входных связей k-го нейрона. То есть, при принятых допущениях о раннем этапе построения СПР, функция активации нейрона находится по следующему алгоритму:
( 11.9) |
( 11.10) |
Здесь – количество активных входов нейрона , т.е. количество входящих в него стрелок на рисунке.
Порог h (ранее упоминавшийся порог допустимости) выбирается экспериментально так, чтобы исключить анализ заведомо ложных решений. В то же время, если ни одно решение не преодолело порог h, это с уверенностью должно свидетельствовать о том, что данная ситуация попала в достаточно большую область не исследованных случаев, и "близких" решений не существует.
Схема логической нейронной сети на рис.11.1 составлена (обучена с помощью направленного размещения стрелок, подразумевающих единичный вес связей, так, что при единичном возбуждении значений факторов, в совокупности характеризующих каждого больного, максимально возбуждается нейрон выходного слоя, указывающий на оптимальное лечение. Предлагаемое решение может выдаваться в виде текста.
Рассмотрим "штатный" режим работы врача-пользователя с СПР на основе логической нейронной сети. Пусть на лечение поступила больная женщина с четко выраженным полом, но с некоторыми промежуточными значениями других факторов в отличие от значений, для которых построена нейронная сеть. Тогда значение фактора (пусть этот фактор соответствует полу) полагаем равным единице.
Пусть значение А фактора находится между теми значениями и ( > ), которым соответствуют рецепторы и соответственно. (Эти значения были свойственны больным, отраженным в БЗ.) Выше подчеркивалось, что значения возбуждения этих рецепторов отображают достоверность высказываний о том, что значения фактора совпадает со значением, соответствующим каждому рецептору. Тогда выберем значение возбуждения и рецепторов и , разделив единицу обратно пропорционально "близости" значения А значениям и 2:
Так же, по принципу близости, выберем значения возбуждения рецепторов, соответствующих фактору Х3, пусть это рецепторы и .
Пусть в результате подобных рассуждений сформированы значения возбуждения рецепторов, отображающие сложившуюся ситуацию:. Пусть экспериментально подобран порог h = 0,5. По (10) найдем возбуждение нейронов выходного слоя: . Несомненно, сеть высказалась в пользу решения , и в соответствии с прилагаемым текстом это решение можно было бы воплотить. Однако не покидает беспокойство: ведь решение тоже обладает высоким весом! Возникает справедливое желание воспользоваться усреднением (4) хотя бы некоторых, допускающих такое усреднение, параметров решений и с учетом их весов и .
Из рис.11.1 видно, что проведенные исследования пяти больных не охватили всех возможных точек факторного пространства событий, т.е. всех возможных комбинаций исходных данных. Например, ситуация не отображена в БЗ. По-видимому, исследование этой ситуации не проводилось. Какой же вывод необходимо сделать, если такая ситуация возникла на практике, т.е. в рабочем режиме применения логической нейронной сети?
"Возбудим" на рис.11.1 указанную ситуацию, положив значения возбуждения рецепторов равным единице. Рассчитаем значения возбуждения нейронов выходного слоя: . Таким образом, сеть высказывается в пользу решения . По-видимому, уточнение стратегии лечения следует продолжить, начав с ее применения в соответствии с указанием логической нейронной сети. БЗ должна быть дополнена по результатам исследований введением новых связей (стрелок) к уточненному решению.
Таким образом, применение логической нейронной сети явно указывает на направление дальнейших исследований для выявления новых факторов и покрытия недостающими знаниями всего факторного пространства событий.
Рис.11.1 наглядно, но технологически неприемлемо иллюстрирует логическую нейронную сеть. Обработка такой сети, т.е. расчет возбуждения нейронов, производится на основе ее простейшего и алгоритмически нетрудоемкого представления матрицей следования, являющейся таблицей. Матрица следования для рассматриваемой (рис.11.1) нейронной сети приведена в таблице 11.1.
В таблице просто и наглядно указаны связи и их веса. (Пустые элементы таблицы соответствуют нулевым весам.) Задавая значение возбуждения рецепторов в первой строке (Х) и используя веса в строках, соответствующих каждому решению (), находим по (11.10) значения возбуждения всех нейронов выходного слоя. Максимально возбужденный нейрон указывает на принимаемое решение, или усредненное решение формируется по нескольким нейронам, преодолевшим порог возбуждения.
Однако медицина вправе предполагать, что каждый фактор в целом или его значения по-разному, с некоторым весом, определяют принимаемое решение. Рано или поздно эти веса находятся. Это означает, что на рис.11.1 каждая стрелка в общем случае сопровождается указанием веса соответствующей связи. Того самого, что в формуле 11.9 фигурирует как . Тогда матрица следования для конкретных, экспериментально найденных весов принимает, например, вид, представленный в таблице 11.2.
Тогда особую актуальность обретает функция активации 11.9.
Ключевые термины
База знаний – свод данных, допускающий логический вывод на основе модели ассоциативного мышления.
Система принятия решений – (здесь) позволяет по измеренным значениям характеристик и анализов больного ставить диагноз и выбирать целесообразную стратегию лечения на основе ассоциативной выборки из базы знаний, по сути заменяя консилиум.
Исчерпывающее множество событий – суммарная вероятность наступления которых равна единице.
Функция активации нейрона – на основе суммы взвешенных значений входных сигналов позволяет получить величину возбуждения нейрона, указывающего на решение – оптимальную стратегию лечения. Анализ значений возбуждения нейронов, преодолевших порог, позволяет, в свою очередь, произвести "голосование" в пользу целесообразной стратегии лечения и произвести усреднение некоторых численных компонент.
Усреднение решений – расчет среднего значения некоторых численных показателей, входящих в состав рекомендуемой стратегии лечения, на основе нескольких взвешенных решений, на которые указывают нейроны сети.
Исследуемая ситуация – комплекс измеренных или предполагаемых значений факторов, интересующих врача.
Оптимальная стратегия решения – стратегия, минимизирующая (максимизирующая) целевую функцию лечения.
Краткие итоги
- Аппарат логических нейронных сетей позволяет воплощать, модифицировать, развивать базу знаний, используемую врачом в качестве информационно-справочной системы.
- Выборка оптимальной стратегии лечения осуществляется не только по четким, измеренным значениям исходных факторов, но и по нечетким данным, на основе модели ассоциативного мышления.
- Несложная функция активации нейрона, позволяющая рассчитывать возбуждение нейрона, и, следовательно, - автоматизировать выбор решения, допускает учет весовых значений некоторых или всех рассматриваемых факторов.
Вопросы:
- Что представляет собой факторное пространство событий?
- Чем определяется ситуация?
- Как формируется запрос на рецепторном слое?
- Как производится модификация и дополнение рецепторного слоя?
- Какова функция активации, если все факторы одинаково влияют на результат?
- Как построить функцию активации, если факторы влияют на результат с разным весом?
- Как формируется логическое описание системы принятия решений?
- Как строится логическая нейронная сеть?
- Как производится усреднение (если необходимо) численных показателей рекомендуемой стратегии лечения?
Дополнительные материалы к лекции, Вы можете скачать здесь.