Стоимость "обучения" |
Системы с ожиданием
Принцип Мо для систем с ожиданием
Mo сначала предложил свой принцип для систем организации очереди. Он изучил времена ожидания абонентов для оператора на ручных станциях Копенгагенской Телефонной Компании.
Рассмотрим независимости систем организации очереди. Вызов, обслуживаемый во всех системах, имеет полное среднее времени ожидания
где - среднее время ожидания -той системы, которая имеет обслуживающих приборов и предложенную нагрузку Стоимость канала равна переменной стоимости плюс постоянная стоимость, выраженная константой Таким образом, общая стоимость каналов равна:
( 12.23) |
Если время ожидания также рассматривать как стоимость, то общая стоимость будет равна . Она должна быть свернута как функция числа каналов в отдельные системы. Если полное среднее время ожидания - , то распределение каналов по отдельным системам определяется:
( 12.24) |
где (тета) - множитель Лагранжа.
Величина является неотъемлемой частью необходимого условия для определения минимума, и можно показать, что в этом случае достаточным условием для минимума являются следующие неравенства :
( 12.25) |
что соответствует:
( 12.26) |
где показано в (12.15).
Выраженное с помощью функции увеличения времени ожидания (12.22) оптимальное решение равно:
( 12.27) |
Функция сведена в таблицу в Принципе Мо (Jensen, 1950 [50] ). Подобная оптимизация может быть проведена для других функций увеличения.
Пример 12.3.1: Система с ожиданием
Мы рассматриваем две различных системы организации очереди. Первая имеет среднее время обслуживания 100 с и предложенную нагрузку 20 Эрл. Отношение стоимости равно 0,01. Вторая система имеет среднее время обслуживания, равное 10 с, и предложенную нагрузку 2 Эрл. Отношение стоимости равняется . Таблица функции увеличения дает:
канала и
каналов.
Средние времена ожидания:
Это показывает, что вызов, который обслуживается в обеих системах, имеет полное среднее время ожидания 0,274 с и что система с меньшим количеством каналов вносит больший вклад в среднее время ожидания.
Стоимость ожидания связана с отношением стоимости. Инвестируя больше в вышеупомянутую систему, мы уменьшаем затраты независимо от системы организации очереди. Необходимо идти на вложения, пока получаем прибыль. Исследования Мо в течение 1920-ых годов показали, что среднее время ожидания для абонентов маленьких станций с немногими операторами должно быть большим, чем среднее время ожидания при больших станциях со многими операторами.
Распределение времени ожидания для M/M/n при дисциплине FCFS
Системы организации очереди, где дисциплина обслуживания зависит от времени поступления вызовов, все имеют одни и те же средние времена ожидания. В этом случае стратегия влияет только на распределение времен ожидания для каждого отдельного клиента. Исследование распределения времени ожидания упрощается в случае дисциплины FCFS (First Come First Served - "Первый прибыл - Первый обслужен"). Эта же дисциплина обозначается FIFO (First In First Out). Она также называется дисциплина обслуживания в порядке поступлении. Но если обслуживающих приборов много, заявка может не обязательно покинуть обслуживающий прибор первой. Тогда дисциплина в порядке поступления рассматривается в соответствии с принципом, чтобы время выхода из очереди и начало освобождения обслуживающего прибора была началом обслуживания другой заявки.
Рассмотрим произвольный вызов. По прибытию в систему вызов или обслуживается немедленно, или должен ждать в очереди (12.6).
Предположим, что вызов, который мы рассматриваем, должен ждать в очереди, то есть система может быть в состоянии , где - число занятых мест ожидания как раз перед поступлением вызова.
Наш вызов должен ждать, пока будет завершено обслуживание вызовов, прежде чем станет доступным свободный обслуживающий прибор. Когда все обслуживающих приборов работают, система завершает обслуживание вызовов с постоянной скоростью , то есть процесс выхода вызовов из обслуживания является Пуассоновским процессом с данной интенсивностью. Мы используем отношения между числовым представлением и представлением с помощью интервала (5.4). Вероятность , что положительное время ожидания превосходит заданную величину, равна вероятности того, что в Пуассоновском потоке вызовов с интенсивностью , по крайней мере, вызовов поступят в течение интервала (6.1):
( 12.28) |
Вышеупомянутое равенство справедливо при условии, что наш вызов должен ждать в очереди. Условная вероятность, что наш вызов поступит, когда все обслуживающих приборов заняты и имеется обслуживаемых вызовов , такова:
( 12.29) |
Это геометрическое распределение, включая нулевой класс (табл. 6.1). Безусловное распределение времени ожидания тогда равно:
( 12.30) |
Когда все элементы - положительные вероятности, мы можем поменять порядок суммирования. Внутренняя сумма является геометрической прогрессией:
Подставляя результат этой суммы, мы получаем:
( 12.31) |
то есть экспоненциальное распределение. Очевидно, существует парадокс - при поступлении вызова в систему со всеми ранее занятыми обслуживающими приборами можно:
- рассчитать число ждущих клиентов. Полное время ожидания тогда будет - Эрланговское распределение;
- если не учитывать этих ждущих клиентов, то время ожидания становится экспоненциально распределенным.
Интерпретация этого факта - то, что взвешенная сумма распределений Эрланга с геометрически распределенными коэффициентами веса эквивалентна экспоненциальному распределению. На рис.12.3 показана диаграмма состояний для (12.30), и мы можем заметить, что она может быть сведена к единственному экспоненциальному распределению (секция 4.4.2 и рис.4.9). Формула (12.31) подтверждает, что среднее время ожидания для клиентов, которые должны ждать в очереди, определяется выражением, показанным в (12.17).
Распределение общее время ожидания (для произвольного вызова) равно (3.19):
( 12.32) |
и средняя величина этого распределения - в соответствии с (12.15).
Время пребывания в системе в случае одного обслуживающего прибора
Когда имеется только один обслуживающий прибор, вероятности состояния (12.2) представляются рядом геометрической прогрессии (12.18) для всех . Каждый вызов занимает экспоненциально распределенный временной интервал с интенсивностью в каждом состоянии. Вызов, который поступает в систему в состоянии , должен остаться в системе, интервал времени распределен по закону Эрланга - . Поэтому время пребывания в системе (время ожидания + время обслуживания), которое также называется временем реакции, является экспоненциально распределенным с интенсивностью . (см. рис. 4.9):
( 12.33) |
Это идентично распределению времени ожидания задержанных вызовов. Среднее время пребывания может быть получено непосредственно, используя из(12.20) и среднее время обслуживания :
( 12.34) |
где - скорость обслуживания. Заметим, что среднее время пребывания в системе равно среднему времени ожидания для задержанных клиентов (12.17).
Модель восстановления машин (модель Пальма)
Эта модель принадлежит классу циклических систем организации очереди и соответствует чистой системе с ожиданием с ограниченным числом клиентов (смотрите распределение Энгсета для случая систем с потерями).
Первым в 1933 г. эту модель рассмотрел Гнеденко и в 1934 г. опубликовал статью. Метод стал широко известен, когда в 1947 г. C. Пальм издал статью [80] с теоретическим анализом распределения трудовых ресурсов,
Рис. 12.4. Плотность распределения для распределения времени ожидания при дисциплинах организации очереди FCFS, LCFS1 и SIRO (случайная). Во всех трех случаях среднее время ожидания для задержанных вызовов - 5 единиц времени. Коэффициент формы - 2 для FCFS, 3.33 - для LCFS и 10 - для SIRO. Число обслуживающих приборов - 10, и предложенная нагрузка - 8 Эрл. Среднее время обслуживания s = 10 единиц времени.
обслуживающих автоматы. Множество машин, которые обычно работают автоматически, обслуживается n ремонтниками. Машины могут сломаться, и тогда понадобится ремонтник, чтобы запустить их в работу снова. Проблема состоит в том, чтобы определить число ремонтников в зависимости от числа машин так, чтобы общие стоимости были минимизированы (по-другому это называется "оптимизированная прибыль"). Машины могут быть, например, текстильными машинами, которые останавливаются, когда заканчивается нить; ремонтники тогда должны заменить пустую бобину машины полной.
Эту модель восстановления машин, или модель взаимного влияния машин, рассматривал Feller (1950 [27] ). Модель соответствует организации очереди в простой закрытой сети и успешно применяется, чтобы решить технические проблемы нагрузки в компьютерных системах. В системе обозначений Кендалла (Лекция 13) система организации очереди обозначается , где - число клиентов и - число обслуживающих приборов.
Модель широко применяется на практике. В сети машины соответствуют вызовам, тогда как "ремонтники" предстают обслуживающими приборами, а "ремонтник" представляется компьютером, управляющим терминалами. В компьютерной си стеме машина может соответствовать программам, хранящимся на диске, а ремонтники представляют каналы ввода-вывода ( ввод-вывод ). Далее мы рассмотрим систему компьютерных терминалов, как основу для развития теории.
Система оконечных устройств
Режим разделения времени - лучшее решение для оптимального обслуживания большой группы источников нагрузки использующих, например, терминалы, подключенные к универсальному компьютеру. Отдельный пользователь должен чувствовать себя так, как будто он - единственный пользователь компьютера (рис.12.5).
Рис. 12.5. Модель восстановления машин Пальма. Компьютерная система с S терминалами (диалоговая система) соответствует системе с ожиданием и с ограниченным числом источников (см. случай Энгсета для систем с потерями).
Отдельный терминал находится все время в одном из двух состояний (диалоговый режим) (рис.12.6):
- пользователь думает (работает), или
- пользователь ждет ответа от компьютера. Временной интервал, когда пользователь думает, является случайной
Рис. 12.6. Отдельный терминал может быть в трех различных состояниях. Любой пользователь может работать активно на терминале (или думать), или он ждет ответа от компьютера. Последний временной интервал (время реакции) разделен на две фазы: фаза ожидания и фаза обслуживания.
Временной интервал, когда пользователь думает, является случайной переменная со средней величиной Временной интервал, когда пользователь ждет ответа от компьютера, называется временем реакции R. Он включает в себя временной интервал (средняя величина ), в котором работа ждет получения доступа к компьютеру, и непосредственно время обслуживания (средняя величина ).
называются временем обращения (рис.12.6). В конце этого временного интервала терминал возвращается к тому же самому состоянию, т.е. к левой стороне в начале интервала (текущее событие). Далее нас интересуют, главным образом, средние величины и характеристики, которые справедливы для всех дисциплин организации очереди, не нарушающих нормальную работу (секция 13.4.2).
Вероятности состояния одного обслуживающего прибора
Рассмотрим теперь систему с терминалами, которые связаны с одним компьютером. Предполагается, что времена размышления абонента для каждого терминала экспоненциально распределены с интенсивностью и время обслуживания (выполнение компьютером работы) распределено экспоненциально с интенсивностью . Когда есть очередь в компьютере, терминалы должны ждать обслуживания. Обслуживаемые терминалы или ждущие в очереди имеют нулевую интенсивность поступления.
Состояние определено как состояние, где в системе организации очереди (рис.12.5) есть терминалов, то есть компьютер либо свободен ( ), либо работает ( ), и ( ) терминалов ждут все время, пока ( ).
Система организации очереди может быть смоделирована процессом "гибели и размножения" и диаграммой перехода состояний, показанной на рис.12.7. Существует статистическое равновесие (эргодическая система). Интенсивности поступления заявок уменьшается, по мере того как длина очереди увеличивается, и интенсивность становится нулевой, когда все терминалы стоят в очереди.
Рис. 12.7. Диаграмма переходов для системы организации очереди, показанной в 12.5. Состояние [ i ] обозначает число терминалов, которые либо обслуживаются, либо ожидают обслуживания, то есть S- i обозначает число терминалов, где пользователь либо размышляет, либо работает непосредственно с компьютером.
Устойчивые вероятности состояния могут быть найдены, по рис.12.7, с помощью уравнения сечения и выражены с помощью числа состояний :
( 12.35) |
Согласно дополнительным ограничением нормировки, подставляя , находим сумму всех вероятностей, которая равна:
( 12.36) |
( 12.37) |
Это - усеченное Пуассоновское распределение (7.9).
Мы можем интерпретировать систему следующим образом. Группе с пучками каналов (терминалами) поступают вызовы от компьютера с экспоненциально распределенными интервалами поступления (интенсивность) .
Когда все пучков каналов заняты (пауза на размышление или ввод), компьютер свободен, и интенсивность поступления нулевая, но мы могли бы предположить, что все пучки еще генерируют вызовы с интенсивностью , которые потеряны в этой или другой группе пучков каналов (экспоненциальное распределение не имеет памяти). Компьютер, таким образом, предлагает нагрузку пучкам каналов, и мы имеем формулу (12.37). B-формула Эрланга справедлива для произвольных времен пребывания в системе (секция 7.3.3), и поэтому можно утверждать, что:
Теорема 12.1. Вероятности состояния модели восстановления машин (12.36) и (12.37) с одним компьютером и терминалами справедливы в течение произвольных времен пауз (размышления и работа с компьютером), когда времена обслуживания компьютером являются экспоненциально распределенными.
Отношение это отношение среднего времени, когда пользователь терминала думает , и среднего времени, когда компьютер обслуживает терминал . Это отношение называется сервисным отношением. В B-формуле Эрланга сервисное отношение соответствует предложенной нагрузке. Вероятности состояния определяются числом терминалов и сервисного отношения. Вычисление по формулам (12.36) и (12.37) проводится, как и в B-формуле (7.29) Эрланга.
Пример 12.5.1: Информационная система
Мы рассматриваем информационную систему, которая организована следующим образом. Вся информация хранится на 6 дисках, которые связаны с одним и тем же терминалом мультиплексорным каналом ввода-вывода данных. Среднее время поиска (определение месторасположения производится вручную) - 3 мс. Среднее время задержки, чтобы определить местонахождение файла - 1 мс, соответствующее время вращения - 2 мс, время считывания файла - экспоненциально распределенное со средней величиной 0,8 мс, дисковое хранение основано на определении месторасположения путем считывания при вращении диска так, чтобы канал был занят только в период чтения. Мы хотим найти максимальную производительность системы (число запросов в секунду). Время паузы на раздумье и работу с терминалом 4 мс, и время обслуживания - 0,8 мс, сервисное отношение, таким образом, равно 5.
B-формула Эрланга дает значение:
Это соответствует запросов в секунду.