Опубликован: 20.04.2011 | Уровень: для всех | Доступ: свободно
Лекция 4:

Теория вероятностей и статистика

< Лекция 3 || Лекция 4: 12 || Лекция 5 >
Аннотация: Все временные интервалы, поступления, и обслуживания вызовов, которые мы рассматриваем, неотрицательны. Поэтому, они могут быть выражены неотрицательными случайными переменными. Интересующие нас временные интервалы, например, времена обслуживания, продолжительность перегрузки (времена блокировки, времена занятости), времена ожидания, времена пребывания в системе, время занятия Центрального процессора ( CPU ), времена между моментами поступления заявок и т.д. Мы называем такой интервал времени "время жизни", а функции распределения этих времен - распределение времени. В этой Лекции мы рассматриваем основные положения теории вероятностей и статистики, применяемые в теории телетрафика.

Функции распределения

Временной интервал может быть описан случайной переменной Т, которая может быть охарактеризована функцией распределения F(t):

F(t)=\int_0^t dF(u) \qquad \mbox{для } 0 \le t \le \infty\\
F(t)=0 \qquad \qquad  \qquad  \mbox{для } t < 0 ( 3.1)

В (3.1) мы интегрируем от 0, чтобы устранить возможную неоднозначность при t= 0. При рассмотрении системы с ожиданием часто имеется положительная вероятность, что время ожидания равно нулю, a F(t) \ne 0. С другой стороны, когда мы смотрим на времена между двумя моментами поступления вызова, мы обычно принимаем F(0) = 0 (Раздел. 5.2.3).

Вероятность того, что продолжительность временного интервала Т меньше или равна t

p(T \le t) = F(t).

Иногда проще рассматривать дополнение функции распределения:

F^c(t) = 1 - F(t).

Ее также называют функцией распределения долговечности. Мы часто предполагаем, что F(t) является дифференцируемой и что существует следующая функция плотности f(t):

dF(t)=f(t)*dt=p\{t < T \le t + dt\}, t \ge 0. ( 3.2)

Обычно мы принимаем, что время обслуживания является независимым от времени момента поступления вызова, и от времени обслуживания других вызовов. Аналитически, для любого распределения времени могут быть проведены множество вычислений. Вообще, мы всегда принимаем, что существует средняя величина времени обслуживания.

Характеристика распределений

Распределения времени, которые принимают только положительные значения, обладают некоторыми выгодными свойствами.

Для i-того нецентрального момента (см. Глоссарий), который мы обычно называем i -й момент, они могут быть показаны с помощью тождества Пальма:

E\{T^i\}=m_i=\int_0^{\infty}t^i*f(t)dt=\int_0^{\infty}it^{i-1}*\{1-F(t)\}dt, i=1,2,\dots ( 3.3)

Тождество Пальма (3.3), которое справедливо для распределений времени "жизни" (определенно только для неотрицательных величин), было сначала доказано Пальма (1943, [79]) следующим образом.

\int_{t=0}^{\infty}it^{i-1}\{1-F(t)\}dt=\int_{t=0}^{\infty}it^{i-1}\{\int_{x=t}^{\infty}f(x)dx\}dt\\

\qquad \qquad \qquad \qquad=\int_{t=0}^{\infty}\int_{x=t}^{\infty}it^{i-1}f(x)dxdt\\

\qquad \qquad \qquad \qquad=\int_{t=0}^{\infty}\int_{x=t}^{\infty}dt^if(x)dx\\

\qquad \qquad \qquad \qquad=\int_{x=0}^{\infty}\int_{t=0}^{x}dt^if(x)dx\\

\qquad \qquad \qquad \qquad=\int_{t=0}^{x}x^if(x)dx\\

\qquad \qquad \qquad \qquad=m_i

Порядок интегрирования может быть изменен, потому что подынтегральное выражение неотрицательно. Таким образом, мы доказали (3.3). Следующее упрощенное доказательство справедливо в предположении, что моменты существуют:

m_i=\int_{t=0}^{\infty}t^if(t)dt\\

\quad=-\int_{t=0}^{\infty}t^id\{1-F(t)\}\\


\quad=-t^i\{1-F(t)\}|_{0}^{\infty}+ \int_{t=0}^{\infty}\{1-F(t)\}dt^i\\

\quad=\int_{t=0}^{\infty}i*t^{i-1}\{1-F(t)\}dt

что и требовалось доказать.

Особо мы отмечаем два первых момента (если они существуют):

m_1=\int_{0}^{\infty}tf(t)dt=\int_{0}^{\infty}\{1-F(t)\}dt, ( 3.4)
m_2=\int_{0}^{\infty}t^2f(t)dt=2t*\{1-F(t)\}dt ( 3.5)

Средняя величина (математическое ожидание) - это первый момент.

m = m_х = Е\{ Т\}. ( 3.6)

i -тый центральный момент определяется как:

E\{(T-m_1)^i\}=\int_{0}^{\infty}(t-m_1)^if(t)dt ( 3.7)

Дисперсия - 2-ой центральный момент:

\sigma^2=Е\{(Т-m_1)^2\}.

Просто показать, что

\sigma^2=m_2-m_1^2 \mbox{  или}\\
m_2=\sigma^2+m_1^2 ( 3.8)

Распределение обычно однозначно определяется всеми его моментами. Нормализованная мера для отклонения распределения от средней величины - коэффициент вариации. Он определяется как отношение между стандартным отклонением и средней величиной:

CV=\mbox{Коэффициент вариации}=\frac{\sigma}{m_1} ( 3.9)

Эта величина безразмерна, и мы позже применим это свойство, чтобы характеризовать дискретные распределения (вероятности состояния). Другая мера нерегулярности - коэффициент формы Пальма, который определяется следующим образом:

\varepsilon=\frac{m_2}{m_1^2}=1+(\frac{\sigma}{m_1})^2 \ge 1 ( 3.10)

Коэффициент формы \varepsilon, так же как \frac{\sigma}{m_1}, независим от выбора масштаба времени, и в дальнейшем они еще появятся во многих формулах.

Чем больше коэффициент формы, тем более нерегулярно распределение времени и, например, тем больше будет среднее время ожидания в системе с ожиданием. Коэффициент формы принимает минимальное значение, и равен единице для постоянных временных интервалов ( \sigma=0 ).

Чтобы оценить распределение, вытекающие из наблюдений, мы часто удовлетворяемся знанием первых двух моментов ( m_1 и \sigma или \varepsilon ). Моменты более высокого порядка требуют получения чрезвычайно большого объема достоверных наблюдений. Распределения времени могут также быть характеризованы другими способами. Некоторые мы рассматриваем ниже.

Пример3.1.1: Экспоненциальное распределение

Для экспоненциального распределения мы имеем:

m_2=\int_{t=0}^{\infty}t^2 \lambda e^{-\lambda t}dt=\int_{t=0}^{\infty}2te^{-\lambda t}dt=\frac{2}{\lambda^2}

Заметим с удивлением, что эти два интеграла идентичны. Эти два подынтегральных выражения могут, кроме того, быть преобразованы к формулам Эрланга-3 и, соответственно, Эрланга-2 (4.8), функция плотности, которых имеет вероятность, равную единице:

m_2=\frac{2}{\lambda^2 }\int_{t=0}^{\infty}\frac{(\lambda t)^2}{2}e^{-\lambda t}\lambda dt=\frac{2}{\lambda^2}\int_{t=0}^{\infty}\lambda te^{-\lambda t}\lambda dt=\frac{2}{\lambda^2}
Пример 3.1.2: Постоянный временной интервал

Для постоянного временного интервала продолжительностью h мы имеем:

m_i=h^i.

Остаток времени "жизни"

Мы хотим найти распределение времени остатка "жизни", при условии, что достигнут уже некоторый возраст x \ge 0. Условное распределение F(t + x|x) определено следующим образом, принимая р(Т \ge х) > 0 и

p\{T>t +x|T>x\}=\frac{p\{(T > t+x) \wedge (T > x)}{p\{T > x\}}\\
=\frac{p\{T > t+x\}}{p\{T > x\}}\\
=\frac{1-F(t+x)}{1-F(x)}

И, таким образом:

F(t+x|x)=p\{T \le t+x|T > x\}\\
=\frac{F(t+x)-F(x)}{1-F(x)}, ( 3.11)
f(t+x|x)=\frac{f(t+x)}{1-F(x)}. ( 3.12)

Pис.3.1 иллюстрирует эти вычисления графически.

Средняя величина m_{1,r} остаточного времени "жизни" может быть представлена как (3.4):

m_{1,r}(x)=\frac{1}{1-F(x)}* \int_{t=0}^{\infty}\{1-F(t+x)\}dt, x \ge 0 ( 3.13)

Показатель время "гибели" х, то есть вероятность, что рассматриваемое время "жизни" заканчивается в пределах интервала (х, x+dx) , при условии, что возраст* был достигнут, получается из (3.11), позволяя определить t= dx:

\mu (x)*dx=\frac{F(x+dx)-F(x)}{1-F(x)}\\
=\frac{dF(x)}{1-F(x)} ( 3.14)
 Функия плотности остаточного времени "жизни", обусловленной данным возрастом х (3.11). Пример основан на распределении Вейбулла We (2,5), где х = 3 и F(3) = 0,3023

Рис. 3.1. Функия плотности остаточного времени "жизни", обусловленной данным возрастом х (3.11). Пример основан на распределении Вейбулла We (2,5), где х = 3 и F(3) = 0,3023

Условная функция плотности F(x) также называется функцией интенсивности отказов. Если приводится эта функция, то F(x) может быть получена как решение следующего дифференциального уравнения:

\frac{dF(x)}{dx}+\mu (x)*F(x)=\mu (x), ( 3.15)

которое имеет следующее решение (предполагая, что F(0) = 0 ):

F(t)=1- exp\{-\int_0^1 \mu (u) du\}, ( 3.16)
f(t)=\mu (t)*exp \{-\int_0^t \mu (u) du\}. ( 3.17)

Показатель "гибели" \mu (t) является постоянным тогда и только, если время "жизни" имеет экспоненциальное распределение (часть 4).

Это фундаментальная характеристика показательного (экспоненциального) распределения, её называют Марковским свойством или свойством без последействия (при отсутствии памяти (возраста)): вероятность завершения не зависит от фактического возраста (истории) (секция 4.1).

Можно было бы ожидать, что среднее остаточное время "жизни" m_{1,r}(x) уменьшится при увеличении х, поскольку ожидаемое остаточное время жизни уменьшается, когда возраст х увеличивается. Но это верно не для всех случаев. Для показательного распределения с коэффициентом формы е = 2 (секция 5.1) мы имеем т_{1,r} = т. Для распределений перевала 1 \le \varepsilon \le 2 мы имеем т_{1,r}= т. (Секция . 4.2), тогда как для плоских распределений 2 \le \varepsilon \le \infty верно т_{1,r} \ge т (Секция. 4.3).

Пример3.1.3: распределение времени ожидания

Рассмотрим систему организации очереди с бесконечной очередью, где любой клиент не может быть заблокирован. Распределение времени ожидания W_s(t) для случайного клиента обычно имеет положительную вероятность при t = 0, потому что некоторые из клиентов обслуживаются немедленно без какой-либо задержки. Мы, таким образом, имеем W_s (0) > 0. Распределение времени ожидания W_+ (t) для клиентов, имеющих положительные времена ожидания, тогда определяется согласно уравнению (3.11):

W_+(t)=\frac{W_s(t)-W_s(0)}{1-W_s(0)},

или, если мы обозначаем вероятность положительного времени ожидания \{1 - W_s(0)\} буквой D (вероятность задержки), то:

D*\{1-W_+(t)\}=1-W_s(t). ( 3.18)

Тогда для функции плотности мы имеем согласно (3.11):

D*w_+(t)=w_s(t) ( 3.19)

Средняя величина распределения получается:

D*w=W, ( 3.20)

Где средняя величина для всех клиентов обозначена W, и средняя величина для задержанных клиентов обозначена w. Формула действительна для любой системы с бесконечной очередью.

Нагрузка по времени пребывания в системе продолжительностью меньше, чем х

До сих пор мы не рассматривали важности времени "жизни" заявок от их продолжительности. Важность времени "жизни" часто пропорциональна его продолжительности, например, когда мы рассматриваем нагрузку системы с организацией очереди, затраты времен центрального процессора, сеанс телефонной связи и т.д.

Если мы распределяем коэффициент веса времени "жизни" пропорционально его продолжительности, то средний вес всех временных интервалов становится равным средней величине

m=\int_0^{\infty} tf(t)dt, ( 3.21)

где f(t)dt - вероятность наблюдения в пределах интервала (t, t+df) и t - вес этого наблюдения.

При обработке нагрузки нас интересует вычисление соотношения всей нагрузки, которая возникает в системе, и времени пребывания в системе заявок продолжительностью меньше, чем х:

\rho_x=\frac{\int_0^x tf(t)dt}{m} ( 3.22)

Это то же самое, что и соотношение средней величины нагрузки, которая возникает в системе, и времени "жизни" меньше, чем х.

Часто относительно небольшое время обслуживания позволяет обслужить относительно большую долю полной нагрузки. Из рис.3.2 мы видим, что если коэффициент формы \varepsilon = 5, то 75 % времен обслуживания вносят только 30 %-ую долю полной нагрузки (правило Вильфредо Парето). Этот факт можно использовать и предоставлять приоритет коротким задачам без большой задержки более длинных задач (Лекция 13).

 Пример величины относительной нагрузки в зависимости от времени пребывания в системе, согласно уравнению (3.22).

Рис. 3.2. Пример величины относительной нагрузки в зависимости от времени пребывания в системе, согласно уравнению (3.22).

Здесь \varepsilon = 2 соответствует показательному распределению, а \varepsilon = 5 соответствует принципу Парето. Мы обращаем внимание, что 10% наибольших времен пребывания в системе вносят вклад от 33 % до 47 %, нагрузки (сравните математические ожидания времени обслуживания клиента и среднее время ожидания в Лекции 5)

< Лекция 3 || Лекция 4: 12 || Лекция 5 >
Нияз Сабиров
Нияз Сабиров
Стоимость "обучения"
Елена Сапегова
Елена Сапегова
диплом
Александр Орешин
Александр Орешин
Россия, Ростов-на-Дону
Андрей Лучицкий
Андрей Лучицкий
Россия