Устранение неполадок
12.5. Сбор сведений для обращения в сервисную службу
Если компоненты WebSphere MQ работают не так, как описано в документации, во время выполнения административных действий генерируются сообщения AMQXXXX и коды причин, указывающие на возникновение неполадок, а журналы менеджера очередей и системные журналы WebSphere MQ содержат сообщения об ошибках, возможно, вам придется обратиться в службу IBM Service.
Причиной этих неполадок могут быть проблемы, возникшие при построении инфраструктуры WebSphere MQ, разработке приложений для доступа к этой инфраструктуре, а также сбои, выявленные в ходе тестирования или эксплуатации приложения.
В этих случаях необходимо тщательно задокументировать сбой, чтобы представители службы IBM Service смогли успешно устранить его.
12.5.1. Составление описания проблемы
Наличие технического описания, включающего сводку симптомов неполадки, снижает шансы неверной интерпретации собранных сведений. После обращения в службу IBM Service вам, возможно, придется работать с разными специалистами.
Поэтому описание проблемы должно содержать максимально полную картину ее внешних проявлений. В него следует включить техническое описание симптомов, а также действий, ведущих к их проявлению.
Представить четкое техническое описание проблемы для специалистов из вашей компании и службы IBM Service поможет Problem Management Record, PMR. Сводку PMR, подготовленную в электронном виде, можно передать представителям IBM, при этом вам не придется устно объяснять суть проблемы.
Подать PMR в электронном виде можно на сайте: http://www.ibm.com/software/support/probsub.html
После подачи сведений о проблеме PMR становится основным источником сведений о ней. Представители IBM Service заносят в PMR результаты всех выполненных ими анализов.
12.5.2. Описание окружения
Подробно опишите окружение, в котором возникла проблема. Непременно включите следующую информацию:
- аппаратную платформу всех используемых компьютеров;
- ОС на всех используемых машинах, включая установленные обновления;
- номер версии WebSphere MQ;
- сведения о всех установленных обновлениях и исправлениях WebSphere MQ.
12.5.3. Описание использования WebSphere MQ
Чрезвычайно полезной информацией является контекст, в котором возникает наблюдаемая проблема. Максимально подробно опишите, какие действия над программой и в каких обстоятельствах вызывают неполадки. Чем подробнее будут предоставленные сведения, тем эффективнее будет диагностика проблемы. Примерное содержание описания приводится ниже.
- Сколько машин, менеджеров очередей и приложений содержится в инфраструктуре?
- Подключаются ли приложения к менеджерам очередей напрямую (через связывание) либо через клиентские подключения? В последнем случае идентичны ли платформа и ОС, на которых работают приложения и менеджер очередей?
- На каком языке программирования написаны приложения?
- Используют ли приложения MQI API непосредственно, через API, соответствующий объектной модели WebSphere MQ, либо через стандартный API, такой как JMS?
- Работают ли приложения непосредственно в ОС либо в сервере приложений или другой исполняющей среде?
- Каковы задачи приложения или административных действий, вызвавших неполадки? Включите в их описание максимум технической информации, включая перечень вызовов MQI, команд MQSC и управляющих команд WebSphere MQ.
12.5.4. Подготовка описания сбоя для отправки в IBM Service
Перечень документов, которые необходимо подготовить для описания возникших неполадок, см. в технической записке (Technote) "MustGather: Read first for all Web Sphere MQ v5.3, v5.3.1, and v6.0 products", доступной по адресу http://www.ibm.com/support/docview.wss?rs=171&uid=swg21177923
12.5.5. Воспроизведение неполадок
Возникновение неполадок может быть связано с попытками выполнения определенных действий. В этом случае можно попробовать повторить эти действия, чтобы воспроизвести неполадки.
Если удается воспроизвести проблему в упрощенной инфраструктуре WebSphere MQ, состоящей из одного или нескольких менеджеров очередей, желательно предоставить IBM Service соответствующие сведения.
Впрочем, воспроизвести аномальные сбои в производственной среде, а также выяснить их причины порой бывает сложно, поскольку такие эксперименты негативно отразятся на ее работе. В итоге воспроизвести наблюдаемые неполадки в рабочей среде удается не всегда.
В подобных случаях весьма удобно иметь тестовую лабораторию, максимально похожую на производственную среду, поскольку в ней можно смоделировать возникновение неполадок.
В FFST и журналах ошибок WebSphere MQ можно найти подробные сведения о неполадках. Данные, зарегистрированные в этих источниках в момент возникновения неполадок, значительно расширяют возможности представителей IBM Service по диагностике и устранению сбоев в случаях, когда воспроизвести их не удается.
12.5.6. Трассировка WebSphere MQ
Инфраструктура WebSphere MQ и работа с ней могут быть довольно сложными и специализированными под конкретные бизнес-требования. Моделирование неполадок на машинах IBM не всегда эффективно, поскольку они не настроены под особенности использования WebSphere MQ в конкретной компании.
Трассировка - мощная функция WebSphere MQ, позволяющая регистрировать все внутренние операции WebSphere MQ в файлах журналов, которые можно отправить в IBM Service для анализа.
Это позволит IBM Service тщательно проанализировать проблему без использования машины клиента и внесения изменений в его среду.
Трассировку можно запускать и останавливать, не прерывая работы менеджеров очередей.
Если удается воспроизвести неполадки в тестовой среде, следует запустить трассировку перед выполнением действий, ведущих к возникновению проблемы, а затем остановить трассировку. Полученные трассировочные данные вместе с FFST, журналами ошибок менеджеров очередей и системными журналами ошибок WebSphere MQ, полученными на машинах, где возникают сбои, следует передать для анализа в службу технической поддержки IBM.
Трассировка всех действий WebSphere MQ снижает производительность инфраструктуры WebSphere MQ, поэтому желательно использовать трассировку во время моделирования сбоев в тестовой среде, а не в производственной. Если такая возможность недоступна и воспроизвести неполадки можно лишь в производственной среде, возможно, в ней же придется активировать и трассировку.
Если установить, какое действие вызывает неполадки, не удается, трассировка работы WebSphere MQ во время их возникновения поможет представителям IBM Service в диагностике.
Трассировка в Windows
На платформе Windows запустить трассировку всех действий WebSphere MQ можно следующей командой:
strmqtrc -t detail -t all
Останавливает трассировку команда
endmqtrc
В WebSphere MQ V6.0 трассировочные файлы хранятся в каталоге C:\Program Files\IBM\WebSphere MQ\Trace, в WebSphere MQ V5.3 - в каталоге C:\Program Files\IBM\WebSphere MQ\Errors.
О настройке максимального размера трассировочных файлов см. в разделе "Problem determination" руководства WebSphere MQ Application Programming Guide, SC34-6595.
Трассировка в UNIX
На платформе UNIX запустить трассировку всех действий WebSphere MQ можно следующей командой:
strmqtrc -e -t detail -t all
Трассировку отдельного менеджера очередей запускают командой вида
strmqtrc -m имя_менеджера_очередей -t detail -t all
Трассировочные файлы создаются в каталоге /var/mqm/trace.
Чтобы содержимое этих файлов было понятно людям, его необходимо отформатировать. Для этого перейдите в каталог с трассировочными файлами и выполните команду
dspmqtrc *.TRC
О настройке размера трассировочных файлов см. в разделе "Problem determination" руководства WebSphere MQ Application Programming Guide, SC34-6595.
Трассировка WebSphere MQ для AIX 5L V5.3
WebSphere MQ для AIX 5L V5.3 использует поддержку трассировки ОС AIX 5L. Эти функции доступны и в WebSphere MQ для AIX 5L V6.0, но рекомендуется использовать вышеописанные функции трассировки WebSphere MQ.
Настройка трассировки WebSphere MQ выполняется так:
MQS_TRACE_OPTIONS=4194303 export MQS_TRACE_OPTIONS
Запустите трассировку, используя трассировочный файл без перезаписи с максимальным размером 50 Мб:
trace -a -j30D,30E -o wmq_trace.trc -s -L 52428800
Остановить трассировку можно следующей командой:
trcstop
Отформатировать отдельный трассировочный файл можно так:
trcrpt -t /usr/mqm/lib/amqtrc.fmt wmq_trace.unf > wmq_trace.fmt
Трассировка в iSeries
На платформе iSeries запустить трассировку всех действий WebSphere MQ можно следующей командой:
TRCMQM TRCEARLY(*YES) SET(*ON) TRCLEVEL(*DETAIL) MAXSTG(8)
Трассировку отдельного менеджера очередей запускают командой вида
TRCMQM SET(*ON) TRCLEVEL(*DETAIL) MAXSTG(8) MQMNAME(ИМЯ_МЕНЕДЖЕРА)
Остановить трассировку можно следующей командой:
TRCMQM SET(*END)
Трассировочные файлы создаются в каталоге /QIBM/UserData/mqm/trace/ файловой системы IFS (integrated file system).
Чтобы содержимое этих файлов было понятно людям, его необходимо отформатировать. Для этого в оболочке QShell перейдите в каталог с трассировочными файлами и выполните команду
dspmqtrc *.TRC
О настройке максимального размера трассировочных файлов см. в разделе "Analyzing problems" руководства WebSphere MQ для iSeries V6.0 System Administration Guide, SC34-6586.
z/OS
О поддержке трассировки в WebSphere MQ для платформы z/OS см. в руководстве WebSphere MQ для z/OS V6.0 Problem Determination Guide, GC34-6600.