Как мы работаем с инцидентами

 Эксплуатация любого программного продукта неизбежно связана с разными ошибками и сбоями, которые на языке ITIL называются Инциденты.

 Для начала приведу определение. Что такое Инцидент?

 

Инцидент – это незапланированное прерывание или снижение качества ИТ-услуги, а также другие случаи, которые пока не повлияли на услугу, но связаны с ней.

 

Инциденты как снежный ком всегда приводят к снижению качества продукта. И все без исключения ИТ-компании с ними работают. Существует два типа компаний – те, кто управляют инцидентами, и те – кто устраняет их по факту их возникновения. И те и другие с инцидентами справляются, но в конечном итоге все упирается в эффективность.

Что такое управление инцидентами?

 

Управление инцидентами – это процесс, отвечающий за управление жизненным циклом всех инцидентов.

 

Управлять инцидентами необходимо – потому, что это обеспечивает минимизацию влияния на бизнес и восстановление нормального функционирования услуги наиболее быстрым способом и минимизирует негативное влияние на бизнес.

 

Процесс управления инцидентами крайне прозрачен, понятен и нагляден для бизнеса в виду того, что позволяет:

  • Снизить незапланированные затраты, которые могут быть вызваны инцидентами;
  • Повысить показатели надежности услуги, а значит максимизировать полезное время функционирования и предназначение услуги.
  • Учитывать бизнес приоритеты в реальном времени за счет определения текущих потребностей и быстрого выделения ресурсов для них.
  • Выделять потенциал в улучшении услуги за счет понимания характера инцидента и действий персонала.

 

Мы в FINGERS выделили для себя основные принципы, по которым управляем инцидентами:

  • Инциденты и их статусы должны быть вовремя и эффективно обнаружены;
  • Все вовлеченные участники должны быть проинформированы о каждом этапе инцидента;
  • Все участники на каждом этапе должны использовать соответствующие бизнес и технические термины;
  • Инциденты должны быть разрешены в согласованное SLAs,OLAs/UСs время;
  • В разрешении инцидента использованы согласованные технические и человеческие ресурсы;
  • Внешняя и внутренняя документация должна соответствовать заявленным возможностям компании по подготовке персонала на каждом этапе инцидента и текущим процессам в компании;
  • Все инциденты должны управляться по единому процессу и схеме;
  • Необходимо проводить аудит инцидентов, что бы убедится в корректном их управлении;
  • Все записи об инцидентах должны быть описаны по единому формату;
  • Приоритезация и эскалация инцидентов должны подчиняться единому и согласованному набору параметров.

 

Следование этим принципам позволяет управлять Инцидентами с минимальными затратами, при этом безошибочно выявлять истинные причины их возникновения, которые в том же ITIL называются Проблемами. Поиск и устранение Проблем в IT-бизнесе – это особая магия. Но об этом в следующий раз.