Техподдержка системы лояльности крупного оператора пассажирских перевозок

Техподдержка системы лояльности крупного оператора пассажирских перевозок

Клиент

Крупнейший в России оператор по перевозке пассажиров.

Проект

Система позволяет пассажирам, принимающим участие в программе лояльности Клиента, накапливать премиальные баллы за произведенные поездки железнодорожным транспортом с возможностью потратить их на новые поездки.

Программой лояльности ежедневно пользуются несколько тысяч пользователей, производится несколько миллионов записей в базу данных в месяц.

Система имеет много сложных информационных связей с другими системами Клиента. Она накапливает и управляет большим количеством разнообразных данных, в ней реализованы сложные ал­горитмы начислений и списаний.

Задача

В начале 2019 года у Клиента накопилось большое количество задач по существенному улучшению стабильности работы и доступности системы, улучшению качества кода, планов по развитию функциональности:

  • происходило более 60 инцидентов в месяц,
  • случалось 2 или более крупных аварийных отказов, более 100 минут недоступности в месяц,
  • развитие системы не производилось.

Решение

Предварительным этапом в подготовке к приемке системы в техническую поддержку стало проведение аудита и разработка эксплуатационной и технической документации.

Следующим шагом по стабилизации системы стало внедрение мониторинга на базе продукта Zabbix. Это позволило определить проблемные элементы действующей системы и приступить к их исправлению. Выпуск ряда патчей по выявленным дефектам позволил стабилизировать работу системы и существенно снизить ее аварийность.

Еще одним направлением работ по стабилизации системы явилась разработка и внедрение процедур и регламентов взаимодействия между внутренними подразделениями и подрядчиками Клиента.

В течение всего периода поддержки наша команда накапливала знания и информацию о системе с помощью мониторинга поведения системы и анализа обращений пользователей программы лояльности. Это позволило проактивно решать проблемы и работать над оптимизацией производительности.

Решение дефектов освободило ресурсы и дало толчок для продолжения развития системы. И к настоящему моменту система была радикально преобразована: стала более гибкой, внутренняя архитектура решения была кардинально переработана.

Статистика проекта

Размер команды: 5 специалистов

Количество обращений/месяц: снижение с 60 до 20 шт

Количество аварий/месяц: 0

Доступность системы: 99,9%

Полное соответствие согласованным SLA и KPI

Технологии

Code: Java, HTML/CSS

Tools: GitLab, Zabbix

Platforms: Spring framework, Oracle DB