В октябрьском номере журнала «Вестник цифровой трансформации» вышла статья о проекте по созданию корпоративной системы управления данными для ОАО «РЖД», реализованном «КОРУС Консалтинг» совместно с «Отраслевым центром разработки и внедрения информационных систем» и «Цифровыми сервисами».
Эффективное использование больших данных в крупной компании невозможно без создания системы управления, которая объединит информацию обо всех аспектах деятельности холдинга. В портфеле «РЖД» уже есть проект, который оптимально подходит для управления большим объемом данных в любой отрасли – корпоративная система управления данными (КСУД). Он изначально создавался с учетом географии и масштаба информационных систем холдинга.
Проект «Корпоративная система управления данными» (КСУД ) решает большое количество важных для ОАО «РЖД» задач – от повышения эффективности управленческих и бизнес-процессов до создания новых сервисов предиктивной аналитики. Кроме того, сама по себе реализация проекта стала предпосылкой к новому этапу развития отечественных информационных технологий. КСУД создавался совместно с реинжинирингом реализованного корпоративного информационного хранилища (КИХ) РЖД (на базе проприетарного решения SAS), для чего была разработана импортонезависимая платформа – корпоративного распределенного хранилища больших данных. КСУД управляет всей критически важной информацией, необходимой для статистического, управленческого и бухгалтерского учета в компании. Руководители различных уровней, а также сотрудники, взаимодействующие со статистикой и отчетностью, могут получать достоверную и непротиворечивую информацию оперативно и в нужном объеме. Кроме того, система унифицирует и проверяет данные и, как следствие, качество данных в аналитических и статистических отчетах и скорость принятия решений возрастает в разы. Система управления данными включает в себя четыре ключевых компонента: Глоссарий бизнес-терминов, Репозиторий форм отчетности и аналитических справок, Банк метаданных и Диаграммы связей данных.
Глоссарий бизнес-терминов предоставляет пользователям единую согласованную методологию формирования бизнес-терминов, используемых в компании, правила формирования показателей и информацию о системах-источниках, владельцах данных. Глоссарий содержит более 17 тыс. бизнес-терминов и порядка 48 млн показателей. Глоссарий реализован на отечественной платформе ПАУКД. Он позволяет в автоматизированном режиме обеспечивать ведение описания показателей, актуальность и их доступность (с минимальным участием человека). Фактически глоссарий создает единую систему и «техническую подложку». Репозиторий форм и аналитических справок – это методологическая и распорядительная база, которая делает работу с отчетностью более удобной и эффективной. Репозиторий позволяет пользователю ответить на вопрос: «Какие методики и распоряжения необходимо использовать при работе с данными и формировании аналитических отчетов и форм?» Репозиторий реализован на отечественной платформе «Спутник ЕСМ», которая предназначена для автоматизации работы с корпоративным контентом в организациях различных сфер деятельности. Один из плюсов платформы – возможность модифицировать систему силами сотрудников без специализированной технической квалификации. Сегодня репозиторий содержит более 265 форм статистической отчетности. Банк метаданных – это реестр, который позволяет получить информацию о системах – источниках формирования и публикации данных. В компании с большим количеством бизнес-процессов и сложными управленческими вертикалями сведения о системах – источниках данных необходимы. Проектной командой КСУД проанализировано более 100 информационных систем. Диаграммы связей данных – инструмент построения диаграмм жизненного цикла данных. С помощью таких диаграмм легко проверить связь показателей с системами – источниками и отчетами.
Алексей Урусов, директор ПКТБ-ЦЦТ ОАО « РЖД»: «Корпоративная система управления данными (КСУД) – универсальная разработка. Мало того, что она сделана под существующие бизнес-потребности «РЖД», система в принципе подойдет для работы любой транспортной отрасли и не только. Здесь через систематизированную структуру иерархии показателей, которая сопоставляется с бизнес-процессами и доменами данных, за счет выверенных справочников создается единый глоссарий, который позволяет корректно формировать базу аналитических отчетов и форм. То есть это универсальный инструмент, он проверен на большом количестве данных, а значит, будет хорошо работать в любой крупной компании. По некоторым сведениям, статистических отчетов у РЖД даже больше, чем в Росстате».
Татьяна Ракитина, руководитель департамента по управлению инновационными проектами ООО «ОЦРВ»: «Мы посмотрели много готовых стандартизированных решений, но я точно могу сказать, что наш глоссарий не равен общепринятому подходу и отличается функциональным составом. В РЖД большое количество бизнес-линий, много бизнес-терминов, они все пересекаются, и нужно прийти к одному пониманию, поэтому у нас с самого начала другой масштаб и другие принципы работы с данными».
Проект по реализации корпоративной системы управления данными РЖД высоко оценен сообществом IT-директоров Global CIO и стал лауреатом конкурса «Проект года» в номинации «Лучший проект в области унификации данных для системообразующей компании».
«Все, что мы намечали в рамках дорожной карты по созданию КСУД по методикам, технологиям, инструментам, реализовано. По результатам реализации снизилось количество разных по числовым значениям одноименных показателей в отчетах и презентациях, предоставляемых руководителям ОАО «РЖД», – рассказывает Татьяна Ракитина руководитель департамента по управлению инновационными проектами ООО «ОЦРВ». Все специалисты, от руководителей топ-уровня до рядовых пользователей, теперь работают по единой модели данных. Такой подход позволил сделать сбор информации о методологии формирования показателей единообразным, у сотрудников смежных подразделений снизился риск возникновения бизнес-ошибок, вызванных неверным пониманием бизнес-терминов. Комплекс инструментов по управлению данными позволяет разрабатывать аналитические отчеты и формы с использованием единого методологического подхода. Снижается трудоемкость множества операций, связанных с работой с данными. И, конечно же, падает риск бизнес-ошибок, вызванных неверным пониманием бизнес-терминов. КСУД исключает использование недостоверных, повторяющихся, невыверенных данных, как с точки зрения методологии, так и с точки зрения систем-источников, в повседневной работе при формировании отчетов, справочно-аналитических материалов для руководства ОАО «РЖД». Сервисы предиктивной аналитики, входящие в КСУД, повышают скорость работы при стратегическом планировании и принятии управленческих решений. Система позволяет взаимодействовать с государственными органами, а также обмениваться с внешними партнерами качественными данными. КСУД также позволит сформировать отраслевую аналитику в реальном режиме времени с высокой степенью детализации – все это возможно благодаря новым стандартам качества и прогрессивным подходам к классификации и хранению данных.
«В сентябре 2020 года после утверждения Концепции КСУД мы начали более детально прорабатывать документы, чтобы составить для себя план и оценить «масштабы задачи». Это не говорит о том, что в компании не было порядка, но проблемы были, и в первую очередь они были с точки зрения интерпретации информации, данных или цифр, которые рождаются на разных вертикальных уровнях или на одном горизонтальном уровне разных функциональных филиалов», – вспоминает Дмитрий Быстрицкий, начальник управления анализа и статистики ОАО «РЖД». Кроме того, для полноценной работы КСУД предстояло преодолеть проблемы, связанные с функционированием ранее внедренных импортных технологий на базе продуктов SAS: горизонтальное масштабирование в системы оказалось крайне затруднительным. Но главное, бизнес-термины разной направленности было невозможно объединять в группы, так же как и создавать показатели на основе их параметров.
Особенности проекта и сложность его реализации обусловлены следующими факторами:
разная готовность к изменениям, как в структурных подразделениях компании, так и в региональных, требует подготовки дифференцированной программы вовлечения сотрудников;
сложная система бизнес-процессов в компании – важно правильно выстроить вертикальные и горизонтальные связи;
большое количество интеграций и масштабность текущего IT-ландшафта;
отсутствие готовых решений на отечественном рынке – собственная разработка с нуля;
методологически верная, но длительная реализация проекта, началась с разработки глоссария бизнес-терминов, который позволил создать структурированные правила, согласованные с бизнес-процессами, по работе с данными и определить приоритетность и направления работ в части ИТ-ландшафта.
Дмитрий Быстрицкий, начальник управления анализа и статистики ОАО «РЖД»: «Культура работы с данными – серьезная, она связана и с безопасностью, и с самоорганизацией, и с пониманием, как эти данные можно использовать. Джек Ма (создатель Alibaba) сказал: «Данные – это нефть XXI века». Поэтому мы сидим на нефти, но пока не знаем, как сделать из нее бензин и разогнаться. Аналитики должны уметь правильно интерпретировать данные, а для этого нужны как глубокие производственные знания, так и знания инструментария по управлению данными. На этом стыке необходимо проводить обучение и повышать квалификацию аналитиков, тем самым обеспечивать развитие внутреннего кадрового резерва. Стоимость такого специалиста на рынке будет очень высокой».
Для эффективной реализации проекта было важно создать команду, которая объединит внутреннюю экспертизу и создаст новые компетенции в части управления данными. У проекта есть команда поддержки платформы, которая занимается решением инцидентов и оказанием консультаций по работе платформы. «Вот такой командой, уже создав базисные компоненты КСУД, мы перешли к созданию Банка метаданных с целью описания источников данных, правил и алгоритмов их формирования. Таким образом, при синхронизации банка модели технических метаданных с глоссарием бизнес-терминов будет реализована возможность обеспечения взаимодействия между бизнесом и ИТ, что позволит описать полный жизненный цикл данных с момента их зарождения до момента публикации в системе-источнике или предоставления отчета руководству, – рассказывает Дмитрий Быстрицкий. – Банк метаданных позволит создать модель технических метаданных, отражающую текущее состояние инфраструктуры и информацию об имеющихся в РЖД массивах данных. Прозрачность данных является фундаментальным элементом архитектуры управления данными».
На создание уникального программного продукта, удовлетворяющего всем поставленным требованиям ОАО «РЖД», потребовалось более 200 тыс. человеко-часов. Сейчас для поддержания стабильной работы системы 50 человек работают в формате полной загрузки, еще 150 задействованы по необходимости.
Однако даже самая совершенная система не может работать без профессионалов, разбирающихся во всех ее тонкостях. Важна не только разработка и техническая поддержка – система должна развиваться и эволюционировать. А для этого нужны высококвалифицированные аналитики и специалисты по большим данным. В 2020 году Министерство труда и социальной защиты ввело стандарт «специалист по большим данным». В РЖД планируют разработать предложения по детализации данного стандарта и регистрации в Министерстве труда и социальной защиты актуальных IT-специальностей по следующим направлениям:
архитектура данных;
бизнес-аналитика;
инженерия данных;
методология;
контроль качества данных.
Тогда у вузов (и не только профильных) появится возможность формировать программы обучения более точно в привязке к потребностям рынка.
В команду реализации вошли:
внутренние подразделения ОАО «РЖД»;
дочерние организации: ОЦРВ (Отраслевой центр разработки и внедрения информационных систем) и ЦС (Цифровые сервисы);
консультанты и разработчики компании-партнера «КОРУС Консалтинг».