Компьютерной памяти никогда не бывает достаточно; тем более сегодня, когда цифровизация становится для бизнеса нормой — а для успешной цифровизации необходимо хранить и обрабатывать значительные массивы данных. Проведённое OCS исследование показывает, что объёмы корпоративных данных у российских заказчиков растут внушительными темпами, при этом возможностей расширять ИТ-инфраструктуру on-premises всё меньше: память и процессоры в глобальном дефиците, кредитные средства по-прежнему дороги. Что же чаще выбирают сегодня в этой связи российские клиенты: инвестировать в собственное «железо», полностью перебазироваться в облака — либо сочетать два эти подхода?
Ссылаясь на опыт своей компании, Александр Зенькович, руководителя направления хранилищ данных и больших данных «ДАР» (входит в ГК «КОРУС Консалтинг»), подтверждает, что на рынке наиболее популярен гибридный подход: «В гибридном подходе есть очевидные преимущества. Прежде всего, особенно если говорить о ML или тяжёлых разовых расчётах, выгоднее арендовать мощности в облаке (например, Yandex Cloud, VK Cloud, Cloud.ru), чем закупать серверы, которые 80% времени будут простаивать. Второй важный момент — это безопасность „ядра“ системы: чувствительные мастер-данные остаются в закрытом контуре (обеспечивая тем самым сохранность и соблюдение требований к ИБ), а в облако выносятся витрины данных или анонимизированные выборки. И ещё одно преимущество — скорость Time-to-Market: современные облака позволяют разворачивать платформу данных за дни и не тратить месяцы на поставку и настройку собственного „железа“».
Современное аналитическое хранилище строится не как классический DWH, а как Data Lakehouse-платформа, где объединяются процессы хранения и обработки, — на это обращает внимание Александр Зенькович: «Такой подход позволяет аккумулировать опыт реализации облачных систем, оптимизировать стоимость проекта, а также применять современные подходы к обработке и хранению данных. При этом бизнес получает такие преимущества, как отказоустойчивость за счёт распределённой архитектуры и репликации, отсутствие единой точки отказа и безопасности за счёт разграничения доступа (RBAC/ABAC), шифрования и мониторинга. Дополнительно повышаются производительность (разделение storage/compute, масштабируемые кластеры) и управляемость, так как появляются понятные метаданные, внедряется методология Data Governance, используется каталог данных. Построение хранилищ исключительно на российском „железе“ выглядит реализуемой задачей, но с оговорками. Возможны ограничения по производительности вычислений, критична правильная архитектура и оптимизация ПО и чаще используется комбинированный подход (российское аппаратное обеспечение + open source стек). При этом на отечественном рынке хорошо развивается бизнес ПАК-решений, которые призваны устранить эти сложности, подготовив общее решение с улучшенным взаимодействием аппаратной и программной составляющих».
Полную версию материала читайте на портале IT Channel News.
Остались вопросы? Подписывайтесь на наш телеграм-канал про аналитику и данные Analytics Now