Работы, связанные с машинным обучением, всегда требовали времени и трудозатрат, что объясняло высокую стоимость проектов. Но при увеличении вычислительных мощностей, резко возросшем уровне качества готовых инструментов и библиотек на open source и явном преимуществе одного из видов алгоритмов обучения невозможно удерживать цену на прежнем уровне.
Количество экспериментов, необходимых для создания первого MVP (minimum viable product), существенно снижается, как и требования к данным — что влечет за собой уменьшение сроков реализации проектов.
Раньше большой блок задач был связан с предварительным этапом — приведением в порядок исходных данных, «причесыванием» базы, настройкой хранения, систем проверок и верификаций.
Увеличивается количество внедрений единых корпоративных хранилищ и реализаций витрин для BI-инструментов, что уменьшает сроки подготовки вводных для обучения систем. Уже сейчас процессы по созданию качественной базы занимают одно из приоритетных мест, тем самым готовя будущую платформу для всех проектов машинного обучения, чувствительных к качеству исходных данных.
По результатам соревнований по машинному обучению на платформе Kaggle первые baseline-результаты, приближенные по качеству к финальным, появляются в течение 5-10 суток после публикации подготовленных данных — при этом в работы включены настройки гиперпараметров алгоритма и создание валидационной стратегии. Также включен базовый предпроцессинг: шкалирование показателей, кодировка переменных, создание дополнительных статистических и логических показателей, поиск аномалий и так далее. Затратив больше времени на усреднение итогов работы нескольких алгоритмов и поиска новых статистически значимых переменных, участники добиваются больших результатов, чем исходный baseline. Но в большинстве случаев его невозможно перенести на продуктивную среду ввиду излишней сложности.
Тем самым долгосрочные сложные проекты превратятся в проекты с итерационным подходом: Baseline → Оплачиваемая итерация 1 (наиболее вероятные эксперименты для улучшения) → Улучшение результата на N → Оплачиваемая итерация 2 → (наиболее вероятные эксперименты для улучшения) → Улучшение результата на N1 → Согласие на текущую реализацию → Завершение проекта.
Трендовые решения из области машинного обучения, уже ставшие классическими: подбор параметров промокампаний, оценка потенциала новых товаров, динамическое ценообразование, клиентское профилирование, противодействие оттоку, прогнозирование регулярного спроса и спроса с учетом промо-активностей – останутся актуальными даже на перенасыщенном рынке. Но чтобы преодолеть барьер недоверия со стороны принимающих решения лиц, компании неизбежно изменят подход к продажам ИИ-решений: перейдут от сухих презентаций к тому, что мы называем Like in Real World.
Иными словами, заменят классический PowerPoint на работающий стенд компании с настроенным аналитическим инструментом, подключением к SMS-центру, виртуальному магазину и email-рассылке.
Демонстрация и продажа решения — теперь не встреча в помещении с проектором, а подробная экскурсия в дивный мир будущего, где всё уже работает: часть переговорной комнаты превращена в отделение банка или в кассу гипермаркета. При демонстрации в сети супермаркетов заказчик видит, как в зависимости от суммы покупок и указанных любимых товаров клиентам приходят различные скидки и предложения, при демонстрации в банке — как система высылает письмо с предложением реструктуризации долга, сформированном на основании его расходов и решения о погашении кредита. Подход позволяет сделать процесс интерактивным: функциональность будет доступна для управления и с другой стороны, что превратит презентации в целые «игровые дни» с использованием разных ролевых моделей.
Рынок развивается и открывает новые возможности. И наша задача — быстро адаптироваться к этим изменениям, чтобы возглавить забег, а не остаться в хвосте.
Источник: VC.ru