Прогнозируется, что объем рынка аналитики данных в спорте достигнет 4,5 млрд долларов к 2025 году. Существует даже отдельная специальность – аналитик спортивных данных. Их задача – собирать данные с поля и вне поля из различных источников и затем анализировать и интерпретировать их. Полевые данные – это, например, эффективность игрока и показатели его здоровья. Данные вне игры могут включать в себя поведение фанатов, покупательские привычки, взаимодействие с командой и игроками в социальных сетях. Выводы из этих данных используются менеджерами команд, тренерами и скаутами, которые ищут новых игроков.
В качестве лишь одного примера – клуб английской футбольной Премьер-лиги «Лестер» вызвал в 2016 году сенсацию, впервые в своей истории став обладателем почетного титула чемпиона Англии. Это произошло, в том числе, благодаря использованию в тренировочном и игровом процессе сложных цифровых инструментов сбора и обработки информации, описывающей различные параметры игры.
А одним из пионеров научного data-ориентированного подхода к тренировочному процессу, развитию игроков и созданию тактического рисунка под противника был Советский Союз, где комплексную аналитическую работу с помощью ЭВМ проводили еще в конце 70-х годов.
Итак, для чего и как именно используются аналитические технологии в спорте? Можно разделить задачи их применения на несколько блоков.
Но до этого вспомню об одном примере искусственного интеллекта на базе компьютерного зрения, который знаком каждому, кто хоть раз видел какой-нибудь матч. Так называемый AI рефери или VAR - система, которая отслеживает каждое движение каждого игрока и в спорных ситуациях готова подсказать – был ли гол, был ли удар, был ли…
Первая область применения аналитики в спорте – прогнозирование и предотвращение травм. Использование носимых технологий в спорте – в одежде и отдельных устройствах, - все больше распространяется. Они позволяют идентифицировать игроков, которые находятся в высокой зоне риска. Тренеры, зная это, определяют для них сбалансированный подход к тренировкам, возможно, с какими-то дополнительными упражнениями для укрепления или восстановления здоровья. Данные собираются в течение некоторого времени, и на их основании можно делать выводы, были ли эти программы полезны.
Вторая область, где используется машинное обучение и аналитика, – это оценка игроков. Существуют многочисленные факторы, которые влияют на общий рейтинг игрока и его ценность на рынке. Общий хайп, бренд, уровень игры, постоянство – все это играет важную роль. Когда команда или клуб принимают решение серьезно вложиться в игрока, перед ними должны быть данные, которые подтверждают, что это их решение верное. Используя подход, основанный на данных, даже небольшие команды теперь могут конкурентно выступать в больших лигах просто за счет покупки правильных игроков. Скауты используют сложные алгоритмы, которые предсказывают, насколько тот или иной игрок станет ценным приобретением для команды и не разрушит ее целостность. Например, какая-нибудь звезда с высоким риском травмы – не самый лучший вариант для серьезной инвестиции небольшой команды, для которой важно, чтобы игрок вел за собой остальных и отыграл полностью весь сезон.
При этом очень любопытно, как собираются подобные данные. В NBA, Национальной баскетбольной ассоциации США, камеры установлены под разными углами для того, чтобы фиксировать игру каждую секунду. Эти камеры смотрят на различные части игровой поверхности, а скорость записи можно изменять.
В Национальный футбольной лиге Штатов устанавливаются чипы в мячах и в защитных прокладках на плечах игроков для того, чтобы отслеживать их местонахождение во время подач. Сравнивая место, где находится мяч и где находится игрок, можно извлечь сложные данные для того, чтобы предсказать период владения мячом, передачи и даже позиции игрока защиты. Также можно мониторить такую информацию, как скорость движения игроков, среднее сердцебиение и общую дистанцию, которую прошли игроки. Эти данные позволяют определить, насколько игрок был эффективен в матче, и насколько это был не единичный результат.
В плавании же используются стационарные камеры, расположенные над и под уровнем воды. Они фиксируют ошибки пловца и сразу же посылают об этом уведомления, записывая количество нарушений.
Идем дальше. Аналитика позволяет вырабатывать правильную стратегию работы команды. Собирая данные матчей, например, движение мяча, пасы и дальнейшие результаты (голы, забитые или пропущенные, например), можно составить модель, которая подскажет наиболее выигрышную стратегию игры
Следующая область связана с работой со зрителями. Это оценка оттока зрителей, то есть прогнозирование уменьшения продаж билетов. Очевидно, что удержать клиента намного дешевле, чем приобрести нового. Поэтому спортивные клубы и команды используют сложные модели для того, чтобы прогнозировать процент зрителей, которые не планируют в следующем году покупать абонемент и предлагать зрителям специальные скидки и делать предложения на билеты и абонементы. Дополнительно, существуют технологии, которые позволяют по электронным билетам или отпечаткам пальцев или другой биометрической характеристике, отслеживать движение зрителей на стадионе. Можно смотреть, что и где они покупают и на основании этого прогнозировать и посещаемость, и количество необходимого персонала.
Еще одна важная область, в которой спортивная индустрия использует AI и ML, ценообразование на билеты. Зрители, которые покупают билеты на стадионы, - важный источник дохода для команды. На базе исторических данных используются модели, которые учитывают сотни факторов (среди которых время года, игроки, которые выйдут на поле, день недели и другое) для того, чтобы сформировать правильные цены на билеты.
Ставки на спорт. Вот уж кто активно использует аналитику данных, так это букмекерские компании. И до, и во время игры ставки постоянно пересчитываются для того, чтобы делающие ставки могли поточнее выбрать победителя.
Что еще? Если мы уйдем со стадионов и кортов, то вспомним о том, что большое количество зрителей с удовольствием наблюдает за спортивным соревнованиями онлайн. Аналитика позволит узнать, какой канал популярнее у зрителей – мобильные приложение или онлайн-видео. С ее помощью можно создать иммерсивное пространство, которое погрузит зрителя в среду матча или гонки. Также появилась возможность «вытаскивать» данные из социальных сетей, чтобы определять, о чем думают фанаты и вести с ними правильную коммуникацию.
И, кстати, при взаимодействии с другими заинтересованными сторонами – операторами связи, провайдерами платежных услуг, ритейлерами, – спортивные клубы могут собирать информацию о поведении своих зрителей и фанатов в более широком контексте – причем от момента, когда зритель переступил порог стадиона до момента, когда он стадион покинул. И в этот промежуток и затем, зрителям можно отправлять персонализированные сообщения со специальными предложениями, а также поставлять эти данные муниципальным органам власти для определения и контроля над трафиком на стадионе.
Уйдем еще дальше от стадиона и посмотрим на внутреннюю кухню и функции спортивных организаций. Как им помогает аналитика? С ее помощью они могут существенно оптимизировать такие области работы, как закупки, цепочки поставок и логистику, управление персоналом, продажи и маркетинг. От необходимого количества гамбургеров до правильного момента розыгрыша лотереи.
Еще одна область применения аналитики и AI – это то, что используют и профессиональные спортсмены, и мы с вами. Это приложения для занятий спортом и поддержания веса. Растущая популярность здорового образа жизни породило огромное количество приложений и других онлайн-помощников, которые могут все – определить ваш тип фигуры, рассчитать, сколько килограммов нужно сбросить, сколько мышечной массы надо подкачать, какие упражнения делать, сделают из вас заправского бегуна или йога.
И последняя область – спортивная журналистика. Представляете корреспондента, которому надо написать о матче? А о двух? А о десяти? А из нескольких разных видов спорта? А из разных городов и стран? Сколько должен журналист посмотреть и сколько он потом будет писать репортаж? Слава Богу, есть AI. Платформы на базе искусственного интеллекта собирают данные, статистику, и, используя функцию обработки естественного языка, пишут сами материалы – может быть, без глубокого чувства, но с описанием ключевых моментов встречи, статистикой и данными. Если вы думаете, что это недостойно настоящего журналиста, подумайте еще раз. Associated Press с помощью такой платформы увеличила в разы свою способность выпускать материалы (они следят за 13 различными лигами 14-ью командами!). А голландская медиагруппа NDC используют AI для репортажей о 60 тысячах футбольных матчей в год.
И напоследок еще несколько примеров.
Аналитика данных помогает собирать показатель CORSI в хоккее, соотношение бросков: в створ ворот, мимо ворот и заблокированных игроками соперника, и таким образом помогает менеджменту команды выявлять наиболее эффективных игроков в составе. Этот метод активно применяет «Toronto Maple Leaves».
С данными работает и футбольный показатель xG — «ожидаемые голы». Это система, позволяющая оценивать каждый удар по воротам с максимальной детализацией, принимая во внимание все составляющие, которые привели к нанесению удара. Анализируя xG команды по итогам игры, тренеры получают максимально объективную картину действий своих игроков. Выявляются эффективные и неэффективные игровые паттерны, связки игроков, закономерности, очевидные при более «грубом» анализе, — например, «удары в створ ворот». В баскетболе то же самое называют Win Shares и VORP, в бейсболе — саберметрикой.
Отличную работу Больших данных продемонстрировала футбольная команда Германии, разбившая в полуфинале недавнего Чемпионата мира бразильцев со счетом 7:1. Анализ игры с помощью инструментов Big Data позволил существенно увеличить скорость перепасовки в центре поля — по ходу турнира команда повышала этот показатель, и к полуфиналу со средних 3,4 с на одну передачу научилась тратить всего 1,1 секунду.
Бейсбольная команда «Oakland Athletics» в середине 2000-х с помощью глубокого анализа Больших данных собирала сверхдешевые составы из никому не известных или всеми забытых игроков и выходила в плей-офф 4 раза подряд, а всего — 5 раз за 7 сезонов.
В крикете AI используется для оптимизации стратегии игры. Можно использовать машинное обучение для предсказания результатов матча с высокой точностью. А прогнозирование посещаемости матчей привело к тому, что большую популярность получили закрытые стадионы, на которых игру можно провести в любую погоду.
Теннисный турнир Уимблдон в этому году представил зрителям новое приложение Win Factor. Созданный IBM на базе ИИ, приложение собирает информацию из различных источников и прогнозирует шансы игроков на победу в том или ином матче. Поклонники спортсменов смогут вносить в приложение собственные прогнозы о будущем победителе. Система также будет предлагать им информацию об игроках, которые менее на виду.
В гонках серии NASCAR, популярных в США заездах по овальной трассе на кузовных машинах, давно существовала проблема: существенное преимущество получали гонщики, нарушавшие правила при заезде на дозаправку или смену шин. До внедрения искусственного интеллекта такие нарушения отслеживали сотрудники организаторов: их на каждой гонке было около 50 человек, каждый через монитор следил за своим участком, фиксировал нарушения, затем перепроверял их на повторе. Теперь организаторам хватает 16 человек, которые обрабатывают данные новой системы, разработанной при участии Microsoft. Вместо 50 человек организаторы установили 46 камер и получили точную модель трассы, данные с камер накладываются на нее, и в результате можно бесспорно определить нарушения.
Конечно, как в любой области использования данных, в спорте тоже существуют потенциальные угрозы при внедрении ИИ: это и законность использования данных спортсменов, и признание результатов игры в случае взлома, и достоверность результатов оценки потенциала спортсменов в случае взлома использующихся систем, и возможность воздействия на поведение болельщиков в случае взлома чат-ботов и виртуальных ассистентов. Все-таки будем надеяться, что информационная безопасность на стадионах и кортах на высоте и такие эксцессы будут встречаться редко.
Источник: TAdviser