Сегодня трудно найти хотя бы одну отрасль, в которой бы не использовали ИИ. Однако, согласно исследованиям, 80% проектов на базе AI-технологии заканчиваются неудачей. Одна из главных причин – некачественные данные, которые используются для обучения и работы ИИ-инструментов.
Если данные, которые используются для обучения ИИ-моделей некорректны или неполны, то модель не сможет точно определять закономерности и делать правильные выводы. Например, ИИ-инструмент для диагностики заболеваний, обученный на неточных медицинских записях, будет выдавать неверные диагнозы, что, понятно, может привести к серьёзным последствиям для здоровья пациентов.
Данные, содержащие предвзятые или дискриминационные элементы, приводят к тому, что ИИ «наследует» предвзятое отношение. Например, если алгоритм набора персонала обучен на основе данных, исходя из которых предпочтение отдается кандидатам определённого пола или национальности, то ИИ будет продолжать эту практику.
Данные должны быть точными и надежными, чтобы ИИ-решения работали корректно. В беспилотных автомобилях, например, ошибки в данных могут привести к авариям и к жертвам. Например, в некоторых случаях автопилот Tesla неправильно интерпретировал дорожные знаки и разметку, что приводило к аварийным ситуациям. В одном из инцидентов автопилот принял белую боковую полосу на дороге за продолжение пути, что привело к столкновению.
И подписывайтесь на наш телеграм-канал про аналитику и данные Analytics Now
Закажите бесплатную консультацию эксперта
Заявка принята