10 Общих ошибок интеллектуального анализа данных (что вы не сделаете)

10 Распространенных ошибок интеллектуального анализа данных (которые вы не сделаете) - манекены

Добыча данных производится методом проб и ошибок, и поэтому для шахтеров данных ошибки допускаются только естественным образом. Ошибки могут быть ценными, другими словами, по крайней мере при определенных условиях. Однако не все ошибки создаются равными. Некоторых лучше всего избежать. Следующий список содержит десять таких ошибок. Если вы внимательно прочитаете их и передадите в память, вы можете избежать нескольких ударов по кривой обучения:

  • Пропуск проверки качества данных: Большинство шахтеров данных считают, что разработка прогнозирующих моделей более интересна, чем анализ данных по проблемам качества. Но если вам не удастся обнаружить и устранить проблемы с качеством данных, вы можете оказаться в бесполезных прогнозах.

  • Отсутствует точка: Вы обнаружили что-то захватывающее! Это хорошо, но если это не относится к бизнес-проблеме, которую вы решили решить, ну, это совсем не актуально. Вернуться в строй.

  • Полагая, что шаблон в данных доказывает причинно-следственную связь: Вы изучаете набор данных и замечаете, что когда переменная A увеличивается, переменная B также увеличивается. Это может произойти из-за того, что переменная A влияет на переменную B или потому что переменная B влияет на переменную A. С другой стороны, может быть, на то и другое влияет другая переменная, которую вы не рассматривали. Или это может быть одноразовое совпадение. Кто может сказать?

  • Вытягивание выводов слишком далеко: Не допускайте, чтобы отношения, которые вы наблюдаете в данных, повторялись в разных обстоятельствах. Если ваши данные были собраны в прохладной среде, не предполагайте, что все будет работать одинаково в горячей заводской настройке.

  • Ставки на результаты, которые не имеют смысла: Методы интеллектуального анализа данных являются неформальными и обычно не подкрепляются научным методом и теорией, поэтому ваши результаты лучше, по крайней мере, имеют смысл для бизнеса. Если нет общих оснований для получения результатов, ваше исполнительное руководство, вероятно, не воспримет это серьезно, и они не должны.

  • Влюбленность в конкретный метод моделирования: Существует не один тип модели интеллектуального анализа данных, который подходит для любой ситуации.

  • Внедрение модели в производство без адекватного тестирования: Не делайте ставку на свою интеллектуальную модель до тех пор, пока вы не проверите ее с данными об удержании и небольшими масштабами в поле.

  • Игнорирование результатов, которые вам не нравятся: Если вы проигнорируете свои данные сейчас, он вернется в один прекрасный день и скажет: «Я сказал вам об этом. «

  • Использование интеллектуального анализа данных для удовлетворения всех потребностей анализа данных: Углубление данных имеет огромную ценность, однако некоторые приложения по-прежнему требуют строгих методов сбора данных, формального статистического анализа и научного метода.

  • Предполагая, что традиционные методы анализа данных больше не имеют значения: Обратитесь к предыдущей марке.