9 Законов интеллектуального анализа данных

9 Законов интеллектуального анализа данных - манекены

Каждая профессия имеет свои руководящие принципы, идеи, которые обеспечивают структуру и руководство в повседневной работе. Добыча данных не является исключением. Ниже приведены девять основных идей, которые помогут вам, когда вы приступите к работе и станьте шахтером данных. Это 9 законов интеллектуального анализа данных, поскольку они были изначально заявлены первопроходцем данных Томаса Хабаза.

1-й закон: бизнес-цели

Вот 1-й закон интеллектуального анализа данных или «Закон о коммерческих целях»: Бизнес-цели являются источником каждого решения для интеллектуального анализа данных.

Вы изучаете данные, чтобы найти информацию, которая поможет вам лучше управлять бизнесом. Разве это не должно быть мантрой анализа всех бизнес-данных? Конечно, должно! Но начинающие шахтеры данных часто сосредотачиваются на технологиях и других деталях, которые могут быть интересными, но не согласованными с потребностями и целями исполнительных лиц, принимающих решения.

Вам нужно разработать привычку определять бизнес-цели, прежде чем делать что-либо еще, и сосредоточиться на этих целях на каждом шаге процесса обработки данных. Примечательно, что этот закон на первом месте. Каждый должен понимать, что интеллектуальный анализ данных - это процесс с определенной целью.

2-й закон: знание бизнеса

Вот 2-й закон интеллектуального анализа данных или «Закон о бизнес-знаниях»: Знания бизнеса являются центральными для каждого этапа процесса интеллектуального анализа данных.

Добыча данных дает власть людям - бизнесменам, которые используют свои знания, опыт и понимание бизнеса, а также методы интеллектуального анализа данных, чтобы найти смысл в данных.

Вам не обязательно быть странным статистиком для интеллектуального анализа данных, но вам нужно знать что-то о том, что означают данные и как работает бизнес. Только когда вы понимаете данные и проблемы, которые вам нужно решить, процессы обработки данных помогут вам найти полезную информацию и использовать ее.

3-й закон: подготовка данных

Вот третий закон интеллектуального анализа данных или «Закон о подготовке данных»: Подготовка данных - это более половины каждого процесса добычи данных.

Традиционные статистики часто имеют возможность собирать новые данные для решения конкретных вопросов исследования. Они могут использовать строгие процессы для планирования экспериментов, проектных анкетирования исследовательских опросов или иным образом собирать высококачественные данные, которые хорошо ориентированы на конкретные цели исследований. Но после всего этого они все еще проводят много времени для очистки и подготовки данных для анализа.

С другой стороны, шахтеры данных почти всегда должны работать с любыми доступными данными. Они используют существующие бизнес-записи, общедоступные данные или данные, которые они могут купить.Скорее всего, все эти данные были собраны для каких-то целей, кроме интеллектуального анализа данных, и без какого-либо строгого плана или тщательного сбора данных. Поэтому шахтеры данных тратят много времени на подготовку данных.

4-й закон: правая модель

Вот 4-й закон интеллектуального анализа данных или «NFL-DM»: Правильная модель для данного приложения может быть обнаружена только экспериментом.

Этот закон также известен стенограммой NFL-DM, а это означает, что для шахтера данных нет бесплатного обеда.

Во-первых, что такое модель? Это уравнение, которое представляет собой картину, наблюдаемую в данных. По крайней мере, он представляет собой образец грубым образом. Математические модели реальных вещей никогда не бывают совершенными! Это факт жизни, и это справедливо и для ядерных физиков, как для шахтеров данных.

В процессе интеллектуального анализа данных модели выбираются путем проб и ошибок. Вы будете экспериментировать с разными типами моделей.

Пятый закон: Образец

Вот 5-й закон интеллектуального анализа данных: Всегда есть шаблоны.

В качестве шахтёра данных вы изучите данные в поисках полезных шаблонов. Другими словами, вы будете искать значимые отношения между переменными в данных. Понимание этих отношений обеспечивает лучшее понимание бизнеса и лучшее предсказание того, что произойдет в будущем. Самое главное, что понимание шаблонов в данных позволяет вам влиять на то, что произойдет в будущем.

Вы всегда находите шаблоны. В данных всегда есть что рассказать. Иногда это подтверждает то, что вы делаете правильно. Это может показаться не очень интересным, но, по крайней мере, оно говорит вам, что вы на правильном пути. В другие дни данные могут сообщать вам, что ваша текущая практика не работает. Это захватывающе, и хотя в краткосрочной перспективе это может не понравиться, знание истины - важный шаг к улучшению.

6-й закон: Усиление

Вот 6-й закон интеллектуального анализа данных или «Закон о проницательности»: Упрощение данных усиливает восприятие в бизнес-области.

Методы интеллектуального анализа данных позволяют лучше понять ваш бизнес, чем вы могли бы сделать без них. Методы интеллектуального анализа данных помогают вам использовать лупу или микроскоп, позволяя обнаруживать эффекты, которые трудно или невозможно обнаружить посредством обычной отчетности.

Вывод данных не мгновенен.

Открытие и обучение с помощью интеллектуального анализа данных - это интерактивный процесс. Вы сделаете открытия, узнаете немного от каждого из них и используете то, что вы обнаружили, чтобы принять меры. Результаты каждого действия, которое вы попробуете, будут давать больше данных, и эти данные позволят вам понять что-то еще. Это цикл открытия, и цикл продолжается до тех пор, пока вы продолжаете исследовать и экспериментировать.

7-й закон: предсказание

Вот 7-й закон интеллектуального анализа данных или «Закон о предсказании»: Прогнозирование увеличивает информацию локально путем обобщения.

Вывод данных помогает вам использовать то, что вы знаете, чтобы делать лучшие прогнозы (или оценки) вещей, которые вы не знаете. В интеллектуальном анализе данных используются методы данных и моделирования, чтобы заменить ваши неформальные ожидания данными, согласованными и более точными оценками.

8-й закон: значение

Вот 8-й закон интеллектуального анализа данных или «Закон о стоимости»: Значение результатов интеллектуального анализа данных не определяется точностью или стабильностью прогнозирующих моделей.

Данные горняки не боятся теории. Как шахтер данных, вы, возможно, даже не знаете теорию статистических моделей, которые вы используете. Возможно, это так же хорошо, потому что в области интеллектуального анализа данных вы будете использовать эти модели способами, которые не обязательно совпадают с теорией, стоящей за ними.

Вы будете искать модели, которые дадут правильные прогнозы (и вы будете использовать тестирование, а не статистическую теорию, чтобы судить об этом). Но вы можете больше беспокоиться о других проблемах, например о том, является ли модель деловой, просвещает вас о неожиданных прогнозирующих факторах или практична для использования на вашем рабочем месте.

9-й Закон: Изменить

Вот 9-й закон интеллектуального анализа данных или «Закон об изменении»: Все шаблоны могут быть изменены.

Мир всегда меняется. Модель, которая дает вам великие прогнозы сегодня, может быть бесполезной завтра. Это факт жизни для всех аналитиков данных, а не только для данных шахтеров.