Базы данных и интеллектуального анализа данных

Базы данных и Data Mining - манекены

Данные, собранные крупными организациями в ходе повседневной деятельности, обычно хранятся в базах данных. Но администраторы баз данных могут не захотеть разрешить непосредственным пользователям данных источники данных и прямой доступ могут быть не лучшим выбором с вашей точки зрения. Прямой доступ к операционным (используемым для обычных бизнес-операций) базам данных может быть плохой идеей, потому что

  • Data-шахтеры используют множество данных. > Вы можете непреднамеренно связать ресурсы и вмешиваться в обычные бизнес-операции.

    Имеются юридические и другие деловые обязательства.
  • Вы можете непреднамеренно нарушить закон о конфиденциальности данных или другое управление данными если ваш доступ к данным не контролируется должным образом. Операционные базы данных не организованы для интеллектуального анализа данных.

  • Вы можете потратить много времени на поиск необходимых данных и не будете уверены в правильности их использования. Когда вам нужны данные из оперативную базу данных (и у вас есть соответствующее разрешение на использование данных), вы должны обсудить свои потребности с администратором, ответственным за эти данные. Вам нужно будет точно указать, какие данные вам нужны, формат, необходимый для интеллектуального анализа данных, и нужны ли вам данные только один раз или на постоянной основе.

Наилучший подход для разовых запросов - это часто для того, чтобы администратор мог извлечь данные для вас и доставить их в текстовый файл или в другой приемлемый формат.

Постоянный доступ к данным - это другой вопрос. Администратор может не захотеть повторно предоставлять извлечение данных, а предоставление прямого доступа к бизнес-системам является рискованным. Общим решением является создание аналитической базы данных

. Это обычная реляционная база данных, которая отделена от обычных бизнес-систем. Данные регулярно (и автоматически) передаются из бизнес-систем в аналитическую базу данных, и данные могут получить доступ к ним в любое время.

Если вы используете аналитическую базу данных, убедитесь, что она организована правильно для поддержки интеллектуального анализа данных. Помогите администратору базы данных, нарисуя диаграмму, подобную той, которая показана, чтобы продемонстрировать, как должны быть организованы данные.

Если администратор базы данных настаивает на том, что данные не могут быть сохранены таким образом, спросите, возможно ли создать представление

(хранимый запрос, который можно запросить, как если бы это была обычная таблица данных) с организацией, которая вам нужна. Многие продукты для интеллектуального анализа данных могут считывать данные из баз данных. Необходимые шаги зависят от

Проекта приложения для интеллектуального анализа данных

  • Структура исходной базы данных

  • Middleware, обычно называемая драйвером

  • ( драйвер ODBC, драйвер JDBC < ), специальное программное обеспечение, которое посредничает между базой данных и прикладным программным обеспечением Документация для вашего приложения для интеллектуального анализа данных должна сообщить вам, может ли он считывать данные из базы данных, и если да, то какой инструмент или функция использовать и как.Администратор, создающий базу данных аналитики, может предоставить сведения о доступе к базе данных. Если вы уже комфортно работаете с базами данных и другими приложениями, вы не найдете ничего удивительного в том, чтобы делать то же самое с приложением для интеллектуального анализа данных. Если базы данных новы для вас, узнайте у специалиста из вашей организации, чтобы пройти через процесс с помощью собственной базы данных и приложения для интеллектуального анализа данных.