Задать вопрос юристу

Извлечение знаний в базах данных

(Knowledge Discovery in Databases). Извлечение (поиск) знаний в базах данных (Knowledge Discovery in Databases - KDD) - процесс обнаружения полезных знаний в базах данных. Эти знания могут быть представлены в виде закономерностей, правил, прогнозов, связей между элементами данных и др.
Главным инструментом поиска знаний в процессе KDD являются аналитические технологии Data Mining, реализующие задачи классификации, кластеризации, регрессии, прогнозирования, предсказания и т.д.
Однако, в соответствии с концепцией KDD, эффективный процесс поиска знаний не ограничивается их анализом. KDD включает последовательность операций, необходимых для поддержки аналитического процесса. К ним отно-сятся:
Консолидация данных - процесс их извлечения из различных ис-точников (OLTP-систем, СУБД, файлов отдельных пользователей, Интернета и т.д.) и загрузка в централизованное хранилище данных.
Подготовка анализируемых выборок данных (в том числе, обучающих), загрузка их из хранилища данных или других источников в аналитическое приложение.
Очистка данных от факторов, мешающих их корректному анализу, таких, как шумы и аномальные значений, дубликаты, противоречия, пропуски, фиктивные значения и т.д.
Трансформация - оптимизация данных для решения определенной задачи. Обычно на данном этапе выполняется исключение незначащих факторов, снижения размерности входных данных, нормализация, обогащение и другие преобразования, позволяющие лучше «приспособить» данные к решению аналитической задачи.
Анализ данных - применение методов и технологий Data Mining: построение и обучение моделей (нейронных сетей, деревьев решений, карт Кохонена и др.), решение задач классификации и регрес-сии, кластеризации, прогнозирования, поиска ассоциаций и т.д. Интерпретация и визуализация результатов анализа, их применение в бизнес-приложениях.
Knowledge Discovery in Databases не задает набор методов обработки или пригодные для анализа алгоритмы, он определяет последовательность действий, которую необходимо выполнить для того, чтобы из исходных данных по-лучить знания. Данный подход универсальный и не зависит от предметной области, что является его несомненным достоинством.
Основоположниками концепции KDD считаются Григорий Пятецкий- Шапиро (Gregory Piatetsky-Shapiro) и Усама Файад (Usama Fayyad).
<< | >>
Источник: Л.А. Трофимова, В.В. Трофимов. Управленческие решения (методы принятия и реализации) : учебное пособие Л.А. Трофимова, В.В. Трофимов . - СПб. : Изд-во СПбГУЭФ,2011. - 190 с.. 2011

Еще по теме Извлечение знаний в базах данных:

  1. 1.3. Анализ формирования инвестиционной политики зарубежных стран в сфере промышленного развития
  2. Глоссарий
  3. 1.24. Бизнес разведка
  4. 7.2. Методы поддержки принятия решений на основе информационных технологий
  5. Извлечение знаний в базах данных
  6. Проблемы, решаемые с помощью методов ИИ
  7. Вопросы для повторения
  8. В поисках знаний
  9. Исследовательский анализ и извлечение знаний
  10. 3.1. Исследовательский анализ данных
  11. 13.4. Viscovery SOMine Lite: дружественный интерфейс и прекрасная визуализация
  12. Часть 2. Загнанных лошадей пристреливают, не правда ли?
  13. Понятие и целесообразность портфельных инвестиций
  14. Экономический потенциал мирового хозяйства: природные и трудовые ресурсы и их оптимальное использование
  15. Базы данных и системы управления ими