Задать вопрос юристу

Исследовательский анализ и извлечение знаний

Исследовательский анализ и извлечение знаний могут быть использованы для обнаружения скрытых знаний, что представляет собой целый интерактивный процесс выявления в данных неизвестных ранее паттернов или структур.
Значения понятий «исследовательский анализ данных», «извлечение знаний» и «обнаружение знаний» часто путаются. На первой международной конференции по обнару-жению знаний в Монреале в 1995 г. было предложено применять термин «обнаружение знаний» для описания всего процесса «извлечения знаний из данных». В этом контексте под знаниями понимаются взаимосвязи между элементами данных и паттерны в наборах данных. В дальнейшем было предложено, чтобы термин «извлечение знаний» использовался исключительно для обозначения той стадии процесса, на которой происходит обнаружение как таковое.
Выражаясь точнее, обнаружение знаний можно было бы определить как нетривиальное извлечение из данных первоначально неизвестных и потенциально полезных знаний. Обнаружение знаний — это междисциплинарный подход, использующий машинное обучение, статистику, технологию баз данных, экспертные системы и методы визуального представления данных. Все они могут внести свой вклад в процесс получения новых знаний.
Основной процесс исследовательского анализа данных и извлечения знаний состоит из множества шагов, начиная с формулировки целей и заканчивая оценкой результатов. Он может включать в себя петлю обратной связи, что означает переформулирование целей на основе полученных результатов. В зависимости от целей этого процесса можно использовать какой-либо тип алгоритмов распознавания образов, машинное обучение или многомерный статистический анализ. Ключевым моментом в извлечении данных является обнаружение первоначально неизвестных структур или образов.
В этой книге мы, в первую очередь, будем использовать подход, основанный на СОК, для поиска образов в больших наборах данных. Главной причиной использования СОК для исследовательского анализа данных и извлечения знаний является то, что данный метод:
числовой, а не символьный;
непараметрический;
не требует никаких априорных предположений о распределении данных;
позволяет обнаруживать в наборах данных неизвестные ранее структуры или образы при помощи обучения без учителя.
Мы продемонстрируем также, что результаты, полученные с помощью СОК, часто можно улучшить, если использовать их в сочетании с традиционными статистическими методами либо в комбинации с другими прогрессивными средствами, а именно с нейронными сетями, обучаемыми с учителем, генетическими алгоритмами и нечеткой логикой. В нескольких главах этой книги будут обсуждаться гибридные приложения СОК.
Перед тем как перейти к более детальному описанию СОК, было бы полезно дать краткий обзор некоторых традиционных методов кластеризации и визуального представления данных без использования специальных математических терминов.
<< | >>
Источник: Дебок Г., Кохонен Т.. Анализ финансовых данных с помощью самоорганизующихся карт / Пер. с англ.-М.: Издательский Дом «АЛЬПИНА»,2001. — 317 с.. 2001

Еще по теме Исследовательский анализ и извлечение знаний:

  1. Извлечение знаний в базах данных
  2. Метод извлечения прецедентов на основе знаний.
  3. 5.5. Извлечения из УК РФ Извлечения из Уголовного кодекса Российской Федерации
  4. 3.1. Исследовательский анализ данных
  5. Р А З Д Е Л 4ВОПРОСЫ ДЛЯ КОНТРОЛЯ ЗНАНИЙ ПО ТЕОРИИ ЭКОНОМИЧЕСКОГО АНАЛИЗА
  6. Методы извлечения прецедентов.
  7. Выбор исследовательской организации.
  8. Взаимоотношения с исследовательскими агентствами
  9. Метод извлечения с учетом применимости прецедентов.
  10. 14.7. Теории извлечения ренты
  11. Научно-исследовательские, опытно-конструкторские и технологические работы
  12. Организация исследований с помощью специализированных исследовательских агентств
  13. Глава 3.АНАЛИТИЧЕСКАЯ И ИССЛЕДОВАТЕЛЬСКАЯ ДЕЯТЕЛЬНОСТЬ В ЦЕНТРАЛЬНЫХ БАНКАХ
  14. Научно–исследовательские программы
  15. Принцип извлечения выгоды
  16. Виды услуг, оказываемых исследовательскими агентствами
  17. Преимущества и недостатки организации исследования силами исследовательской фирмы
  18. Метод извлечения прецедентов на основе деревьев решений.