Задать вопрос юристу

Исследовательский анализ и извлечение знаний

Исследовательский анализ и извлечение знаний могут быть использованы для обнаружения скрытых знаний, что представляет собой целый интерактивный процесс выявления в данных неизвестных ранее паттернов или структур.
Значения понятий «исследовательский анализ данных», «извлечение знаний» и «обнаружение знаний» часто путаются. На первой международной конференции по обнару-жению знаний в Монреале в 1995 г. было предложено применять термин «обнаружение знаний» для описания всего процесса «извлечения знаний из данных». В этом контексте под знаниями понимаются взаимосвязи между элементами данных и паттерны в наборах данных. В дальнейшем было предложено, чтобы термин «извлечение знаний» использовался исключительно для обозначения той стадии процесса, на которой происходит обнаружение как таковое.
Выражаясь точнее, обнаружение знаний можно было бы определить как нетривиальное извлечение из данных первоначально неизвестных и потенциально полезных знаний. Обнаружение знаний — это междисциплинарный подход, использующий машинное обучение, статистику, технологию баз данных, экспертные системы и методы визуального представления данных. Все они могут внести свой вклад в процесс получения новых знаний.
Основной процесс исследовательского анализа данных и извлечения знаний состоит из множества шагов, начиная с формулировки целей и заканчивая оценкой результатов. Он может включать в себя петлю обратной связи, что означает переформулирование целей на основе полученных результатов. В зависимости от целей этого процесса можно использовать какой-либо тип алгоритмов распознавания образов, машинное обучение или многомерный статистический анализ. Ключевым моментом в извлечении данных является обнаружение первоначально неизвестных структур или образов.
В этой книге мы, в первую очередь, будем использовать подход, основанный на СОК, для поиска образов в больших наборах данных. Главной причиной использования СОК для исследовательского анализа данных и извлечения знаний является то, что данный метод:
числовой, а не символьный;
непараметрический;
не требует никаких априорных предположений о распределении данных;
позволяет обнаруживать в наборах данных неизвестные ранее структуры или образы при помощи обучения без учителя.
Мы продемонстрируем также, что результаты, полученные с помощью СОК, часто можно улучшить, если использовать их в сочетании с традиционными статистическими методами либо в комбинации с другими прогрессивными средствами, а именно с нейронными сетями, обучаемыми с учителем, генетическими алгоритмами и нечеткой логикой. В нескольких главах этой книги будут обсуждаться гибридные приложения СОК.
Перед тем как перейти к более детальному описанию СОК, было бы полезно дать краткий обзор некоторых традиционных методов кластеризации и визуального представления данных без использования специальных математических терминов.
<< | >>
Источник: Дебок Г., Кохонен Т.. Анализ финансовых данных с помощью самоорганизующихся карт / Пер. с англ.-М.: Издательский Дом «АЛЬПИНА»,2001. — 317 с.. 2001

Еще по теме Исследовательский анализ и извлечение знаний:

  1. Суть экономической теории
  2. ОПРЕДЕЛЕНИЯ ИННОВАЦИОННОЙ ДЕЯТЕЛЬНОСТИ В ЗАКОНОДАТЕЛЬНЫХ АКТАХ РОССИЙСКОЙ ФЕДЕРАЦИИ 1. НА ФЕДЕРАЛЬНОМ УРОВНЕ
  3. 1.3. Анализ формирования инвестиционной политики зарубежных стран в сфере промышленного развития
  4. 1.24. Бизнес разведка
  5. В поисках знаний
  6. Исследовательский анализ и извлечение знаний
  7. Самоорганизующиеся карты
  8. 3.1. Исследовательский анализ данных
  9. 13.4. Viscovery SOMine Lite: дружественный интерфейс и прекрасная визуализация
  10. 3.2. Использование внебюджетных источников
  11. Воздействие Европы на Азию в I500-i820-x гг.
  12. ВНУТРЕННЯЯ СТРУКТУРА ЭКОНОМИЧЕСКОГО ПРОЦЕССА ПРИСВОЕНИЯ СРЕДСТВ ПРОИЗВОДСТВА
  13. Понятие и целесообразность портфельных инвестиций
  14. ЛИТЕРАТУРА
  15. ГЛОССАРИЙ
  16. 2.1 Теоретические предпосылки оценки рисков аварий
  17. Понятие и характеристика договора коммерческой концессии
  18. Принципы инновационного права