Технология KDD (Knowledge discovery data-bases)
Технология KDD получила свое название в 1989 году. Представляет собой технологию извлечение данных из баз данных. Описывает не конкретный алгоритм или математический аппарат, а последовательность действий, которую необходимо выполнить для извлечения знаний. Основные этапы:
- Выборка данных - первый шаг KDD на основе которого формируется из имеющей совокупности данных исходная выборка. Для получения исходной выборки используются методы фильтрации данных, запросы экспертиза и экспертные данные.
- Очистка – процедура на основе исходной выборки информации представляющей ценность, поиск аномалий, обнаружение дубликатов и противоречий, сглаживания и т.д.
- Трансформация – для того чтобы представить информацию в определенном виде. Например для прогнозирования временных рядов ряд преобразуется в скользящее окно. К трансформации относится квантование сортировка группировка и другие
- Data Mining
- Интерпретация
Комментарии (0)