Keywords: data Mining, big Data, data processing, decision visualization, decision trees, neural networks, KDID, data preparation
DATA PREPARATION FOR DATA MINING
UDC 004.82
The article provides an analytical overview of such approaches as Data Mining, KDID. The trends and prospects of Data Mining are examined. Attention is paid to the issue of preparing source data in mining models, an author's approach to preparing source data is proposed, based on the calculation of global and local values of the average for a classification sample of data.
1. Han, J. and M. Kamber, Data Mining: Concepts and Techniques, Morgan Kaufmann,
2. San. Francisco, 2000 [Электронный ресурс]. Режим доступа http://media.wiley.com/product_data/excerpt/24/04712285/0471228524-1.pdf (Дата обращения 13.05.20).
3. MIKE2.0, Big Data Definition [Электронный ресурс]. Режим доступа: http://mike2.openmethodology.org/wiki/Big_Data_Definition (Дата обращения 13.05.20).
4. Луньков А. Д. Интеллектуальный анализ данных [Электронный ресурс] / А. Д. Луньков, А. В. Харламов // Саратовский национальный исследовательский университет. – Режим доступа: http://elibrary.sgu.ru/uch_lit/1141.pdf (Дата обращения 15.05.20).
5. Keith D. Foote, Big Data Trends in 2020 [Электронный ресурс]. Режим доступа: https://www.dataversity.net/big-data-trends-in-2020 (Дата обращения 14.05.20).
6. Введение в современный Data Mining [Электронный ресурс]. Режим доступа: https://statistica.ru/local-portals/data-mining/ (Дата обращения 12.05.20).
7. GridMiner: An Infrastructure for Data Mining on Computational Grids Peter Brezany1 , Jürgen Hofer1 , A Min Tjoa2 , Alexander Wöhrer1 1 Institute for Software Science, University of Vienna Liechtensteinstrasse 22, A-1090 Vienna, Austria, [электронный ресурс]. Режим доступа http://www.gridminer.org/publications/brezany_apac03.pdf (Дата обращения 13.05.20).
8. Лавлинская О. Ю. Решение задачи классификации данных на основе многослойного персептрона / О. Ю. Лавлинская, В. О. Логвина // Вестник Воронежского института высоких технологий. – № 2 (29). – 2019. – C. 59-64.
9. Dorian Pyle. Data Preparation for Data Mining. – Los Altos, California: Morgan Kaufmann Publishers, 1999.
Keywords: data Mining, big Data, data processing, decision visualization, decision trees, neural networks, KDID, data preparation
For citation: Lavlinskaya O.Y. , Kiseleva V.I. , DATA PREPARATION FOR DATA MINING. Bulletin of the Voronezh Institute of High Technologies. 2020;14(2). Available from: https://vestnikvivt.ru/ru/journal/pdf?id=1082 (In Russ).
Published 30.06.2020