Построение ассоциативной классификационной модели данных на основе метода Apriori


https://doi.org/10.21686/1818-4243-2020-4-4-12

Полный текст:


Аннотация

Целью работы является исследование современных проблем и перспектив решения интеллектуального анализа больших веб-данных в реальном времени, а также возможность практической реализации технологии Web Mining для больших веб-данных на практическом примере.
Материалы и методы. Исследование включало в себя обзор библиографических источников по проблемам интеллектуального анализа больших данных. Была применена технология Web Mining для ассоциативного анализа больших веб-данных, а также компьютерное моделирование практической задачи анализа транзакции с помощью скриптового языка общего назначения (PHP).
Результаты. В ходе работы описана специфика технологии Data Mining, а также был проанализирован современный подход к анализу больших веб-данных – Web Mining. Дана краткая классификация решаемым задачам с помощью технологии Web Mining. Обоснована проблема интеллектуального анализа больших веб – данных на скриптовом языке общего назначения (PHP): отсутствие библиотек для интеллектуального анализа данных, затрудненная нормализация данных к виду необходимому для интеллектуального анализ, взаимодействие с системой управления базой данных. Так же был реализован пример, показывающий подход к интеллектуальному анализу больших веб-данных. На основе представления о технологии Web Mining и описанных сложностях анализа веб-данных на языке PHP, были предложены приёмы эффективного решения поставленной практической задачи интеллектуального анализа веб-данных на основе транзакций, совершенных в динамическом веб-приложении. Был разработан модуль ассоциативного анализа транзакций клиентов на языке программирования PHP. Модуль включает в себя класс интеллектуальной обработки данных. Так же разработана структурная схема модуля, архитектура системы. Построенный модуль позволяет решить основную часть проблемы ассоциативного анализа больших веб-данных по технологии Web Mining с целью решения поставленной задачи выявления закономерностей в большом массиве веб-данных. Ассоциативный анализ веб - данных происходит значительно быстрее благодаря сочетанию скриптового языка общего назначения и объектно-ориентированного подхода.
Заключение. По результатам проведённого исследования, можно утверждать, что современное состояние технологии анализа больших веб-данных позволяет эффективно обрабатывать объекты данных, выявлять закономерности, получать скрытые данные и получать полноценные статистические данные в реальном времени. Полученные результаты могут использоваться как в целях первичного изучения технологий анализа больших веб-данных, так и в качестве дополнения к системе управления содержимым для интеллектуального анализа веб-данных. Использование технологии ассоциативного анализа и созданного универсального класса-обработчика делает созданный модуль гибким, а возможность ручной интеграции делает данный модуль универсальным (не зависит от системы управления базой данных). Методы алгоритма работают с выбранными данными. Данный фактор существенно упрощает дальнейшую разработку программного кода.


Об авторах

К. В. Мулюкова
Инженерно-технологическая академия Южного федерального университета
Россия

Ксения Валериановна Мулюкова - аспирант 

Таганрог



В. М. Курейчик
Инженерно-технологическая академия Южного федерального университета

Виктор Михайлович Курейчик - д.т.н., профессор

Таганрог



Список литературы

1. Акимушкин В.А., Поздняков С.Н. Обзор методов educational data mining для анализа протоколов взаимодействия обучаемого с «научными играми» // Компьютерные инструменты в образовании. 2013. № 6. С. 26–32.

2. Марц Н., Уоррен Д. Большие данные. Принципы и практика построения масштабируемых систем обработки данных в реальном времени. М.: Вильямс, 2017. 368 с.

3. Кошик А. Веб-аналитика 2.0 на практике. Тонкости и лучшие методики. М.: Вильямс, 2014. 528 с.

4. Novikova G.M., Azofeifa E.J. Semantics of big data in corporate management systems // Discrete and Continuous Models and Applied Computational Science. 2018. № 4 (26). С. 383–392.

5. Паклин H., Орешков В. Бизнес-аналитика: от данных к знаниям. СПб.: Питер, 2013. 704 с.

6. Благирев А. П., Хапаева Н. Big Data простым языком. М.: АСТ, 2019. 256 с.

7. Кычкин А.В., Квитко Я.И. Архитектурно-функциональная организация информационной системы управления большими данными в промышленности и энергетике // Вестник Пермского национального исследовательского политехнического университета. Электротехника, информационные технологии, системы управления. 2018. № 25. С. 109–125

8. Касторнова В.А. Технология использования программных сред информационно образовательного пространства предметной области «Информатика» в осуществлении контроля знаний // Управление образованием: теория и практика. 2018. № 3 (31). С. 33–49.

9. Филяк П.Ю., Байларли Э.Э.О., Растворов В.В., Старченко В.И. Инструментальные средства для использования Big Data и Data Mining в целях обеспечения информационной безопасности – подходы, опыт применения // Вестник Московского финансово-юридического университета. 2017. № 2. С. 210–220

10. Павлов Н. В. Советующая интеллектуальная система как инструмент решения маркетинговых проблем и обучения маркетологов-практиков // Практический маркетинг. 2018. № 3 (253). С. 3–9.

11. Большие Данные [Электрон. ресурс] // Толковый словарь на Академике. Режим доступа: https://dic.academic.ru/dic.nsf/ruwiki/1422719 (Дата обращения: 16.06.2020).

12. Data Mining: что внутри [Электрон. ресурс] // Habr. Режим доступа: https://habr.com/ru/post/95209/ (Дата обращения: 24.06.2020).

13. Мулюкова К.В., Курейчик В.М. Проблема анализа больших веб-данных и использование технологии Data Mining для обработки и поиска закономерностей в большом массиве веб-данных на практическом примере // Открытое образование. 2019. № 23 (2). С. 42–49.

14. Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Технологии анализа данных. Data Mining, Visual Mining, Text Mining, OLAP. 2 изд. Спб.: БХВ-Петербург, 2007. 384 с.

15. Суркова А.С., Буденков С.С. Построение модели и алгоритма кластеризации в интеллектуальном анализе данных // Вестник Нижегородского университета им. Н.И. Лобачевского. 2012. № 2 (1). С. 198–202.

16. Григораш А.С., Курейчик В.М., Курейчик В.В. Программный комплекс решения задачи кластеризации // Программные продукты и системы. 2017. № 2(30). С. 261–269.

17. Валитова Ю. О., Фазанова А. Д. Алгоритм автоматизированного сбора и анализа данных для формирования модели личности специалиста, востребованного рынком труда // Вестник евразийской науки. 2017. № 2 (9). С. 1–9.

18. Сытник А.А., Шульга Т.Э., Данилов Н.А., Гвоздюк И.В. Математическая модель активности пользователей программного обеспечения // Программные продукты и системы. 2018. № 1(31). С. 79-84.

19. Пивоварова Н.В., Видунова С.И. Интеллектуальный анализ данных в фармацевтическом бизнесе // Вестник евразийской науки. 2016. № 6 (8). С. 1–8.

20. Биллиг В.А., Иванова О.В., Царегородцев Н.А. Построение ассоциативных правил в задаче медицинской диагностики // Программные продукты и системы. 2016. № 2 (114). C. 146–157.

21. Олянич И.А. Сравнение алгоритмов построения ассоциативных правил на основе набора данных покупательских транзакций // Известия Самарского научного центра Российской академии наук. 2018. № 6-2 (20). С. 379–382.

22. Свиридов А.С., Лазарев В.С. Разработка базовой абстракции действий по выполнению математических операций на языке программирования PHP // Известия Южного федерального университета. Технические науки. 2015. № 4 (165). С. 217–224.

23. Лагерев Д.Г., Савостин И.А., Герасимчук В.Ю., Полякова М.С. Исследование склонности пользователей интернет-магазина к покупке на основе технических данных о визитах посетителей интернет-магазина // Современные информационные технологии и ИТ-образование. 2018. № 4 (14). С. 911–922.


Дополнительные файлы

Для цитирования: Мулюкова К.В., Курейчик В.М. Построение ассоциативной классификационной модели данных на основе метода Apriori. Открытое образование. 2020;24(4):4-12. https://doi.org/10.21686/1818-4243-2020-4-4-12

For citation: Mulyukova K.V., Kureichik V.M. Building an Associative Classification Data Model Based on the Apriori Method. Open Education. 2020;24(4):4-12. (In Russ.) https://doi.org/10.21686/1818-4243-2020-4-4-12

Просмотров: 67

Обратные ссылки

  • Обратные ссылки не определены.


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1818-4243 (Print)
ISSN 2079-5939 (Online)