Основи інтелектуального аналізу даних

Код модуля:

Тип модуля: за вибором студента

Семестри: одинадцятий

Обсяг модуля:

Загальна кількість годин – 90 (кредитів ЕКТС – 3) аудиторні години – 36(лекції – 20, лабораторні заняття – 16)

Лектор: к.т.н., доцент Сидоренко Валерій Миколайович

Результати навчання:

  • знати :

теоретичні основи технології Data Mining;

  • вміти :

розробляти закінчені аналітичні сценарії на базі аналітичної платформи Deductor та в середовищі R, включаючи ETL-процес, проектування сховища даних та побудову моделей Data Mining у межах задач кластеризації, класифікації, регресії, пошуку асоціативних правил, пошуку послідовних шаблонів та аналізу часових рядів.

Спосіб навчання (аудиторне, дистанційне навчання): аудиторне

Необхідні обов’язкові попередні та супутні модулі:

вища математика, теорія ймовірностей та математична статистика, дискретна математика, алгоритми та методи обчислень, обчислювальна техніка, програмування, об’єктно-орієнтоване програмування, паралельні та розподілені обчислення, організація баз даних, системи управління базами даних, експертні системи та системи штучного інтелекту.

Зміст навчального модуля:

ETL-процес та OLAP.

Технології аналізу даних. Консолідація даних. Трансформація даних. Візуалізація даних. Очищення і попередня обробка даних.

Data Mining. Статистичні методи та машинне навчання. Методи зниження розмірності даних.

Задача асоціації. Задача кластеризації. Задачі класифікації та регресії. Аналіз часових рядів.

Рекомендована література:

1. Паклин Н.Б., Орешков В.И. Бизнес-аналитика: от данных к знаниям. — СПб.: Питер, 2009. — 624с.

2. Барсегян А. А., Куприянов М. С., Холод И. И. Анализ данных и процессов. СПб.: BHV, 2009. – 512 с.

3. Иберла К. Факторный анализ. Пер. с нем. М.: Статистика, 1980 - 398 с.

4. Харман Г. Современный факторный анализ. М.: Статистика, 1972 г. 489 с.

5. Дрейпер Н., Смит Г. Прикладной регрессионный анализ. В двух томах. М.: Финансы и статистика, 1986. — 351 с.

6. BaseGroup Labs технологии анализа данных [Электронный ресурс] : Аналитическая платформа  Deduсtor. — Электрон. дан.— Режим доступа: http://basegroup.ru/.— Загл. с экрана.

7. From Data Mining to Knowledge Discovery in Databases [Электронный ресурс]: / Под ред. Usama Fayyad, Gregory Piatetsky-Shapiro and Padhraic Smyth — Электрон. дан. (1файл). 1996 — Режим доступа: http://www.daedalus.es/fileadmin/daedalus/doc/MineriaDeDatos/fayyad96.pdf.— Загл. с экрана.

8. Web Mining Research: A Survey [Электронный ресурс] : / Под ред. Raymond Kosala,  Hendrik Blockeel — Электрон. дан. (1файл). 2000 — Режим доступа: www.sigkdd.org/explorations/issue2-1/kosala.pdf. — Загл. с экрана.

9. Data Mining Community's Top Resource 
for Data Mining and Analytics SoftwareJobsConsulting, Courses, Education, News, Companies, and more. Режим доступа:

http://www.kdnuggets.com/ . — Загл. с экрана.

Форми та методи навчання:

Лекції та лабораторні заняття, розрахунково-графічна робота, самостійна робота

Методи та критерії оцінювання:

Поточний контроль та підсумковий контроль:

  • лекції усіх змістовних модулів (10%);
  • розрахунково-графічна робота, модульний контроль (50%);
  • робота на практичних та лабораторних заняттях (20%);
  • залік (20%)

Мова навчання: українська 

Викладачі: 
Зображення користувача vmsidorenko.

Сидоренко Валерій