Фреймворк для систематизації методів науки про дані
DOI:
https://doi.org/10.15276/aait.01.2021.7Ключові слова:
наука про дані, фреймворк, попередня обробка даних, моделювання даних, візуалізація даних, ситуаційний аналізАнотація
Бурхливий розвиток науки про дані призвів до накопичення великої кількості моделей, методів і технік, які показали
доцільність свого застосування. Як показав аналіз публікацій, систематизація методів і технік науки про дані є актуальною
задачею, але в більшості результати релевантні до вирішення конкретної прикладної задачі. В роботі розроблено не орієнто-
ваний на конкретну предметну область та задачу фреймворк для систематизації методів науки про дані. Трирівнева ієрархія
метамодель-метод-техніка впорядковує залежності між існуючими методами та техніками та знижує складність їх розумін-
ня. Перший рівень структури складають три метамоделі: препроцесингу, моделювання та візуалізації даних. На другому
рівні розташовані методи, які відповідають метамоделям. На третьому рівні зібрані основні техніки, згруповані відповідно
до методів. Також описано принципи використання ієрархії. Для цього формально визначено типовий процес вирішення
завдання з залученням методів науки про дані та сформульовано алгоритм використання фреймворку. Метод ситуаційного
аналізу застосовано для того, щоб пересвідчитися в працездатності фреймворку. Розглянуто чотири кейси застосування
методів науки про дані для вирішення практичних завдань, які описані в сучасних публікаціях. Показано, що описані рі-
шення повністю узгоджуються з запропонованою ієрархією методів фреймворку. Визначено рекомендовані напрямки засто-
сування фреймворку та його обмеження: об’єкти обраної галузі повинні бути описані лише структурованими або напівстру-
ктурованими ознаками. На завершення наведено шляхи подальших досліджень.