Методи машинного навчання для класифікації мультимодальних даних

Автор(и)

  • Наталія Іванівна Бойко Національний університет “Львівська політехніка”, вул. Професорська, 1. Львів, 79013, Україна https://orcid.org/0000-0002-6962-9363
  • Михайло Васильович Музика Національний університет “Львівська політехніка”, вул. Професорська, 1. Львів, 79013, Україна https://orcid.org/0000-0001-8285-1631

DOI:

https://doi.org/10.15276/aait.05.2022.11

Ключові слова:

метод, алгоритм, аналіз, машинне навчання, мультимодальні дані, класифікація, K-найближчий сусід

Анотація

У цій роботі запропоновані методи аналізу мультимодальних методів даних, які сприябть підвищенню загальної точності
результатів, а також методи класифікації K-найближчого сусіда (KNN) для мінімізації їх ризику. Розглядається механізм
підвищення точності класифікації KNN. Методами дослідження, які використовуються в даній роботі, є порівняння, аналіз,
індукція, експеримент. Ця робота була спрямована на підвищення точності класифікації KNN шляхом порівняння вже існуючих
алгоритмів та застосування нових методів. Було проаналізовано багато літературних та медійних джерел на тему класифікації за
алгоритмом k найближчих сусідів та обрано найцікавіші, варіації поданого алгоритму. Акцент буде зроблено на досягненні
максимальної точності класифікації шляхом порівняння існуючих і їх удосконалення існуючих методів вибору числа k і
знаходження найближчого класу. Також порівнюються алгоритми з аналізом і попередньою обробкою даних і без них. Усі
стратегії, які розгляндаються в цій статті, будуть досягнуті суто практичним шляхом. Проведено експериментальну класифікацію
за k найближчими сусідами з різними варіаціями. Даними для експерименту використовувались два різних набори даних різного
розміру. В якості аргументів класифікації були взяті різні класифікації k і розмір тестової вибірки. В роботі вивчаються три
варіанти алгоритму k найближчих сусідів: класичний KNN, KNN з найменшим середнім і гібридний KNN. Здійснюється
порівняння цих алгоритмів для різних розмірів тестової вибірки для інших чисел k. У статті аналізуються дані перед
класифікацією. Що стосується підбору числа k, то не існує простого методу, який би дав максимальний результат з великою
точністю. Суть алгоритму полягає в тому, щоб знайти k найближчих до вибірки об'єктів, які вже класифіковані за попередньо
заданими та пронумерованими класами. Потім серед цих k об’єктів потрібно порахувати, скільки разів зустрічається клас, і
призначити обраному об’єкту найпоширеніший клас.

Завантаження

Дані завантаження ще не доступні.

Біографії авторів

Наталія Іванівна Бойко, Національний університет “Львівська політехніка”, вул. Професорська, 1. Львів, 79013, Україна

кандидат економічних наук, доцент кафедри Системи штучного інтелекту

Scopus Author ID: 57191967462

 

Михайло Васильович Музика, Національний університет “Львівська політехніка”, вул. Професорська, 1. Львів, 79013, Україна

Кафедра Системи штучного інтелекту

Опубліковано

2022-07-04

Як цитувати

[1]
Boyko N.I., Muzyka M.V.. “Methods of analysis of multimodal data to increase the accuracy of classification”. Applied Aspects of Information Technology. 2022; Vol. 5, No. 2: 147-160. DOI:https://doi.org/10.15276/aait.05.2022.11.