Розробка інфраструктури виявлення аномалій у наборах великих даних

Автор(и)

  • Хлевна Юлія Леонідівна Київський національний університет імені Тараса Шевченка, вул. Володимирська, 60. Київ, 01033, Україна https://orcid.org/0000-0002-1807-8450
  • Коваль Богдан Сергійович Київський національний університет імені Тараса Шевченка, вул. Володимирська, 60. Київ, 01033, Україна http://orcid.org/0000-0002-3757-0221

DOI:

https://doi.org/10.15276/aait.05.2022.23

Ключові слова:

великі дані, виявлення аномалій, хмарні обчислення, обробка даних, споживання даних

Анотація

У роботі представлено аналіз моделей, методів і технологій виявлення аномалій у даних. Зроблено висновок, що на
основі проведеного аналізу рішення проблеми виявлення аномалій у даних слід розглядати як комплексну технологію, яка
складається з формування та застосування математичних моделей у поєднанні з дослідженням підходів до обробки даних. У
статті проаналізовано сучасний стан технологій обробки потоків великих даних та відображено особливості найбільш
поширених і прогресивних з них, напр. Apache Hadoop, Apache Spark, Apache Cassandra, Apache Kafka, Apache Storm і
Apache Beam. Окрім цього, увага приділяється інфраструктурі, у якій створені моделі програмного забезпечення можуть
бути розгорнуті та використані, беручи до уваги високий характер даних у режимі реального часу. У статті запропоновано
сформувати інфраструктуру для виявлення аномалій у даних як прикладний приклад хмарної інфраструктури обробки
великих даних. У роботі продемонстровано розроблену модель інфраструктури для виявлення аномалій у потокових даних
реального часу, яка базується на експертному методі формування вимог до програмної складової, вибору алгоритму
виявлення аномалій, вибору інструментів та удосконалення алгоритму. Виділені інструменти виявлення аномалій
дозволяють створити безпечне рішення для виявлення аномалій у реальному часі за допомогою Dataflow, BigQuery ML і
Cloud DLP. У статті представлено прикладну реалізацію виявлення аномалій у режимі реального часу за допомогою GCP та
Apache Beam – аналіз потоку даних програмних журналів в інформаційній системі та виявлення серед них шахрайських, що
допоможе підвищити кібербезпеку системи. Робота демонструє можливі вдосконалення базової моделі, які можуть
допомогти її прискорити.

Завантаження

Дані завантаження ще не доступні.

Біографії авторів

Хлевна Юлія Леонідівна, Київський національний університет імені Тараса Шевченка, вул. Володимирська, 60. Київ, 01033, Україна

доктор технічних наук, доцент кафедри Технологій управління, Київський
національний університет імені Тараса Шевченка, вул. Володимирська, 60. Київ, 01033, Україна

Scopus Author ID: 57191869873

Коваль Богдан Сергійович, Київський національний університет імені Тараса Шевченка, вул. Володимирська, 60. Київ, 01033, Україна

аспірант кафедри Технологій управління, Київський національний університет імені
Тараса Шевченка, вул. Володимирська, 60. Київ, 01033, Україна

Scopus Author ID: 57200141737

Опубліковано

2022-12-23

Як цитувати

[1]
Khlevna I.L.., Koval B.S. “Development of infrastructure for anomalies detection in big data”. Applied Aspects of Information Technology. 2022; Vol. 5, No. 4: 348–358. DOI:https://doi.org/10.15276/aait.05.2022.23.