Огляд з детектування обличь на основі глибокого навчання

Автор(и)

DOI:

https://doi.org/10.15276/aait.06.2023.15

Ключові слова:

Виявлення обличчя, одноступеневий детектор, двоступеневий детектор, глибоке навчання, детектор одиночного пострілу, багатозадачні каскадні згорткові нейронні мережі MTCNN, RetinaNet, YuNet

Анотація

У статті основна увага приділяється огляду моделей виявлення обличчя, що ґрунтуються на глибокому навчанні, зокрема огляду різних одноетапних моделей, з яких можна вибрати відповідну модель розпізнавання осіб, і в той же час пропонується напрям удосконалення моделі виявлення обличчя відповідно до фактичних вимог прикладних систем комп'ютерного зору. Моделі виявлення обличчя, які були проведені, включають SSD, MTCNN, RetinaNet, YuNet у наборі даних Wider Face. Завдання під час опитування – структурне дослідження вибраних моделей, проведення експериментальних досліджень для оцінки точності та продуктивності цих моделей. Для оцінки та надання моделі виявлення обличчя, що відповідає вимогам, використовуються два показники - AP для оцінки точності та FPS для оцінки продуктивності. Для наших додатків у режимі реального часу на системах камер, пов’язаних із обличчям, таких як система моніторингу водія, система безпеки супермаркетів (попередження про крадіжки в магазинах, попередження про порушення порядку), система відвідування, часто вимагає швидкої обробки, але все одно забезпечує точність. Моделі, які зараз застосовуються в нашій системі, як-от Yolos, RetinaNet_MobileNet, SSD, гарантують обробку в реальному часі, але більшість із цих моделей мають труднощі з виявленням маленьких облич у кадрі та випадках, що містять контексти, які легко прийняти за обличчя людини. У той же час модель RetinaNet_Resnet50 забезпечує найвищу точність, особливо для забезпечення виявлення маленьких облич у кадрі, але час обробки більший. Тому за допомогою цього опитування ми пропонуємо напрямок удосконалення моделі розпізнавання обличчя на основі структури RetinaNet з метою забезпечення точності та скорочення часу обробки

Завантаження

Дані завантаження ще не доступні.

Біографії авторів

Тхе Вінь Чан, Університет транспорту міста Хошимін, місто Хошімін. В'єтнам

доктор філософії, старший викладач кафедри Інформаційних систем. Університет транспорту
міста Хошимін, місто Хошімін. В'єтнам

Scopus ID: 288641

Нгуєн Тхі Кхань Тієн, Національний університет «Одеська політехніка». Одеса, Україна

доктор філософії, старший викладач кафедри Інформаційних технологій (Ho Chi Minh City
University of Transport. Ho Chi Minh City. Vietnam), старший викладач кафедри Інформаційних систем. Національний університет «Одеська політехніка». Одеса, Україна


 

Чан Кім Тхань , Університет транспорту міста Хошимін, місто Хошімін, В'єтнам

доктор філософії, старший викладач. Університет транспорту міста Хошимін, місто Хошімін, В'єтнам


 

Опубліковано

2023-06-02

Як цитувати

[1]
The V.T.., Tien N.T.K.., Thanh T.K.. “A survey on deep learning based face detection”. Applied Aspects of Information Technology. 2023; Vol. 6, No. 2: 201–212. DOI:https://doi.org/10.15276/aait.06.2023.15.