Огляд з детектування обличь на основі глибокого навчання
DOI:
https://doi.org/10.15276/aait.06.2023.15Ключові слова:
Виявлення обличчя, одноступеневий детектор, двоступеневий детектор, глибоке навчання, детектор одиночного пострілу, багатозадачні каскадні згорткові нейронні мережі MTCNN, RetinaNet, YuNetАнотація
У статті основна увага приділяється огляду моделей виявлення обличчя, що ґрунтуються на глибокому навчанні, зокрема огляду різних одноетапних моделей, з яких можна вибрати відповідну модель розпізнавання осіб, і в той же час пропонується напрям удосконалення моделі виявлення обличчя відповідно до фактичних вимог прикладних систем комп'ютерного зору. Моделі виявлення обличчя, які були проведені, включають SSD, MTCNN, RetinaNet, YuNet у наборі даних Wider Face. Завдання під час опитування – структурне дослідження вибраних моделей, проведення експериментальних досліджень для оцінки точності та продуктивності цих моделей. Для оцінки та надання моделі виявлення обличчя, що відповідає вимогам, використовуються два показники - AP для оцінки точності та FPS для оцінки продуктивності. Для наших додатків у режимі реального часу на системах камер, пов’язаних із обличчям, таких як система моніторингу водія, система безпеки супермаркетів (попередження про крадіжки в магазинах, попередження про порушення порядку), система відвідування, часто вимагає швидкої обробки, але все одно забезпечує точність. Моделі, які зараз застосовуються в нашій системі, як-от Yolos, RetinaNet_MobileNet, SSD, гарантують обробку в реальному часі, але більшість із цих моделей мають труднощі з виявленням маленьких облич у кадрі та випадках, що містять контексти, які легко прийняти за обличчя людини. У той же час модель RetinaNet_Resnet50 забезпечує найвищу точність, особливо для забезпечення виявлення маленьких облич у кадрі, але час обробки більший. Тому за допомогою цього опитування ми пропонуємо напрямок удосконалення моделі розпізнавання обличчя на основі структури RetinaNet з метою забезпечення точності та скорочення часу обробки