Ефективне детектування і заміна облич при створенні простого фейкового відео

Автор(и)

  • Шеремет Олексій Іванович Донбаська державна машинобудівна академія, бул. Машинобудівників, 39. Краматорськ, Україна https://orcid.org/0000-0003-1298-3617
  • Садовой Олександр Валентинович національний ТУ «Дніпровська політехніка», пр. Дмитра Яворницького, 19. Дніпро, Україна https://orcid.org/0000-0001-9739-3661
  • Гаршанов Денис Володимирович Харківський національний університет радіоелектроніки, пр. Науки, 14. Харків, Україна https://orcid.org/0009-0008-6257-468X
  • Ковальчук Олег Степанович Донбаська державна машинобудівнв академія, бул. Машинобудівників, 39. Краматорськ, Україна https://orcid.org/0009-0009-5521-6451
  • Шеремет Катерина Сергіївна Донбаська державна машинобудівна академія, бул. Машинобудівників, 39. Краматорськ, Україна https://orcid.org/0000-0003-3783-5274
  • Сохіна Юлія Віталіївна Дніпровський державний технічний університет, вул. Дніпробудівська, 2. Кам’янське, Україна https://orcid.org/0000-0002-4329-5182

DOI:

https://doi.org/10.15276/aait.06.2023.20

Ключові слова:

діпфейк, афінна трансформація, виявлення обличчя, відео обробка, альфа-канал, бінарні маски

Анотація

Технології виявлення та розпізнавання обличь є одними з найбільш інтенсивно досліджуваних тем у галузі комп’ютерного зору завдяки їх величезному потенціалу застосування в багатьох галузях. Ці технології продемонстрували практичне застосування в різних контекстах, таких як виявлення підозрілих осіб у багатолюдних міських просторах, розпізнавання власників смартфонів у реальному часі, створення переконливих діпфейків для розважальних додатків і спеціалізованих програм, які змінюють рухи рис обличчя, наприклад губ або очей. Завдяки сучасним досягненням апаратного та програмного забезпечення, сучасна технологічна інфраструктура надає більше ресурсів, ніж необхідно для потокового відео. У результаті прості системи розпізнавання обличь можуть бути реалізовані без використання дорогих серверів, які вимагають певних попередньо навчених моделей. Така велика кількість ресурсів змінює ландшафт розпізнавання обличь, і дискусія в даній статті обертається навколо цих нових парадигм. Основна увага в цій статті – поглиблений аналіз ключових концепцій детектування обличчя в потокових відеоданих за допомогою відомих попередньо навчених моделей. Обговорювані моделі включають HRNet, RetinaFace, Dlib, MediaPipe і KeyPoint R-CNN. Кожна з цих моделей має свої сильні та слабкі сторони, і дана стаття розглядає ці атрибути в контексті практичних прикладів із реального світу. Такий розгляд дає цінну інформацію про практичне застосування цих моделей і компроміси, пов’язані з їх використанням. Крім того, стаття представляє вичерпний огляд методів трансформації зображення. Представлено абстрактний метод афінного перетворення зображення, важливу техніку обробки зображень, яка змінює геометричні властивості зображення, не впливаючи на інтенсивність його пікселів. Крім того, у статті розглядаються операції перетворення зображень, які виконуються за допомогою бібліотеки OpenCV, однієї з провідних бібліотек у галузі комп’ютерного зору, що забезпечує дуже гнучкий і ефективний набір інструментів для маніпулювання зображеннями. Кульмінацією цього дослідження є практична автономна система для заміни зображення у відео. Ця система використовує модель RetinaFace для здійснення висновків і використовує OpenCV для афінних перетворень, демонструючи концепції та технології, які обговорюються в статті. Таким чином, проведена робот просуває сферу виявлення та розпізнавання обличь, представляючи інноваційний підхід, який повною мірою використовує сучасні апаратні та програмні досягнення.

Завантаження

Дані завантаження ще не доступні.

Біографії авторів

Шеремет Олексій Іванович, Донбаська державна машинобудівна академія, бул. Машинобудівників, 39. Краматорськ, Україна

доктор технічних наук, професор, завідувач кафедри Електромеханічних систем автоматизації 

Scopus ID: 57170410800

Садовой Олександр Валентинович, національний ТУ «Дніпровська політехніка», пр. Дмитра Яворницького, 19. Дніпро, Україна

Доктор технічних наук, професор кафедри Електроприводу 

Scopus Author ID: 57205432765

Гаршанов Денис Володимирович, Харківський національний університет радіоелектроніки, пр. Науки, 14. Харків, Україна

Студент факультету Комп’ютерної інженерії та управління 

 

Ковальчук Олег Степанович, Донбаська державна машинобудівнв академія, бул. Машинобудівників, 39. Краматорськ, Україна

Студент факультету Автоматизації машинобудування та інформаційних технологій

 

Шеремет Катерина Сергіївна, Донбаська державна машинобудівна академія, бул. Машинобудівників, 39. Краматорськ, Україна

Інженер кафедри Інтелектуальних систем прийняття рішень 

Scopus Author ID: 57207768511

Сохіна Юлія Віталіївна, Дніпровський державний технічний університет, вул. Дніпробудівська, 2. Кам’янське, Україна

Кандидат технічних наук, доцент кафедри Електротехніки та електромеханіки 

Scopus Author ID: 57205445522

Опубліковано

2023-09-30

Як цитувати

[1]
Sheremet O.I.., Sadovoi O.V.., Harshanov D.V., Kovalchuk O.S.., Sheremet K.S., Sokhina Y.V. “Efficient face detection and replacement in the creation of simple fake videos”. Applied Aspects of Information Technology. 2023; Vol. 6, No. 3: 286–303. DOI:https://doi.org/10.15276/aait.06.2023.20.

Статті цього автора (авторів), які найбільше читають