Фрагментна обробка відео за нормою Кі Фана
DOI:
https://doi.org/10.15276/aait.07.2024.5Ключові слова:
фрагментація відеопотоку, Кі Фан норма, декомпозиція сингулярного значенняАнотація
У даному дослідженні ми зосередили нашу увагу на способі формалізації опису блоків відеокадрів в контексті рішення
задачі відео фрагментації. Оскільки відеодані можуть бути різного розміру, розбиття на блоки кожного кадру дає
можливість формально описати кадр як квадратну матрицю. Блок кадру є матриця довільної розмірності. Можливість
пропустити крок приведення такої матриці до квадратної, або векторизація за допомогою деякого дескриптора дозволяє
знизити обчислювальні витрати, визволяючи обчислювальні ресурси необхідних для цього перетворення. В цьому
дослідженні ми використовуємо норму Кі Фана в якості дескриптора блоку кадру. Норма Кі Фана побудована на основі
сингулярних чисел матриці. Сингулярний розклад не має обмежень ні до розмірності, ні до характеру елементів вихідної
матриці. Ми провели порівняльний аналіз ефективності отриманого дескриптора для відео даних різного розміру і з різним
відношенням сторін який показав, що зміна дескриптора кожного блоку не залежить ні від розміру відео, ні від відношення
сторін. Зміни дескрипторів кожного блоку від кадру до кадру є ідентичними для відеоданих різного розміру. Це означає, що
в результаті такого фрагментного перетворення отримується квадратна матриця фіксованого розміру незалежно від розміру
вихідного відео. Це дозволяє уніфікувати подальшу обробку відео, що може бути корисним для задачі інформаційного
пошуку в великих базах відео даних за умов надання запиту «за зразком». В цьому випадку ми в режимі оффлайн можемо
проаналізувати існуючу базу і співставити кожному відео фіксовану квадратну матрицю дескрипторів, що дозволить значно
зменшити час та кількість ресурсів при співставленні із запитом. Також даний підхід може бути ефективно використаний
для аналізу відео даних з метою детектування руху і відстеження зміни сцени.