Методологія пошуку зображень на базі бінарного розбиття простору та перцептивного хешування

Автор(и)

  • Микола Анатолійович Годовиченко Одеський національний політехнічний ун-т, пр. Шевченка, 1. Одеса, 65044, Україна https://orcid.org/0000-0001-5422-3048
  • Світлана Григорівна Антощук Одеський національний політехнічний ун-т, пр. Шевченка, 1. Одеса, 65044, Україна https://orcid.org/0000-0002-9346-145X
  • Варвара Ігорівна Куваєва Одеський національний політехнічний ун-т, пр. Шевченка, 1. Одеса, 65044, Україна https://orcid.org/0000-0002-9350-1108

DOI:

https://doi.org/10.15276/aait.05.2022.10

Ключові слова:

пошук зображень на основі вмісту, бінарне розбиття простору, перцептивне хешування, дерево точки огляду, дискретне косинусне перетворення, дискретне вейвлет-перетворення

Анотація

Стаття розглядає питання щодо побудови систем пошуку зображень на основі зображення-зразка. Розглянуто основні
виклики, які стоїть на шляху вчених та інженерів при побудові подібних систем, розглянуто складові частини подібних систем і дано короткий огляд основних методів і технік, які використовувалися в цій галузі для реалізації основних складових
частин систем пошуку зображень. У якості одного з варіантів розв'язання подібного завдання запропоновано методологію
пошуку зображень на основі методу бінарного розбиття простору та методу перцептивного хешування. Дерева бінарного
розбиття простору являють собою структуру даних, отриману наступним чином: простір розбивається гіперплощиною на
два напівпростори, потім кожен напівпростір рекурсивно розбивається до тих пір, поки кожен вузол не буде містити тільки
тривіальну частину вхідних об'єктів. Алгоритми перцептивного хешування дозволяють отримати уявлення зображення у
вигляді хеш-значення довжиною 64 біта, при чому схожі зображення будуть представлені схожими хеш-значеннями. У якості метрики визначення відстані між хеш-значеннями використовується відстань Геммінга, яка підраховує кількість різних
біт. Для організації бази хеш-значень використовується vp-дерево, що є реалізацією структури бінарного розбиття простору.
Для експериментального дослідження методики був використаний набір даних Caltech-256, який містить 30607 зображень,
розбитих на 256 категорій, у якості алгоритмів перцептивного хешування були використані алгоритми Difference Hash, PHash та Wavelet Hash, дослідження проводилося в середовищі Google Colab. В рамках експериментального дослідження
було розглянуто стійкість алгоритмів хешування до модифікації, стиснення, розмиття, зашумлення та повороту зображення.
Крім того, було проведено дослідження процесу побудови vp-дерева та процесу пошуку зображень у дереві. В результаті
експериментів було встановлено, що кожен з алгоритмів хешування має свої переваги та недоліки. Так, алгоритм хешування, заснований на різниці значень пікселів на зображенні, виявився найшвидшим, але був не надто стійким до модифікації
та повороту зображень. Алгоритм P-Hash, заснований на використанні дискретного косинусного перетворення, показав
кращу стійкість до розмиття зображень, але виявився чутливим до стиснення. Алгоритм W-Hash, заснований на вейвлетперетворенні Гаара, дозволив побудувати найбільш ефективну структуру дерева і виявився стійким до модифікації та стиснення зображення. Запропонована методика не рекомендується для використання в системах пошуку зображень загального
призначення, однак, може бути корисна для пошуку зображень у спеціалізованих базах. В якості подальших шляхів покращення методики можна відзначити удосконалення структури vp-дерева, а також пошук більш ефективного методу представлення зображення, ніж перцептивне хешування.

Завантаження

Дані завантаження ще не доступні.

Біографії авторів

Микола Анатолійович Годовиченко, Одеський національний політехнічний ун-т, пр. Шевченка, 1. Одеса, 65044, Україна

кандидат технічних наук, доцент кафедри Штучного інтелекту та аналізу даних

Scopus Author ID: 57188700773

Світлана Григорівна Антощук, Одеський національний політехнічний ун-т, пр. Шевченка, 1. Одеса, 65044, Україна

доктор технічних наук, професор, директор Інституту Комп’ютерних систем

Scopus Author ID: 8393582500

Варвара Ігорівна Куваєва, Одеський національний політехнічний ун-т, пр. Шевченка, 1. Одеса, 65044, Україна

кандидат технічних наук, доцент кафедри Інформаційних систем

Scopus Author ID: 57203618134

 

Опубліковано

2022-07-04

Як цитувати

[1]
Hodovychenko M.A.., Antoshchuk S.G., Kuvaieva V.I. “Methodology for image retrieval based on binary space partitioning and perceptual image hashing”. Applied Aspects of Information Technology. 2022; Vol. 5, No. 2: 136 –146. DOI:https://doi.org/10.15276/aait.05.2022.10.

Статті цього автора (авторів), які найбільше читають