Порівняння архітектур генеративних змагальних мереж для синтез у біомедичних зображень
DOI:
https://doi.org/10.15276/aait.03.2021.4Ключові слова:
глибоке навчання, генеративна змагальна мережа, біомедичні зображення, синтез зображеньАнотація
У статті проаналізовано та здійснено порівняння архітектур генеративно-змагальних мереж. Ці мережі будуються на
основі згорткових нейронних мереж, що широко застосовуються для задач класифікації. Згорткові мережі вимагають великої кількості навчальних даних, щоб досягнути потрібної точності. У роботі генеративно-змагальні мережі використано для
синтезу біомедичних зображень. Біомедичні зображення широко застосовуються в медицині, особливо в онкології. Для постановки діагнозу в онкології біомедичні зображення поділяються на три класи: цитологічні, гістологічні та імуногістохімічні. Начальні вибірки біомедичних зображень є дуже малими. Отримання навчальних зображень є складним і дорогим процесом. Для експериментів використано навчальну вибірку цитологічних зображень. В статті розглянуто найбільш розповсюджені архітектури генеративно-змагальних мереж, такі як DCGAN, WGAN, WGAN-GP, BGAN, BEGAN. Типова архітектура GAN мережі складається із генератора та дискримінатора. В основі генератора та дискримінатора лежить архітектура
CNN мережі. . У роботі проаналізовано алгоритм глибокого навчання для синтезу зображень за допомогою генеративнозмагальних мереж. Під час експериментів розв’язано такі задачі. Для збільшення початкової кількості навчальних даних у
вибірці застосовано множину афінних перетворень: відображення, паралельний перенос, зсув, масштабування тощо. Кожна
з архітектур навчалася протягом визначеної кількості ітерації. Обрані архітектури були порівняні за часом навчання та якістю зображень на основі FID (Frechet Inception Distance) метрики. Для експериментів використано мову програмування
Python і фреймворк для машинного навчання Pytorch. На основі використаних технологій розроблено прототип програмного
модуля для синтезу цитологічних зображень. Синтез цитологічних зображень проведено на основі DCGAN, WGAN,
WGAN-GP, BGAN, BEGAN архітектур. Для проведення експериментів було використано онлайн середовище Google
Colaboratory із використанням графічного процесора Nvidia Tesla K80