Методи та апаратні засоби для прискорення роботи згорткової нейронної мережі
DOI:
https://doi.org/10.15276/aait.06.2023.1Ключові слова:
Convolutional neural networks, two-dimensional convolution, scalar product, multi-input adder, parallel-stream implementation, problem-oriented approachАнотація
Проаналізовано і виділено три основні підходи до побудови комп’ютерних систем: програмний, апаратний та пробле-мно-орієнтований. Вибрано для реалізації ЗНМ проблемно-орієнтований підхід. Цей підхід використовує процесорне ядро з апаратними прискорювачами, що реалізують базові операції ЗНМ. Розробку комп’ютерних систем для реалізації ЗНМ доцільно здійснювати на основі інтегрованого підходу. Цей підхід включає сучасну елементу базу, існуючі апаратні та програм-ні засоби для реалізації ЗНМ; методи іалгоритми реалізації ЗНМ; методи, алгоритми іНВІС-структури для реалізації базових операцій ЗНМ; методи та засоби автоматизованого проектування апаратних і програмних засобів орієн-тованих на реалізацію ЗНМ комп’ютерних систем. Для розробки комп’ютерних систем для реалізації ЗНМ вибрано підхід, який включає: зміннийсклад обладнання; використання базису елементарних арифметичних операцій; організація процесу обчислення скалярного добутку як виконання єдиної операції; конвеєризації іпросторового паралелізму; локалізації іспро-щення зв’язків між сходинками конвеєра; узгодження часу формування вхідних даних і вагових коефіцієнтів з тривалістю конвеєрного такту. Показано, що для зменшення часу опрацювання зображень великого обсягу найдоцільніше використати паралельно-потокову НВІС-реалізацію базових операцій. Вибрано модифікованиий алгоритм Бута для формування частко-вих добутків у паралельно-потоковому пристрою обчислення скалярного добутку, що забезпечило зменшення у два рази кількості сходинок конвеєра. Вдосконалено метод групового підсумовування, який за рахунок використання багатовходо-вих однорозрядних суматорів, об’єднаних за принципом дерева Уоллеса, забезпечує зменшення часу підсумовування. Роз-роблено метод паралельно-потокового обчислення скалярного добутку у ковзаючому вікні, який за рахунок узгодження часу надходження стовпчиків вхідних даних і вагових коефіцієнтів з тривалістю конвеєрного такту забезпечує високу ефек-тивність використання обладнання та обчислення у реальному часі. Визначено основні шляхи узгодження часу надходжен-ня стовпчиків вхідних даних і вагових коефіцієнтів з тривалістю конвеєрного такту роботи апаратних засобів, які реалізу-ють двовимірну згортку. Розроблено структуру апаратних засобів для реалізації двовимірної згортки у ковзаючому вікні, якаорієнтована на НВІС-реалізацію з високою ефективністю використання обладнання. Вибрано для реалізації апаратних прискорювачів програмовані логічні інтегральні схеми. Розроблено та відмодельовано на базі FPGA EP3C16F484 сімейства Cyclone III фірми Altera однорозрядні 7, 15 і 31 входові суматори та синтезовано на їх базі 8-входовий 7-розрядний суматор.