Please use this identifier to cite or link to this item:
https://elib.psu.by/handle/123456789/45951
Title: | Эффективное уменьшение разрешения изображений в нейронных сетях на основе вейвлетов |
Authors: | Воробей, В. А. Малевич, А. Э. Varabei, U. Malevich, A. |
Other Titles: | Wavelet-Based Effective Images Downscaling in Neural Networks |
Issue Date: | 2024 |
Publisher: | Полоцкий государственный университет имени Евфросинии Полоцкой |
Citation: | Воробей, В. А. Эффективное уменьшение разрешения изображений в нейронных сетях на основе вейвлетов / В. А. Воробей, А. Э. Малевич // Вестник Полоцкого государственного университета. Серия C, Фундаментальные науки. - 2024. - № 2 (43). - С. 10-15. - DOI: 10.52928/2070-1624-2024-43-2-10-15 |
Abstract: | На основе дискретного вейвлет-преобразования реализованы несколько вариантов блоков для уменьшения разрешения изображений внутри моделей компьютерного зрения. Блоки протестированы с использованием моделей ResNetV2-50 и MobileNetV2 на наборе данных Flowers. При незначительном увеличении количества параметров и близком уровне качества удалось сократить количество эпох для сходимости на 34 %, а требования к видеопамяти на 18 %. Благодаря особенностям реализации предложенных блоков они могут быть использованы для замены слоев уменьшения разрешени я изображений и в моделях для других задач с целью экономии вычислительных ресурсов и ускорения процесса тренировки. В разработанных блоках для вычисления вейвлет-преобразования используются стандартные операция сложения и умножения, что позволяет при необходимости легко экспортировать обученные модели в другие форматы. |
metadata.local.description.annotation: | Based on discrete wavelet transform, several blocks for images downscaling in computer vision models were implemented. The blocks were tested with ResNetV2-50 and MobileNetV2 models on Flowers dataset. With small increase in number of models’ parameters and close results in terms of metric the changes allowed to reduce number of training epochs by 34 % and VRAM requirements by 18 %. Due to the implementation details the blocks suggested can be used as a replacement of layers responsible for images downscaling in models for other tasks to save computation resources and speed up training process. In the blocks developed standard operations of addition and multiplication are used for evaluation of wavelet transform, which allows a simple export of trained models into other formats. |
URI: | https://elib.psu.by/handle/123456789/45951 |
metadata.dc.rights: | open access |
metadata.dc.identifier.doi: | 10.52928/2070-1624-2024-43-2-10-15 |
Appears in Collections: | 2024, № 2 (43) |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.