Please use this identifier to cite or link to this item:
https://elib.psu.by/handle/123456789/45507
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.author | Ким, Т. Ю. | ru_RU |
dc.contributor.author | Прокопович, Г. А. | ru_RU |
dc.date.accessioned | 2024-10-03T08:07:45Z | - |
dc.date.available | 2024-10-03T08:07:45Z | - |
dc.date.issued | 2024 | - |
dc.identifier.citation | Ким, Т. Ю. Исследование влияния способа формирования функции вознаграждения по методу «двойника» для алгоритма обучения с подкреплением / Т. Ю. Ким, Г. А. Прокопович // Информационно-коммуникационные технологии: достижения, проблемы, инновации (ИКТ-2024) : электронный сборник статей III международной научно-практической конференции, г. Полоцк, 29 марта 2024 г. / Полоцкий государственный университет имени Евфросинии Полоцкой. – Новополоцк : Полоцкий государственный университет имени Евфросинии Полоцкой, 2024. – С. 92-96. | ru_RU |
dc.identifier.uri | https://elib.psu.by/handle/123456789/45507 | - |
dc.description.abstract | В работе предложен новый метод управления мобильным роботом по лабиринту. Метод основан на повторении классического обучения с подкреплением в сочетании с правосторонним алгоритмом, который позволил обучить мобильного робота передвигаться по лабиринту. Предложенный метод основан на работе двух алгоритмов, взаимодействующих между собой – алгоритм правой руки и алгоритма обучения с подкреплением. Первый алгоритм является дискретным, который реализует детерминированный алгоритм движения по лабиринту. Скорость движения, которого зависит от второго алгоритма. Второй алгоритм предназначен для «копирования» действий первого алгоритма, имитирующего идеальное движение робота. Разработанная функция вознаграждения позволяет удерживать центр масс робота в центре коридора и при необходимости поворачивать, следуя алгоритму. | ru_RU |
dc.language.iso | ru | ru_RU |
dc.publisher | Полоцкий государственный университет имени Евфросинии Полоцкой | ru_RU |
dc.rights | open access | ru_RU |
dc.title | Исследование влияния способа формирования функции вознаграждения по методу «двойника» для алгоритма обучения с подкреплением | ru_RU |
dc.type | Article | ru_RU |
Appears in Collections: | Информационно-коммуникационные технологии: достижения, проблемы, инновации. 2024 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.