Study of the dependence of accuracy in vehicles search on the size of the object using UAV images
Abstract
Digital images are increasingly used to analyze different types of objects and their localization and
classification. There are many areas for using this information; it is often employed for surveillance systems,
automatic driving of vehicles, or exploration of new territories. At the same time, there are a fairly large
number of neural networks that allow implementation of this functionality by training them using data sets of
various types and classifications. Often, data sets created with the help of unmanned aerial vehicles are
frequently used for research tasks. Such datasets allow the recognition of various types of objects without
direct access to them, which allows safe exploration of different territories. The use of unmanned aerial
vehicles is quite common nowadays, especially in the fields of photography and videography. Many
photographers use unmanned aerial vehicles to take pictures of landscapes and use automatic tracking systems
for movement. Automatic movement systems and object search systems are quite sensitive to the size of the
object and the quality of the search algorithm. Because of the wide applicability of this task, as well as the
small amount of initial data, the topic of our work is the study of the dependence of the accuracy of localization
and classification of objects on their area in images obtained using unmanned aerial vehicles. The main
subject of this study is the quality of neural networks that allow obtaining information about objects, as well as
research by obtaining statistical data and a test set of data on the dependence of detection accuracy on the size
of the object. The goal of this study was to obtain statistics on the accuracy of localization and classification
depending on the size of the object and to determine the accuracy thresholds using the obtained statistics. The
task of this study is to train common neural networks with an open architecture on a set of data obtained using
unmanned aerial vehicles and to determine their characteristics, particularly the dependence of recognition
accuracy on the size of the object. The expected result of the work is the threshold values of the size of the
object, which are permissible for a sufficiently accurate classification and localization of objects, as well as the
metrics of the quality of the work of the studied neural networks. Because of this work, conclusions are given
that reflect the threshold values of object sizes, on which the recognition accuracy depends. Цифрові зображення все частіше використовуються для задач аналізу різних типів об’єктів, їх
локалізації та класифікації. Сфер використання цієї інформації досить багато, часто її використовують для
систем спостереження, автоматичного водіння транспорту чи дослідження нових територій. Разом з цим існує досить велика кількість нейронних мереж, що дозволяють реалізувати даний функціонал шляхом їх
навчання використовуючи набори даних різних типів та класифікацій. Дуже часто для задач дослідження
використовують набори даних, що зроблені за допомогою безпілотних літальних апаратів. Такі набори даних
дозволяють розпізнавати різного роду об’єкти, не маючи до них прямого доступу, що дає змогу безпечно
досліджувати різні території. Використання безпілотних літальних апаратів досить поширено в наш час,
особливо в задачах фотографії та відео, багато фотографів використовують безпілотні літальні апарати для
отримання знімків краєвидів, а також системи автоматичного стеження для переміщення. Системи
автоматичного переміщення, а також системи пошуку об’єктів, досить чутливі до розміру об’єкта, а також
якості алгоритму пошуку. Саме через широку застосовуваність даної задачі, а також малої кількості
початкових даних, темою роботи є дослідження залежності точності локалізації та класифікації об’єктів від
їх площі на знімках, що отримані за допомогою безпілотних літальних апаратів. Основну увагу привернуто
до якості роботи нейронних мереж, що дозволяють отримувати інформацію про об’єкти, а також
дослідження за допомогою отримання статистичних даних та тестовому наборі даних залежності точності
детектування від розміру об’єкта. Метою роботи є отримання статистичних даних щодо точності локалізації
та класифікації в залежності від розміру об'єкта, а також визначення порогів точності з використанням
отриманих статистичних даних. Задача роботи - це навчання розповсюджених нейронних мереж з
відкритою архітектурою на наборі даних, що отримані за допомогою безпілотних літальних апаратів, та
визначення їх характеристик, зокрема залежності точності розпізнавання від розміру об’єкта. Очікуваний
результат роботи - це порогові значення розміру об’єкта, що допустимі для достатньо точної класифікації та
локалізації об’єктів, а також метрики якості роботи досліджуваних нейронних мереж. В результаті роботи
буде наведено висновки, що відображають порогові значення розмірів об’єктів, від якого залежить точність
розпізнавання.