Человеческое восприятие не включает точных вычислений своего местоположения в сцене, а лишь сравнивает схожесть сцен и определяет местоположение на основе этого сходства. Таким образом, с помощью глубокого обучения можно анализировать схожесть сцен и сравнивать их с картой сцен, чтобы имитировать процесс человеческого восприятия и реализовать локализацию на основе визуального восприятия (без геометрических вычислений).
Основные цели исследования:
Сравнение схожести сцен на основе одного изображения уже широко исследовано, но сравнение схожести сцен на основе последовательности изображений еще не изучено. Исследование методов моделирования сцен, снятых нескольким изображениям, и построения графа, а затем нахождения оптимального соответствия подграфа на карте (графе сети).
Исследование методов генерации характеристик объектов в сцене, таких как NetVLAD или FE-Net из работы "Image Matching Based on Deep Feature and Spatial Correlation Graph".
Исследование построения графовых сверточных нейронных сетей (Graph Convolutional Networks) для вычисления схожести.
Исследование методов извлечения характеристик пройденных сцен и сохранения их в графе для построения семантической карты.## 2. Основные идеи
Исследовательские идеи:
Конкретные методы исследования (необходимо попробовать):1. Использование EdgeBox или других методов для нахождения интересных областей и извлечения характеристик объектов с помощью глубокого обучения - EdgeBox извлекает только интересные области статья, объяснение на китайском 2. Исследование Siamese сетей для повышения способности отличения характеристик (можно использовать FE-Net из работы "Image Matching Based on Deep Feature and Spatial Correlation Graph") 3. Исследование графовых сверточных нейронных сетей для извлечения характеристик узлов графа и выполнения соответствия графов.## 3. Ключевые технологии
Неделя 5: Изучение литературы по теме, написание отчета по теме и задания
Неделя 6-7: Анализ и разработка проектного плана, разбиение на базовые функциональные модули программы
Неделя 8-11: Исследование алгоритмов компьютерного зрения, проектирование глубоких нейронных сетей, составление программы
Неделя 12-13: Письмо дипломной работы
Неделя 14-15: Подготовка к защите дипломной работы
Улучшенная версия DBow2 (https://github.com/rmsalinas/DBow3)
FBOW (Fast Bag of Words) - крайне оптимизированная версия библиотек DBow2/DBow3 (https://github.com/rmsalinas/fbow)
Устойчивое локальное измерение роботов с помощью алгоритмов компьютерного зрения и сетей (https://github.com/MHassanNadeem/localization-network-flows)
NetVLAD: архитектура CNN для слабо контролируемого распознавания мест (https://www.di.ens.fr/willow/research/netvlad/)
Графовые сверточные сети в PyTorch (https://github.com/tkipf/pygcn)
Графовые сверточные сети с быстрым локализованным спектральным фильтром (https://github.com/mdeff/cnn_graph)
Графовые сверточные сети (GCNs) (https://github.com/sungyongs/graph-based-nn)
[2015 Визуальное распознавание мест: обзор](references/survey/2015 Visual Place Recognition: A Survey.pdf)
NetVLAD: архитектура CNN для слабо контролируемого распознавания мест
VLAD
Распознавание мест с использованием ConvNet-маркеров: устойчивое к изменению точки обзора, устойчивое к условиям, без обучения
2020 Визуальный поиск среди миллиардов аэрокосмических изображений
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Комментарии ( 0 )