Welcome to Scribd!

Learning-Based Methods For VO and Global Localization

Uploaded by

0% found this document useful (0 votes)

4 views17 pages

This document discusses learning-based visual odometry estimation methods including supervised, unsupervised, and hybrid approaches. Supervised learning uses a relative pose label to optimize a loss function, while unsupervised learning relies on view synthesis and photometric reconstruction losses without pose labels. Two main challenges of unsupervised learning are scale ambiguity and assumptions of static scenes. Recent works have addressed these with techniques like depth map transformations for scale recovery and generative adversarial networks to improve synthetic views. Hybrid methods typically combine geometric and photometric losses to achieve state-of-the-art performance on benchmarks like KITTI. The gap between supervised and unsupervised visual odometry is decreasing as unsupervised techniques continue advancing.

Original Description:

Original Title

Learning-based methods for VO and Global Localization

Copyright

Available Formats

PPTX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

4 views17 pages

Learning-Based Methods For VO and Global Localization

Uploaded by

Nguyễn Anh Minh

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 17

Search inside document

Learning-based

methods for VO
and Global
Localization
NGUYEN ANH MINH - IVSR
Chen et. al – “A Survey on Deep Learning for Localization and Mapping
Towards the Age of Spatial Machine Intelligence”
Chen et. al – “A Survey on Deep Learning for Localization and Mapping
Towards the Age of Spatial Machine Intelligence”
Learning-based Visual Odometry estimation

Supervised
Learning
End-to-end
Learning

Un (Self)-
supervised Learning

Hybrid
Learning
Supervised Learning

Image at timestamp
t

𝑝 ={ ^
^ 𝑅 , 𝑡^ }
Relative pose:
Image at timestamp Rotation and
t+1 translation
Supervised Learning

Image at timestamp
t

𝑝 ={ ^
^ 𝑅 , 𝑡^ }
Relative pose:
Image at timestamp Rotation and
t+1 translation

Euclidian regression loss: ,)

Deep VO
Other works

Publication Contribution
Saputra et. al Add curriculum learning and geometric loss
2019a constraints
Saputra et. al Knowledge distillation for compressed pose
2019b resgressor
Xue et. Al 2019 - Introduced a memory module that stores
global information
- A refining module that improve pose estimates
and preserved contextual information
Self-Supervised Learning

Image at timestamp
^𝐷
t Predicted depth
(Target view) image

𝐼 𝑡
Synthetic of source
image wrapped into ^𝐼 𝑠
target view

Image at timestamp 𝑝 ={ ^
^ 𝑅 , 𝑡^ }
t+1 Relative pose:
(Source view) Rotation and
translation
𝐼 𝑠
Photometric reconstruction loss: ,)
SFM Learner
View synthesis as supervision

For each pixel in the targeted view image (ground-truth):

// project the coordinate of target pixel to source view

// Calculate intensity of the similar-location pixel in predicted synthesis

image using bilinear interpolation

Calculate photometric reconstruction loss between real target image and predicted synthetic:
Two main problems of unsupervised VO

1. Non-consistent in global scale due to scale ambiguity

2. Photometric loss assumes that the scene is static and no
camera occlusions
Two main problems of unsupervised VO

1. Non-consistent in global scale due to scale ambiguity

2. Photometric loss assumes that the scene is static and no
camera occlusions

Publication Contribution
Bian et. al Scale recovery by transform depth map into 3D
space and project them back to produce
reconstructed depth.
GeoNet geometric consistency loss and 2D flow generator
GANVO Generative-Adversarial Learning to generate better
synthetic depth map.
Li. et al Use GAN for more accurate synthetic target view.
Benchmarks

1. KITTI – Odometry:
- 11 training sequences, 11 testing sequences
- Sequence 9 and 10 are commonly used for learning-
based methods
2. TUM-RGBD
- 21 sequences for training and testing
Summary
Summary

- Hybrid VO shows the best

performance

- Unsupervised VO is slightly
outperformed by supervised VO;
however, the gap is diminishing
Thank you

- NGUYEN ANH MINH

Aimbot True?
Document2 pages
Aimbot True?
Red xx
100% (2)
Role of Operating System As Resource Manager
Document4 pages
Role of Operating System As Resource Manager
dee
No ratings yet
A10 5.1.0 Cli-Cgn
Document224 pages
A10 5.1.0 Cli-Cgn
李潇
No ratings yet
Python 3 Programming
Document6 pages
Python 3 Programming
Mahesh VP
No ratings yet
Crime Records Management System
Document64 pages
Crime Records Management System
Amrinder Singh
88% (32)
Fast Visual Object Counting Via Example Based Density Estimation 2
Document5 pages
Fast Visual Object Counting Via Example Based Density Estimation 2
Minh Đinh Nhật
No ratings yet
Example-Based Visual Object Counting With A Sparsity Constraint
Document6 pages
Example-Based Visual Object Counting With A Sparsity Constraint
Minh Đinh Nhật
No ratings yet
14
Document5 pages
14
Themozhi Jawahar
No ratings yet
Under Water Image Enhancement Using Discrete Cosine Transform
Document4 pages
Under Water Image Enhancement Using Discrete Cosine Transform
anil kasot
No ratings yet
Physics: Crash Course For JEE Main 2020
Document16 pages
Physics: Crash Course For JEE Main 2020
Ayush Sharma
No ratings yet
Generalized Bounds For Time To Collision From First-Order Image Motion
Document7 pages
Generalized Bounds For Time To Collision From First-Order Image Motion
Giovanni
No ratings yet
Teague 1980
Document11 pages
Teague 1980
Itms Hamandy
No ratings yet
41 Image Motion en
Document44 pages
41 Image Motion en
gari
No ratings yet
CR 1153
Document4 pages
CR 1153
api-3717234
No ratings yet
NSFF Supp
Document5 pages
NSFF Supp
qwerty
No ratings yet
Volumetric Obscurance: Bradford James Loos University of Utah Peter-Pike Sloan Disney Interactive Studios
Document6 pages
Volumetric Obscurance: Bradford James Loos University of Utah Peter-Pike Sloan Disney Interactive Studios
mikesfbay
No ratings yet
2019 FB Jones TTI preSDM Time Conversion
Document11 pages
2019 FB Jones TTI preSDM Time Conversion
Remildes Prazeres
No ratings yet
Automatic Palmprint Identification Based On High Order Zernike Moment
Document7 pages
Automatic Palmprint Identification Based On High Order Zernike Moment
kavi priya
No ratings yet
Unsupervised 3D Object Recognition and Reconstruction in Unordered Datasets
Document8 pages
Unsupervised 3D Object Recognition and Reconstruction in Unordered Datasets
Ricardo Sutana
No ratings yet
Aneja Convolutional Image Captioning CVPR 2018 Paper
Document10 pages
Aneja Convolutional Image Captioning CVPR 2018 Paper
ajsocool
No ratings yet
Neurocomputing: Kyongson Jon, Ying Sun, Qixin Li, Jun Liu, Xiaofei Wang, Wensheng Zhu
Document13 pages
Neurocomputing: Kyongson Jon, Ying Sun, Qixin Li, Jun Liu, Xiaofei Wang, Wensheng Zhu
sobia
No ratings yet
Image Enhancement in The Spatial Domain (Chapter 3)
Document17 pages
Image Enhancement in The Spatial Domain (Chapter 3)
preethithamilanban
No ratings yet
Image Registration
Document33 pages
Image Registration
sujitha
No ratings yet
Exploiting Temporal Coherence in Ray Casted Walkthroughs
Document9 pages
Exploiting Temporal Coherence in Ray Casted Walkthroughs
Heji Zulkunz
No ratings yet
25 - Ray Optics and Optical Instruments - Keynotes
Document28 pages
25 - Ray Optics and Optical Instruments - Keynotes
thor
No ratings yet
Corrections To Off-Axis Data Recorders: Measurements From Event
Document48 pages
Corrections To Off-Axis Data Recorders: Measurements From Event
dj39alx
No ratings yet
Sequential Simulation Drawing Structures From Training Images
Document28 pages
Sequential Simulation Drawing Structures From Training Images
Mario Perez
No ratings yet
Visible-Surface Detection Methods: CS3162 Introduction To Computer Graphics
Document10 pages
Visible-Surface Detection Methods: CS3162 Introduction To Computer Graphics
athira
No ratings yet
Super Sample
Document12 pages
Super Sample
Lmao company
No ratings yet
Cyclegan, A Master of Steganography
Document6 pages
Cyclegan, A Master of Steganography
sandysanderson
No ratings yet
Telescope: Physics Notes
Document1 page
Telescope: Physics Notes
Ilias Achhab
No ratings yet
A Principal Component Regression Strategy For Estimating Motion Eng Opt 2008
Document8 pages
A Principal Component Regression Strategy For Estimating Motion Eng Opt 2008
Shadow
No ratings yet
3D Reconstruction Based On Stereovision and Texture Mapping
Document6 pages
3D Reconstruction Based On Stereovision and Texture Mapping
Bharat Chandra Sahu
No ratings yet
Nips Eyebm
Document9 pages
Nips Eyebm
mike
No ratings yet
Jurnal
Document4 pages
Jurnal
helmy mukti
No ratings yet
Hale 10 Image Guided 3 D Interpolation of Borehole Data Seg
Document5 pages
Hale 10 Image Guided 3 D Interpolation of Borehole Data Seg
Praveen
No ratings yet
Position Time
Document1 page
Position Time
sophiadionora9
No ratings yet
The Lumigraph
Document12 pages
The Lumigraph
dylan953989763
No ratings yet
Cloud Covering Denoising Through Image Fusion: Salvador Gabarda, Gabriel Cristo Bal
Document8 pages
Cloud Covering Denoising Through Image Fusion: Salvador Gabarda, Gabriel Cristo Bal
ecekarthi
No ratings yet
MIR2012 Lec6
Document24 pages
MIR2012 Lec6
yeesuen
No ratings yet
Alessandro Neri: Index Terms - Gauss-Laguerre Circular Harmonic Func
Document8 pages
Alessandro Neri: Index Terms - Gauss-Laguerre Circular Harmonic Func
K Praveen Kumar
No ratings yet
Rethinking Inductive Biases For Surface Normal Estimation
Document14 pages
Rethinking Inductive Biases For Surface Normal Estimation
Clark Ren
No ratings yet
Day 6 - Orthophoto
Document33 pages
Day 6 - Orthophoto
Aarthi shree
No ratings yet
Computational Imaging For VLBI Image Reconstruction
Document10 pages
Computational Imaging For VLBI Image Reconstruction
Stalino Negro
No ratings yet
Recurrent Convolutional Neural Network For Video Classification
Document6 pages
Recurrent Convolutional Neural Network For Video Classification
jeffconnors
No ratings yet
Wang EventSR From Asynchronous Events To Image Reconstruction Restoration and Super-Resolution CVPR 2020 Paper
Document11 pages
Wang EventSR From Asynchronous Events To Image Reconstruction Restoration and Super-Resolution CVPR 2020 Paper
Sunilmahek Mahek
No ratings yet
Lecture4 - Convnets For CV Slide
Document65 pages
Lecture4 - Convnets For CV Slide
mohdharislcp
No ratings yet
Exam1 FO 2024
Document3 pages
Exam1 FO 2024
Abhinav Sinha
No ratings yet
Admm Diptv
Document8 pages
Admm Diptv
aneetachristo94
No ratings yet
Environment Matting and Compositing
Document10 pages
Environment Matting and Compositing
diegomfagundes
No ratings yet
2010 - CNF - IH - Detection of Copy-Rotate-Move Forgery Using Zernike Moments (Pre-Proceedings) - 1
Document15 pages
2010 - CNF - IH - Detection of Copy-Rotate-Move Forgery Using Zernike Moments (Pre-Proceedings) - 1
Saasi
No ratings yet
Frequentnet: A New Deep Learning Baseline For Image Classification
Document6 pages
Frequentnet: A New Deep Learning Baseline For Image Classification
Nguyễn Trường Sơn
No ratings yet
Computer Graphics
Document10 pages
Computer Graphics
usmanrather78
No ratings yet
CG 7
Document8 pages
CG 7
Sujan Timalsina
No ratings yet
Optical Flow Using Color Information: Preliminary Results: Kelson R. T. Aires Andre M. Santana Adelardo A. D. Medeiros
Document5 pages
Optical Flow Using Color Information: Preliminary Results: Kelson R. T. Aires Andre M. Santana Adelardo A. D. Medeiros
Janice Figueiredo
No ratings yet
3-D Object Pose Determination Using Computer Vision
Document4 pages
3-D Object Pose Determination Using Computer Vision
Raziel Alba
No ratings yet
Rairo. R: Echerche Opérationnelle
Document19 pages
Rairo. R: Echerche Opérationnelle
Ni Had
No ratings yet
Vlocnet: Nguyen Anh Minh - IVSR - 2021
Document14 pages
Vlocnet: Nguyen Anh Minh - IVSR - 2021
Nguyễn Anh Minh
No ratings yet
Measurement of Ri
Document6 pages
Measurement of Ri
saikat mitra
No ratings yet
Development of 3D Finite Element Code of Incompatible Displacement Mode For Flexural Analysis
Document8 pages
Development of 3D Finite Element Code of Incompatible Displacement Mode For Flexural Analysis
rohit
No ratings yet
Prestack Imaging of Overturned Reflections by Reverse
Document7 pages
Prestack Imaging of Overturned Reflections by Reverse
Claire Liu
No ratings yet
Guided Filter and Discrete Wavelet Transform Based Medical Image Fusion Using Image Statistics
Document10 pages
Guided Filter and Discrete Wavelet Transform Based Medical Image Fusion Using Image Statistics
swapna
No ratings yet
Dahua Icip05 Localnet SR
Document4 pages
Dahua Icip05 Localnet SR
anon_45914
No ratings yet
Physics EASE 1 Pointers G10 2324
Document2 pages
Physics EASE 1 Pointers G10 2324
Ramadhan Amri
No ratings yet
Multi View Three Dimensional Reconstruction: Advanced Techniques for Spatial Perception in Computer Vision
From Everand
Multi View Three Dimensional Reconstruction: Advanced Techniques for Spatial Perception in Computer Vision
Fouad Sabry
No ratings yet
Handout 04
Document17 pages
Handout 04
abibual desalegn
No ratings yet
Xilinx v14.3-v14.7 ISim User Guide
Document160 pages
Xilinx v14.3-v14.7 ISim User Guide
Edward
No ratings yet
Traffic Light Controller System Using Counter
Document6 pages
Traffic Light Controller System Using Counter
Mighty Pubg
No ratings yet
Smooth Migration To Imagicle UC Applications.: Black Belt - Stage 3
Document8 pages
Smooth Migration To Imagicle UC Applications.: Black Belt - Stage 3
chindi.com
No ratings yet
Ansible For Network Engineers
Document2 pages
Ansible For Network Engineers
Jacob
No ratings yet
Java Mock3
Document19 pages
Java Mock3
rishiimca
No ratings yet
Enterprise Data Storage and Analysis On Spark
Document34 pages
Enterprise Data Storage and Analysis On Spark
Claudiu Purdel
No ratings yet
Unit 2
Document60 pages
Unit 2
Ashish kumar
No ratings yet
DECS-250 Firmware and Hardware Revision History
Document4 pages
DECS-250 Firmware and Hardware Revision History
LOI HO
No ratings yet
Compaq Notebook - 15-s104nz Product Specifications
Document3 pages
Compaq Notebook - 15-s104nz Product Specifications
Charly Suarez
No ratings yet
Jinko Manual JK4016
Document24 pages
Jinko Manual JK4016
Gustavo Ceschi
No ratings yet
Packet Tracer - Skills Integration Challenge Addressing Table
Document12 pages
Packet Tracer - Skills Integration Challenge Addressing Table
Leidy Lorena Valderrama Cerquera
No ratings yet
CloudHub Interview Question
Document10 pages
CloudHub Interview Question
srinivas2
No ratings yet
HPE StorageWorks SDLT 160 - 320 - Overview
Document4 pages
HPE StorageWorks SDLT 160 - 320 - Overview
Paul Kostrzewa
No ratings yet
Segmented Paging: Unit Iv
Document11 pages
Segmented Paging: Unit Iv
Mohan Patel
No ratings yet
Unismart Weba Gas Meter
Document2 pages
Unismart Weba Gas Meter
Misbachul Choir
No ratings yet
Project Report
Document22 pages
Project Report
20BCS3213 Saksham Kumar
No ratings yet
Hsslive-XI-Comp-app-05 Data Types and Operators
Document6 pages
Hsslive-XI-Comp-app-05 Data Types and Operators
Harry Highmore
No ratings yet
Old Age Home Management System
Document36 pages
Old Age Home Management System
archanakmv499
50% (2)
Chapter 6-Gate Level Modeling
Document31 pages
Chapter 6-Gate Level Modeling
Danh ZEUS49
No ratings yet
C - Recursion - Tutorialspoint
Document3 pages
C - Recursion - Tutorialspoint
avigail ceballos
No ratings yet
Simotion Scout Communication Manual
Document338 pages
Simotion Scout Communication Manual
LIN SEN
No ratings yet
Mod Menu Crash 2023 01 27-13 48 55
Document1 page
Mod Menu Crash 2023 01 27-13 48 55
NFQ GAMING
No ratings yet
Tarjeta SNMP Del UPS Marca Delta
Document2 pages
Tarjeta SNMP Del UPS Marca Delta
Jozé Luis
No ratings yet
Tesys Motor Starters - Open Version: Presentation
Document4 pages
Tesys Motor Starters - Open Version: Presentation
joao
No ratings yet