Welcome to Scribd!

Skip carousel

Neural Architecture Search: Basics

Uploaded by

MInh Thanh

0% found this document useful (0 votes)

28 views20 pages

15_NAS_1

Original Title

15_NAS_1

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

15_NAS_1

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

28 views20 pages

Neural Architecture Search: Basics

Uploaded by

MInh Thanh

15_NAS_1

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 20

Search inside document

Neural Architecture Search Basics

Shusen Wang

http://wangshusen.github.io/
• Parameters

• Hyper-parameters
Training
data

Parameters (aka weights)

Testing Test
data accuracy
Training Hyper-
data parameters

Parameters (aka weights)

Testing Test
data accuracy
Architecture
Training Hyper-
data parameters
Algorithm

Parameters (aka weights)

Testing Test
data accuracy
Architecture
Training Hyper-
data parameters
Algorithm

Parameters (aka weights)

Testing Test
data accuracy
CNN Architectures

• Architectural hyper-parameters of a CNN include

• numbers of conv and dense layers,
• number of filters, size of filters, and stride in each conv layer,
• width of each dense layer.
CNN Architectures

• Architectural hyper-parameters of a CNN include

• numbers of conv and dense layers,
• number of filters, size of filters, and stride in each conv layer,
• width of each dense layer.

• Popular CNN architectures are manually designed.

• E.g., ResNet, MobileNet, etc.
• Manually tuning the architectural hyper-parameters.
CNN Architectures

• # of filters • # of filters • # of filters

• size of filters • size of filters ⋯ • size of filters
• stride • stride • stride

Conv Layer 1 Conv Layer 2 Conv Layer 20

Neural Architecture Search (NAS)

Definition: Neural Architecture Search (NAS).

Find the architecture that leads to the best validation accuracy
(or other metrics such as efficiency.)

• Example: ResNet has better accuracy than VGG.

• Example: MobileNet is more efficient than ResNet, although
MobileNet has lower accuracy.
Search Space
Hyper-parameter Types Candidates
# of filters 24, 36, 48, 64
size of filters 3×3, 5×5, 7×7
stride 1, 2

# of filters ∈ { 10, 11, 12, 13, ..., 98, 99, 100 }

Search Space
Hyper-parameter Types Candidates
# of filters 24, 36, 48, 64
size of filters 3×3, 5×5, 7×7
stride 1, 2
Search Space
Hyper-parameter Types Candidates
# of filters 24, 36, 48, 64
size of filters 3×3, 5×5, 7×7
stride 1, 2

Search space: The set containing all the possible architectures.

• We want to build a CNN with 20 Conv layers.
• Search space:
24, 36, 48, 64 -. × 3×3, 5×5, 7×7 -.
× 1, 2 -.
.
Search Space
Hyper-parameter Types Candidates
# of filters 24, 36, 48, 64
size of filters 3×3, 5×5, 7×7
stride 1, 2

Search space: The set containing all the possible architectures.

• We want to build a CNN with 20 Conv layers.
• Search space:
24, 36, 48, 64 -. × 3×3, 5×5, 7×7 -. × 1, 2 -. .
• Size of search space (i.e., number of possible architectures):
4×3×2 -. = 4×10-2 .
Search Space
Hyper-parameter Types Candidates
# of filters 24, 36, 48, 64
size of filters 3×3, 5×5, 7×7
stride 1, 2

Search space: The set containing all the possible architectures.

• For example, this is an outcome of NAS:

Layer 1 Layer 2 ⋯ Layer 20

# of filters 24 48 ⋯ 64
Size of filters 5×5 3×3 ⋯ 3×3
Stride 1 1 ⋯ 2
Baseline: Random Search

Train Evaluate
randomly selected
CNN model val acc = 82%
hyper-parameters

randomly selected
CNN model val acc = 94%
hyper-parameters
Baseline: Random Search

Train Evaluate
randomly selected
CNN model val acc = 82%
hyper-parameters

randomly selected
CNN model val acc = 94%
hyper-parameters

randomly selected
CNN model val acc = 91%
hyper-parameters

randomly selected
CNN model val acc = 88%
hyper-parameters
Challenges in NAS

Challenge 1: Each trial is expensive.

• Training a CNN from scratch takes hours or days, if a single
GPU is used.

Challenge 2: The search space is too big.

• Number of possible architectures:
4×3×2 -. = 4×10-2 .
Thank You!

http://wangshusen.github.io/

Familiarization With Apparatus and Equipment Used in Testing of Materials
Document5 pages
Familiarization With Apparatus and Equipment Used in Testing of Materials
EmanoAce
33% (6)
Genetic Algorithm
Document31 pages
Genetic Algorithm
Rovick Tarife
No ratings yet
Chess Scientific Calculation
Document6 pages
Chess Scientific Calculation
Senthilkumar
No ratings yet
System-on-Chip Test Architectures: Nanometer Design for Testability
From Everand
System-on-Chip Test Architectures: Nanometer Design for Testability
Laung-Terng Wang
No ratings yet
Pindyck TestBank 7e
Document17 pages
Pindyck TestBank 7e
Victor Firmana
100% (5)
A Review Paper On Improvement of Impeller Design A Centrifugal Pump Using FEM and CFD
Document3 pages
A Review Paper On Improvement of Impeller Design A Centrifugal Pump Using FEM and CFD
IJIRST
No ratings yet
Perkins 20 Kva (404D-22G)
Document2 pages
Perkins 20 Kva (404D-22G)
Ravael
No ratings yet
5 Algoritma Klastering
Document85 pages
5 Algoritma Klastering
icobes ur
No ratings yet
Cic Tips Part 1&2
Document27 pages
Cic Tips Part 1&2
Yousef Alalawi
No ratings yet
Machine Learning CNN
Document28 pages
Machine Learning CNN
abcd efgh
No ratings yet
TensorFlow With R
Document46 pages
TensorFlow With R
biondimi
No ratings yet
Pengantar Datamining: Anto Satriyo Nugroho, DR - Eng
Document33 pages
Pengantar Datamining: Anto Satriyo Nugroho, DR - Eng
Rendy Dwi Anugrah Putra
No ratings yet
Kernel Methods: Feature Mapping at No Cost
Document25 pages
Kernel Methods: Feature Mapping at No Cost
Pooja Patwari
No ratings yet
Lecture 3 - MachineLearning-CrashCourse2023
Document99 pages
Lecture 3 - MachineLearning-CrashCourse2023
Giorgio Aduso
No ratings yet
Building Memory-Efficient Java Applications: Practices and Challenges
Document140 pages
Building Memory-Efficient Java Applications: Practices and Challenges
matias_dev
No ratings yet
Object Recognition
Document43 pages
Object Recognition
A J
No ratings yet
a-GIST CNNs Quicksummary Hyunguk
Document25 pages
a-GIST CNNs Quicksummary Hyunguk
최희욱
No ratings yet
Kernel Methods For General Pattern Analysis PDF
Document77 pages
Kernel Methods For General Pattern Analysis PDF
ZenPhi
No ratings yet
Ker As Tutorial
Document33 pages
Ker As Tutorial
Yoann Dragneel
No ratings yet
Convnet Exercise
Document1 page
Convnet Exercise
Sana N
No ratings yet
VGG and Resnet
Document18 pages
VGG and Resnet
saisivani.ashok2021
No ratings yet
Data Mining Data Transformations: Gergely Lukács
Document51 pages
Data Mining Data Transformations: Gergely Lukács
Blazs
No ratings yet
CSE 473 Pattern Recognition: Instructor: Dr. Md. Monirul Islam
Document57 pages
CSE 473 Pattern Recognition: Instructor: Dr. Md. Monirul Islam
Nadia Anjum
100% (1)
Custer Analysis: Prepared by Navin Ninama
Document20 pages
Custer Analysis: Prepared by Navin Ninama
Nishith Lakhlani
No ratings yet
What Is Cluster Analysis?: - Cluster: A Collection of Data Objects
Document9 pages
What Is Cluster Analysis?: - Cluster: A Collection of Data Objects
Irum Fatima
No ratings yet
7-1-0-Rockets TSC-20230405
Document55 pages
7-1-0-Rockets TSC-20230405
s96281
No ratings yet
Using Machine Learning Techniques For Prediction of Breast Cancer Subtypes - Upload
Document30 pages
Using Machine Learning Techniques For Prediction of Breast Cancer Subtypes - Upload
Erik sali
No ratings yet
Lecture 1 DAA
Document27 pages
Lecture 1 DAA
test
No ratings yet
MachineLearning - Algorithms - Tagged
Document35 pages
MachineLearning - Algorithms - Tagged
Anthony Corneau
No ratings yet
06 Query Processing (2) - NDN
Document31 pages
06 Query Processing (2) - NDN
MUHAMMAD ABU RIJAL KUSNAEDI
No ratings yet
Sports Analytics
Document21 pages
Sports Analytics
Priyanshu Saini
No ratings yet
16 dm2 Dimred 2022 23
Document49 pages
16 dm2 Dimred 2022 23
nimra
No ratings yet
Chapter 4: Linear Models For Classification: Grit Hein & Susanne Leiberg
Document21 pages
Chapter 4: Linear Models For Classification: Grit Hein & Susanne Leiberg
lala
No ratings yet
Tensors - Training A Model in Keras - Character Recognition Example - MINST
Document25 pages
Tensors - Training A Model in Keras - Character Recognition Example - MINST
satitekm
No ratings yet
w5 Classification
Document34 pages
w5 Classification
Swastik Sindhani
No ratings yet
Data Mining: Kabith Sivaprasad (BE/1234/2009) Rimjhim (BE/1134/2009) Utkarsh Ahuja (BE/1226/2009)
Document32 pages
Data Mining: Kabith Sivaprasad (BE/1234/2009) Rimjhim (BE/1134/2009) Utkarsh Ahuja (BE/1226/2009)
Rule2
No ratings yet
M8 Klastering
Document83 pages
M8 Klastering
Teofilus Evan
No ratings yet
Clustering Algorithm: A Fundamental Operation in Data Mining
Document44 pages
Clustering Algorithm: A Fundamental Operation in Data Mining
Maelo Borinqueño
No ratings yet
PR01
Document41 pages
PR01
এ.এস. সাকিব
100% (1)
Unit Iv Cluster Analysis What Is Clusteranalysis?
Document24 pages
Unit Iv Cluster Analysis What Is Clusteranalysis?
Hit Man
No ratings yet
Data Science - 240 Hrs
Document2 pages
Data Science - 240 Hrs
Ash talks
No ratings yet
Dr. S. Vairachilai Department of CSE CVR College of Engineering Mangalpalli Telangana
Document18 pages
Dr. S. Vairachilai Department of CSE CVR College of Engineering Mangalpalli Telangana
Savitha Elluru
No ratings yet
Cnvs Dataset and Analysis: Prepared By: Mohammed Abdulghani Taha Supervised By: Assist. Prof. Gokmen Altay
Document39 pages
Cnvs Dataset and Analysis: Prepared By: Mohammed Abdulghani Taha Supervised By: Assist. Prof. Gokmen Altay
Muhammad A. Bazzaz
No ratings yet
SSD: Single Shot Multibox Detector: (Wliu, Cyfu, Aberg) @cs - Unc.Edu
Document17 pages
SSD: Single Shot Multibox Detector: (Wliu, Cyfu, Aberg) @cs - Unc.Edu
Revanth Vennu
No ratings yet
Statistical Methods in Artificial Intelligence CSE471 - Monsoon 2015: Lecture 02
Document26 pages
Statistical Methods in Artificial Intelligence CSE471 - Monsoon 2015: Lecture 02
srikanth.mujjiga
No ratings yet
Lab Expt 6 SVM Classifer With Feature Kernel Techniques
Document14 pages
Lab Expt 6 SVM Classifer With Feature Kernel Techniques
AYUSHI WAKODE
No ratings yet
Welcome To The Kernel-Class
Document11 pages
Welcome To The Kernel-Class
S
No ratings yet
Unit-2 Feature Selection
Document92 pages
Unit-2 Feature Selection
Rahul Vashistha
No ratings yet
Day 1 S2
Document24 pages
Day 1 S2
Shailaja Udtewar
No ratings yet
Classification
Document40 pages
Classification
Syed Hamza Ibrar Shah
No ratings yet
Week 5 Applications of ML in Security
Document36 pages
Week 5 Applications of ML in Security
Asfand Khalid
No ratings yet
Agenda: 1. Introduction To Clustering
Document47 pages
Agenda: 1. Introduction To Clustering
Salih Genel
No ratings yet
Pres 0911 Regrid Update
Document9 pages
Pres 0911 Regrid Update
Salam Faith
No ratings yet
Cse329:Prelude To Competitive Coding: Course Outcomes
Document3 pages
Cse329:Prelude To Competitive Coding: Course Outcomes
Clash With GROUDON
No ratings yet
Activity Recognition Using Wearble Sensors
Document17 pages
Activity Recognition Using Wearble Sensors
priya
No ratings yet
Cluster Analysis
Document39 pages
Cluster Analysis
muhavic36
No ratings yet
Colloquium - Bayesian Optimization Algorithm - Sajib Kumar Biswas
Document25 pages
Colloquium - Bayesian Optimization Algorithm - Sajib Kumar Biswas
cs
No ratings yet
Johnson ECCV16 Supplementary
Document6 pages
Johnson ECCV16 Supplementary
censors
No ratings yet
Visible Light Indoor Localization Using The Naïve Bayes Classifier
Document15 pages
Visible Light Indoor Localization Using The Naïve Bayes Classifier
Muhammad Sobaan Tahir
No ratings yet
ML1 - Classification - KNN & NB
Document23 pages
ML1 - Classification - KNN & NB
param_email
No ratings yet
Ch6 Crypto6e
Document68 pages
Ch6 Crypto6e
emad helal
No ratings yet
MAJOR14
Document14 pages
MAJOR14
swathi
100% (1)
Accelerated Data Science Introduction To Machine Learning Algorithms
Document37 pages
Accelerated Data Science Introduction To Machine Learning Algorithms
sanketjaiswal
No ratings yet
GADataMining CNA
Document73 pages
GADataMining CNA
arpita1790
No ratings yet
Techniques in Wildlife Investigations: Design and Analysis of Capture Data
From Everand
Techniques in Wildlife Investigations: Design and Analysis of Capture Data
John R. Skalski
Rating: 5 out of 5 stars
5/5 (1)
Siamese Network: Shusen Wang
Document51 pages
Siamese Network: Shusen Wang
MInh Thanh
No ratings yet
Few-Shot Learning: Shusen Wang
Document42 pages
Few-Shot Learning: Shusen Wang
MInh Thanh
No ratings yet
2022 Streaming Summit Netflix
Document100 pages
2022 Streaming Summit Netflix
MInh Thanh
No ratings yet
14 Parallel 3
Document56 pages
14 Parallel 3
MInh Thanh
No ratings yet
14 Parallel 4
Document59 pages
14 Parallel 4
MInh Thanh
No ratings yet
Pretraining and Fine Tuning: Shusen Wang
Document41 pages
Pretraining and Fine Tuning: Shusen Wang
MInh Thanh
No ratings yet
RNN + RL: Shusen Wang
Document51 pages
RNN + RL: Shusen Wang
MInh Thanh
No ratings yet
Value-Based Reinforcement Learning: Shusen Wang
Document53 pages
Value-Based Reinforcement Learning: Shusen Wang
MInh Thanh
No ratings yet
Differentiable NAS: Shusen Wang
Document42 pages
Differentiable NAS: Shusen Wang
MInh Thanh
No ratings yet
Actor-Critic Methods: Shusen Wang
Document35 pages
Actor-Critic Methods: Shusen Wang
MInh Thanh
No ratings yet
Policy-Based Reinforcement Learning: Shusen Wang
Document46 pages
Policy-Based Reinforcement Learning: Shusen Wang
MInh Thanh
No ratings yet
13 RL 5
Document70 pages
13 RL 5
MInh Thanh
No ratings yet
14 Parallel 2
Document28 pages
14 Parallel 2
MInh Thanh
No ratings yet
14 Parallel 1
Document51 pages
14 Parallel 1
MInh Thanh
No ratings yet
Image Caption: Shusen Wang
Document35 pages
Image Caption: Shusen Wang
MInh Thanh
No ratings yet
9 RNN 8
Document48 pages
9 RNN 8
MInh Thanh
No ratings yet
9 RNN 9
Document34 pages
9 RNN 9
MInh Thanh
No ratings yet
Reinforcement Learning Basics: Shusen Wang
Document95 pages
Reinforcement Learning Basics: Shusen Wang
MInh Thanh
No ratings yet
Idirectional Ncoder Epresentations From Ransformers : B E R T Bert
Document26 pages
Idirectional Ncoder Epresentations From Ransformers : B E R T Bert
MInh Thanh
No ratings yet
10 Transformer 2
Document56 pages
10 Transformer 2
MInh Thanh
No ratings yet
Making Rnns More Effective: Shusen Wang
Document21 pages
Making Rnns More Effective: Shusen Wang
MInh Thanh
No ratings yet
Data Poisoning Attacks: Shusen Wang
Document17 pages
Data Poisoning Attacks: Shusen Wang
MInh Thanh
No ratings yet
Data Processing Basics: Shusen Wang
Document37 pages
Data Processing Basics: Shusen Wang
MInh Thanh
No ratings yet
Text Generation: Shusen Wang
Document49 pages
Text Generation: Shusen Wang
MInh Thanh
No ratings yet
Long Short Term Memory (LSTM) : Shusen Wang
Document26 pages
Long Short Term Memory (LSTM) : Shusen Wang
MInh Thanh
No ratings yet
Text Processing and Word Embedding: Shusen Wang
Document48 pages
Text Processing and Word Embedding: Shusen Wang
MInh Thanh
No ratings yet
10 Transformer 1
Document47 pages
10 Transformer 1
MInh Thanh
No ratings yet
Neural Machine Translation: Shusen Wang
Document57 pages
Neural Machine Translation: Shusen Wang
MInh Thanh
No ratings yet
Recurrent Neural Networks (RNNS) : Shusen Wang
Document33 pages
Recurrent Neural Networks (RNNS) : Shusen Wang
MInh Thanh
No ratings yet
Variational Autoencoder For Image Generation: Shusen Wang
Document71 pages
Variational Autoencoder For Image Generation: Shusen Wang
MInh Thanh
No ratings yet
Sterling B2B Integrator - Installing and Uninstalling Standards - V5.2
Document20 pages
Sterling B2B Integrator - Installing and Uninstalling Standards - V5.2
Willy Gao
No ratings yet
PLT Lecture Notes
Document5 pages
PLT Lecture Notes
Ramzi Abdoch
No ratings yet
As 60068.5.2-2003 Environmental Testing - Guide To Drafting of Test Methods - Terms and Definitions
Document8 pages
As 60068.5.2-2003 Environmental Testing - Guide To Drafting of Test Methods - Terms and Definitions
SAI Global - APAC
No ratings yet
Ts Us Global Products Accesories Supplies New Docs Accessories Supplies Catalog916cma - PDF
Document308 pages
Ts Us Global Products Accesories Supplies New Docs Accessories Supplies Catalog916cma - PDF
SRMPR CRM
No ratings yet
Ingles Avanzado 1 Trabajo Final
Document4 pages
Ingles Avanzado 1 Trabajo Final
Francis Garcia
No ratings yet
A Novel Adoption of LSTM in Customer Touchpoint Prediction Problems Presentation 1
Document73 pages
A Novel Adoption of LSTM in Customer Touchpoint Prediction Problems Presentation 1
Os M
No ratings yet
Discover Mecosta 2011
Document40 pages
Discover Mecosta 2011
Pioneer Group
No ratings yet
2021S-EPM 1163 - Day-11-Unit-8 ProcMgmt-AODA
Document13 pages
2021S-EPM 1163 - Day-11-Unit-8 ProcMgmt-AODA
ehsan ershad
No ratings yet
Delta AFC1212D-SP19
Document9 pages
Delta AFC1212D-SP19
Brent Smith
No ratings yet
Shubham Tonk - Resume
Document2 pages
Shubham Tonk - Resume
rajiv
No ratings yet
A. The Machine's Final Recorded Value Was P1,558,000
Document7 pages
A. The Machine's Final Recorded Value Was P1,558,000
Tawan Vihokratana
No ratings yet
M J 1 Merged
Document269 pages
M J 1 Merged
sanya
No ratings yet
NOP Portal
Document87 pages
NOP Portal
Carlos Rico
No ratings yet
SME-Additional Matter As Per Latest Syllabus Implementation Workshop
Document14 pages
SME-Additional Matter As Per Latest Syllabus Implementation Workshop
Avijeet Banerjee
No ratings yet
90FF1DC58987 PDF
Document9 pages
90FF1DC58987 PDF
fanta tasfaye
No ratings yet
Hager Pricelist May 2014
Document64 pages
Hager Pricelist May 2014
rajinipre-1
No ratings yet
Strobostomp HD™ Owner'S Instruction Manual V1.1 En: 9V DC Regulated 85ma
Document2 pages
Strobostomp HD™ Owner'S Instruction Manual V1.1 En: 9V DC Regulated 85ma
Shane Fairchild
No ratings yet
Hexoskin - Information For Researchers - 01 February 2023
Document48 pages
Hexoskin - Information For Researchers - 01 February 2023
emrecan cincan
No ratings yet
JAZEL Resume-2-1-2-1-3-1
Document2 pages
JAZEL Resume-2-1-2-1-3-1
GirlieJoyGayo
No ratings yet
Manual 40ku6092
Document228 pages
Manual 40ku6092
Marius Stefan Berinde
No ratings yet
Hip Norm
Document35 pages
Hip Norm
Aiman Arifin
No ratings yet
18 - PPAG-100-HD-C-001 - s018 (VBA03C013) - 0 PDF
Document1 page
18 - PPAG-100-HD-C-001 - s018 (VBA03C013) - 0 PDF
Santiago Garcia
No ratings yet
23 Things You Should Know About Excel Pivot Tables - Exceljet PDF
Document21 pages
23 Things You Should Know About Excel Pivot Tables - Exceljet PDF
RishavKrishna
0% (1)
Cryo Engines
Document6 pages
Cryo Engines
gdonina
No ratings yet
M2 Economic Landscape
Document18 pages
M2 Economic Landscape
Princess Silence
No ratings yet