Welcome to Scribd!

EGU2020 13063 Presentation

Uploaded by

0% found this document useful (0 votes)

7 views24 pages

This document describes using supervised regression learning to predict aerosol particle size distributions ranging from 3-1000 nm using inputs like PM2.5, total particle number, trace gases, and meteorological parameters from a measurement station in Finland. Random forest models were able to reasonably predict particle time series and metrics with up to 1-year of training data at 10-minute resolution. Features like PM2.5 and total particle number were found to be important predictors.

Original Description:

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

7 views24 pages

EGU2020 13063 Presentation

Uploaded by

marwan

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 24

Search inside document

SUPERVISED REGRESSION LEARNING FOR PREDICTIONS

OF 3-1000 NM AEROSOL PARTICLE SIZE DISTRIBUTIONS

FROM PM2.5, TOTAL PARTICLE NUMBER, TRACE GASES AND
METEOROLOGICAL PARAMETERS AT HYYTIÄLÄ SMEAR II
STATION
Yusheng Wu1, R. Cai1, M. Zaidan1, J. Kuula2, H. Timonen2, P. Aalto1, M. Kulmala1,
K. Lehtipalo1, T. Petäjä1, J. Kangasluoma1
1 Institute for Atmospheric and Earth System Research / Physics, Faculty of Science, University of Helsinki, Finland
2 Finnish Meteorological Institute, Erik Palménin aukio 1, 00560 Helsinki, Finland

MOTIVATION
Health eﬀect of sub-micron particles, especially the
ultrafine particles (<100 nm)
Epidemiological studies are lacking suitable data
Air quality stations routine measurement: PM2.5,
meteorological and trace gases data
The temptation of using machine learning to fill this
gap
FIELD MEASUREMENTS
Hyytiälä Forestry Field Station (SMEAR II)
A very comprehensive regional boreal forest environment
Famous for new particle formation studies
Southen Finland (61°50.845' N, 24°17.686' E, 180 m a.s.l.)
MEASURED INPUT DATA
Catogories Features Time resolution
Meteorology wind, T, RH, P, Rad 1 min
Trace gases CO, SO2, NOx, O3 5 min
Particle PM2.5, Ntot 10 min
MEASURED OUTPUT DATA
Instruments Features Time resolution
DMPS 3 nm ~ 1 μm 10 min
APS 500 nm ~ 20 μm 10 min

OUTPUT FORMAT
Separation point: 650 nm
Combined to 94 bins of normalized number
concentration (dN/dlogDp)
data time-series
FEATURE ENGINEERING
Abstract date-time information: weekend, season
Encoding: wind direction, hour of day
Date before the predicting day: memory/delay effect
2
PERFORMANCE METRICS - R _SCORES
predicted vs observed(test)
R2, pronounced "R squared"
coefficient of determination
Nash-Sutcliffe model efficiency coefficient
vary from -∞ to 1 for a non-linear regression or a
linear regression without including an intercept
T 2
t t
∑ (Qm −Qo )
t=1
NSE = 1 − 2
T t
∑ (Qo −Q̄o )
t=1
PERFORMANCE METRICS - NMAE
NRMSE: normalized mean-absolute-error
vary from 0 to ∞
n
∑ ∣
∣yi −xi ∣
∣
i=1
MAE =
n

MAE
NMAE =
ȳ
PERFORMANCE METRICS - NRMSE
NRMSE: normalized root-mean-square-error
vary from 0 to ∞
1 n
ȳ = ∑ yi
n i=1

n 2
1
MSE = ∑ Y − Y ̂
n i=1 ( i i)

RMSE = √MSE
‾‾‾‾‾

RMSE
NRMSE =
ȳ
RANDOM FOREST
Hyperparameter tuning: random search
param_distributions =
{
'n_estimators': [10, 30, 100, 300],
'max_features': ['auto', 'sqrt'],
'max_depth': [10, 30, 100, None],
'min_samples_split': [2, 5, 10],
'min_samples_leaf': [1, 2, 4],
'bootstrap': [True, False]
}
RANDOM FOREST PREDICT TIME SERIES
Feature number: 9 (raw)
1 year training data, 10-min time resolutio
Parameters: n-fold cv = 3, n_iter = 100
RANDOM FOREST PREDICT NTOT
Feature number: 9 (raw)
1 year training data, 10-min time resolutio
Parameters: n-fold cv = 5, n_iter = 100
RANDOM FOREST PREDICT TIME SERIES
Feature number: 12 (raw) -> 46 (derived)
1 year training data, 10-min time resolutio
Parameters: n-fold cv = 5, n_iter = 40
RANDOM FOREST PREDICT METRICS
Feature number: 12 (raw) -> 46 (derived)
1 year training data, 10-min time resolutio
Parameters: n-fold cv = 5, n_iter = 40
RANDOM FOREST PREDICT METRICS
Feature number: 12 (raw) -> 46 (derived)
1 year training data, 10-min time resolutio
Parameters: n-fold cv = 3, n_iter = 20
RANDOM FOREST PREDICT METRICS
Without PM2.5
1 year training data, 10-min time resolutio
Parameters: n-fold cv = 3, n_iter = 20
RANDOM FOREST PREDICT METRICS
Without PM2.5, Ntot
1 year training data, 10-min time resolutio
Parameters: n-fold cv = 3, n_iter = 20
RANDOM FOREST FEATURE IMPORTANCE
Feature number: 9 (raw)
1 year training data, 10-min time resolutio
Parameters: n-fold cv = 3, n_iter = 100
RANDOM FOREST, ADABOOST, GRADIANT BOOST
Feature number: 9 (raw)
1 year training data, 10-min time resolutio
Parameters: n-fold cv = 3, n_iter = 100
PREDICTION TIME SMOOTHING
Feature number: 12 (raw) -> 46 (derived)
1 year training data, time resolutio: 10-min -> 1-day
Parameters: n-fold cv = 3, n_iter = 100
SUMMARY
Feasible to predict partical size distribution from
routine data
The prediction of middle size range (100-1000 nm) is
relative easier
PM2.5 and Ntot are relative important features for
the predcition
NEXT TO DO
Other learning algorithms
Trade-oﬀ: accuracy, explainability, computational
consumption
Generalizing models or methodologies for diﬀerent
places
THANK YOU

Interactions between Electromagnetic Fields and Matter: Vieweg Tracts in Pure and Applied Physics
From Everand
Interactions between Electromagnetic Fields and Matter: Vieweg Tracts in Pure and Applied Physics
Karl-Heinz Steiner
No ratings yet
EuMW Serhir TimeDomaine
Document4 pages
EuMW Serhir TimeDomaine
Nageswara Rao Challa
No ratings yet
Instruments and Measurements
From Everand
Instruments and Measurements
Birger Qvarnstrom
No ratings yet
Ee4015 Matlab3
Document4 pages
Ee4015 Matlab3
Abdul Rahim
No ratings yet
Computer Processing of Remotely-Sensed Images: An Introduction
From Everand
Computer Processing of Remotely-Sensed Images: An Introduction
Paul M. Mather
No ratings yet
A1 2 George
Document19 pages
A1 2 George
RARS Kumarakom
No ratings yet
Performance Analysis of Energy Detection-Based Spectrum Sensing Over Fading Channels
Document4 pages
Performance Analysis of Energy Detection-Based Spectrum Sensing Over Fading Channels
Mary Vargas
No ratings yet
Frequency Response For Control System Analysis - GATE Study Material in PDF
Document8 pages
Frequency Response For Control System Analysis - GATE Study Material in PDF
nidhi tripathi
No ratings yet
Spectral Estimation Notes
Document6 pages
Spectral Estimation Notes
Santanu Ghorai
100% (1)
Optimal Periodic Sampling Sequences For Nearly - Alias-Free Digital Signal Processing
Document5 pages
Optimal Periodic Sampling Sequences For Nearly - Alias-Free Digital Signal Processing
nanostallmann
No ratings yet
Ee 6403 - Discrete Time Systems and Signal Processing (April/ May 2017) Regulations 2013
Document4 pages
Ee 6403 - Discrete Time Systems and Signal Processing (April/ May 2017) Regulations 2013
selvakumargeorg1722
No ratings yet
Formatting Template
Document16 pages
Formatting Template
David Rosas
No ratings yet
DSP
Document15 pages
DSP
bbmathi
No ratings yet
EEM496 Communication Systems Laboratory - Report6 - Probability of Error For Mary PSK, Qam and Scatter Plots
Document18 pages
EEM496 Communication Systems Laboratory - Report6 - Probability of Error For Mary PSK, Qam and Scatter Plots
donatello84
No ratings yet
Terebilo 1997 0182
Document3 pages
Terebilo 1997 0182
Particle Beam Physics Lab
No ratings yet
EXPERIMENT NO. 9 Modulation Index and Power Consideration
Document12 pages
EXPERIMENT NO. 9 Modulation Index and Power Consideration
ez shintaishi
No ratings yet
Evaluation of A Methodology For Low-Speed Bearing Fault Diagnosis (Final Version)
Document14 pages
Evaluation of A Methodology For Low-Speed Bearing Fault Diagnosis (Final Version)
Lene Meireles
No ratings yet
Neutron Noise Analysis of Simulated Mechanical and Thermalhydraulic Perturbations in A PWR Core
Document20 pages
Neutron Noise Analysis of Simulated Mechanical and Thermalhydraulic Perturbations in A PWR Core
KhangBom
No ratings yet
IWPSD 2011 - Sarmista
Document6 pages
IWPSD 2011 - Sarmista
Sarmista Sengupta
No ratings yet
Lecture 03 PHYS780
Document39 pages
Lecture 03 PHYS780
thelordxor
No ratings yet
Implementing K-Nearest Neighborhood As A Forecast Method For Intra Hour Resolution With No Exogenous Outputsmartins Et Al
Document6 pages
Implementing K-Nearest Neighborhood As A Forecast Method For Intra Hour Resolution With No Exogenous Outputsmartins Et Al
Paulo Victor Soares
No ratings yet
Gas Turbine Modeling by Using Neural Networks Trained On Field Operating Data
Document0 pages
Gas Turbine Modeling by Using Neural Networks Trained On Field Operating Data
vcharles
No ratings yet
Chapter-4: 4/19/2012 1 Prof.H.T.Patil, CCOEW, PUNE
Document36 pages
Chapter-4: 4/19/2012 1 Prof.H.T.Patil, CCOEW, PUNE
harish9
No ratings yet
Nonlinear Regression Applied For Power Quality Disturbances Characterization in Grids With Wind Generators
Document5 pages
Nonlinear Regression Applied For Power Quality Disturbances Characterization in Grids With Wind Generators
Sara Afzal
No ratings yet
Binary Splitting
Document8 pages
Binary Splitting
corne0
No ratings yet
Aero230 Avionic Systems - Revision Formulae: DB MW DBM
Document2 pages
Aero230 Avionic Systems - Revision Formulae: DB MW DBM
Carlos Lopez
No ratings yet
Venkatesh Shenoi Abs
Document7 pages
Venkatesh Shenoi Abs
Venkatesh Shenoi
No ratings yet
01 Basicsignal 02
Document13 pages
01 Basicsignal 02
Rithik Jain
No ratings yet
Compilation of Cie Exam Formulas
Document78 pages
Compilation of Cie Exam Formulas
Bren Dungca
50% (2)
Performance Analysis of Energy Detection Algorithm in Cognitive Radio
Document6 pages
Performance Analysis of Energy Detection Algorithm in Cognitive Radio
Nguyen van Tu
No ratings yet
Load Forecasting
Document30 pages
Load Forecasting
yogi_maha
50% (2)
LAB 9 - Multirate Sampling
Document8 pages
LAB 9 - Multirate Sampling
M Hassan Bashir
No ratings yet
Adaptive Filter Notes
Document26 pages
Adaptive Filter Notes
Rajnish Kumar
0% (1)
Non-Parametric Power Spectrum Estimation Methods
Document25 pages
Non-Parametric Power Spectrum Estimation Methods
startech
No ratings yet
Mesosphere Stratosphere Troposphere (MST) Radar Signal Using DWT With OGS
Document4 pages
Mesosphere Stratosphere Troposphere (MST) Radar Signal Using DWT With OGS
Sureshbabu P
No ratings yet
Cure Monitoring by Fiber Optic Sensor
Document21 pages
Cure Monitoring by Fiber Optic Sensor
partenope2329
No ratings yet
Data Driven Choice of Threshold in Cepstrum Based Spectrum Estimate
Document15 pages
Data Driven Choice of Threshold in Cepstrum Based Spectrum Estimate
sipij
No ratings yet
Mathematical Modelling of Sampling Process
Document6 pages
Mathematical Modelling of Sampling Process
Nishant Saxena
No ratings yet
Refer Guide REDIM 2005 2
Document43 pages
Refer Guide REDIM 2005 2
elnaqa176
No ratings yet
Reliability Lecture Notes
Document12 pages
Reliability Lecture Notes
peach5
No ratings yet
Algorithms 05 00588
Document16 pages
Algorithms 05 00588
Akshay Chaturvedi
No ratings yet
School of Electronics Engineering (Sense) Wireless and Mobile Communication
Document7 pages
School of Electronics Engineering (Sense) Wireless and Mobile Communication
JOYPRAKASH GHOSH
No ratings yet
Wideband Spectrum Sensing - Riri
Document35 pages
Wideband Spectrum Sensing - Riri
Chaeriah Wael
No ratings yet
Response Spectrum Analysis PDF
Document30 pages
Response Spectrum Analysis PDF
Sujay Santra
No ratings yet
DSP Sp23 Wk14 230524
Document27 pages
DSP Sp23 Wk14 230524
Qaiser Abbas
No ratings yet
0303 Bate
Document13 pages
0303 Bate
GilbertoAndresDuarte
No ratings yet
Combined Spectroscopy Problems1
Document4 pages
Combined Spectroscopy Problems1
chem_dream2831
100% (1)
Homework #5: Numerical Differentiation and Integration
Document5 pages
Homework #5: Numerical Differentiation and Integration
Andres Mendez
No ratings yet
Laporan Ekologi Estimasi Populasi - Compress - Id.en PDF
Document12 pages
Laporan Ekologi Estimasi Populasi - Compress - Id.en PDF
Wildan Alfian
No ratings yet
Unit 4
Document10 pages
Unit 4
Gurunathan
No ratings yet
Introduction To Matlab Neural Network Toolbox
Document10 pages
Introduction To Matlab Neural Network Toolbox
Lastri Widya
No ratings yet
Design of Adaptive Equalizer: Using LMS Algorithm
Document8 pages
Design of Adaptive Equalizer: Using LMS Algorithm
soumya0324416
No ratings yet
Signal Processing and Diagnostics
Document191 pages
Signal Processing and Diagnostics
Chu Duc Hieu
No ratings yet
Seismic Performance of Tuned Mass Dampers
Document9 pages
Seismic Performance of Tuned Mass Dampers
Afham Ahmad
No ratings yet
Signal Processing For GPR
Document47 pages
Signal Processing For GPR
Thành Duy Nguyễn
No ratings yet
Automatic Processing Tools For Sewing Parameter Analysis: Index
Document34 pages
Automatic Processing Tools For Sewing Parameter Analysis: Index
Shaaban Noaman
No ratings yet
Icml
Document24 pages
Icml
Abhishek Bansal
No ratings yet
Tema5 Teoria-2830
Document57 pages
Tema5 Teoria-2830
Luis Alejandro Sanchez Sanchez
No ratings yet
Microsoft Word - Preciado - Optoel09.4o
Document3 pages
Microsoft Word - Preciado - Optoel09.4o
mpreciado78
No ratings yet
Doppler Spread Estimation in Mobile Communication Systems: Young-Chai Gibong Jeong
Document5 pages
Doppler Spread Estimation in Mobile Communication Systems: Young-Chai Gibong Jeong
82416149
No ratings yet
EGU2020 10029 Presentation
Document14 pages
EGU2020 10029 Presentation
marwan
No ratings yet
EGU2020 9870 Presentation
Document16 pages
EGU2020 9870 Presentation
marwan
No ratings yet
EGU2020 13133 Presentation
Document19 pages
EGU2020 13133 Presentation
marwan
No ratings yet
EGU2020 11450 Presentation
Document30 pages
EGU2020 11450 Presentation
marwan
No ratings yet
EGU2020 10472 Presentation
Document1 page
EGU2020 10472 Presentation
marwan
No ratings yet
EGU2020 9604 Presentation
Document15 pages
EGU2020 9604 Presentation
marwan
No ratings yet
EGU2020 9966 Presentation
Document23 pages
EGU2020 9966 Presentation
marwan
No ratings yet
EGU2020 10849 Presentation
Document8 pages
EGU2020 10849 Presentation
marwan
No ratings yet
EGU2020 11559 Presentation
Document16 pages
EGU2020 11559 Presentation
marwan
No ratings yet
EGU2020 10385 Presentation
Document29 pages
EGU2020 10385 Presentation
marwan
No ratings yet
EGU2020 13686 Presentation
Document13 pages
EGU2020 13686 Presentation
marwan
No ratings yet
EGU2020 16162 Presentation
Document15 pages
EGU2020 16162 Presentation
marwan
No ratings yet
EGU2020 12899 Presentation
Document26 pages
EGU2020 12899 Presentation
marwan
No ratings yet
EGU2020 13419 Presentation
Document14 pages
EGU2020 13419 Presentation
marwan
No ratings yet
EGU2020 12943 Presentation
Document29 pages
EGU2020 12943 Presentation
marwan
No ratings yet
EGU2020 17007 Presentation
Document1 page
EGU2020 17007 Presentation
marwan
No ratings yet
EGU2020 19620 Presentation
Document14 pages
EGU2020 19620 Presentation
marwan
No ratings yet
EGU2020 19171 Presentation
Document1 page
EGU2020 19171 Presentation
marwan
No ratings yet
EGU2020 19667 Presentation
Document14 pages
EGU2020 19667 Presentation
marwan
No ratings yet
EGU2020 18670 Presentation
Document14 pages
EGU2020 18670 Presentation
marwan
No ratings yet
EGU2020 15048 Presentation
Document2 pages
EGU2020 15048 Presentation
marwan
No ratings yet
EGU2020 20430 Presentation
Document13 pages
EGU2020 20430 Presentation
marwan
No ratings yet
EGU2020 21489 Presentation
Document18 pages
EGU2020 21489 Presentation
marwan
No ratings yet
EGU2020 19807 Presentation
Document1 page
EGU2020 19807 Presentation
marwan
No ratings yet
Deep Learning Q Inversion From Reflection Seismic Data
Document1 page
Deep Learning Q Inversion From Reflection Seismic Data
marwan
No ratings yet
EGU2020 21549 Presentation
Document28 pages
EGU2020 21549 Presentation
marwan
No ratings yet
M&a Private Firms
Document24 pages
M&a Private Firms
marwan
No ratings yet
EGU2020 7819 Presentation
Document7 pages
EGU2020 7819 Presentation
marwan
No ratings yet
Chapter 4 and 5 Notes Question Amp Solutions
Document6 pages
Chapter 4 and 5 Notes Question Amp Solutions
marwan
No ratings yet
Estimation of Fine-Scale Relative Humidity Profiles
Document11 pages
Estimation of Fine-Scale Relative Humidity Profiles
marwan
No ratings yet
Metrics WT 2023-24 Unit15 Sem Examples New
Document16 pages
Metrics WT 2023-24 Unit15 Sem Examples New
noahroos
No ratings yet
Chapter 2 STD
Document19 pages
Chapter 2 STD
HƯƠNG NGUYỄN LÊ NGỌC
No ratings yet
Parameter Estimation of The Weibull Distribution Comparison of The Least-Squares Method and The Maximum Likelihood Estimation
Document15 pages
Parameter Estimation of The Weibull Distribution Comparison of The Least-Squares Method and The Maximum Likelihood Estimation
IJAERS JOURNAL
No ratings yet
Finding Answers Through Data Collection
Document67 pages
Finding Answers Through Data Collection
Ruffa L
No ratings yet
Seatwork For Psych 210
Document4 pages
Seatwork For Psych 210
Louise B
No ratings yet
Sem With Amos I PDF
Document68 pages
Sem With Amos I PDF
gunturean
100% (1)
EXERCISE#9 Measures of Variability 2
Document2 pages
EXERCISE#9 Measures of Variability 2
Mark Anthony Libeco
No ratings yet
2019 Score Predictor
Document9 pages
2019 Score Predictor
Taha Saeed
No ratings yet
Analisis Data Kuantitatif - Pengenalan
Document22 pages
Analisis Data Kuantitatif - Pengenalan
Ahmadazams Sulaiman
No ratings yet
Chapter 3 Examples
Document6 pages
Chapter 3 Examples
JD FC
No ratings yet
Syllabus STA6167 - SpAring2014
Document3 pages
Syllabus STA6167 - SpAring2014
Nawaraj Pokhrel
No ratings yet
Mating Design
Document26 pages
Mating Design
Teflon Slim
No ratings yet
Allama Iqbal Open University, Islamabad (Department of Statistics) Warning
Document3 pages
Allama Iqbal Open University, Islamabad (Department of Statistics) Warning
Maryam Amin
No ratings yet
TRIAL STPM Mathematics M 2 (SABAH) SMK Tinggi KotaKinabalu
Document12 pages
TRIAL STPM Mathematics M 2 (SABAH) SMK Tinggi KotaKinabalu
SK
No ratings yet
Education in Nigeria
Document3 pages
Education in Nigeria
Adejo Wada
No ratings yet
Quiz 4 Independent T Test
Document12 pages
Quiz 4 Independent T Test
Flizzy PoP
No ratings yet
Statistics Mcqs - Estimation Part 2: Examrace
Document8 pages
Statistics Mcqs - Estimation Part 2: Examrace
Vishal kaushik
No ratings yet
Data Preparation Process PDF
Document30 pages
Data Preparation Process PDF
Irfan Zubair
No ratings yet
Section 4: Extreme Value Analysis - An Introduction
Document58 pages
Section 4: Extreme Value Analysis - An Introduction
Minh Phuc Huynh
No ratings yet
Scorecard Formula Guide
Document32 pages
Scorecard Formula Guide
Swati Adh
No ratings yet
My PPT On Graphical Representation of Data
Document54 pages
My PPT On Graphical Representation of Data
Pedup Dukpa
100% (5)
Quarter 4 Week 8: Practical Research 2
Document6 pages
Quarter 4 Week 8: Practical Research 2
Kurt Russel Doblon
No ratings yet
Type II Error in Hypo Test PDF
Document15 pages
Type II Error in Hypo Test PDF
sound05
No ratings yet
Week 6 - Result Analysis 2b
Document60 pages
Week 6 - Result Analysis 2b
Abdul Karim
No ratings yet
Skewed & Symmetric Distributions Foldable
Document4 pages
Skewed & Symmetric Distributions Foldable
jonathan perez
No ratings yet
11 Normal Distribution
Document19 pages
11 Normal Distribution
A.B. Cbm
50% (2)
Hasil Estimasi
Document6 pages
Hasil Estimasi
Ade Jamal Mirdad
No ratings yet
Standard Deviation Quiz
Document1 page
Standard Deviation Quiz
Emerin Rio
No ratings yet
Training Survey For Banks
Document21 pages
Training Survey For Banks
girishtiwaskar
No ratings yet