Outlier Analysis

Uploaded by

pppchan23100

0% found this document useful (0 votes)

6 views18 pages

Original Title

Outlier-Analysis

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

6 views18 pages

Outlier Analysis

Uploaded by

pppchan23100

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 18

Search inside document

Outlier Analysis

Data Mining:
Data Mining Methods
with Dr. Qin Lv
Learning objective: Apply techniques
for outlier analysis and explain how they
work. Evaluate and compare methods.
Outlier/Anomaly
Ø General/normal patterns
• Frequent patterns, classification, clustering
Ø Abnormal: differs from the norm
Ø Outlier analysis/anomaly detection
• “Outliers are errors and should be removed?”
• Outliers may be significant events, frauds, …
Types of Outliers/Anomalies
280

Ø Global 260 Unusual Time

Series Snippets Level Shifting

• Obj differs from the rest 240

Kelvin
Ø Contextual 220

• Obj differs in a context

200

Ø Collective
180

160

• Group of objs differ

199 200 200 200 200 200
8-0 0-0 1-0 2-1 4-0 5-0
9-1 1-3 6-1 0-2 3-1 7-2
8 1 5 8 1 4
Date (yyyy-mm-dd)
Outlier/Anomaly Examples
Ø Environmental
• Temperature, commute time, wind power generation
Ø Social
• #friends, #posts, #likes, time series, network structure
Ø Financial
• Stock price, credit card transactions, spatial/temporal
Anomaly Detection: Challenges
Ø Normal vs. abnormal
• No clear definition, vary by application, noisy data
Ø Efficiency
• Latency, scalability, adaptability
Ø Interpretability
• How to interpretate and explain the results?
Anomaly Detection: Methods
Ø Groundtruth label
• Supervised, unsupervised, semi-supervised
Ø Assumption of normal vs. abnormal
• Statistical model
• Majority vs. minority
• Proximity: distance, density
Classification-based Methods
Ø Supervised learning
• Normal and/or abnormal cases
• More than one normal/abnormal classes
Ø Challenges
• Class imbalance: e.g., faults are much less frequent
• New patterns: e.g., new types of security attack
Clustering-based Methods
Ø Unsupervised learning
• No pre-defined normal/abnormal cases
• Majority vs. minority clusters
• Multiple clusters for the normal/abnormal cases
Ø Generalizable to different applications
• Clustering method, similarity measure
Proximity-based Methods
Ø Faraway from others => abnormal
Ø Distance-based
• Absolute proximity, e.g., kNN
Ø Density-based
• Relative proximity, e.g., ε-neighborhood
Semi-supervised Methods
Ø Partial labels: normal/abnormal cases
Ø Combination of clustering & classification
• Clustering
• Normal: large clusters and/or normal cases
• Abnormal: small clusters and/or abnormal cases
• Classification
Contextual Anomaly
Ø Context features => behavior features
• E.g., similar weather conditions => solar/wind power
Ø Identifying context
• Frequent patterns, subspace, domain-specific
Ø Detecting anomaly within context
• Transform to global outlier detection
Collective Anomaly
Ø A group of objects deviate from the norm
• E.g., Distributed Denial-of-Service (DDoS) attack
Ø Structural relationship among objects
• E.g., purchases of specific items at certain time/location
Ø Super object: a group of related objects
• Transform to global outlier detection
280

260 Unusual Time

Series Snippets Level Shifting

Example: Remote
240

Kelvin
220

Sensing Data
200

180

160
199 200 200 200 200 200
8 -09 0-0 1-0 2-1 4-0 5-0
1-3 6-1 0-2 3-1 7-2

Ø Spatial-temporal anomaly
-18 1 5 8 1 4
Date (yyyy-mm-dd)
Example:
Wind Farm
Ø Fault prediction

Ø Fault diagnosis
Example: Solar
Farm (1)
Ø Hierarchical anomaly
PV Str ing Com biner Box Inver ter Utility Gr id

PV
Panel
Example: Solar Farm (2)
Ø Collaborative fault detection
Summary: Outlier Analysis
Ø Types of outliers/anomalies
• Global, contextual, collective
Ø Methods
• Unsupervised, (semi-)supervised, context, structure
Ø Interpretation
• Errors or significant events

Cashier Technique
Document40 pages
Cashier Technique
Sujith Sukumaran
No ratings yet
SPI Design Procedure
Document104 pages
SPI Design Procedure
Kamlesh Dave
No ratings yet
Exp.: Date: 2/7/2020: Calculation of Measurement of Uncertainty As Per NABL 141
Document1 page
Exp.: Date: 2/7/2020: Calculation of Measurement of Uncertainty As Per NABL 141
Mechtek Lab
No ratings yet
Unit - 1
Document24 pages
Unit - 1
rajeshwari
100% (2)
LT Basic Handout 20051103
Document146 pages
LT Basic Handout 20051103
陳冠宇
No ratings yet
Geostatistical Data Analysis
Document195 pages
Geostatistical Data Analysis
Orestes Gomez G
No ratings yet
Data Mining Methods
Document18 pages
Data Mining Methods
pppchan23100
No ratings yet
Stator Core R&R (Equator 1)
Document101 pages
Stator Core R&R (Equator 1)
Mario Gorett Lopez Martinez
No ratings yet
Lab Briefing BIOE50009 - Molecules, Materials and Measurement 2
Document28 pages
Lab Briefing BIOE50009 - Molecules, Materials and Measurement 2
Azhar Sindhi
No ratings yet
Class 5 Mult Reg Diag 2
Document38 pages
Class 5 Mult Reg Diag 2
Neway Alem
No ratings yet
Kew Analog Multimeters
Document2 pages
Kew Analog Multimeters
wanna_ac
No ratings yet
09 EdgeDetection
Document11 pages
09 EdgeDetection
yur4al
No ratings yet
Production - Problems and Field Monitoring
Document73 pages
Production - Problems and Field Monitoring
adeeb
No ratings yet
Industrial Scanners Catalog EN LTR 201506B
Document32 pages
Industrial Scanners Catalog EN LTR 201506B
Dennis Chai
No ratings yet
N07V-K Rev005
Document2 pages
N07V-K Rev005
Rosa Bustos Valenzuela
No ratings yet
1 3sourcesoferror
Document13 pages
1 3sourcesoferror
tranduong182512
No ratings yet
Solar Physics Sounding Rocket
Document12 pages
Solar Physics Sounding Rocket
Genevieve Vigil
No ratings yet
Lab Report DC Generator Testing
Document8 pages
Lab Report DC Generator Testing
Muhammad Atif
No ratings yet
Type 8 Ds Jan18
Document3 pages
Type 8 Ds Jan18
Suresh Kumar
No ratings yet
II Unit Wind Loading
Document29 pages
II Unit Wind Loading
renganathank87
No ratings yet
How Well Do Environment-Based Models Predict Species Abundances at A Coarse Scale?
Document31 pages
How Well Do Environment-Based Models Predict Species Abundances at A Coarse Scale?
Maisha Damian
No ratings yet
AeroReport Trabalho
Document7 pages
AeroReport Trabalho
João Alexandre
No ratings yet
Cursos de Formación FEA
Document4 pages
Cursos de Formación FEA
Jaime
No ratings yet
X-Ray Diffraction Analysis: Dr. Majid Khan
$X-Ray Diffraction Analysis: Dr. Majid Khan$
Document36 pages
X-Ray Diffraction Analysis: Dr. Majid Khan
sami
No ratings yet
Industrial Scanners Catalog en LTR 201602
Document32 pages
Industrial Scanners Catalog en LTR 201602
Satwant Singh
No ratings yet
Chapter 3b - The Box-Jenkins Methodology For RIMA Models - Student Version
Document73 pages
Chapter 3b - The Box-Jenkins Methodology For RIMA Models - Student Version
Khánh Đoan Lê Đình
No ratings yet
Inspection, Testing and Maintenance of Fire Protection Systems: Managing The Qualifications of Contractors and Their Employees
Document38 pages
Inspection, Testing and Maintenance of Fire Protection Systems: Managing The Qualifications of Contractors and Their Employees
DaveRaphaelDumanat
No ratings yet
Stress & Strain - Ecs238
Document49 pages
Stress & Strain - Ecs238
Harith Iskandar
No ratings yet
Tall Buildings: Wind Loading and Structural Response Lecture 19 Dr. J.D. Holmes
Document30 pages
Tall Buildings: Wind Loading and Structural Response Lecture 19 Dr. J.D. Holmes
Gaurang Vesmawala
No ratings yet
Tall Buildings: Wind Loading and Structural Response Lecture 19 Dr. J.D. Holmes
Document30 pages
Tall Buildings: Wind Loading and Structural Response Lecture 19 Dr. J.D. Holmes
STN
No ratings yet
Brief Description: Application Note - Industries & Market
Document2 pages
Brief Description: Application Note - Industries & Market
Jose Oliveros Ardila
No ratings yet
Siemens Eg Type Circuit Breaker
Document15 pages
Siemens Eg Type Circuit Breaker
Ana Hernández Monterrubio
No ratings yet
Reduction of Defects in High Pressure Bolts: Project Review
Document17 pages
Reduction of Defects in High Pressure Bolts: Project Review
VickyVenkataraman
No ratings yet
Regression: Variables Entered/Removed
Document7 pages
Regression: Variables Entered/Removed
Febie Nurmalitasari
No ratings yet
Digipot Rotary Encoder
Document12 pages
Digipot Rotary Encoder
Gowtham Vinnu
No ratings yet
AE420 Chpt7 Fall 2021
Document20 pages
AE420 Chpt7 Fall 2021
LIU Hengxu
No ratings yet
Industrial Instrumentation
Document7 pages
Industrial Instrumentation
Nguyễn Xuân Dương
No ratings yet
T3-4. Testing and NDT
Document10 pages
T3-4. Testing and NDT
That Guy
No ratings yet
EN 2-2004 Example 001
Document7 pages
EN 2-2004 Example 001
RMM
No ratings yet
Ti401 Pro & Tix501 Introduction. Thermal Imaging Product Line Reshape
Document14 pages
Ti401 Pro & Tix501 Introduction. Thermal Imaging Product Line Reshape
MINTO K JOY
No ratings yet
Polynomial Example
Document21 pages
Polynomial Example
______.________
No ratings yet
Levelling Introduction
Document44 pages
Levelling Introduction
Md Khairul
No ratings yet
OpticalDiagnosticsInReactiveAndTwoPhaseFlows I II
Document44 pages
OpticalDiagnosticsInReactiveAndTwoPhaseFlows I II
bouziane.boudraa
No ratings yet
Agenda: Cleanroom/Environment Static Charge Challenges Control Strategies
Document22 pages
Agenda: Cleanroom/Environment Static Charge Challenges Control Strategies
ThisIs MyCat
No ratings yet
Brochure Dilatometer
Document2 pages
Brochure Dilatometer
allyabid
No ratings yet
Intermediate Vibration Analysis Training Topics - Cat II - BKV - FV
Document2 pages
Intermediate Vibration Analysis Training Topics - Cat II - BKV - FV
Cory O'Donnell
No ratings yet
V1 V2 Cal PRC
Document5 pages
V1 V2 Cal PRC
Cyril J Padiyath
No ratings yet
App Note Ceramics - Us PDF
Document2 pages
App Note Ceramics - Us PDF
Saragadam Dilsri
No ratings yet
CADEX - Assessing The Health of Batteries - 2007
Document77 pages
CADEX - Assessing The Health of Batteries - 2007
mekki1
No ratings yet
1 3sourcesoferror
Document13 pages
1 3sourcesoferror
Do Thi My Le
No ratings yet
Liquidlevel
Document24 pages
Liquidlevel
Anu Raj Anu Raj
No ratings yet
Vishay Roederstein: Features
Document7 pages
Vishay Roederstein: Features
deepak_singla227
No ratings yet
Testing 1
Document31 pages
Testing 1
Jagan V
No ratings yet
Bang Tinh Chon Day
Document18 pages
Bang Tinh Chon Day
Hoang Đàn Ngụy
No ratings yet
VM - Dec 2003
Document32 pages
VM - Dec 2003
Mely Leiva
No ratings yet
What Is Robust Design or Taguchi's Method?
Document29 pages
What Is Robust Design or Taguchi's Method?
ANIL KUMAR
No ratings yet
Tri-Rated Rev005
Document2 pages
Tri-Rated Rev005
Jean Pierre Goossens
100% (1)
Oriented Core Analysis
Document23 pages
Oriented Core Analysis
reza hosseini
No ratings yet
E-Solar Systems Solar Modules
Document1 page
E-Solar Systems Solar Modules
George Kattapuram
No ratings yet
Industrial Scanners Catalog EN 201407
Document32 pages
Industrial Scanners Catalog EN 201407
Dennis Chai
No ratings yet
c05 Wright Munich Chain Ladder
Document28 pages
c05 Wright Munich Chain Ladder
SITI QIBTIYYAH
No ratings yet
Geotechnical Logging and Mapping Preocedures and Data Analysis-Majdi-Abdalah
Document32 pages
Geotechnical Logging and Mapping Preocedures and Data Analysis-Majdi-Abdalah
Mustafa Saeed
No ratings yet
6S Battery: Nur Fadhilah Binti Jaafar Nurhannah Binti Azni Che Alim Amirul Bin Che Salmi
Document13 pages
6S Battery: Nur Fadhilah Binti Jaafar Nurhannah Binti Azni Che Alim Amirul Bin Che Salmi
Hannah Azni
No ratings yet
Fourier Series and Numerical Methods for Partial Differential Equations
From Everand
Fourier Series and Numerical Methods for Partial Differential Equations
Richard Bernatz
No ratings yet
AFM 34 en PDF
Document4 pages
AFM 34 en PDF
Dee Raja
No ratings yet
Steam Boilers, Engines, Nozzles and Turbines
Document39 pages
Steam Boilers, Engines, Nozzles and Turbines
Vinay Ankolekar
No ratings yet
Brochure ES-220 UHP Electric Skids PDF
Document2 pages
Brochure ES-220 UHP Electric Skids PDF
venky4025
No ratings yet
Subject:-Data Structure Using C 3 Semester A: G.H.Raisoni College of Engineering
Document6 pages
Subject:-Data Structure Using C 3 Semester A: G.H.Raisoni College of Engineering
bachayadav
No ratings yet
MUDIM ZAKARIA Ent
Document25 pages
MUDIM ZAKARIA Ent
Farid Alias
50% (2)
BP Greater Plutonio Update
Document2 pages
BP Greater Plutonio Update
njenns
No ratings yet
Auto Trend Forecaster
Document15 pages
Auto Trend Forecaster
herbak
No ratings yet
International Journal of Quality & Reliability Management: Article Information
Document24 pages
International Journal of Quality & Reliability Management: Article Information
asyrafmuhdd
No ratings yet
ShipRocket Proposal
Document7 pages
ShipRocket Proposal
Shashi Bhushan Singh
No ratings yet
FLS Minerals Brochure PDF
Document8 pages
FLS Minerals Brochure PDF
monam ellghorbeli
No ratings yet
Iasimp Qr023 en e
Document6 pages
Iasimp Qr023 en e
Pedro Arrambidez Hernandez
No ratings yet
Technical Note - Transformer Temperature Rise Test
Document2 pages
Technical Note - Transformer Temperature Rise Test
mazzoffa
100% (1)
Easa-Icaa Sms m5
Document13 pages
Easa-Icaa Sms m5
Husam F
No ratings yet
MR Hearter Manual MH - HS-50-75-125-175-210KT
Document20 pages
MR Hearter Manual MH - HS-50-75-125-175-210KT
Kit
No ratings yet
Kodak
Document10 pages
Kodak
Emerson Fonte Dos Santos Freire
No ratings yet
IBM Flex System X220
Document370 pages
IBM Flex System X220
Anushri Chansoria
No ratings yet
Devolo Manual
Document73 pages
Devolo Manual
John Metaxas
No ratings yet
Agreement of MR Baharul Islam
Document2 pages
Agreement of MR Baharul Islam
api-353405611
50% (2)
CNC Ram
Document29 pages
CNC Ram
Anand Dubey
No ratings yet
Deletegning Karcher K 720MX
Document50 pages
Deletegning Karcher K 720MX
ipovrixiotriton ipovrixiotriton
No ratings yet
Tele Wiring Diagram
Document2 pages
Tele Wiring Diagram
bartman666
No ratings yet
Areva KVFG R8559C
Document216 pages
Areva KVFG R8559C
lj_treels
100% (1)
Selfa: Product Catalogue
Document63 pages
Selfa: Product Catalogue
КонстантинКлёнов
No ratings yet
lpd8806 English
Document6 pages
lpd8806 English
peterpet
No ratings yet
Spare Parts Catalog: MT-L 3095 Material Number: 4474.053.065 Current Date: 14.03.2024
Document26 pages
Spare Parts Catalog: MT-L 3095 Material Number: 4474.053.065 Current Date: 14.03.2024
HSM PIONIER
No ratings yet