Welcome to Scribd!

Anomaly Detection

Uploaded by

0% found this document useful (0 votes)

4 views49 pages

This document discusses anomaly detection in machine learning and network security. It defines anomalies and outliers, and explains how to detect outliers using z-scores. Common causes of anomalies are given as different data classes, natural variation, and data errors. Challenges in anomaly detection are discussed, including obtaining accurate labels for supervised learning methods and dealing with different data types.

Original Description:

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

4 views49 pages

Anomaly Detection

Uploaded by

Amita Soni

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 49

Search inside document

MACHINE LEARNING AND NETWORK SECURITY

UNIT 2: Anomaly Detection

Anomaly vs Outliers
A standard normal table (also called the unit normal table or z-score table) is a mathematical table for the values
of ϕ, indicating the values of the cumulative distribution function of the normal distribution. Z-Score, also known as
the standard score, indicates how many standard deviations an entity is, from the mean.

𝑋−𝜇
𝑍=
𝜎
Reference Link: https://www.machinelearningplus.com/machine-learning/how-to-detect-outliers-with-z-score/
Standard Normal Distribution
Mean=0, Standard Deviation=1
Causes of Anomalies

1. Data from different classes

An object may be different because it is of a different class. Cases like credit card theft, Intrusion detection, outcome
of disease, abnormal test result are good examples of anomalies occurring and identified using class labels. Example:
measuring the weights of oranges, but a few grapefruit are mixed in.

2. Natural variation

In a Normal or Gaussian distribution the probability of a data object decreases rapidly. Such objects are considered as
anomalies. These are also called as outliers. Example: Unusually tall people.

3. Data measurement and Collection Errors

These kinds of errors occur when we collect erroneous data or if there is any deviation while measuring data.
Example: 200 pounds of a 2 year old.
Line A is blue line, B is green line and C is red
line.
We could use a clustering algorithm to assign membership to cluster.
Other Challenges in Anomaly Detection
Machine learning methods can be classified in many different ways. Quite frequently, we differentiate between
supervised and unsupervised learning. In supervised learning, the learning program needs labeled examples
given by a “teacher”, whereas in unsupervised learning, the program directly learns patterns from the data,
without any human intervention or guidance. The typical approach adopted by this method is to build a
predictive model for normal vs. anomaly classes. It compares any unseen data instance against the model to
identify which class it belongs to, whereas an unsupervised method works based on certain assumptions. It
assumes that (i) normal instances are far more frequent than anomalous instances and (ii) anomalous instances
are statistically different from normal instances. However, if these assumptions are not true, such methods
suffer from high false alarm rates.

For supervised learning, an important issue is to obtain accurate and representative labels, especially for the
anomaly classes.
Various Types of Data

The attributes used to describe real-life objects can be of different types. The following are the commonly used
types of attribute variables.
network

Top 100 Machine Learning Questions With Answers For Interview PDF
Document48 pages
Top 100 Machine Learning Questions With Answers For Interview PDF
Piyush Saraf
100% (2)
Advanced Risk Analysis in Engineering Enterprise Systems (2012)
Document453 pages
Advanced Risk Analysis in Engineering Enterprise Systems (2012)
atirina
No ratings yet
Gea1000 Finals Cheatsheet
Document2 pages
Gea1000 Finals Cheatsheet
Axel Javas
No ratings yet
J. R. M. Hosking, James R. Wallis - Regional Frequency Analysis - An Approach Based On L-Moments (1997) PDF
Document238 pages
J. R. M. Hosking, James R. Wallis - Regional Frequency Analysis - An Approach Based On L-Moments (1997) PDF
MOHAMAMED BOSS
No ratings yet
England and Verrall - Predictive Distributions of Outstanding Liabilities in General Insurance
Document43 pages
England and Verrall - Predictive Distributions of Outstanding Liabilities in General Insurance
api-3851231
100% (2)
1preparing Data
Document6 pages
1preparing Data
Ukky
No ratings yet
2009 Data Cleaning
Document8 pages
2009 Data Cleaning
Glory of Billy's Empire Jorton Knight
No ratings yet
A Review of Statistical Outlier Methods
Document8 pages
A Review of Statistical Outlier Methods
jljimenez1969
No ratings yet
02 - Accuracy and Precision-Chem23
Document5 pages
02 - Accuracy and Precision-Chem23
EJ Ramirez
No ratings yet
How To Calculate Outliers
Document7 pages
How To Calculate Outliers
Celina Borillo
No ratings yet
1outlier - Wikipedia
Document47 pages
1outlier - Wikipedia
jlesalvador
No ratings yet
Data Mining:: Concepts and Techniques
Document13 pages
Data Mining:: Concepts and Techniques
Hasibur Rahman Porag
No ratings yet
Outlier: Occurrence and Causes
Document6 pages
Outlier: Occurrence and Causes
Tangguh Wicaksono
No ratings yet
DataScience Interview Questions
Document66 pages
DataScience Interview Questions
ravi Kiran
No ratings yet
Data Science Interview Questions: Answer Here
Document54 pages
Data Science Interview Questions: Answer Here
neeraj12121
No ratings yet
12 Outlier
Document55 pages
12 Outlier
Nivedita Bhore
No ratings yet
Descriptive Statistics
Document28 pages
Descriptive Statistics
Kaushal Pandey
No ratings yet
Detection of Outliers: Iglewicz and Hoaglin
Document2 pages
Detection of Outliers: Iglewicz and Hoaglin
Joseph Tang
No ratings yet
Data Science Interview Questions 1599708768
Document54 pages
Data Science Interview Questions 1599708768
aalto falto
No ratings yet
Nature of Statistics: Sample Population Parameter, Statistic
Document3 pages
Nature of Statistics: Sample Population Parameter, Statistic
Sofia Isabelle Garcia
No ratings yet
Data Mining:: Concepts and Techniques
Document16 pages
Data Mining:: Concepts and Techniques
chitra devi
No ratings yet
1.1 - Statistical Analysis PDF
Document10 pages
1.1 - Statistical Analysis PDF
zoohyun91720
No ratings yet
Data Science Interview Questions
Document55 pages
Data Science Interview Questions
Arunachalam Narayanan
100% (2)
6anomaly Fraud Detection
Document5 pages
6anomaly Fraud Detection
Saugat Tripathi
No ratings yet
TOPIC 1.3 Statistical Tests and Data Analysis
Document35 pages
TOPIC 1.3 Statistical Tests and Data Analysis
TOP4IK101 GG
No ratings yet
Paper-1 Significance of One-Class Classification in Outlier Detection
Document11 pages
Paper-1 Significance of One-Class Classification in Outlier Detection
Rachel Wheeler
No ratings yet
Data Science Interview Q's - I
Document11 pages
Data Science Interview Q's - I
Raja
No ratings yet
Standard Deviation Dissertation
Document5 pages
Standard Deviation Dissertation
OrderCustomPaperUK
100% (1)
Introduction and Problem Area: Tentative Title - Detecting Interesting Patterns
Document7 pages
Introduction and Problem Area: Tentative Title - Detecting Interesting Patterns
Aishwarya Singh
No ratings yet
Application of Statistical Concepts in The Determination of Weight Variation in Coin Samples
Document3 pages
Application of Statistical Concepts in The Determination of Weight Variation in Coin Samples
Micah Peralta
No ratings yet
MeasuresMeasurements Eng
Document87 pages
MeasuresMeasurements Eng
Ruba
No ratings yet
Outlier Analysis in Data Mining
Document5 pages
Outlier Analysis in Data Mining
Diksha Gupta
No ratings yet
Anomaly Detection 2
Document8 pages
Anomaly Detection 2
Aishwarya Singh
No ratings yet
Appendix B: Introduction To Statistics: Eneral Terminology
Document15 pages
Appendix B: Introduction To Statistics: Eneral Terminology
Xingjian Liu
No ratings yet
Missing and Outlier
Document20 pages
Missing and Outlier
STYX
No ratings yet
Project Risk
Document27 pages
Project Risk
Ngô Việt Đức
No ratings yet
Error Types and Error Propagation
Document6 pages
Error Types and Error Propagation
DerioUnbound
No ratings yet
Standard Deviation and Its Applications
Document8 pages
Standard Deviation and Its Applications
anon_882394540
100% (1)
Outlier
Document9 pages
Outlier
keisha555
No ratings yet
IQL Chapter 5 - What Is Normal?
Document5 pages
IQL Chapter 5 - What Is Normal?
Glad Dys
No ratings yet
BA UNIT-3 - Part 1
Document4 pages
BA UNIT-3 - Part 1
Arunim Yadav
No ratings yet
Basic Analytical Concepts
Document12 pages
Basic Analytical Concepts
Himadri Jana
No ratings yet
Part A
Document16 pages
Part A
Saumya Singh
No ratings yet
Cancer Detection Using Data Mining
Document13 pages
Cancer Detection Using Data Mining
rishabh kumar
No ratings yet
Statistics For Datacience
Document7 pages
Statistics For Datacience
NIKHILESH M NAIK 1827521
100% (1)
05 Normal Distribution Hypothesis
Document41 pages
05 Normal Distribution Hypothesis
Ademu Onu
No ratings yet
Estimation of COVID19 Infection Using Machine Learning Algorithms
Document15 pages
Estimation of COVID19 Infection Using Machine Learning Algorithms
Kalyani Darapaneni
No ratings yet
On Outliers, Statistical Risks, and A Resampling Approach Towards Statistical Inference
Document14 pages
On Outliers, Statistical Risks, and A Resampling Approach Towards Statistical Inference
Gerda Schlinger
No ratings yet
Chapter 6 7 Anomaly Fraud Detection Advanced Datamining Application
Document10 pages
Chapter 6 7 Anomaly Fraud Detection Advanced Datamining Application
Niranjan Kumar Das
No ratings yet
Group 2
Document73 pages
Group 2
Daniel Nguyen
No ratings yet
Outlier Detection Techniques
Document56 pages
Outlier Detection Techniques
tony2222
No ratings yet
Inference For Numerical Data - Stats 250
Document18 pages
Inference For Numerical Data - Stats 250
Oliver Barr
No ratings yet
Q1. What Is Data Science? List The Differences Between Supervised and Unsupervised Learning
Document41 pages
Q1. What Is Data Science? List The Differences Between Supervised and Unsupervised Learning
Bibal Benifa
100% (1)
Anomaly Detection - Analysis and Prediction Techniques in IoT Environment A Systematic Literature Review
Document18 pages
Anomaly Detection - Analysis and Prediction Techniques in IoT Environment A Systematic Literature Review
rasecla
No ratings yet
5 Ways To Find Outliers in Your Data - Statistics by Jim
Document35 pages
5 Ways To Find Outliers in Your Data - Statistics by Jim
Arindam Chakraborty
No ratings yet
Business Statistics Syallbus
Document10 pages
Business Statistics Syallbus
manish yadav
No ratings yet
Chapter 4
Document41 pages
Chapter 4
Shible Sheikh
No ratings yet
Statistics in Neurosciences: Basics - Field Chapter 1-5
Document33 pages
Statistics in Neurosciences: Basics - Field Chapter 1-5
lisamartinova747
No ratings yet
Discusion Forum Unit 2
Document2 pages
Discusion Forum Unit 2
ezra fred
No ratings yet
Characterizing Measurements and Results: Level 2 Analytical Chemistry 2020/2021
Document9 pages
Characterizing Measurements and Results: Level 2 Analytical Chemistry 2020/2021
bobby la fleur
No ratings yet
Activity and Module 2 Statistics and Probability - G11
Document4 pages
Activity and Module 2 Statistics and Probability - G11
rakistabanda6
No ratings yet
ABC of Clinical Reasoning
From Everand
ABC of Clinical Reasoning
Nicola Cooper
No ratings yet
Artificial Intelligence Diagnosis: Fundamentals and Applications
From Everand
Artificial Intelligence Diagnosis: Fundamentals and Applications
Fouad Sabry
No ratings yet
Engineering Statistics Handbook 4. Process Modeling
Document60 pages
Engineering Statistics Handbook 4. Process Modeling
agbas20026896
No ratings yet
Inferences and Conclusions From Data
Document389 pages
Inferences and Conclusions From Data
Sandro Berrio
No ratings yet
Eld26 PDF
Document6 pages
Eld26 PDF
anjit mahato
No ratings yet
An Adjusted Boxplot For Skewed Distributions: M. Hubert, E. Vandervieren
Document16 pages
An Adjusted Boxplot For Skewed Distributions: M. Hubert, E. Vandervieren
Raul Hernan Villacorta Garcia
No ratings yet
Statistical Model
Document5 pages
Statistical Model
BOBBY212
No ratings yet
IntroduEconometrics - MBA 525 - FEB2024
Document266 pages
IntroduEconometrics - MBA 525 - FEB2024
Aklilu Girma
No ratings yet
12 Housing Prices
Document12 pages
12 Housing Prices
Deepmala Bharti
No ratings yet
Woman Empowerment
Document16 pages
Woman Empowerment
Shailendra Bhatt
No ratings yet
Information Systems: Lixia Chen, Alin Dobra
Document18 pages
Information Systems: Lixia Chen, Alin Dobra
Leonardo Jaimes
No ratings yet
Chapter 3
Document5 pages
Chapter 3
Haris Malik
No ratings yet
Statistics Hci
Document118 pages
Statistics Hci
saxycb
No ratings yet
Introduction To Statistical Modeling With SAS/STAT Software
Document60 pages
Introduction To Statistical Modeling With SAS/STAT Software
Mindong Chen
No ratings yet
IEEE Power Transformer PHM
Document10 pages
IEEE Power Transformer PHM
Hu Chao
No ratings yet
Repeated Measures Analysis of Variance: An Example
Document32 pages
Repeated Measures Analysis of Variance: An Example
gore_11
No ratings yet
29614
Document7 pages
29614
Jigyasa Gautam
0% (3)
Carhart Model
Document12 pages
Carhart Model
Mohd Asjad
No ratings yet
Analysis of CFAR Detection With Multiple Pulses Transmission Case in Pareto Distributed Clutter
Document6 pages
Analysis of CFAR Detection With Multiple Pulses Transmission Case in Pareto Distributed Clutter
Zellagui Energy
No ratings yet
Lecturenotes12 10
Document22 pages
Lecturenotes12 10
Joseph Shonhiwa
No ratings yet
Issues in The Structural Equation Modeling of Complex Survey Data
Document6 pages
Issues in The Structural Equation Modeling of Complex Survey Data
Zain Asaahi
No ratings yet
Package RMS': June 1, 2011
Document219 pages
Package RMS': June 1, 2011
temp_spss
No ratings yet
JNTUK R20 ML UNIT-I Final
Document22 pages
JNTUK R20 ML UNIT-I Final
sanjanareddy.satti24
No ratings yet
Section 6.3.2hhh
Document23 pages
Section 6.3.2hhh
looklikenasi
No ratings yet
Permutation Tests For Stochastic Ordering and ANOVA Theory and Applications With R
Document220 pages
Permutation Tests For Stochastic Ordering and ANOVA Theory and Applications With R
Eric Rojas
No ratings yet
Introduction To Quantitative Analysis
Document45 pages
Introduction To Quantitative Analysis
Lian Blakely Cousin
No ratings yet
Surface Roughness Model For St37
Document4 pages
Surface Roughness Model For St37
fitraska
No ratings yet
Forecast Pro V8 Statistical Reference Manual
Document62 pages
Forecast Pro V8 Statistical Reference Manual
gacastroh81
No ratings yet
Harvard Defendant Expert Report - 2017-12-15 Dr. David Card Expert Report Updated Confid Desigs Redacted
Document197 pages
Harvard Defendant Expert Report - 2017-12-15 Dr. David Card Expert Report Updated Confid Desigs Redacted
wolf wood
No ratings yet