0% found this document useful (0 votes)

54 views8 pages

Text Categorization Evaluation Methods

This document discusses evaluation methods for text categorization systems. It introduces classification accuracy as a basic evaluation metric but notes problems with it, such as not accounting for different misclassification costs. It then describes per-document and per-category evaluation using precision and recall metrics to measure how well a system predicts category membership at the document and category level respectively. The F-measure is presented as a way to combine precision and recall into a single score.

Uploaded by

Sahar Salah

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

54 views8 pages

Text Categorization Evaluation Methods

Uploaded by

Sahar Salah

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Text Categorization: Evaluation (Part 1)

ChengXiang Cheng Zhai

Department of Computer Science
University of Illinois at Urbana-Champaign

Overview
What is text categorization?
Why text categorization?
How to do text categorization?
Generative probabilistic models
Discriminative approaches

How to evaluate categorization results?

General Evaluation Methodology

Have humans to create a test collection where every document is
tagged with the desired categories (ground truth)
Generate categorization results using a system on the test collection
Compare the system categorization decisions with the human-made
categorization decisions and quantify their similarity (or equivalently
difference)
The higher the similarity is, the better the results are
Similarity can be measured from different perspectives to understand
the quality of results in detail (e.g., which category performs better?)
In general, different categorization mistakes may have a different cost
that inevitably depends on specific applications, but it is okay not to
consider such a cost variation for relative comparison of methods
3

Classification Accuracy (Percentage of Correct Decisions)

d1
d2
d3

y(+) y(-) n(+)

y(-) n(+) y(+)
n(+) n(+) y(+)

n(+)
n(+)
n(+)

+/- human answer

(+= correct; - =incorrect)
y/n system result
(y=yes; n=no)

Classification Accuracy =

Total number of correct decisions

Total number of decisions made

count ( y( )) count ( n( ))
kN

Problems with Classification Accuracy

Some decision errors are more serious than others
It may be more important to get the decisions right on some
documents than others
It may be more important to get the decisions right on some
categories than others
E.g., spam filtering: missing a legitimate email costs more than letting
a spam go

Problem with imbalanced test set

Skewed test set: 98% in category 1; 2% in category 2
Strong baseline: put all instances in category 1 98% accuracy!
5

Per-Document Evaluation
c1

d1
d2
d3

y(+) y(-) n(+)

y(-) n(+) y(+)
n(+) n(+) y(+)

Human (+)

n(+)
n(+)
n(+)

System (y)

System (n)

True Positives

False Negatives

TP
Human (-)

False Positives

FN
True Negatives

How good are the decisions on di?

When the system says yes,
how many are correct?

TP
Precision
TP FP
Recall

TP
TP FN

Does the doc have all the categories

it should have?
6

Per-Category Evaluation
c1

d1
d2
d3

y(+) y(-) n(+)

y(-) n(+) y(+)
n(+) n(+) y(+)

Human (+)

n(+)
n(+)
n(- )

System (y)

System (n)

True Positives

False Negatives

TP
Human (-)

False Positives

FN
True Negatives

How good are the decisions on ci?

When the system says yes,
how many are correct?

TP
Precision
TP FP
Recall

TP
TP FN

Has the category been assigned to

all the docs of this category? 7

Combine Precision and Recall: F-Measure

R
2 PR
F1
PR
2
2 1

1
2 1

Why not 0.5P+0.5R?

( 2 1) P * R

1
2P R
P
P: precision
R: recall
: parameter (often set to 1)

What is R if the system says y for all category-doc pairs?

Understanding Classification Algorithms
No ratings yet
Understanding Classification Algorithms
131 pages
Understanding Confusion Matrix Metrics
No ratings yet
Understanding Confusion Matrix Metrics
21 pages
6.data Mining - Classification
No ratings yet
6.data Mining - Classification
37 pages
Unit 4 Learning
No ratings yet
Unit 4 Learning
100 pages
Mlslides 2
No ratings yet
Mlslides 2
92 pages
Evaluating Classification Methods
No ratings yet
Evaluating Classification Methods
29 pages
Evaluation Metrics in Machine Learning
No ratings yet
Evaluation Metrics in Machine Learning
26 pages
Understanding ML Evaluation Metrics
No ratings yet
Understanding ML Evaluation Metrics
20 pages
Evaluating Models CH-3
No ratings yet
Evaluating Models CH-3
5 pages
Evaluation
No ratings yet
Evaluation
7 pages
Chater 3 Class 10
No ratings yet
Chater 3 Class 10
4 pages
NLP Classifier Performance Metrics
No ratings yet
NLP Classifier Performance Metrics
146 pages
Classification Metrics
No ratings yet
Classification Metrics
39 pages
AI Model Evaluation Techniques Explained
No ratings yet
AI Model Evaluation Techniques Explained
12 pages
CH 07 Evaluation
No ratings yet
CH 07 Evaluation
25 pages
Classification Metrics Mod 6
No ratings yet
Classification Metrics Mod 6
8 pages
Evaluating Models
No ratings yet
Evaluating Models
8 pages
Classification Task and Confusion Matrix Guide
No ratings yet
Classification Task and Confusion Matrix Guide
17 pages
Classification Model Evaluation Techniques
No ratings yet
Classification Model Evaluation Techniques
15 pages
Evaluating Data Mining Model Performance
No ratings yet
Evaluating Data Mining Model Performance
30 pages
ML CH 5
No ratings yet
ML CH 5
45 pages
9.1 Accuracy: Formula: Accuracy (True Positives + True Negatives) / (Total Observations)
No ratings yet
9.1 Accuracy: Formula: Accuracy (True Positives + True Negatives) / (Total Observations)
4 pages
3.3 - Accuracy and Precision From Confusion Matrix
No ratings yet
3.3 - Accuracy and Precision From Confusion Matrix
4 pages
GR X Unit 3 Evaluation NBE Key
No ratings yet
GR X Unit 3 Evaluation NBE Key
6 pages
Classification Algorithms Overview
No ratings yet
Classification Algorithms Overview
20 pages
Data Mining: Evaluation Methods
No ratings yet
Data Mining: Evaluation Methods
25 pages
Binary Classifier Training and Evaluation
No ratings yet
Binary Classifier Training and Evaluation
151 pages
Machine Learning Algorithms for Hiring
No ratings yet
Machine Learning Algorithms for Hiring
7 pages
Class X Unit3WS Evaluation
No ratings yet
Class X Unit3WS Evaluation
3 pages
Multiclass Classification Metrics Guide
No ratings yet
Multiclass Classification Metrics Guide
35 pages
Lec09 Classifier Evaluation
No ratings yet
Lec09 Classifier Evaluation
185 pages
Module 8 PDF
No ratings yet
Module 8 PDF
51 pages
Understanding Confusion Matrix Basics
No ratings yet
Understanding Confusion Matrix Basics
32 pages
Language Processing Model Evaluation Techniques
No ratings yet
Language Processing Model Evaluation Techniques
6 pages
Text Classification Techniques Explained
No ratings yet
Text Classification Techniques Explained
19 pages
Naïve Bayes Classifier
No ratings yet
Naïve Bayes Classifier
39 pages
Unit - 3 Evaluation
No ratings yet
Unit - 3 Evaluation
6 pages
Risk Security and Regulatory Compliance
No ratings yet
Risk Security and Regulatory Compliance
12 pages
2020 Eval4nlp-1 9
No ratings yet
2020 Eval4nlp-1 9
13 pages
Evaluation Data
No ratings yet
Evaluation Data
3 pages
Machine Learning Model Evaluation Metrics
No ratings yet
Machine Learning Model Evaluation Metrics
24 pages
A Review of The F-Measure: Its History, Properties, Criticism, and Alternatives
No ratings yet
A Review of The F-Measure: Its History, Properties, Criticism, and Alternatives
24 pages
Unit-6 Notes PART A
No ratings yet
Unit-6 Notes PART A
20 pages
Cyber Analytics Performance Metrics Guide
No ratings yet
Cyber Analytics Performance Metrics Guide
15 pages
ML Paradigms and Evaluation Metrics Guide
No ratings yet
ML Paradigms and Evaluation Metrics Guide
57 pages
Cls 10 Evaluation Final
No ratings yet
Cls 10 Evaluation Final
10 pages
CH 6
No ratings yet
CH 6
24 pages
Evaluation
No ratings yet
Evaluation
31 pages
Part B Unit 3
No ratings yet
Part B Unit 3
23 pages
X Evaluating Model
No ratings yet
X Evaluating Model
3 pages
Classifier Performance Evaluation Guide
No ratings yet
Classifier Performance Evaluation Guide
22 pages
SupervisedLearning Classification
No ratings yet
SupervisedLearning Classification
20 pages
11 Machine Learning System Design PDF
No ratings yet
11 Machine Learning System Design PDF
7 pages
Classification Algorithms and Evaluation Techniques
No ratings yet
Classification Algorithms and Evaluation Techniques
24 pages
Sprite Channel Overview and Usage
No ratings yet
Sprite Channel Overview and Usage
2 pages
dr-KhalidKerawani-التواصل الفوري المتزامن وغير المتزامن PDF
100% (1)
dr-KhalidKerawani-التواصل الفوري المتزامن وغير المتزامن PDF
34 pages
Macromedia Director Animation Guide
No ratings yet
Macromedia Director Animation Guide
2 pages
Factors Influencing Colonoscopy Quality
No ratings yet
Factors Influencing Colonoscopy Quality
1 page
Overview of Macromedia Director MX 2004
No ratings yet
Overview of Macromedia Director MX 2004
20 pages
E-Learning Theories and Models Explained
No ratings yet
E-Learning Theories and Models Explained
16 pages
Essential Qualities of Branch Managers
No ratings yet
Essential Qualities of Branch Managers
4 pages
Effective Time Management Strategies
No ratings yet
Effective Time Management Strategies
20 pages
World Journal On Educational Technology
No ratings yet
World Journal On Educational Technology
13 pages
edItLib 2015
No ratings yet
edItLib 2015
9 pages
Ai9 2
No ratings yet
Ai9 2
3 pages
The Complete Guide To Overcoming OCD by David Veal
No ratings yet
The Complete Guide To Overcoming OCD by David Veal
2 pages
Engineering Ethics Case Study
No ratings yet
Engineering Ethics Case Study
2 pages
AI ML Interview Questions For Teacher
No ratings yet
AI ML Interview Questions For Teacher
2 pages
Teaching As An Art and Science Etc
0% (1)
Teaching As An Art and Science Etc
4 pages
Overview of the Berlitz Method
No ratings yet
Overview of the Berlitz Method
3 pages
Module 1 Packet - TEYL MOOC - 2024
No ratings yet
Module 1 Packet - TEYL MOOC - 2024
36 pages
Ellinger 2016
No ratings yet
Ellinger 2016
13 pages
Fullerton Teacher Induction ILP Guide
No ratings yet
Fullerton Teacher Induction ILP Guide
6 pages
JD - Zonal Manager Phonepe
No ratings yet
JD - Zonal Manager Phonepe
3 pages
Work Immersion Experience and College Readiness #2
No ratings yet
Work Immersion Experience and College Readiness #2
10 pages
Portola Science Fair Timeline 2021
No ratings yet
Portola Science Fair Timeline 2021
1 page
Midwifery Decision-Making Framework Review
No ratings yet
Midwifery Decision-Making Framework Review
13 pages
Blank DLL Deped Order No. 42 S. 2016
No ratings yet
Blank DLL Deped Order No. 42 S. 2016
4 pages
Teaching Math Concepts to Preschoolers
No ratings yet
Teaching Math Concepts to Preschoolers
23 pages
MCII for Habit Formation
No ratings yet
MCII for Habit Formation
9 pages
Assignment Guidelines for Financial Accounting
No ratings yet
Assignment Guidelines for Financial Accounting
6 pages
Priscilla Amfoasah: Personal Assistant Resume
No ratings yet
Priscilla Amfoasah: Personal Assistant Resume
2 pages
German Language Course for Beginners in Qatar
0% (1)
German Language Course for Beginners in Qatar
4 pages
Correlation of Class Discussion and Participation
No ratings yet
Correlation of Class Discussion and Participation
8 pages
Understanding and Completing Analogies
No ratings yet
Understanding and Completing Analogies
10 pages
Preferred Reporting Items For Systematic Reviews and Meta-Analyses
No ratings yet
Preferred Reporting Items For Systematic Reviews and Meta-Analyses
3 pages
The Viniyoga of Āsana - 2. There Are Many Approaches To Āsana Practice
No ratings yet
The Viniyoga of Āsana - 2. There Are Many Approaches To Āsana Practice
2 pages
The Theoretical Branches of Philosophy
No ratings yet
The Theoretical Branches of Philosophy
10 pages
2 Touching Spirit BearPart I WA
No ratings yet
2 Touching Spirit BearPart I WA
2 pages
PSAU Education Portfolio Overview
No ratings yet
PSAU Education Portfolio Overview
52 pages
Research Proposal Template Guide
No ratings yet
Research Proposal Template Guide
15 pages
Lecture 3: Psycholinguistic Theories of Sentence Processing I
No ratings yet
Lecture 3: Psycholinguistic Theories of Sentence Processing I
8 pages
Term Paper Ethics
No ratings yet
Term Paper Ethics
3 pages
All Graphic Organizers - Methods and Approaches - Team 8
No ratings yet
All Graphic Organizers - Methods and Approaches - Team 8
17 pages

Text Categorization Evaluation Methods

Uploaded by

Text Categorization Evaluation Methods

Uploaded by

Text Categorization: Evaluation (Part 1)

ChengXiang Cheng Zhai

How to evaluate categorization results?

General Evaluation Methodology

Classification Accuracy (Percentage of Correct Decisions)

y(+) y(-) n(+)

+/- human answer

Total number of correct decisions

Problems with Classification Accuracy

Problem with imbalanced test set

y(+) y(-) n(+)

How good are the decisions on di?

Does the doc have all the categories

y(+) y(-) n(+)

How good are the decisions on ci?

Has the category been assigned to

Combine Precision and Recall: F-Measure

Why not 0.5*P+0.5*R?

What is R if the system says y for all category-doc pairs?

You might also like

Why not 0.5P+0.5R?