Welcome to Scribd!

Analysis of Admissions Dataset:: Project by

Uploaded by

0% found this document useful (0 votes)

3 views12 pages

This document summarizes an analysis of student admissions data conducted by a team to predict student placement based on their profiles. The team performed data understanding, visualization, univariate and bivariate analysis, built models including logistic regression, decision trees, KNN, naive Bayes and SVM, and evaluated the models based on accuracy and AUCROC metrics. The key insights were that the dataset was imbalanced, the models did not strongly distinguish classes, possibly due to insufficient data or variables, and SVM had the best accuracy score and was suitable for the small dataset size.

Original Description:

PPT in admission dataset

Original Title

Project

Copyright

Available Formats

PPTX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

3 views12 pages

Analysis of Admissions Dataset:: Project by

Uploaded by

ShivangDubey

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 12

Search inside document

ANALYSIS OF ADMISSIONS

DATASET:

Project by:

• Kuldeep
• Vignesh
• Varun S
• Shivang
• Utkarsh
OVERVIEW:

 Business problem

 Data understanding

 Data visualization using tableau

 Univariate and bivariate analysis

 Model building

 Evaluation metrics

 Key insights
BUSINESS PROBLEM:

Predicting whether the enrolled students are going

to get placed or not based on there profile.
Hence improving the caliber of the college.
DATA UNDERSTANDING:

 The given data is of the shape (391,19).

 Based on the business problem, we are taking ‘Placement’ as dependent

variable and the rest all are independent variable.

 On observing the distribution of dependent variable, we can say that dataset

is imbalance.

 We found few missing values in the feature Entrance_Test, which is

replaced with value ‘Direct_Adimission’
DATA VISUALIZATION USING TABLEAU:
MARKS DISTRIBUTION:
UNIVARIATE AND BIVARIATE
ANALYSIS:
 Placed Vs Not placed
GENDER VS PLACEMENT SPECIALIZATION vs PLACEMENT
MODEL BUILDING:

 We have used the following models:

-Logistic regression

-Decision tree

-KNN classifier

-Naïve based

-Support vector machine

EVOLUTION METRICS:

MODELS ACCURACY SCORE AUCROC

Logistic regression 0.77 0.5

Decision tree 0.72 0.5

KNN classifier 0.76 0.5

Naïve based 0.71 0.5

Support vector machine 0.81 0.5

KEY INSIGHTS:

 Since the model is imbalanced, we take AUCROC as an evaluation metric.

 Considering the evolution metrics of all the models i.e. in the range of 0.5-0.6, which
infer that the model do not distinguish between the classes.

 This may occur due to insufficient records or improper selection of variables.

 Based on the Accuracy score, we can infer that support vector machine is a better
model.

 The SVM is applicable for the dataset with less number of records, which also holds
true in this case.

Process Performance Models: Statistical, Probabilistic & Simulation
From Everand
Process Performance Models: Statistical, Probabilistic & Simulation
Vishnuvarthanan Moorthy
No ratings yet
Naive Bayes Classifier: Fundamentals and Applications
From Everand
Naive Bayes Classifier: Fundamentals and Applications
Fouad Sabry
No ratings yet
Chapter 11 KNN Naive Bayes and LDA
Document15 pages
Chapter 11 KNN Naive Bayes and LDA
kiitlabsbsc
No ratings yet
Analysis of K-Fold Cross-Validation Over Hold-Out
Document6 pages
Analysis of K-Fold Cross-Validation Over Hold-Out
way
No ratings yet
Feature Extraction: - Saheni Patra
Document17 pages
Feature Extraction: - Saheni Patra
Arindam Roy
No ratings yet
Churn Predict Analysis
Document23 pages
Churn Predict Analysis
Sujeet Rajput
100% (1)
Cross Validation Explained
Document8 pages
Cross Validation Explained
nathanlgrossman
No ratings yet
Exer8 Indigo 1
Document2 pages
Exer8 Indigo 1
Karl Soriano
No ratings yet
College Physics: Machine Learning
Document49 pages
College Physics: Machine Learning
Simarpreet
No ratings yet
Report
Document24 pages
Report
Faizan Bajwa
No ratings yet
DATT - Class 05 - Assignment - GR 9
Document9 pages
DATT - Class 05 - Assignment - GR 9
SAURABH SINGH
No ratings yet
UE20CS312 Unit2 Slides
Document206 pages
UE20CS312 Unit2 Slides
abhay spam
No ratings yet
CUTE - 2 Presentation: Group 15 BY Vedavyas Udutha Ravi Teja Sanam Sai Chand Kalva
Document10 pages
CUTE - 2 Presentation: Group 15 BY Vedavyas Udutha Ravi Teja Sanam Sai Chand Kalva
Ravi Teja Sanam
No ratings yet
Churn Prediction Report
Document4 pages
Churn Prediction Report
Ause El
No ratings yet
Machine Learning VIVEK
Document118 pages
Machine Learning VIVEK
RemyaRS
100% (3)
Lead Scoring Case Study Presentation
Document11 pages
Lead Scoring Case Study Presentation
Devanshi
100% (2)
Storytelling With Data To Executives 09212016
Document33 pages
Storytelling With Data To Executives 09212016
Oscar Pinillos
No ratings yet
Graduate Admission Prediction - Data Analytics
Document32 pages
Graduate Admission Prediction - Data Analytics
Faiza Noor
No ratings yet
Linear Regression Playbook
Document1 page
Linear Regression Playbook
Bogdan Mariut
No ratings yet
Multi Criteria
Document15 pages
Multi Criteria
Ahmad Afandi Hrp
No ratings yet
Lead Scoring Group Case Study Presentation
Document19 pages
Lead Scoring Group Case Study Presentation
Santosh Arakeri
100% (2)
Partial Least Square
Document6 pages
Partial Least Square
Ibnusina Bloodbrothers
No ratings yet
Modelling and Evaluation
Document70 pages
Modelling and Evaluation
ANIMESH KUMAR
No ratings yet
ML Practical 04
Document19 pages
ML Practical 04
chatgptlogin2001
No ratings yet
Make Better Predictions With Powerful Regression Procedures
Document2 pages
Make Better Predictions With Powerful Regression Procedures
Minh Nguyen
No ratings yet
ML Lec-10
Document19 pages
ML Lec-10
BHARGAV RAO
No ratings yet
Business Report - Predictive Modeling
Document59 pages
Business Report - Predictive Modeling
Priyanka Patil
No ratings yet
1.4 Intro To Need of Estimation and Validation PDF
Document18 pages
1.4 Intro To Need of Estimation and Validation PDF
Dhairya Thakkar
No ratings yet
Generalization of Linear and Non-Linear Support Vector Machine in Multiple Fields: A Review
Document14 pages
Generalization of Linear and Non-Linear Support Vector Machine in Multiple Fields: A Review
CSIT iaesprime
No ratings yet
DATA SCIENCE With DA, ML, DL, AI Using Python & R PDF
Document10 pages
DATA SCIENCE With DA, ML, DL, AI Using Python & R PDF
Saikumar Reddy
No ratings yet
How To Minimize Misclassification Rate and Expected Loss For Given Model
Document7 pages
How To Minimize Misclassification Rate and Expected Loss For Given Model
ANJALI PATEL
No ratings yet
Extension Node To The Rescue of The Curse of Dimensionality Via Weight of Evidence (WOE) Recoding
Document9 pages
Extension Node To The Rescue of The Curse of Dimensionality Via Weight of Evidence (WOE) Recoding
VũMinh
No ratings yet
Untitled
Document128 pages
Untitled
P.V.S. VEERANJANEYULU
No ratings yet
Week11-Lecture 11ML Algorithms Metrics - Updated
Document29 pages
Week11-Lecture 11ML Algorithms Metrics - Updated
fgfdgfdgfd
No ratings yet
BA 2023 - 2024 T03 Descriptive Data Mining
Document57 pages
BA 2023 - 2024 T03 Descriptive Data Mining
jhkkpmynkg
No ratings yet
Discriminant Analysis
Document23 pages
Discriminant Analysis
Dorin Katuu
No ratings yet
Data Mining: Concepts and Techniques: January 14, 2014
Document64 pages
Data Mining: Concepts and Techniques: January 14, 2014
sathyam66
No ratings yet
Capstone Project Business: Predict Customer Churn in E-Commerce
Document10 pages
Capstone Project Business: Predict Customer Churn in E-Commerce
A d
100% (2)
Unit 7 - Introduction To Predictive Analytics
Document10 pages
Unit 7 - Introduction To Predictive Analytics
Rosan Yanise
No ratings yet
Machine Learning (Part 1) : Iykra Data Fellowship Batch 3
Document28 pages
Machine Learning (Part 1) : Iykra Data Fellowship Batch 3
aril dan
No ratings yet
Workshop Project Report
Document10 pages
Workshop Project Report
Rajveer Singh
No ratings yet
Customer Churn Prediction
Document3 pages
Customer Churn Prediction
mbibachris
No ratings yet
Aam Micro
Document13 pages
Aam Micro
workwithsnehh
No ratings yet
Untitled
Document29 pages
Untitled
Nikhil
No ratings yet
Bibitor LLC Inventory Analysis Case Study Phase 3
Document21 pages
Bibitor LLC Inventory Analysis Case Study Phase 3
Phạm Duy Đạt
No ratings yet
Predicting Mode of Transport (ML) : Akalya KS
Document17 pages
Predicting Mode of Transport (ML) : Akalya KS
student login
No ratings yet
A Comparison of Regression Models For Prediction of Graduate Admissions
Document5 pages
A Comparison of Regression Models For Prediction of Graduate Admissions
Varad
No ratings yet
ML Quiz QuestionsVV
Document7 pages
ML Quiz QuestionsVV
ratnadepp
No ratings yet
Car Price Prediction
Document8 pages
Car Price Prediction
Meenachi Sundaram
No ratings yet
What Is Considered A Good AUC Score
Document5 pages
What Is Considered A Good AUC Score
Athirah Norzaid
No ratings yet
Chapter 5: Concept Description: Characterization and Comparison
Document58 pages
Chapter 5: Concept Description: Characterization and Comparison
Harjas Bakshi
No ratings yet
Transforming Classifier Scores Into Accurate Multiclass Probability Estimates
Document6 pages
Transforming Classifier Scores Into Accurate Multiclass Probability Estimates
Sowmya Kartik
No ratings yet
Regression PDF
Document10 pages
Regression PDF
sanjay kumar
No ratings yet
Measurement Function/Parameter: Revision: 0
Document6 pages
Measurement Function/Parameter: Revision: 0
JGlobex
No ratings yet
DWM Exp 5,219
Document12 pages
DWM Exp 5,219
Mayur Pawade
No ratings yet
S2 - Datascience Lifecycle
Document19 pages
S2 - Datascience Lifecycle
mmtharindu
No ratings yet
Mixed Methods Research: Integrating Qualitative and Quantitative Methods
Document52 pages
Mixed Methods Research: Integrating Qualitative and Quantitative Methods
Shazura Shaari
No ratings yet
SWAYAM Syllabus - Predictive - Analyticsnew
Document3 pages
SWAYAM Syllabus - Predictive - Analyticsnew
UNikz (Official)
No ratings yet
Measurement and Scaling Techniques
Document28 pages
Measurement and Scaling Techniques
Riya Pandey
No ratings yet
Share BATCH 8 JOURNAL PAPER
Document12 pages
Share BATCH 8 JOURNAL PAPER
Om namo Om namo Srinivasa
No ratings yet