Welcome to Scribd!

Skip carousel

Business Intelligence and Analytics

Uploaded by

Omar Farooque

0% found this document useful (0 votes)

2 views8 pages

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

2 views8 pages

Business Intelligence and Analytics

Uploaded by

Omar Farooque

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 8

Search inside document

Business Intelligence and Analytics

Project Report

By: M.Vishnu (RA2111027020008)

CSE BDA-A
Jobs and Salaries in Data Science

Aim: To present Report on jobs and salaries in different countries by using Data Science.

Problem Statement:
Different industries require distinct skill sets within the data science domain. However, professionals
and employers may lack insights into these specific requirements, leading to misalignment in hiring
and career development efforts.

Feature Selection:
The Feature I have selected in this Data is Experience Level. This Classifies the professional
experience level of the employee. Common categories might include 'Entry-level', 'Mid-level',
'Senior', and 'Executive', providing insight into how experience influences salary in data-related roles.

Importing the libraries:

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

Exploring the data:

set = r"C:\Users\M.V.SUBBARAO\Downloads\archive\jobs_in_data.csv"
Data = pd.read_csv(set)
print(Data.head())
Data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 9355 entries, 0 to 9354
Data columns (total 12 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 work_year 9355 non-null int64
1 job_title 9355 non-null object
2 job_category 9355 non-null object
3 salary_currency 9355 non-null object
4 salary 9355 non-null int64
5 salary_in_usd 9355 non-null int64
6 employee_residence 9355 non-null object
7 experience_level 9355 non-null object
8 employment_type 9355 non-null object
9 work_setting 9355 non-null object
10 company_location 9355 non-null object
11 company_size 9355 non-null object
dtypes: int64(3), object(9)
memory usage: 877.2+ KB

Data Cleaning:

The Salary in Usd is enough for the analysis

Data.drop(columns=["salary_currency","salary"],inplace=True)

counts = Data["company_location"].value_counts()
filtered_counts = counts[counts > 20].to_frame()
filtered_counts
As you can see the first location's count is 20 times the second one so we gonna
focus just on the US

Data=Data[Data["company_location"]=='United States']

Data.drop("company_location",inplace=True,axis=1)

Data.head()

Data visualization:

The categories

plt.figure(figsize=(15,8))
Data["job_category"].value_counts().plot(kind="bar", color='#00E5E5')

<Axes: xlabel='job_category'>
The job Titles:
plt.figure(figsize=(15,8))
job_title_counts = Data["job_title"].value_counts()
Data2 = Data[Data["job_title"].isin(job_title_counts[job_title_counts >
20].index)]
Data2["job_title"].value_counts().plot(kind="bar",color='#23CE6B').set_ylabel(
"Count")

Text(0, 0.5, 'Count')

Work settings and Experience levels Comparison

plt.figure(figsize=(20,8))

ax1 = plt.subplot2grid((2,4), (0,0))

ax2 = plt.subplot2grid((2,4), (0,1))
ax3 = plt.subplot2grid((2,4), (0,2))
ax4 = plt.subplot2grid((2,4), (0,3))
ax5 = plt.subplot2grid((2,4), (1,0),colspan=2)
ax6 = plt.subplot2grid((2,4), (1,2),colspan=2)
ax1.hist(Data[Data["experience_level"] ==
"Senior"]["work_setting"],color='#00FFFF')
ax1.set_title("Senior")
ax3.hist(Data[Data["experience_level"] == "Entry-
level"]["work_setting"],color='#00FFFF')
ax3.set_title("Entry-level")
ax2.hist(Data[Data["experience_level"] == "Mid-
level"]["work_setting"],color='#00FFFF')
ax2.set_title("Mid-level")
ax4.hist(Data[Data["experience_level"] ==
"Executive"]["work_setting"],color='#00FFFF')
ax4.set_title("Executive")
ax5.hist(Data["work_setting"],color='#00FFFF')
ax5.set_title("All work settings")
ax6.hist(Data["experience_level"],color='#00FFFF')
ax6.set_title("All experience levels")

plt.show()

Work year and company size

plt.figure(figsize=(16,5))
A = plt.subplot2grid((1,2), (0,0))
B = plt.subplot2grid((1,2), (0,1))

A.hist(Data["work_year"],color='#00FFFF')
A.set_title("Work year count")
A.set_xticks([2020,2021,2022,2023])
B.hist(Data["company_size"],color='#00FFFF')
B.set_title("Company size count")

plt.show()
Data.head()

Result:
Thus, I successfully implemented project report on jobs and salaries of different countries on data
science.

Assignment 2
Document10 pages
Assignment 2
Guillermo Rodriguez
100% (2)
Solution Manual For Fundamentals of Database Systems 6E 6th Edition
Document2 pages
Solution Manual For Fundamentals of Database Systems 6E 6th Edition
Hira Khalid
13% (8)
Trivium Subjects Method Skills PDF
Document9 pages
Trivium Subjects Method Skills PDF
SwanKnight
No ratings yet
Salarios
Document8 pages
Salarios
Dani Codda
No ratings yet
Data Preprocessing in Python - Handling Missing Data
Document8 pages
Data Preprocessing in Python - Handling Missing Data
reyesward085
No ratings yet
Python Module 5
Document19 pages
Python Module 5
surajmishraa24
No ratings yet
Pps Ui22cs57lab 10
Document17 pages
Pps Ui22cs57lab 10
ui22cs57
No ratings yet
Predicting Employee Churn in Python
Document19 pages
Predicting Employee Churn in Python
Swostik Rout
100% (1)
Mini Project2 DAV Answers - Jupyter Notebook
Document21 pages
Mini Project2 DAV Answers - Jupyter Notebook
Priscella Coc
No ratings yet
LSTM Stock Prediction
Document38 pages
LSTM Stock Prediction
Ketan Ingale
100% (1)
Knowledge Transfer Data Redaction On EnterpriseDB
Document19 pages
Knowledge Transfer Data Redaction On EnterpriseDB
Guntur Ks
No ratings yet
06 Seaborn
Document13 pages
06 Seaborn
Anonymous 001
No ratings yet
Working With Data
Document38 pages
Working With Data
Deva Hema D
No ratings yet
Lecture Material 3
Document7 pages
Lecture Material 3
2021me372
No ratings yet
DP - 19 - 3 - Practice FAZRULAKMALFADILA - C2C022001
Document39 pages
DP - 19 - 3 - Practice FAZRULAKMALFADILA - C2C022001
Fazrul akmal fadhila
No ratings yet
EDA and Data Cleaning
Document33 pages
EDA and Data Cleaning
Prithvi Narve
No ratings yet
Unit III - Pandas - Data Manipulation Using Python
Document15 pages
Unit III - Pandas - Data Manipulation Using Python
SARAVANAN
No ratings yet
41 Perusse Alexander Aperusse PDF
Document7 pages
41 Perusse Alexander Aperusse PDF
Anurita Mathur
No ratings yet
Homework 99 Fall 06
Document3 pages
Homework 99 Fall 06
d.vargas
No ratings yet
ANURAG CPP Lab Manual A1to10
Document63 pages
ANURAG CPP Lab Manual A1to10
andy paul
No ratings yet
Working With Categorical Data Chapter4
Document33 pages
Working With Categorical Data Chapter4
Walid Sassi
No ratings yet
Business Analytics Course Assignment
Document2 pages
Business Analytics Course Assignment
Claudia Rojas
No ratings yet
Murthykanuru (3,0)
Document2 pages
Murthykanuru (3,0)
Hemanth Kumar
No ratings yet
DWDM Lab Report
Document26 pages
DWDM Lab Report
Simran Shrestha
No ratings yet
Practical No 1: Then We Check To See If The Database We Created Is Attached by Typing The Command
Document42 pages
Practical No 1: Then We Check To See If The Database We Created Is Attached by Typing The Command
Anonymous rtcJXmaNm
No ratings yet
How To Use NLP in Python A Practical Step-by-Step ExampleTo Find Out The In-Demand Skills For Data SC
Document12 pages
How To Use NLP in Python A Practical Step-by-Step ExampleTo Find Out The In-Demand Skills For Data SC
Juanito Alimaña
No ratings yet
Ass-2 Ds
Document29 pages
Ass-2 Ds
Vedant Andhale
No ratings yet
Draft of Final Report
Document23 pages
Draft of Final Report
vallimeenaavellaiyan
No ratings yet
Group Assignment - Data Mining
Document28 pages
Group Assignment - Data Mining
Simran Saha
No ratings yet
SSRS Exercise
Document44 pages
SSRS Exercise
santhosh1212
No ratings yet
Pandas Tutorial
Document21 pages
Pandas Tutorial
KEVIN KUMAR
No ratings yet
Hiring Process Analytics
Document4 pages
Hiring Process Analytics
Rahul Shirude
80% (5)
Notes 23 Regression R
Document5 pages
Notes 23 Regression R
b.barbararodrig
No ratings yet
D17108GC30 Add Prac Solution
Document13 pages
D17108GC30 Add Prac Solution
Citra N
No ratings yet
Inventory Simulation - For Test Data Copy 2
Document10 pages
Inventory Simulation - For Test Data Copy 2
SATYA
No ratings yet
Databases Laboratory 3: Marin Iuliana
Document19 pages
Databases Laboratory 3: Marin Iuliana
Stefan Surdu
No ratings yet
Customer Segmentation 1683225943
Document34 pages
Customer Segmentation 1683225943
Doruk Şerbetçioğlu
No ratings yet
03 A Polynomial Linear Regression
Document6 pages
03 A Polynomial Linear Regression
Gabriel Gheorghe
No ratings yet
SAP BW - Virtual Characteristic (Multiprovider & Infoset) - RSR - OLAP - BADI
Document21 pages
SAP BW - Virtual Characteristic (Multiprovider & Infoset) - RSR - OLAP - BADI
Abdul Malik
No ratings yet
(RDBMS) : DML (Data Manipulation Language)
Document7 pages
(RDBMS) : DML (Data Manipulation Language)
Trish Riley
No ratings yet
Asar Project
Document14 pages
Asar Project
techusama4
No ratings yet
1624106057@g.us
Document13 pages
1624106057@g.us
Nidhi Mallya
No ratings yet
Relational Algebra - Tutorial Problems
Document3 pages
Relational Algebra - Tutorial Problems
Aruna A
No ratings yet
6CS030 Workshop 3
Document15 pages
6CS030 Workshop 3
SHANTI ROKKA
No ratings yet
Experiment No 6
Document5 pages
Experiment No 6
dwrre
No ratings yet
Descriptive Statistics With Pandas: Data Handling Using Pandas - II
Document37 pages
Descriptive Statistics With Pandas: Data Handling Using Pandas - II
B. Jennifer
100% (1)
PreProcessing With R
Document6 pages
PreProcessing With R
purushottam kumar
No ratings yet
Number Range Buffering For DIM IDs and SIDs
Document15 pages
Number Range Buffering For DIM IDs and SIDs
Ashwin Kumar
No ratings yet
SQL Server
Document96 pages
SQL Server
Atulya garg
No ratings yet
Time Series Analysis Time Series Analysis
Document5 pages
Time Series Analysis Time Series Analysis
Nimish Agrawal
No ratings yet
Id 3
Document4 pages
Id 3
VIJAY YADAV
No ratings yet
SQL 5
Document10 pages
SQL 5
El Club
No ratings yet
Machine Learning - Customer Segment Project. Approved by UDACITY
Document19 pages
Machine Learning - Customer Segment Project. Approved by UDACITY
Carlos Pimentel
100% (1)
18LE02/18EE02/18TE02/18PD05/18FD05/18SD05/18YD05/18ID05 - Database Management Systems
Document4 pages
18LE02/18EE02/18TE02/18PD05/18FD05/18SD05/18YD05/18ID05 - Database Management Systems
Anand Kumar VP
No ratings yet
Python
Document32 pages
Python
YogenDran Suraskumar
No ratings yet
Number Format
Document2 pages
Number Format
sfonlinetrainer
No ratings yet
QuestionBank LabPractcals
Document12 pages
QuestionBank LabPractcals
Sujal Patel
No ratings yet
Exercises 2
Document10 pages
Exercises 2
nekromany.99.10.10
No ratings yet
CHAPTER 7 - Function
Document11 pages
CHAPTER 7 - Function
Abdelaz IDRISSOU
No ratings yet
DB2 11.1 for LUW: SQL Basic Training for Application Developers
From Everand
DB2 11.1 for LUW: SQL Basic Training for Application Developers
Robert Wingate
No ratings yet
Data Science Programming In Python
From Everand
Data Science Programming In Python
Anita Raichand
No ratings yet
DB2 11 for z/OS: SQL Basic Training for Application Developers
From Everand
DB2 11 for z/OS: SQL Basic Training for Application Developers
Robert Wingate
Rating: 4 out of 5 stars
4/5 (1)
Stud WB Sna II HP Ux
Document640 pages
Stud WB Sna II HP Ux
Dhanush Dhyan
No ratings yet
Bikroy: Report On Market Potential of Energy Drinks in Bangladesh
Document16 pages
Bikroy: Report On Market Potential of Energy Drinks in Bangladesh
NøthîñgLîfè
No ratings yet
SQL Schema ERD and Table Designs
Document8 pages
SQL Schema ERD and Table Designs
Victor Adrian Alecu
No ratings yet
Res 510 Module 2 Updated
Document27 pages
Res 510 Module 2 Updated
Safa Haziq
No ratings yet
Lib Burst Generated
Document57 pages
Lib Burst Generated
leme on
No ratings yet
Data Structure-: A. H. M. Saiful Islam Associate Professor and Chairman Department of Computer Science and Engineering
Document31 pages
Data Structure-: A. H. M. Saiful Islam Associate Professor and Chairman Department of Computer Science and Engineering
Tamim Islam
No ratings yet
OODBMS - Concepts
Document9 pages
OODBMS - Concepts
smartbilal5338
No ratings yet
Oracle Database: Dbquest Oracle University Course Schedules (2019)
Document7 pages
Oracle Database: Dbquest Oracle University Course Schedules (2019)
prabhu777
No ratings yet
KELOMPOK 5 - An Overview of Business Intelligence, Analytics, and Data Science
Document15 pages
KELOMPOK 5 - An Overview of Business Intelligence, Analytics, and Data Science
Garnedyna AR
No ratings yet
Data ONTAP 81 Upgrade and RevertDowngrade Guide
Document157 pages
Data ONTAP 81 Upgrade and RevertDowngrade Guide
Purushothama Gn
No ratings yet
Asignación 6 y 7. Inglés 2. Resuelta
Document7 pages
Asignación 6 y 7. Inglés 2. Resuelta
VP Leonel
No ratings yet
Characteristics of Qualitative
Document23 pages
Characteristics of Qualitative
Peachy Cleo Suarez
No ratings yet
SAS Functions by Example - Herman Lo
Document18 pages
SAS Functions by Example - Herman Lo
boggala
100% (1)
Mid Term Progress Report Details
Document3 pages
Mid Term Progress Report Details
Jiten Thakur
No ratings yet
Artificial Intelligence For Blood Analysis
Document14 pages
Artificial Intelligence For Blood Analysis
KIPNGENO EMMANUEL
No ratings yet
Falderal Jazzman Effects Pedal - Preamp For Jazz Bassists
Document6 pages
Falderal Jazzman Effects Pedal - Preamp For Jazz Bassists
Leonardo D. Duarte
No ratings yet
Math 7-4th Quarter
Document3 pages
Math 7-4th Quarter
Marie Saren
67% (3)
RSCH 120 Week 1-9
Document130 pages
RSCH 120 Week 1-9
DryZla
100% (1)
Data Archiving in Enterprise Controlling (EC)
Document16 pages
Data Archiving in Enterprise Controlling (EC)
sf69v
No ratings yet
IS in IT
Document19 pages
IS in IT
Emman Escullar
No ratings yet
SS ZG518
Document5 pages
SS ZG518
Avinash Pandey
No ratings yet
Module Element 3i's
Document5 pages
Module Element 3i's
Bagwis Maya
No ratings yet
Soal Uts Pti C 2018
Document3 pages
Soal Uts Pti C 2018
Faisal Fanani
No ratings yet
Program 2
Document6 pages
Program 2
Bhavani Varun K
No ratings yet
Computer YEAR 13 WORKSHEET
Document35 pages
Computer YEAR 13 WORKSHEET
Damien Wong
No ratings yet
Normal Forms
Document19 pages
Normal Forms
senthilkumaranmsc
No ratings yet
Azure Data Factory Cookbook 2nd
Document533 pages
Azure Data Factory Cookbook 2nd
curcubeupecur
100% (2)
2.1 Practice 12 Apply Patch Set Using DBMS - ROLLING
Document15 pages
2.1 Practice 12 Apply Patch Set Using DBMS - ROLLING
Mandoiu Stefan
No ratings yet