Welcome to Scribd!

Skip carousel

DataAnalytics Document

Uploaded by

Shanmukha Sarma

0% found this document useful (0 votes)

6 views5 pages

Original Title

DataAnalytics document

Copyright

Available Formats

DOCX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

6 views5 pages

DataAnalytics Document

Uploaded by

Shanmukha Sarma

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 5

Search inside document

#program

import pandas as pd

import seaborn as sns

import matplotlib.pyplot as plt

# Replace 'your_dataset.csv' with your actual CSV file name

df = pd.read_csv('weather.csv')

# Assuming 'RainToday' and 'RainTomorrow' are your target variables

df['RainToday'] = df['RainToday'].map({'No': 0, 'Yes': 1})

df['RainTomorrow'] = df['RainTomorrow'].map({'No': 0, 'Yes': 1})

# Descriptive Statistics

descriptive_stats = df[['MinTemp', 'MaxTemp', 'Rainfall', 'Evaporation']].describe()

print(descriptive_stats)

# Time Series Visualization for selected columns

time_series_columns = ['MinTemp', 'MaxTemp', 'Rainfall', 'Evaporation', 'Sunshine', 'WindGustSpeed',

'Humidity9am', 'Humidity3pm', 'Pressure9am', 'Pressure3pm', 'Temp9am', 'Temp3pm']

plt.figure(figsize=(12, 8))

sns.lineplot(data=df[time_series_columns])

plt.title('Time Series Visualization of Selected Weather Variables')

plt.xlabel('Data Points')

plt.ylabel('Values')

plt.show()

# Correlation Analysis

correlation_matrix = df[time_series_columns].corr()
plt.figure(figsize=(10, 8))

sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', fmt=".2f")

plt.title('Correlation Matrix')

plt.show()

# Rainfall Distribution

plt.figure(figsize=(10, 6))

sns.histplot(df['Rainfall'], kde=True)

plt.title('Rainfall Distribution')

plt.xlabel('Rainfall')

plt.ylabel('Frequency')

plt.show()

# Seasonal Analysis

# Assuming 'Rainfall' column in your dataset for seasonal analysis

seasonal_data = df.groupby('Rainfall')[time_series_columns].mean()

seasonal_data.plot(kind='bar', figsize=(12, 8))

plt.title('Seasonal Analysis of Selected Weather Variables')

plt.xlabel('Season')

plt.ylabel('Average Values')

plt.show()

Output:
MinTemp MaxTemp Rainfall Evaporation
count 366.000000 366.000000 366.000000 366.000000
mean 7.265574 20.550273 1.428415 4.521858
std 6.025800 6.690516 4.225800 2.669383
min -5.300000 7.600000 0.000000 0.200000
25% 2.300000 15.025000 0.000000 2.200000
50% 7.450000 19.650000 0.000000 4.200000
75% 12.500000 25.500000 0.200000 6.400000
max 20.900000 35.800000 39.800000 13.800000
Explanation:

Overview:
This Python script performs analysis and visualization of weather data using the pandas, seaborn,
and matplotlib libraries. The key components include basic statistics, time series visualization,
correlation analysis, rainfall distribution, and seasonal analysis.
Approach and Methodologies:
 Data Reading:
 The script begins by reading the weather dataset from a CSV file ('weather.csv') using
pandas.
 Data Preprocessing:
 Categorical variables ('RainToday' and 'RainTomorrow') are mapped to numerical values
for further analysis.
 Basic Statistics:
 Basic statistics (mean, standard deviation, min, 25%, 50%, 75%, max) are calculated for
specific columns ('MinTemp', 'MaxTemp', 'Rainfall', 'Evaporation').
 Time Series Visualization:
 Time series visualization is performed for selected weather variables to observe trends
and patterns over time.
 Correlation Analysis:
 A correlation matrix and heatmap are generated to analyze the relationships between
different weather variables.
 Rainfall Distribution:
 A histogram with a kernel density estimate is created to visualize the distribution of
rainfall values.
 Seasonal Analysis:
 Seasonal analysis is performed using the 'Rainfall' column because there is no seasons
mentioned in the dataset. so, providing insights into average values of selected weather
variables across different seasons.
Challenges:
 Data Quality:
 The script assumes a clean dataset without addressing potential data quality issues.
 Seasonal Analysis Assumption:
 The seasonal analysis assumes the 'Rainfall' column is suitable for this purpose;
additional domain knowledge might be necessary.

Ultimate Guide To BPMN en
Document26 pages
Ultimate Guide To BPMN en
r.koba
100% (3)
Solution - Data Analysis With Python-Project-2 - v1.0
Document14 pages
Solution - Data Analysis With Python-Project-2 - v1.0
Amit Kumar
No ratings yet
Data Science Programming In Python
From Everand
Data Science Programming In Python
Anita Raichand
No ratings yet
UiPath Automation Best Practice Guide 05 25012018
Document39 pages
UiPath Automation Best Practice Guide 05 25012018
Glo Jos
No ratings yet
Summative Test in Mathematics 8
Document4 pages
Summative Test in Mathematics 8
Garry D. Divinagracia
No ratings yet
Data Analysis and Visualization in R - Final Paper - Bike Sharing Dataset Analysis
Document16 pages
Data Analysis and Visualization in R - Final Paper - Bike Sharing Dataset Analysis
Archit Pateria
No ratings yet
Huawei 434789548 Massive MIMO TDD ERAN15 1 Draft A PDF
Document215 pages
Huawei 434789548 Massive MIMO TDD ERAN15 1 Draft A PDF
ALEXANDRE JOSE FIGUEIREDO LOUREIRO
No ratings yet
AZ-104 Exam - Free Actual Q&as, Page 1 - ExamTopics
Document170 pages
AZ-104 Exam - Free Actual Q&as, Page 1 - ExamTopics
mnpawan
No ratings yet
Unit 4 - DSA
Document9 pages
Unit 4 - DSA
Roshanaa R
100% (1)
Theil-Sen No R
Document5 pages
Theil-Sen No R
Filipe Duarte
No ratings yet
21 - Practice Note On Time Series USING R
Document17 pages
21 - Practice Note On Time Series USING R
Faguni guha
No ratings yet
Seasonal Rating Simulation in Opendss: Setting Up The Ratings
Document3 pages
Seasonal Rating Simulation in Opendss: Setting Up The Ratings
TerrorTricolorFC
No ratings yet
Anupkumar M Bongale
Document39 pages
Anupkumar M Bongale
Siddhartha Bagaria
No ratings yet
PST1 Solutions For Students
Document10 pages
PST1 Solutions For Students
Dirty Rajan
100% (1)
SI: Step-By-Step EDM Analysis
Document19 pages
SI: Step-By-Step EDM Analysis
hengzi
No ratings yet
CS2B Summary Sheets 2021
Document71 pages
CS2B Summary Sheets 2021
Vaibhav Sharma
No ratings yet
Computing Thousands of Test Statistics Simultaneously in R
Document6 pages
Computing Thousands of Test Statistics Simultaneously in R
Luis Pragmah
No ratings yet
Explore Weather Trends
Document6 pages
Explore Weather Trends
Jeeva K
No ratings yet
Cluster Analysis in Spark
Document10 pages
Cluster Analysis in Spark
Syed Zubair
No ratings yet
Performing Analysis of Meteorological Data: Punam Seal
Document21 pages
Performing Analysis of Meteorological Data: Punam Seal
Punam
No ratings yet
Assignment 2 - LP1
Document7 pages
Assignment 2 - LP1
bbad070105
No ratings yet
PST2 Main
Document13 pages
PST2 Main
Dirty Rajan
No ratings yet
Mastering Advanced Time Series Techniques - by Sadrach Pierre, Ph.D. - DataDrivenInvestor
Document10 pages
Mastering Advanced Time Series Techniques - by Sadrach Pierre, Ph.D. - DataDrivenInvestor
yatipa c
No ratings yet
Time Series Forecasting Predicting Monthly Beer Production
Document19 pages
Time Series Forecasting Predicting Monthly Beer Production
12-Mohit Rao
No ratings yet
SE LAB 3 Experiments
Document11 pages
SE LAB 3 Experiments
srinidhigoskula
No ratings yet
Ai - Phase 3
Document9 pages
Ai - Phase 3
Manikandan N
No ratings yet
Regression Linaire Python Tome I
Document9 pages
Regression Linaire Python Tome I
Elisée TEGUE
No ratings yet
Exp2 - Data Visualization and Cleaning and Feature Selection
Document13 pages
Exp2 - Data Visualization and Cleaning and Feature Selection
mnbatrawi
No ratings yet
Exercise6 RodneyMuganzi
Document5 pages
Exercise6 RodneyMuganzi
mugrodny
No ratings yet
VA Case Study 2
Document27 pages
VA Case Study 2
thakurpulkit1023
No ratings yet
Control Flow - Looping
Document18 pages
Control Flow - Looping
Nur Syazliana
No ratings yet
AIDS - DM Using Python - Lab Programs
Document19 pages
AIDS - DM Using Python - Lab Programs
yelubandirenukavidyadhari
No ratings yet
Getting Your Hands-On Climate Data - Visualize Climate Data With Python
Document20 pages
Getting Your Hands-On Climate Data - Visualize Climate Data With Python
Bikas C. Bhattarai
No ratings yet
Time Series Basics
Document21 pages
Time Series Basics
Chopra Shubham
100% (1)
BIP5,8,9,10 Mahesh
Document7 pages
BIP5,8,9,10 Mahesh
nonsenseqwe198
No ratings yet
GraphVar Dynamic Tutorial
Document26 pages
GraphVar Dynamic Tutorial
Rogerio Urbano
No ratings yet
Multiple Linear Regression Using Python Machine Learning: Kaleab Woldemariam, June 2017
Document8 pages
Multiple Linear Regression Using Python Machine Learning: Kaleab Woldemariam, June 2017
apurv shukla
No ratings yet
Time Series
Document16 pages
Time Series
Shil Shambharkar
No ratings yet
Prediction of Wind Speed of A Germany Location Near Nuremberg
Document3 pages
Prediction of Wind Speed of A Germany Location Near Nuremberg
Sarobar Roy
No ratings yet
DNN ALL Practical 28
Document34 pages
DNN ALL Practical 28
4073Himanshu Patle
No ratings yet
Pertm. 3 IDF
Document31 pages
Pertm. 3 IDF
Nuandw
No ratings yet
Multivariate Time Series Forecasting With LSTMs in Keras
Document20 pages
Multivariate Time Series Forecasting With LSTMs in Keras
Tobias
No ratings yet
Final Task X
Document17 pages
Final Task X
Dirty Rajan
No ratings yet
11 Create Netcdf Python
Document22 pages
11 Create Netcdf Python
Ali Jalaly
No ratings yet
Time Series Modeling: Shouvik Mani April 5, 2018
Document46 pages
Time Series Modeling: Shouvik Mani April 5, 2018
Salvador Ramirez
No ratings yet
TSA Project Python Code
Document6 pages
TSA Project Python Code
marketingwithparamjeet
No ratings yet
CS 103 Lecture 1 Arrays
Document44 pages
CS 103 Lecture 1 Arrays
Nick Ryan Azupardo
No ratings yet
Forecasting Time Series With R - Dataiku
Document16 pages
Forecasting Time Series With R - Dataiku
Max Greco
No ratings yet
Dimensional Reduction in R
Document24 pages
Dimensional Reduction in R
Shil Shambharkar
No ratings yet
Zerox Ready
Document21 pages
Zerox Ready
gowrishankar nayana
No ratings yet
CHAPTER 7 (SAS Session) 2023
Document137 pages
CHAPTER 7 (SAS Session) 2023
ALAZAR AMSALU
No ratings yet
Advt Da
Document13 pages
Advt Da
Devendhiran Dasarathan
No ratings yet
DEV Lab Material
Document16 pages
DEV Lab Material
dharun0704
No ratings yet
Catchment Calibration With Comments
Document65 pages
Catchment Calibration With Comments
Luis Oseguera
No ratings yet
Minitab Statguide Time Series
Document72 pages
Minitab Statguide Time Series
Suraj singh
No ratings yet
Time-Series Forecasting Using Conv1D-LSTM - Multiple Timesteps Into Future
Document6 pages
Time-Series Forecasting Using Conv1D-LSTM - Multiple Timesteps Into Future
8c354be21d
No ratings yet
A Comprehensive Guide To Time Series Analysis
Document18 pages
A Comprehensive Guide To Time Series Analysis
Adriano Marcos Rodrigues Figueiredo
No ratings yet
Lect3 PDF
Document53 pages
Lect3 PDF
Sajjad Husham
No ratings yet
הנדסת תוכנה- הרצאה 7
Document19 pages
הנדסת תוכנה- הרצאה 7
Ron
No ratings yet
Getting Started Data Tidying Basic Summary Statistics: Function Usage
Document2 pages
Getting Started Data Tidying Basic Summary Statistics: Function Usage
Maria Clotilde Chagas Neta
No ratings yet
DM Practice
Document15 pages
DM Practice
66 Rohit Patil
No ratings yet
SanneExploratory Data Analysis
Document2 pages
SanneExploratory Data Analysis
AKSHAY PARIHAR
0% (1)
Final Project Instructions
Document2 pages
Final Project Instructions
julius
No ratings yet
Notes About Data Integration
Document3 pages
Notes About Data Integration
Luis Esteban
No ratings yet
DFSS SciPy
Document7 pages
DFSS SciPy
Goran Christiansson
No ratings yet
User Guide: Tatkal Ticket Booking: - Register As An Individual. Registration Is FREE
Document7 pages
User Guide: Tatkal Ticket Booking: - Register As An Individual. Registration Is FREE
Pratiksha Jadhav
No ratings yet
Module PE5: Problem 1
Document4 pages
Module PE5: Problem 1
Roshan Shanmughan
No ratings yet
Ame Assignment
Document2 pages
Ame Assignment
Anirudh Sreeraj
No ratings yet
OOP2 (Part 2) - JAVA FX
Document22 pages
OOP2 (Part 2) - JAVA FX
outsiderlb.business
No ratings yet
SpaceClaim2009Plus SP1 UsersGuide
Document479 pages
SpaceClaim2009Plus SP1 UsersGuide
surefooted1
No ratings yet
Rules of 13th NG Fest - Moot Court Competition
Document7 pages
Rules of 13th NG Fest - Moot Court Competition
Madmax Tyrant
No ratings yet
Project Network
Document24 pages
Project Network
sourav1302
No ratings yet
Upload A Document To Access Your Download: VK+Formula Calculation +sample
Document3 pages
Upload A Document To Access Your Download: VK+Formula Calculation +sample
Imran Khan
No ratings yet
Nigerian Defence Academy Academic Branch
Document9 pages
Nigerian Defence Academy Academic Branch
Giwa Muqsit
No ratings yet
Tla5Kup Logic Analyzer Field Upgrade Kit Instructions: Warning
Document47 pages
Tla5Kup Logic Analyzer Field Upgrade Kit Instructions: Warning
api-19827677
No ratings yet
Cockpit Design Philosophy
Document14 pages
Cockpit Design Philosophy
Muvinda Jayasinghe
No ratings yet
Line Algorithm
Document62 pages
Line Algorithm
Anonymous p8bHAAx
No ratings yet
Premiere Templates
Document27 pages
Premiere Templates
SaRiiey Arum
100% (1)
Program References
Document37 pages
Program References
Michelle Sipat
No ratings yet
A Systematic Approach To Synthesis of Verification Test-Suites For Modular Soc Designs
Document6 pages
A Systematic Approach To Synthesis of Verification Test-Suites For Modular Soc Designs
Lee RickHunter
No ratings yet
Update 623
Document2 pages
Update 623
ert rtyrt
No ratings yet
02 Mpi 0
Document19 pages
02 Mpi 0
Debobroto Das Robin
No ratings yet
Ns 3
Document2 pages
Ns 3
Tierra Mejia
No ratings yet
C#ASP NETNotes
Document39 pages
C#ASP NETNotes
Your Honor
No ratings yet
India'S New Currency Symbol
Document23 pages
India'S New Currency Symbol
Sachin
No ratings yet
IATA TIDS GoLite Comparison - Canada
Document6 pages
IATA TIDS GoLite Comparison - Canada
drsingh
No ratings yet
Pad370 - Procurement
Document5 pages
Pad370 - Procurement
전수라
No ratings yet
Sinhala Archaic Numerals
Document2 pages
Sinhala Archaic Numerals
fjmcgrath111
No ratings yet
SET A: Indian Space Research Organisation
Document26 pages
SET A: Indian Space Research Organisation
akshata
No ratings yet
Electronics 1.1.chapter 12 - Logic Gates - 2
Document17 pages
Electronics 1.1.chapter 12 - Logic Gates - 2
motion marufu
No ratings yet