Data Science 1

Uploaded by

Nivesshent RW

0% found this document useful (0 votes)

7 views2 pages

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

7 views2 pages

Data Science 1

Uploaded by

Nivesshent RW

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 2

Search inside document

What is Data Science :

Data science is an inter-disciplinary field that uses scientific methods, processes, algorithms and
systems to extract knowledge and insights from many structural and unstructured data.[1][2] Data
science is related to data mining, machine learning and big data.

Data science 25 years ago referred to gathering and cleaning datasets then applying
statistical methods to that data. In 2018, data science has grown to a field that encompasses
data analysis, predictive analytics, data mining, business intelligence, machine learning, and
so much more.
Data science, 'explained in under a minute', looks like this.
You have data. To use this data to inform your decision-making, it needs to be relevant, well-
organized, and preferably digital. Once your data is coherent, you proceed with analyzing it,
creating dashboards and reports to understand your business’s performance better. Then
you set your sights to the future and start generating predictive analytics. With predictive
analytics, you assess potential future scenarios and predict consumer behavior in creative
ways.

Data Science Process:

Obtain:

In this step, you will need to query databases, and this will include a technical skillset
like MySQL to process the data. You may even start out with simple formats like Microsoft Excel to
obtain the data and then, later on, convert it into usable data. If you are using Python or R, they
have specific packages that can directly read data from these platforms into the programmes.

Scrub

In this process, you need to convert the data from one format to another and consolidate
everything into one standardized format across all data. For example, if your data is
collected in CSV files, then you will need to apply SQL queries to these CSV data so that
you will be able to pair it with programming languages like Python or R.

Explore:
In order to achieve that, this process comes into place. First of all, you will need to inspect
the data and all its properties. There are different types of data like numerical data,
categorical data, ordinal and nominal data etc. With that, there are different types of data
characteristics which will require you to handle them differently.
Following that, the next step would be to compute descriptive statistics to to extract
features and test significant variables. Testing significant variables often times is done
with correlation. For example, exploring the correlation of the risk of someone getting
high blood pressure in relations to their height and weight. Do note that some variables
are correlated, but to significant in terms of the model.
Model:

Our purpose of this stage can also include the grouping of data to understand the logic
behind those clusters. For example, you would like to group your e-commerce customers
to understand their behaviour on your website. So this would require you identify groups
of data points with clustering algorithms, using methods like k-means; or make
predictions using regressions like linear or logistic regressions.

Intrepret:

You will need to visualise your findings accordingly, keeping it driven by your business
questions. It is very important to be able to present your findings in such a way that is
useful to your organisation, or else it would be pointless to your stakeholders.
In this process, technical skills only is not sufficient. One very important skill you need is to
be able to tell a very clear and actionable story. If your presentation does not trigger
actions in your audience, it means that your communication was not efficient. Remember
that you will be presenting to an audience with no technical background, so the way you
communicate the message is key.

Data Science 1
Document2 pages
Data Science 1
Nivesshent RW
No ratings yet
Unit-3 DS
Document21 pages
Unit-3 DS
rajkumarmtech
No ratings yet
Data Value Chain Explained in 12 Steps
Document8 pages
Data Value Chain Explained in 12 Steps
Mahamud elmoge
No ratings yet
Data Science
Document33 pages
Data Science
Visdara Solutions
100% (2)
Data Science: What the Best Data Scientists Know About Data Analytics, Data Mining, Statistics, Machine Learning, and Big Data – That You Don't
From Everand
Data Science: What the Best Data Scientists Know About Data Analytics, Data Mining, Statistics, Machine Learning, and Big Data – That You Don't
Herbert Jones
Rating: 5 out of 5 stars
5/5 (1)
DataScience Reading
Document6 pages
DataScience Reading
Bharath
No ratings yet
PYTHON DATA SCIENCE: A Practical Guide to Mastering Python for Data Science and Artificial Intelligence (2023 Beginner Crash Course)
From Everand
PYTHON DATA SCIENCE: A Practical Guide to Mastering Python for Data Science and Artificial Intelligence (2023 Beginner Crash Course)
Calvert Long
No ratings yet
Classroom Assignment 2
Document3 pages
Classroom Assignment 2
Lavesh Sethia
No ratings yet
Data Wrangling Process Explained
Document9 pages
Data Wrangling Process Explained
Alexandrina Likova
No ratings yet
R Data Science Essentials - Sample Chapter
Document26 pages
R Data Science Essentials - Sample Chapter
Packt Publishing
No ratings yet
PYTHON DATA SCIENCE: Harnessing the Power of Python for Comprehensive Data Analysis and Visualization (2023 Guide for Beginners)
From Everand
PYTHON DATA SCIENCE: Harnessing the Power of Python for Comprehensive Data Analysis and Visualization (2023 Guide for Beginners)
Tristan Webster
No ratings yet
Assignement - Data Science For Business Growth and Big Data and Business Analytics
Document5 pages
Assignement - Data Science For Business Growth and Big Data and Business Analytics
Robert Demetz
No ratings yet
Data Analytics For Beginners - Paul Kinley - CreateSpace Independent Publishing Platform 2016 - IsBN 978-1-53989-673-9
Document51 pages
Data Analytics For Beginners - Paul Kinley - CreateSpace Independent Publishing Platform 2016 - IsBN 978-1-53989-673-9
Kemploe
100% (2)
Data Science: Unlocking Insights from Big Data
Document8 pages
Data Science: Unlocking Insights from Big Data
preeti25
No ratings yet
What Is Data Science
Document13 pages
What Is Data Science
Ravi Shankar
No ratings yet
Unit 1 - DSA
Document12 pages
Unit 1 - DSA
Roshanaa R
No ratings yet
Advanced Analytics with Transact-SQL: Exploring Hidden Patterns and Rules in Your Data
From Everand
Advanced Analytics with Transact-SQL: Exploring Hidden Patterns and Rules in Your Data
Dejan Sarka
No ratings yet
(Excerpts From) Investigating Performance: Design and Outcomes With Xapi
From Everand
(Excerpts From) Investigating Performance: Design and Outcomes With Xapi
Janet Laane Effron
No ratings yet
Key Roles and Life Cycle
Document4 pages
Key Roles and Life Cycle
Aman
No ratings yet
Unit I (Notes 2)
Document16 pages
Unit I (Notes 2)
Click Beats
No ratings yet
Discuss The Role of Data Mining Techniques and Data Visualization in e Commerce Data Mining
Document13 pages
Discuss The Role of Data Mining Techniques and Data Visualization in e Commerce Data Mining
Prema S
No ratings yet
Technical Expertise
Document14 pages
Technical Expertise
incessfajardo
No ratings yet
Life Cycle of Data Science - Complete Step-By-step Guide
Document3 pages
Life Cycle of Data Science - Complete Step-By-step Guide
MTSSEducation
No ratings yet
Data Science
Document14 pages
Data Science
Eajaaz Ahamed
No ratings yet
1 1 Intro To Data and Data Science Course Notes
Document8 pages
1 1 Intro To Data and Data Science Course Notes
Un Known
No ratings yet
Statictics Computerscience Information Science
Document3 pages
Statictics Computerscience Information Science
mahanth reddy
No ratings yet
What Is Data Science - IBM
Document10 pages
What Is Data Science - IBM
waqar ahmad
No ratings yet
Essential Data Science Skills That Need To Be Mastered
Document19 pages
Essential Data Science Skills That Need To Be Mastered
Abiodun Ilori
No ratings yet
What is Data Science? Key Concepts and Applications
Document10 pages
What is Data Science? Key Concepts and Applications
Priyaranjan Soren
100% (1)
Da Unit-2
Document23 pages
Da Unit-2
Shruthi Sayam
No ratings yet
Unit-II (Data Analytics)
Document17 pages
Unit-II (Data Analytics)
bhavya.shivani1473
No ratings yet
Data Mining
Document18 pages
Data Mining
admin ker
100% (1)
Educational Data Mining Thesis Topics
Document7 pages
Educational Data Mining Thesis Topics
sandyharwellevansville
100% (2)
Be Data Curious!: Be Data Curious!, #1
From Everand
Be Data Curious!: Be Data Curious!, #1
Nick Jewell
No ratings yet
Data Mining: What Is Data Mining?: Correlations or Patterns Among Fields in Large Relational Databases
Document6 pages
Data Mining: What Is Data Mining?: Correlations or Patterns Among Fields in Large Relational Databases
Anonymous wfUYLhYZt
No ratings yet
Big Data Modeling and Management Systems
From Everand
Big Data Modeling and Management Systems
Alexander Afriyie
No ratings yet
Data Science Master Class 2023
Document8 pages
Data Science Master Class 2023
giriprasad gunalan
No ratings yet
JPNR - S07 - 631
Document7 pages
JPNR - S07 - 631
testinho
No ratings yet
Business Intelligence and Analytics Tools
Document4 pages
Business Intelligence and Analytics Tools
Bryan Capulong
No ratings yet
Unit 1
Document28 pages
Unit 1
Banuroopa Velkumar
No ratings yet
An Introduction To Data Science (2022 Updated Edition)
Document9 pages
An Introduction To Data Science (2022 Updated Edition)
Miguel Silva
No ratings yet
Data Science
Document4 pages
Data Science
Shikhar Choudhary
No ratings yet
PYTHON DATA ANALYTICS: Harnessing the Power of Python for Data Exploration, Analysis, and Visualization (2024)
From Everand
PYTHON DATA ANALYTICS: Harnessing the Power of Python for Data Exploration, Analysis, and Visualization (2024)
NED MUNOZ
No ratings yet
Final Syllabi Data Analytics
Document3 pages
Final Syllabi Data Analytics
Arun
No ratings yet
What Is Data Science
Document14 pages
What Is Data Science
Jackson Marube
No ratings yet
BIG DATA ANALYTICS PROCESS
Document11 pages
BIG DATA ANALYTICS PROCESS
akurathikotaiah
100% (1)
Predictive Analytics Using Rattle and Qlik Sense - Sample Chapter
Document24 pages
Predictive Analytics Using Rattle and Qlik Sense - Sample Chapter
Packt Publishing
No ratings yet
Big Data Analytics - Quick Guide - Tutorialspoint
Document50 pages
Big Data Analytics - Quick Guide - Tutorialspoint
Aero Acad
No ratings yet
Unit-1 DA
Document23 pages
Unit-1 DA
parth.parsewar.cs
No ratings yet
Data Science Specialization
Document21 pages
Data Science Specialization
SEENU MANGAL
No ratings yet
Data Mining
Document7 pages
Data Mining
zhouyun521
No ratings yet
Data Science Notes
Document138 pages
Data Science Notes
Rachu
No ratings yet
Six Steps To Master Machine Learning With Data Preparation
Document44 pages
Six Steps To Master Machine Learning With Data Preparation
Poorna28
No ratings yet
Comprehensive Guide to Implementing Data Science and Analytics: Tips, Recommendations, and Strategies for Success
From Everand
Comprehensive Guide to Implementing Data Science and Analytics: Tips, Recommendations, and Strategies for Success
Rick Spair
No ratings yet
Unit-1 Data Science
Document74 pages
Unit-1 Data Science
snikhath20
No ratings yet
The 365 DS Booklet PDF
Document67 pages
The 365 DS Booklet PDF
Charly Sarti
100% (1)
Data Science Job Roles Explained
Document11 pages
Data Science Job Roles Explained
sipra
No ratings yet
Term Paper Data Warehousing and Data Mining
Document4 pages
Term Paper Data Warehousing and Data Mining
auhavmpif
100% (1)
Big Data Analysis
Document30 pages
Big Data Analysis
Adithya Guttha
No ratings yet
Data Analytics Vs Data Mining
Document10 pages
Data Analytics Vs Data Mining
iimskills0
No ratings yet
Moocs SQL
Document10 pages
Moocs SQL
Alonso Azaldegui
No ratings yet
MySQL Cheat Sheet GitHub
Document12 pages
MySQL Cheat Sheet GitHub
lekara
100% (1)
HANA
Document27 pages
HANA
Alejandro Londoño
No ratings yet
Log
Document21 pages
Log
Bernard Pogi
No ratings yet
SQL Dba
Document4 pages
SQL Dba
optimizesql
0% (3)
Tech Note 99 Determining SPCPro Alarm Types With SQL Queries
Document2 pages
Tech Note 99 Determining SPCPro Alarm Types With SQL Queries
Passenger Medeam
No ratings yet
Experiment No.1: Dbms Lab (RCS-551)
Document23 pages
Experiment No.1: Dbms Lab (RCS-551)
shriyam sharma
No ratings yet
IADOT Records Management System Indexing Standard 1997
Document111 pages
IADOT Records Management System Indexing Standard 1997
joseph jaala
No ratings yet
Lucene Solr
Document52 pages
Lucene Solr
Rubila Dwi Adawiyah
No ratings yet
DD 9 3 Practice
Document4 pages
DD 9 3 Practice
Arsil Karim
No ratings yet
TTERR
Document498 pages
TTERR
errr33
No ratings yet
Q223+AWSome+Day+Online Module+2 Final
Document34 pages
Q223+AWSome+Day+Online Module+2 Final
cidtahp
No ratings yet
Oracle Database 12c R2: Administration Workshop Ed 3: Duration
Document6 pages
Oracle Database 12c R2: Administration Workshop Ed 3: Duration
jackomito
100% (1)
CLL F030 - Brazilian Solution For Inter-Org Transfers - TRM
Document17 pages
CLL F030 - Brazilian Solution For Inter-Org Transfers - TRM
Sergio Righi
No ratings yet
Etl 1 PDF
Document14 pages
Etl 1 PDF
Tejeswara Rao
No ratings yet
Homework #1: Ittools
Document8 pages
Homework #1: Ittools
cess
No ratings yet
Kroenke v12 ch04
Document36 pages
Kroenke v12 ch04
Tanzeem Syed
No ratings yet
Lab Manual: Database and Information Retrieval System
Document70 pages
Lab Manual: Database and Information Retrieval System
Amit Chougule
No ratings yet
1.exadata Performance Best Practices
Document44 pages
1.exadata Performance Best Practices
MingdaLu
No ratings yet
Manual 4GL Uanify Vision
Document650 pages
Manual 4GL Uanify Vision
Antony Zietz
No ratings yet
10 Distributeddbms
Document56 pages
10 Distributeddbms
Krishna Kumar
No ratings yet
Hierarchy of Data
Document2 pages
Hierarchy of Data
api-3826459
100% (5)
Polytechnic University of The Philippines Master List
Document2 pages
Polytechnic University of The Philippines Master List
Joshua Rodriguez
No ratings yet
Mobile Content Providers
Document38 pages
Mobile Content Providers
M. Talha Nadeem
No ratings yet
Summary Chapter 6 Foundations of Business Intelligence: Databases and Information Management
Document2 pages
Summary Chapter 6 Foundations of Business Intelligence: Databases and Information Management
Niswatun Chaira
50% (2)
Managing Databases With Binary Large Objects
Document9 pages
Managing Databases With Binary Large Objects
mathulelr
No ratings yet
Technical Comparison Edb Postgres Enterprise and Oracle Enterprise Ebook
Document35 pages
Technical Comparison Edb Postgres Enterprise and Oracle Enterprise Ebook
ehpp2003
100% (1)
Awp Presentation
Document8 pages
Awp Presentation
Pawan
No ratings yet
Hbase Mock Test
Document6 pages
Hbase Mock Test
Devendra Makde
No ratings yet
Concepts of Database Management Eighth Edition
Document41 pages
Concepts of Database Management Eighth Edition
Isaac Pavesich
No ratings yet