Sandbox

Uploaded by

poi.tamrakar

0% found this document useful (0 votes)

2 views7 pages

Sandbox in data science

Copyright

Available Formats

PPTX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Sandbox in data science

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

2 views7 pages

Sandbox

Uploaded by

poi.tamrakar

Sandbox in data science

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 7

Search inside document

Unit-2

What is a Data Science Sandbox

• The Data Science Sandbox is an environment specifically designed for data

science and analytics.
• It gives data scientists and analysts a protected, shared environment
where models can be built and experiments conducted without harm to
application databases.
• A data sandbox, in the context of big data, is a scalable and developmental
platform used to explore an organization's rich information sets through
interaction and collaboration. It allows a company to realize its actual
investment value in big data.
Data Science Sandbox
• A data sandbox includes massive parallel central processing units,
high-end memory, high-capacity storage and I/O capacity and
typically separates data experimentation and production
database environments in data warehouses.
• The IBM Netezza 1000 is an example of a data sandbox platform
which is a stand-alone analytic data mart. An example of a logical
partition in an enterprise data warehouse, which also serves as a
data sandbox platform, is the IBM Smart Analytics System.
• A Hadoop cluster like IBM InfoSphere BigInsights Enterprise
Edition is also included in this category.
Example
Data Science Sandbox characteristics:
Data Science Sandbox characteristics:
• Scalability: can grow and shrink to accommodate the volume of data and computation needed. Cloud
environments provide powerful scalability.
• Shareable Code and Models: a combination of source code repository and sharable code snippets enable model
management. Code sharing via Python Notebooks and Zepelin Notebooks is a best practice.
• Data Science Platforms and Languages: provide the data scientist with base to develop solutions. Platforms can
provide a graphical interface, such as: Alteryx, Knime and Rapid Miner. Programming languages provide detailed
control, such as: Python, R, Scala, C++ and Julia. Julia has 10x to 30x faster execution speeed compared to Python
and R.
• Data Science Libraries: provide prebuilt solutions to data science challenges. Python core libraries like Numpy and
Pandas are a given, plus data science libraries like Scikit-Learn, TensorFlow and Keras provide a solution
framework.
• Data Protection: provides security for at risk data such as customer personal information. Data protection
measures can include: user authorization, user authentication, firewalls, data encryption and data obfuscation. In
many cases, senstive data can be removed before loading to the Data Science Sandbox environment.
• Data Engineering: supplies the data environment: datastores and data pipelines. This function is performed by
Data Engineers.
• Data Wrangling: enables data to be "mssaged" at a detail level. It includes: data cleansing, filtering and organizing.
This function is performed by Data Scientists.
• Flexible Data Access: data virtualization, data lake, data import
• On Demand: enables new projects and research efforts to start quickly without
• Play and Experimentation: enable creative juices to flow for the development of innovative solutions. Data
Scientists can quickly develop and test hypothesis through experimentation.

Canon Pixma Wireless Mobile Printer Marketing Plan.
Document14 pages
Canon Pixma Wireless Mobile Printer Marketing Plan.
Anushay
No ratings yet
Mtctce 2
Document5 pages
Mtctce 2
Henrry Soto
100% (1)
Chapter 6 - Big Data Architecture Part 1
Document41 pages
Chapter 6 - Big Data Architecture Part 1
Suren Dev
No ratings yet
Big Data Components
Document31 pages
Big Data Components
4241 DAYANA SRI VARSHA
No ratings yet
Ebook: Data Visualization Tools For Users (English)
Document26 pages
Ebook: Data Visualization Tools For Users (English)
BBVA Innovation Center
No ratings yet
DSP Cat 1
Document107 pages
DSP Cat 1
R B SHARAN
No ratings yet
Big Data Analytics
Document79 pages
Big Data Analytics
sania2011
100% (2)
Big Data 2021 - 6,7,8 Big Data Technologies
Document55 pages
Big Data 2021 - 6,7,8 Big Data Technologies
Putri Nur aini
No ratings yet
BlueGranite Data Lake Ebook
Document23 pages
BlueGranite Data Lake Ebook
Prasanth
No ratings yet
Lecture 1.1 - Introduction To DE
Document27 pages
Lecture 1.1 - Introduction To DE
zakiamine97
No ratings yet
Big Data and Hadoop
Document37 pages
Big Data and Hadoop
Sreenivasulu Gogula
No ratings yet
Big Data Unit 1 Notes
Document27 pages
Big Data Unit 1 Notes
fewoho4495
No ratings yet
Bda Mod 1
Document17 pages
Bda Mod 1
Ison Pereira
No ratings yet
Data Lake
Document2 pages
Data Lake
David Sofita
No ratings yet
CS8091 BIGDATA ANALYTICS QUESTION BANK - Watermark
Document95 pages
CS8091 BIGDATA ANALYTICS QUESTION BANK - Watermark
Marianinu antony
No ratings yet
Unit No. 4
Document67 pages
Unit No. 4
vishal phule
No ratings yet
Big Table
Document21 pages
Big Table
sharath_rakki
No ratings yet
VTU Exam Question Paper With Solution of 18CS72 Big Data and Analytics Feb-2022-Dr. v. Vijayalakshmi
Document25 pages
VTU Exam Question Paper With Solution of 18CS72 Big Data and Analytics Feb-2022-Dr. v. Vijayalakshmi
WWE ROCKERS
No ratings yet
PPT02-Big Data Architecture
Document44 pages
PPT02-Big Data Architecture
TsabitAlaykRidhollah
No ratings yet
Nurin Nazihah Binti Zailani - 6c - Big Data Platform
Document12 pages
Nurin Nazihah Binti Zailani - 6c - Big Data Platform
NURIN NAZIHAH ZAILANI
No ratings yet
Lect7 IoT BigData1
Document28 pages
Lect7 IoT BigData1
Eng:Mostafa Morsy Mohamed
No ratings yet
Lakehouse: A Unified Data Architecture
Document9 pages
Lakehouse: A Unified Data Architecture
IJRASETPublications
No ratings yet
Information Management Unit 3
Document10 pages
Information Management Unit 3
Mukul
No ratings yet
BDA Module1
Document64 pages
BDA Module1
Nidhi Srivastava
No ratings yet
Bda - M1
Document64 pages
Bda - M1
Chandan A H
No ratings yet
BDA Unit 2 1
Document42 pages
BDA Unit 2 1
Jerald Ruban
No ratings yet
15CS565 Module4
Document61 pages
15CS565 Module4
Ravi Shankar
No ratings yet
cs320 Data Platforms Databricks Long
Document47 pages
cs320 Data Platforms Databricks Long
J.B
No ratings yet
Hadoop
Document23 pages
Hadoop
sowjanya kandukuri
No ratings yet
Data Glossary - Michael Dillon
Document11 pages
Data Glossary - Michael Dillon
Fuzuli Nagisoylu
No ratings yet
Part A Aim: Prerequisite: Database Outcome: To Impart Knowledge of Data Warehouse and Data Mining Theory
Document4 pages
Part A Aim: Prerequisite: Database Outcome: To Impart Knowledge of Data Warehouse and Data Mining Theory
khushi
No ratings yet
LS1.1 - V6 Generalized Architecture of Big Data Systems
Document8 pages
LS1.1 - V6 Generalized Architecture of Big Data Systems
R Krish
No ratings yet
Unlock The Power of Private Cloud Big Data Analytics Ref Arch
Document18 pages
Unlock The Power of Private Cloud Big Data Analytics Ref Arch
soo kyung Lee
No ratings yet
Bda Ese
Document66 pages
Bda Ese
jasbutani1234
No ratings yet
Lecture 2 - Big Data
Document8 pages
Lecture 2 - Big Data
Harshita Badwal
No ratings yet
Understanding Big Data and NoSQL
Document31 pages
Understanding Big Data and NoSQL
Justine Joy
No ratings yet
Unit 1
Document21 pages
Unit 1
Abinaya
No ratings yet
Chapter 3
Document85 pages
Chapter 3
Shivananda V Seeri
No ratings yet
100 Dataengineering Interview Questions TRRaveendra 1694654407
Document58 pages
100 Dataengineering Interview Questions TRRaveendra 1694654407
Sree Krith
No ratings yet
DS Tools Lec 01
Document23 pages
DS Tools Lec 01
Youmna Eid
No ratings yet
Big Data and Data Science: Case Studies: Priyanka Srivatsa
Document5 pages
Big Data and Data Science: Case Studies: Priyanka Srivatsa
Yasir Butt
No ratings yet
DM Mod1 PDF
Document16 pages
DM Mod1 PDF
Gururaja Hebbur Satyanarayana
No ratings yet
Data Deduplication Data Domain
Document24 pages
Data Deduplication Data Domain
wailim
No ratings yet
Big Data Processing Tools
Document9 pages
Big Data Processing Tools
Parveen Kumari
No ratings yet
Big Data 101 Brief PDF
Document4 pages
Big Data 101 Brief PDF
Aruna Pattam
No ratings yet
Big Data-Introduction
Document14 pages
Big Data-Introduction
tripathineeharika
No ratings yet
Cloudera Data Warehouse
Document11 pages
Cloudera Data Warehouse
Mohamad Bin Kadro
No ratings yet
Reference Architecture Big Data
Document3 pages
Reference Architecture Big Data
juergen_urbanski
100% (1)
A Perusal of Big Data Classification and
Document13 pages
A Perusal of Big Data Classification and
manitenkasi
No ratings yet
Big Data Unit 1 AKTU Notes
Document87 pages
Big Data Unit 1 AKTU Notes
abhijitraj229
No ratings yet
Scidb Overview: The Need
Document2 pages
Scidb Overview: The Need
Ozioma Ihekwoaba
No ratings yet
Day1 2
Document110 pages
Day1 2
patil_555
No ratings yet
Discuss The Characteristics of Big Data
Document2 pages
Discuss The Characteristics of Big Data
Rhea Estavillo
No ratings yet
Data Science
Document87 pages
Data Science
Umar Ahmad
No ratings yet
Data Lake or Data Swamp?
Document16 pages
Data Lake or Data Swamp?
Kira Hoffman
No ratings yet
List The Main Categories of Data
Document10 pages
List The Main Categories of Data
sramalingam288953
No ratings yet
Lakehouse Analytics
Document20 pages
Lakehouse Analytics
nahuel.bourdichon
No ratings yet
Data Mining and Data Warehouse BY
Document12 pages
Data Mining and Data Warehouse BY
api-19799369
100% (1)
The Growing Enormous of Big Data Storage
Document6 pages
The Growing Enormous of Big Data Storage
Eddy Manurung
No ratings yet
Hadoop - MapReduce
Document51 pages
Hadoop - MapReduce
dangtran
No ratings yet
Delta Table and Pyspark Interview Questions
Document14 pages
Delta Table and Pyspark Interview Questions
velamatiskiran
No ratings yet
Python Data Analysis: Transforming Raw Data into Actionable Intelligence with Python's Data Analysis Capabilities
From Everand
Python Data Analysis: Transforming Raw Data into Actionable Intelligence with Python's Data Analysis Capabilities
Tom Lesley
No ratings yet
LiftCell User Manual
Document4 pages
LiftCell User Manual
Edini Zena
No ratings yet
Pinn Inc v. Apple - Patent Infringement
Document35 pages
Pinn Inc v. Apple - Patent Infringement
Jack Purcher
No ratings yet
Canon Imageclass d1320 Owner S Manual
Document174 pages
Canon Imageclass d1320 Owner S Manual
felipemadu
No ratings yet
Earth's Internal Heat
Document29 pages
Earth's Internal Heat
Noilyn Sabroso
100% (1)
Welcome To OTAN Online!
Document37 pages
Welcome To OTAN Online!
branka_m
No ratings yet
How To Manually Restore A WordPress Site From A WordPress Backup
Document15 pages
How To Manually Restore A WordPress Site From A WordPress Backup
Mmd
No ratings yet
Page Replacement Algorithms - Page Fault - Gate Vidyalay
Document9 pages
Page Replacement Algorithms - Page Fault - Gate Vidyalay
PAIN
No ratings yet
Free Zweigart Download March 19
Document16 pages
Free Zweigart Download March 19
Anonymous 69mvrfAG6
100% (2)
Sad Mcqs Bank
Document68 pages
Sad Mcqs Bank
sharmilakorai
0% (1)
XSS Cross-Site Scripting Attack Detection by Machine Learning Classifiers
Document5 pages
XSS Cross-Site Scripting Attack Detection by Machine Learning Classifiers
Vishal Patil
No ratings yet
Word Documents Template: Sub Sub Headings
Document5 pages
Word Documents Template: Sub Sub Headings
cwkkarachchi
No ratings yet
Module 9 - Web Page Design
Document3 pages
Module 9 - Web Page Design
Mary Jane Pagay
No ratings yet
ConfigSnapshot Upgrade Benefits v32
Document2 pages
ConfigSnapshot Upgrade Benefits v32
MM4484
No ratings yet
Troubleshooting Directory For LHB Type RMPU EOG AC Coach-Eng PDF
Document44 pages
Troubleshooting Directory For LHB Type RMPU EOG AC Coach-Eng PDF
divisional electrical engg
100% (6)
Oracle SPARC Server Update 2020 Solution Engineer
Document1 page
Oracle SPARC Server Update 2020 Solution Engineer
Patrick Joseph Augustin Ahoican Nampe
No ratings yet
CFD-Toolkit V2014.0 User Manual
Document23 pages
CFD-Toolkit V2014.0 User Manual
Yousaf Saidalavi
No ratings yet
Master Boot Record
Document7 pages
Master Boot Record
shinde_jayesh2005
No ratings yet
Hasan Bin Ekram: Career Objective
Document3 pages
Hasan Bin Ekram: Career Objective
Hasan Sarik
No ratings yet
Latest Microsoft 070-483 Dumps Questions at Lead4pass
Document10 pages
Latest Microsoft 070-483 Dumps Questions at Lead4pass
Israel M. Friske
No ratings yet
Metsim Print 2018 PDF
Document1 page
Metsim Print 2018 PDF
Walter Andrés Orquera
No ratings yet
2012 Bike Master Catalog
Document221 pages
2012 Bike Master Catalog
AntonioPallone
50% (2)
Fpga Implementation of Fir Filters Using Pipelined Bit-Serial Canonical Signed Digit Multipliers
Document9 pages
Fpga Implementation of Fir Filters Using Pipelined Bit-Serial Canonical Signed Digit Multipliers
SARATH MOHANDAS
No ratings yet
Diagrama de Tablas SAP by Mundosap
Document29 pages
Diagrama de Tablas SAP by Mundosap
PeNu Techy
No ratings yet
Montagem G800
Document12 pages
Montagem G800
Josias Bezerra
No ratings yet
Fact Sheet DPR2900 Rectifier PDF
Document2 pages
Fact Sheet DPR2900 Rectifier PDF
sam
50% (2)
04 Herrajes Europeos
Document33 pages
04 Herrajes Europeos
Israel Bross
No ratings yet
Aim & Oum
Document4 pages
Aim & Oum
tsurendar
100% (1)