Bigdata

Uploaded by

swapnillsai

0% found this document useful (0 votes)

473 views12 pages

an intoduction

Original Title

bigdata ppt

Copyright

Available Formats

PPTX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

an intoduction

Copyright:

Attribution Non-Commercial (BY-NC)

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

473 views12 pages

Bigdata

Uploaded by

swapnillsai

an intoduction

Copyright:

Attribution Non-Commercial (BY-NC)

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 12

Search inside document

BIG DATA

BIGDATA , collection of large and complex data sets difficult to process using on-hand database tools

WHY IS IT INTRODUCED
Lots of data is being collected & warehoused. Processing exceeds database system capacity. Structured & Unstructured data Separation of data from application. Understanding data analytics. Faster development, faster runtime. Elastic Feature-Level Scalability.

APACHE HADOOP
Provides massive scalable storage, its not a database Data Processing Platform HDFS, a fault tolerant storage Store data in native format Reduce cost & lower risks Extracting business value from data Deliver new insights Automatically handles s/w & h/w failures

HDFS
Fault tolerant storage Survive failure on disk, network and network interface Uses Map-Reduce programs Creates clusters of machines and co-ordinates Storage on clusters using blocks No special hardware compared to RAID

PROBLEMS WITH BIG DATA

Will be so overwhelmed Costs escalate too fast Storage consumed 3 times Timeliness Analysis Poor data locality Incompatible & Replicated data

CONCLUSION
Big Data will replace the approaches, tools and systems that underpin development work. Better analysis of the large volumes of data. Potential for advancing in many scientific disciplines. Improving the profitability. Technical challenges to be addressed dynamically

REFERENCES
www.bigdatauniversity.com www.sas.com/big-data/ en.wikipedia.org/wiki/Big_data cra.org/ccc/docs/init/bigdatawhitepaper.pdf dataanalyticssummit.com hadoop.apache.org

Todays Big Data Is Not Tomorrows Big Data

THANK YOU

Mastering Apache Cassandra - Second Edition
From Everand
Mastering Apache Cassandra - Second Edition
Nishant Neeraj
No ratings yet
Dynamo DB Basic Concepts
Document1,090 pages
Dynamo DB Basic Concepts
Adesh Matkar
No ratings yet
Managing Multimedia and Unstructured Data in the Oracle Database
From Everand
Managing Multimedia and Unstructured Data in the Oracle Database
Marcelle Kratochvil
No ratings yet
Hadoop Ecosystem
Document55 pages
Hadoop Ecosystem
nehal
No ratings yet
Google Cloud Dataproc The Ultimate Step-By-Step Guide
From Everand
Google Cloud Dataproc The Ultimate Step-By-Step Guide
Gerardus Blokdyk
No ratings yet
Apache Spark: Dhineshkumar S K
Document31 pages
Apache Spark: Dhineshkumar S K
PREM KUMAR M
No ratings yet
Hadoop Cluster Deployment
From Everand
Hadoop Cluster Deployment
Danil Zburivsky
No ratings yet
Hadoop Tutorial
Document13 pages
Hadoop Tutorial
becitratul
No ratings yet
Hadoop Ecosystem
Document16 pages
Hadoop Ecosystem
poojan thakkar
No ratings yet
NoSQL MongoDB HBase Cassandra
Document142 pages
NoSQL MongoDB HBase Cassandra
justin maxton
No ratings yet
BigData Unit 2
Document15 pages
BigData Unit 2
Sreedhar Arikatla
No ratings yet
WT Unit-I
Document49 pages
WT Unit-I
Pauravi Nagarkar
No ratings yet
Course Contents of Hadoop and Big Data
Document11 pages
Course Contents of Hadoop and Big Data
rahulsse
No ratings yet
Eye OS
Document9 pages
Eye OS
amalgupta_08
No ratings yet
Hadoop Interviews Q
Document9 pages
Hadoop Interviews Q
S K
No ratings yet
Big Data and Spark Developers
Document5 pages
Big Data and Spark Developers
Balaji Arun
No ratings yet
CHAPTER 03: Big Data Technology Landscape
Document81 pages
CHAPTER 03: Big Data Technology Landscape
01fm19mca006
No ratings yet
Hadoop, A Distributed Framework For Big Data
Document55 pages
Hadoop, A Distributed Framework For Big Data
HARISH REDDY B
No ratings yet
Practise Quiz Ccd-470 Exam (05-2014) - Cloudera Quiz Learning
Document74 pages
Practise Quiz Ccd-470 Exam (05-2014) - Cloudera Quiz Learning
ratneshkumarg
No ratings yet
Map Reduce With Hadoop:: Presented by ANIVESHA-126 ARITRA-128 RIA-142 Shashvat - 150 SHEKHAR-151
Document9 pages
Map Reduce With Hadoop:: Presented by ANIVESHA-126 ARITRA-128 RIA-142 Shashvat - 150 SHEKHAR-151
Aritra Banerjee
100% (1)
Design Approach To Handle Late Arriving Dimensions and Late Arriving Facts
Document109 pages
Design Approach To Handle Late Arriving Dimensions and Late Arriving Facts
boddu_raghunarayana
No ratings yet
The Teradata Database - Part 3 Usage Fundamentals PDF
Document20 pages
The Teradata Database - Part 3 Usage Fundamentals PDF
shrikanchi rathi
No ratings yet
API Design Principles and Best Practices
Document21 pages
API Design Principles and Best Practices
Govind Patel
No ratings yet
Data Profiling Overview: What Is Data Profiling, and How Can It Help With Data Quality?
Document3 pages
Data Profiling Overview: What Is Data Profiling, and How Can It Help With Data Quality?
Nilesh Patil
No ratings yet
Why AHV hypervisor reduces complexity - Part 2
Document21 pages
Why AHV hypervisor reduces complexity - Part 2
Rishab Sachdeva
No ratings yet
Presentation ON RDBMS: Submitted By-Dilpreet Singh Joginder Singh Class - Mba (Bu) 3 SEM
Document11 pages
Presentation ON RDBMS: Submitted By-Dilpreet Singh Joginder Singh Class - Mba (Bu) 3 SEM
namdeeptoor
100% (3)
Relational Object Oriented and Multi Dimensional Databases
Document13 pages
Relational Object Oriented and Multi Dimensional Databases
api-297547878
No ratings yet
CS8091 BIGDATA ANALYTICS QUESTION BANK - Watermark
Document95 pages
CS8091 BIGDATA ANALYTICS QUESTION BANK - Watermark
Marianinu antony
No ratings yet
Unit 3 - OLAP
Document107 pages
Unit 3 - OLAP
PARAZZI
No ratings yet
Big Data Technology Stack
Document12 pages
Big Data Technology Stack
Khalid Imran
No ratings yet
Ise-Vii-data Warehousing and Data Mining (10is74) - Notes
Document143 pages
Ise-Vii-data Warehousing and Data Mining (10is74) - Notes
Sudhir Anakal
100% (1)
Lesson 1 - Hadoop and Big Data Overview
Document57 pages
Lesson 1 - Hadoop and Big Data Overview
conyee
No ratings yet
MIS-15 - Data and Knowledge Management
Document55 pages
MIS-15 - Data and Knowledge Management
Abhishek Pandey
No ratings yet
Software Testing and Quality Assurance: Testing State Transition Diagrams
Document30 pages
Software Testing and Quality Assurance: Testing State Transition Diagrams
Iuliana Andronache
No ratings yet
Netezza Oracle Configuration in Datastage
Document8 pages
Netezza Oracle Configuration in Datastage
Praphulla Rayala
No ratings yet
The Poster Child of Open Source Business
Document35 pages
The Poster Child of Open Source Business
Sharath Ghosh
No ratings yet
Class: CS 237 Distributed Systems Middleware Instructor: Nalini Venkatasubramanian
Document55 pages
Class: CS 237 Distributed Systems Middleware Instructor: Nalini Venkatasubramanian
Pratheesh Kumar
No ratings yet
Question Bank For Object Oriented Analysis Design Regulation 2013
Document6 pages
Question Bank For Object Oriented Analysis Design Regulation 2013
PRIYA RAJI
No ratings yet
Hive Lecture Notes
Document17 pages
Hive Lecture Notes
Yuvaraj V, Assistant Professor, BCA
100% (1)
Design and Capacity Planning of Next Generation Network
Document7 pages
Design and Capacity Planning of Next Generation Network
Khoe Pham
No ratings yet
Enabling Technologies and Federated Cloud
Document38 pages
Enabling Technologies and Federated Cloud
asd
100% (1)
RDBMS PPT
Document34 pages
RDBMS PPT
Arshpreet Kaur
No ratings yet
A Gentle Introduction To Graph Neural Networks
Document9 pages
A Gentle Introduction To Graph Neural Networks
Eric K. A. Yartey
No ratings yet
Oracle Fact Sheet 079219 PDF
Document2 pages
Oracle Fact Sheet 079219 PDF
Giovanni Serauto
100% (1)
Seminar
Document16 pages
Seminar
Arjun Naidu
No ratings yet
Unit I Introduction 1.1 What Motivated Data Mining? Why Is It Important?
Document18 pages
Unit I Introduction 1.1 What Motivated Data Mining? Why Is It Important?
ANITHA AMMU
No ratings yet
New Office 365
Document14 pages
New Office 365
Yusuf Kusuma
No ratings yet
Bigdata PDF
Document76 pages
Bigdata PDF
Indra Wijaya
No ratings yet
Big Data Question Bank
Document15 pages
Big Data Question Bank
kokiladevirajavelu
0% (2)
Custom DynamoDB Import Wizard - DB Services
Document8 pages
Custom DynamoDB Import Wizard - DB Services
DB Services
No ratings yet
Operating System
Document60 pages
Operating System
Anopp
No ratings yet
Uit 1 & Unit 2 Notes
Document79 pages
Uit 1 & Unit 2 Notes
Sakshi Raj
No ratings yet
Data Security Powerpoint
Document25 pages
Data Security Powerpoint
leanna hoyte
No ratings yet
Managing A Database: Discovering Computers Fundamentals
Document39 pages
Managing A Database: Discovering Computers Fundamentals
Charlene Joy Prudente
No ratings yet
Comparing Hadoop and RDBMS for large data processing
Document27 pages
Comparing Hadoop and RDBMS for large data processing
Aakanksha Jain
No ratings yet
BIG DATA ANALYTICS REFERENCE ARCHITECTURES
Document26 pages
BIG DATA ANALYTICS REFERENCE ARCHITECTURES
Tejaswini
No ratings yet
New Relic
Document1 page
New Relic
anthonycacciola
No ratings yet
CSD310 - Pertemuan 9 - ETL
Document54 pages
CSD310 - Pertemuan 9 - ETL
SAWALI WAHYU
No ratings yet
Understanding MongoDB Internals
Document36 pages
Understanding MongoDB Internals
Dev Fitriady
No ratings yet
Enterprise Resource Planning
Document39 pages
Enterprise Resource Planning
pRiNcE DuDhAtRa
No ratings yet
INFOR Concepts - 2
Document1 page
INFOR Concepts - 2
swapnillsai
No ratings yet
Infa 1
Document18 pages
Infa 1
swapnillsai
No ratings yet
Many Formulas
Document11 pages
Many Formulas
Ernest Markovnikov
No ratings yet
Online College Magazine
Document2 pages
Online College Magazine
Sripriya Guna
No ratings yet