Welcome to Scribd!

Untitled Document

Uploaded by

it.was.spam

0% found this document useful (0 votes)

4 views1 page

This document contains questions to prepare for viva voce exams covering 5 units: 1) understanding big data, 2) Hadoop distributed file system, 3) NoSQL data management, 4) MapReduce and YARN, and 5) Pig and Hive. For each unit, 5 questions are provided to test knowledge of key concepts and differentiate components like name and data nodes in HDFS, mapper and reducer tasks in MapReduce, and similarities and differences between HiveQL and SQL.

Original Description:

Original Title

Untitled document

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

4 views1 page

Untitled Document

Uploaded by

it.was.spam

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 1

Search inside document

viva questions

### UNIT-1: Understanding Big Data

1. What are the key characteristics of big data?
2. Why is big data important in today's context?
3. Discuss the challenges posed by big data.
4. Can you classify big data analytics? Explain.
5. Provide examples of big data applications in healthcare, banking, advertising, and other
industries.

### Unit 2: Hadoop Distributed File System (HDFS)

1. Explain the components of the Hadoop ecosystem.
2. Describe the architecture of Hadoop.
3. What are the key concepts of HDFS?
4. Differentiate between Name nodes and Data nodes in HDFS.
5. How do you read, write, and delete data in HDFS?

### Unit 3: NoSQL Data Management

1. What is NoSQL and why is it used?
2. Discuss the aggregate data models in NoSQL.
3. Explain the key-value and document data models.
4. What are graph databases and schema-less databases?
5. Describe the concepts of sharding and map-reduce in NoSQL.

### Unit 4: MapReduce and YARN

1. Explain the MapReduce paradigm in Hadoop.
2. Differentiate between Mapper and Reducer tasks.
3. What are Job and Task trackers in Hadoop?
4. Discuss the components and functions of YARN.
5. How does YARN address the failures encountered in classic MapReduce?

### Unit 5: Pig and Hive

1. How do you install and run Pig? Provide an example.
2. Compare Pig with traditional databases.
3. What is Pig Latin and how is it used for data processing?
4. Explain the concepts of Hive and its shell.
5. Discuss the similarities and differences between HiveQL and traditional SQL.

These questions should cover the main topics outlined in your syllabus.

Solution Manual For Analytics Data Science Artificial Intelligence Systems For Decision Support 11th by Sharda
Document28 pages
Solution Manual For Analytics Data Science Artificial Intelligence Systems For Decision Support 11th by Sharda
JayStewartmsie
100% (33)
cp5293 Big Data Analytics Question Bank
Document13 pages
cp5293 Big Data Analytics Question Bank
Sanguine Shereen
0% (1)
Big Data Project
Document61 pages
Big Data Project
count.blues
100% (3)
Big Data Syllabus
Document3 pages
Big Data Syllabus
Angel Dahal
No ratings yet
BDA Answers-1
Document15 pages
BDA Answers-1
afreed khan
No ratings yet
Ism 6404 CH 7
Document47 pages
Ism 6404 CH 7
Noemer Orsolino
No ratings yet
Lecture1 Introduction Jan7 2018
Document39 pages
Lecture1 Introduction Jan7 2018
Ayça Yıldız
No ratings yet
Co Bda
Document1 page
Co Bda
mydhili
No ratings yet
BDA BCA Sem-6 Question Bank Q-WPS Office
Document2 pages
BDA BCA Sem-6 Question Bank Q-WPS Office
vishnu.garuda246
No ratings yet
Big Data Tools and Its Framework
Document5 pages
Big Data Tools and Its Framework
2041020004.smrutitanaya
No ratings yet
BIG DATA Unit 1 & 2 Assignment
Document1 page
BIG DATA Unit 1 & 2 Assignment
Somesh Singh
No ratings yet
Important Da
Document9 pages
Important Da
Priyadarshini
No ratings yet
BDA Assignment1 BE6 20
Document10 pages
BDA Assignment1 BE6 20
vardhan mordharia
No ratings yet
Big Data Syllabus For Theory and Lab
Document4 pages
Big Data Syllabus For Theory and Lab
chetana tukkoji
No ratings yet
Questionbank 12 With-Answer
Document3 pages
Questionbank 12 With-Answer
Av
No ratings yet
Big Data
Document10 pages
Big Data
Jorge Grube
No ratings yet
Big Data Notes
Document68 pages
Big Data Notes
DrKrishna Priya Chakireddy
No ratings yet
NoSQL Database New Era of Databases For
Document12 pages
NoSQL Database New Era of Databases For
prakash
No ratings yet
Important Questions
Document1 page
Important Questions
Sudharsana Vasudevan
No ratings yet
Lecture1 Introduction
Document27 pages
Lecture1 Introduction
Elon Dusk
No ratings yet
1.3 Module-1
Document26 pages
1.3 Module-1
dhurgadevi
No ratings yet
1.2 Module-1
Document21 pages
1.2 Module-1
dhurgadevi
No ratings yet
Bda Ese
Document66 pages
Bda Ese
jasbutani1234
No ratings yet
IM Ch14 Big Data Analytics NoSQL Ed12
Document8 pages
IM Ch14 Big Data Analytics NoSQL Ed12
Mohsin
No ratings yet
Assignment 2
Document1 page
Assignment 2
Shubham Jain
No ratings yet
Bda QB
Document18 pages
Bda QB
tanupandav333
No ratings yet
Dbms Assignment 4
Document15 pages
Dbms Assignment 4
kanishka medankara
No ratings yet
Cp5293 Big Data Analytics Question Bank
Document13 pages
Cp5293 Big Data Analytics Question Bank
Sanguine Shereen
0% (1)
Bigdata Syllabus
Document3 pages
Bigdata Syllabus
Sankar Terli
No ratings yet
Hadoop
Document14 pages
Hadoop
srcesrbije.online
No ratings yet
NO SQL Data Management
Document123 pages
NO SQL Data Management
Hirdesh Sharma
No ratings yet
Bda - 1 Unit
Document21 pages
Bda - 1 Unit
ASMA UL HUSNA
No ratings yet
Big Data and Data Science: Case Studies: Priyanka Srivatsa
Document5 pages
Big Data and Data Science: Case Studies: Priyanka Srivatsa
Yasir Butt
No ratings yet
Qbank Datamining
Document8 pages
Qbank Datamining
Anzal Ashraf
No ratings yet
Big Assignment
Document8 pages
Big Assignment
melesse bisema
No ratings yet
General Question Bank
Document5 pages
General Question Bank
Manvendra Sinh
No ratings yet
2CS702-CPD-Odd 23 24
Document9 pages
2CS702-CPD-Odd 23 24
cowcow121010
No ratings yet
Chapter 3 Review Questions
Document5 pages
Chapter 3 Review Questions
Sarah Gharaibeh
No ratings yet
Database Fundamentals by Theophilus Edet
Document230 pages
Database Fundamentals by Theophilus Edet
Sebastian A. Montanchez Saldarriaga
No ratings yet
Mastering Database Design
From Everand
Mastering Database Design
Ted Noreux
No ratings yet
Bda Assignment
Document7 pages
Bda Assignment
Avinash
No ratings yet
MCA - BigData Notes
Document136 pages
MCA - BigData Notes
Vinu Varshith
No ratings yet
Anglais Abd S2
Document53 pages
Anglais Abd S2
Énomis Douyou
No ratings yet
BDA Assignment - 231012 - 151952
Document4 pages
BDA Assignment - 231012 - 151952
Arun Chaudhari
No ratings yet
Ilovepdf - Merged (3) - 221-230
Document10 pages
Ilovepdf - Merged (3) - 221-230
kanishka saxena
No ratings yet
20IT503 - Big Data Analytics - Unit1
Document59 pages
20IT503 - Big Data Analytics - Unit1
5023-Monish Kumar K
No ratings yet
Top 4 Open Source Tools You Can Use To Handle Big Data
Document64 pages
Top 4 Open Source Tools You Can Use To Handle Big Data
dineshgomber
No ratings yet
Big Data With Hadoop
Document26 pages
Big Data With Hadoop
sonu samge
No ratings yet
CH 2
Document21 pages
CH 2
BERHAN HAILU
No ratings yet
Big Data Mining and Knowledge Discovery
Document6 pages
Big Data Mining and Knowledge Discovery
RANIA_MKHININI_GAHAR
No ratings yet
Bda Q
Document30 pages
Bda Q
Ninja Training
No ratings yet
Book Big Data Technology
Document87 pages
Book Big Data Technology
Anish shah
No ratings yet
Bda Super Imp
Document35 pages
Bda Super Imp
WWE ROCKERS
No ratings yet
Big Data Analytics
Document19 pages
Big Data Analytics
bagaverupesh8
No ratings yet
Updated Unit-2
Document55 pages
Updated Unit-2
sc
0% (1)
BDA - Unit-1
Document24 pages
BDA - Unit-1
Aishwarya Rayasam
No ratings yet
Big Data Analytics-Syllabus
Document3 pages
Big Data Analytics-Syllabus
Dual Dave
No ratings yet
Part B Questions
Document3 pages
Part B Questions
sangeetha
No ratings yet
A Study On Some of Data Warehouses and Data Mining (Case Study of Data Mining For Environmental Problems)
Document8 pages
A Study On Some of Data Warehouses and Data Mining (Case Study of Data Mining For Environmental Problems)
EighthSenseGroup
No ratings yet
RDBMS In-Depth: Mastering SQL and PL/SQL Concepts, Database Design, ACID Transactions, and Practice Real Implementation of RDBM (English Edition)
From Everand
RDBMS In-Depth: Mastering SQL and PL/SQL Concepts, Database Design, ACID Transactions, and Practice Real Implementation of RDBM (English Edition)
Dr. Madhavi Vaidya
No ratings yet