Introduction To Data Architecture: Lecture # 1 Dr. Saif Ur Rehman Malik

Uploaded by

Memoona Ishfaq

0% found this document useful (0 votes)

4 views18 pages

Original Title

Copyright

Available Formats

PPTX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

0% found this document useful (0 votes)

4 views18 pages

Introduction To Data Architecture: Lecture # 1 Dr. Saif Ur Rehman Malik

Uploaded by

Memoona Ishfaq

Copyright:

Available Formats

Download as PPTX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Jump to Page

You are on page 1of 18

Search inside document

Introduction to Data

Architecture
Lecture # 1

Dr. Saif Ur Rehman Malik

Data Architecture
• A data architecture describes how data is managed--from collection
through to transformation, distribution, and consumption. It sets the
blueprint for data and the way it flows through data storage systems. It
is foundational to data processing operations and artificial intelligence
(AI) applications.
Introduction (cont…)
• Corporate data include everything found in the corporation in the way of data.
• The most basic division of corporate data is by structured data and unstructured
data.
• As a rule, there are much more unstructured data than structured data.
• Unstructured data have two basic divisions—
• repetitive data and nonrepetitive data.
• Big data is made up of unstructured data.
Introduction (cont…)
• Nonrepetitive big data has a fundamentally different form than repetitive
unstructured big data.
• The differences between nonrepetitive big data and repetitive big data are so large
that they can be called the boundaries of the “great divide.”
• As a rule, nonrepetitive big data has MUCH greater business value than repetitive
big data.
Data Architecture
• Data architecture is about the larger picture of data and how it fits together in a typical organization.
Subdividing Data

Corporate Data
Structured Data
• Structured data is when data is in a standardized format, has a well-
defined structure, complies to a data model, follows a persistent
order, and is easily accessed by humans and programs. This data type
is generally stored in a database

• Examples: SQL, Excel, or any relational database.

Unstructured Data
Unstructured data is information that is not arranged according to a preset data model or schema, and therefore
cannot be stored in a traditional relational database or RDBMS. Text and multimedia are two common types of
unstructured content.
Repetitive Unstructured
• A typical form of repetitive unstructured data in the corporation might be the data generated by an analog
machine.

• For example, a farmer has a machine that reads the identification of railroad cars as the railroad cars pass
through the farmer's property. Trains pass through the property night and day. The electronic eye reads and
records the passage of each car on the track.
Nonrepetitive Unstructured Data
• Nonrepetitive unstructured data are data that are nonrepetitive, such as e-mails.
• Each email can be long or short. The e-mail can be in English or Spanish (or some other languages.) The
author of the e-mail can say anything that he/she pleases. It is only a pure accident if the contents of any e-
mail are identical to the contents of any other email.
• And there are many forms of nonrepetitive unstructured data. There are voice recordings, there are contracts,
there are customer feedback messages, etc.
The Great Divide of Data
The Great Divide of Data
It is hardly obvious why there should be this great divide of data. But
there are some very
• good reasons for the divide:
• Repetitive data usually have very limited business value, while
nonrepetitive data are rich in business value.
• Repetitive data can be handled one way; nonrepetitive data are
handled very differently.
• Repetitive data can be analyzed one way, while nonrepetitive data can
be analyzed in a very different manner.
Textual/Nontextual Data

• Nonrepetitive unstructured data can be divided into textual and nontextual data.
Business Value
The Data Infrastructure

A Step by Step Manual Guide With Screen Shots - Sap Basis - Daily Check List
Document7 pages
A Step by Step Manual Guide With Screen Shots - Sap Basis - Daily Check List
Animesh Sinha
100% (1)
Reliabilityweb Uptime Element Chart
Document1 page
Reliabilityweb Uptime Element Chart
Hesham Mahdy
No ratings yet
Data Modeling
Document87 pages
Data Modeling
Crish Nagarkar
No ratings yet
Kindexing Mechanisms
Document7 pages
Kindexing Mechanisms
SMBEAUTY
No ratings yet
Jump Start MySQL: Master the Database That Powers the Web
From Everand
Jump Start MySQL: Master the Database That Powers the Web
Timothy Boronczyk
No ratings yet
Heaps
Document29 pages
Heaps
Memoona Ishfaq
No ratings yet
Big Data
Document19 pages
Big Data
Mousoomi Baruah
No ratings yet
Introduction To Big Data - Presentation
Document30 pages
Introduction To Big Data - Presentation
Mohamed Rachdi
No ratings yet
NEMS
Document13 pages
NEMS
Chandrakiran Alapati
No ratings yet
5.1 Data and Databases
Document14 pages
5.1 Data and Databases
BLADE LEMON
No ratings yet
BDA Question Answer
Document29 pages
BDA Question Answer
Yachika Yadav
No ratings yet
Data Types
Document36 pages
Data Types
Vedant Bohra
No ratings yet
Chapter 2 Emerging
Document31 pages
Chapter 2 Emerging
SEIFU ABERRA
No ratings yet
Chapter Two: Data Science
Document31 pages
Chapter Two: Data Science
Mohammed Abdurhaman
No ratings yet
Chapter 01: Types of Digital Data
Document79 pages
Chapter 01: Types of Digital Data
01fm19mca006
No ratings yet
#2 Data Science
Document32 pages
#2 Data Science
ALIYI KEDIR
No ratings yet
Big Data Analytics Notes
Document74 pages
Big Data Analytics Notes
mazlankhan1430
No ratings yet
Unit 1: To Data Science
Document56 pages
Unit 1: To Data Science
shinjo
No ratings yet
Ba 2
Document80 pages
Ba 2
ROHITH S 2227951
No ratings yet
Big Data Intro
Document12 pages
Big Data Intro
Alekhya Abbaraju
No ratings yet
BDA Notes
Document96 pages
BDA Notes
Pulkit Desai
No ratings yet
CH-2 Data Science
Document45 pages
CH-2 Data Science
Test Test
No ratings yet
Big Data Analytics Unit Test-I Answers Bank
Document10 pages
Big Data Analytics Unit Test-I Answers Bank
vishal phule
No ratings yet
Data - Analytics - Unit - I - III MCA'A'
Document207 pages
Data - Analytics - Unit - I - III MCA'A'
Imran Alam
No ratings yet
Data Warehousing: Engr. Madeha Mushtaq Department of Computer Science Iqra National University
Document29 pages
Data Warehousing: Engr. Madeha Mushtaq Department of Computer Science Iqra National University
Nusrat Ullah
No ratings yet
Data Warehousing & Data Mining - Study Material
Document27 pages
Data Warehousing & Data Mining - Study Material
kavitha Ravichandran
No ratings yet
BigData Unit-1
Document72 pages
BigData Unit-1
Ravi Yadav
No ratings yet
Chapter 01: Types of Digital Data
Document80 pages
Chapter 01: Types of Digital Data
Shivananda V Seeri
No ratings yet
Lecture02-Main Motivation and Drivers For Big Data Adoption
Document9 pages
Lecture02-Main Motivation and Drivers For Big Data Adoption
jhonjairoaza
No ratings yet
4th - Business Intelligence
Document30 pages
4th - Business Intelligence
Joyce Gutierrez Juliano
No ratings yet
Data Science Class2
Document33 pages
Data Science Class2
Yashwanth Yashu
No ratings yet
University Institute of Computing: Big Data Analytics 21CAH-782
Document13 pages
University Institute of Computing: Big Data Analytics 21CAH-782
Neeraj Kukreti
No ratings yet
Chapter 1 Introduction To Big Data
Document19 pages
Chapter 1 Introduction To Big Data
shubham.ojha2102
No ratings yet
Module 1. 16974328175990
Document119 pages
Module 1. 16974328175990
Sagar B S
No ratings yet
Hris 2
Document35 pages
Hris 2
nida
No ratings yet
Data Warehousing Slides
Document76 pages
Data Warehousing Slides
Farid
No ratings yet
Session 1
Document58 pages
Session 1
2022si04048
No ratings yet
BDA Unit 1
Document50 pages
BDA Unit 1
Alekhya Abbaraju
No ratings yet
Chapter 2 Data Science
Document28 pages
Chapter 2 Data Science
lemma4a
No ratings yet
Class+2+ +Lecture+Note.
Document43 pages
Class+2+ +Lecture+Note.
harvardcasestudies
No ratings yet
Big Data Intro
Document47 pages
Big Data Intro
Muhammad Zeeshan Khalid
No ratings yet
Information Technology: Chapter Two
Document56 pages
Information Technology: Chapter Two
Ērmias Álemayehu
No ratings yet
BIG DATA and Its Traits
Document25 pages
BIG DATA and Its Traits
Jaswanth Racha
No ratings yet
Empowering BI Professionals: Building Tools and Processes For Data-Driven Insights
Document11 pages
Empowering BI Professionals: Building Tools and Processes For Data-Driven Insights
Riddhi Vekariya
No ratings yet
Getting An Overview of Big Data (Module1)
Document58 pages
Getting An Overview of Big Data (Module1)
Nihal Koche
No ratings yet
Lecture 1: Big Data Challenges and Overview: Extracted From
Document26 pages
Lecture 1: Big Data Challenges and Overview: Extracted From
Maira Riaz
No ratings yet
Foundation of Information Management Systems-Chapter3
Document20 pages
Foundation of Information Management Systems-Chapter3
Fuad Kapitan
No ratings yet
Big Data Analytics: Prepared By: Raed Karim, PH.D
Document12 pages
Big Data Analytics: Prepared By: Raed Karim, PH.D
Fernando Andrés Hinojosa Villarreal
No ratings yet
Introduction To DBMS - T1
Document21 pages
Introduction To DBMS - T1
Sithum Pabodha
No ratings yet
Unit 1
Document61 pages
Unit 1
Keshav Bagaade
No ratings yet
Facets of Data
Document22 pages
Facets of Data
Prashant Sahu
No ratings yet
DBMS
Document24 pages
DBMS
Tapaswini Satapathy
No ratings yet
Bda MST Merged
Document230 pages
Bda MST Merged
Deepti Agrawal
No ratings yet
Programming Flowchart Pseudocode Algorithm Final
Document77 pages
Programming Flowchart Pseudocode Algorithm Final
Jaycee Larubis
No ratings yet
Introduction To Data Management - Week 1 - 2024
Document17 pages
Introduction To Data Management - Week 1 - 2024
Mjay
No ratings yet
Chapter 2: Data Science
Document32 pages
Chapter 2: Data Science
Abdela Aman Mtech
No ratings yet
Unit I. Introduction To DBMS: - Case Study:-Mysql Database
Document127 pages
Unit I. Introduction To DBMS: - Case Study:-Mysql Database
Aditya Jamdade
No ratings yet
SESSION 2017-2018: B.Tech (Cse) Year: Iv Semester: Viii
Document68 pages
SESSION 2017-2018: B.Tech (Cse) Year: Iv Semester: Viii
Rishabh jain
No ratings yet
Unit 5 Concepts of Big Data and Data Lake
Document15 pages
Unit 5 Concepts of Big Data and Data Lake
jaysukhv234
No ratings yet
Course Information: Customer Data Analysis and Customer Relationship Management
Document13 pages
Course Information: Customer Data Analysis and Customer Relationship Management
Haoyang Wei
No ratings yet
Database Management System
Document32 pages
Database Management System
Computers GCM KADAPA
No ratings yet
Bda - Unit 1
Document32 pages
Bda - Unit 1
delwinfrancis02
No ratings yet
Set Software Programs Organization Storage Retrieval Data Database
Document26 pages
Set Software Programs Organization Storage Retrieval Data Database
yogendra857
No ratings yet
Fundamentals of Database - CSIT
Document30 pages
Fundamentals of Database - CSIT
Omkar Basnet
No ratings yet
Final Mis2
Document23 pages
Final Mis2
Renjumul Mofid
No ratings yet
lec-11-ERD Examples
Document19 pages
lec-11-ERD Examples
Memoona Ishfaq
No ratings yet
Lecture-3 Relational Algebra I
Document41 pages
Lecture-3 Relational Algebra I
Memoona Ishfaq
No ratings yet
Lab Manual - CSC371 - DB-I - V3.0 Revised
Document137 pages
Lab Manual - CSC371 - DB-I - V3.0 Revised
Memoona Ishfaq
No ratings yet
Entity-Relationship Modelling
Document50 pages
Entity-Relationship Modelling
Memoona Ishfaq
No ratings yet
Lecture07 - SEO Best Practices
Document33 pages
Lecture07 - SEO Best Practices
Memoona Ishfaq
No ratings yet
Lecture 09 - Social Media Marketing
Document19 pages
Lecture 09 - Social Media Marketing
Memoona Ishfaq
No ratings yet
Iim Indore'S: Integrated Program in Business Analytics (IPBA)
Document8 pages
Iim Indore'S: Integrated Program in Business Analytics (IPBA)
Ankit Panda
No ratings yet
How To Register For The GCP Exam
Document14 pages
How To Register For The GCP Exam
pritamjaan
No ratings yet
Executive Summary-2
Document13 pages
Executive Summary-2
Ulkar Alaskarova
No ratings yet
Technical Sheet Elite Home Trainers Interactive Trainers Suito 2020
Document4 pages
Technical Sheet Elite Home Trainers Interactive Trainers Suito 2020
zsx zsx
No ratings yet
A360 and A360 Collaboration For Revit - Presentation PDF
Document62 pages
A360 and A360 Collaboration For Revit - Presentation PDF
Wanderson
100% (1)
Wireline & Pipe Recovery 5-6
Document2 pages
Wireline & Pipe Recovery 5-6
Anonymous yWgZxGW5d
100% (1)
Advanced Certification In: Cloud Computing and Devops
Document16 pages
Advanced Certification In: Cloud Computing and Devops
manjul.dixit
No ratings yet
CENT Condition Monitoring Service
Document2 pages
CENT Condition Monitoring Service
supljina
No ratings yet
Equipment Warr Upd
Document6 pages
Equipment Warr Upd
Gurvinderpal Singh Multani
No ratings yet
IRFP240
Document8 pages
IRFP240
Hugo Jimenez
No ratings yet
Advanced Query Syntax
Document7 pages
Advanced Query Syntax
Lord Vario
No ratings yet
MPUD v6 5 (Clean)
Document199 pages
MPUD v6 5 (Clean)
Keith Roney
No ratings yet
The Ethics of Artificial Intelligence
Document2 pages
The Ethics of Artificial Intelligence
dragon knight
No ratings yet
Iscom Rax 711 (B) : Essential Demarcation Device
Document3 pages
Iscom Rax 711 (B) : Essential Demarcation Device
Carlos Paz
No ratings yet
Multi-Storey Steel Building Solutions
Document16 pages
Multi-Storey Steel Building Solutions
vannethny
No ratings yet
DVS VRTX Repair Guide
Document29 pages
DVS VRTX Repair Guide
Luke Renz
No ratings yet
Section 3.2.3 TENTATIVE VENDORS LIST
Document3 pages
Section 3.2.3 TENTATIVE VENDORS LIST
waelabouelela
No ratings yet
The Effects of Cell Phone Use On Academic Performance in Tertiary Education
Document6 pages
The Effects of Cell Phone Use On Academic Performance in Tertiary Education
Robilyn Oliquino
No ratings yet
MANUAL - Part 1 PN 101328780
Document370 pages
MANUAL - Part 1 PN 101328780
Alesson
No ratings yet
Journal of Business Research: Uthayasankar Sivarajah, Muhammad Mustafa Kamal, Zahir Irani, Vishanth Weerakkody
Document24 pages
Journal of Business Research: Uthayasankar Sivarajah, Muhammad Mustafa Kamal, Zahir Irani, Vishanth Weerakkody
reshma k.s
No ratings yet
Paytm
Document94 pages
Paytm
goswamiphotostat
100% (1)
6th Sem Syllabus
Document19 pages
6th Sem Syllabus
shrav
No ratings yet
Fujitsu Lifebook S Series SH760 560
Document3 pages
Fujitsu Lifebook S Series SH760 560
Agus Marsono
No ratings yet
Modelarts Huawei
Document76 pages
Modelarts Huawei
SHOFIA IZZAH
No ratings yet
Customer Relationship Management
Document17 pages
Customer Relationship Management
deepak balokhra
No ratings yet
Pma XT SP0009 PDF
Document15 pages
Pma XT SP0009 PDF
El_memito
No ratings yet