You are on page 1of 18

Exam

Name___________________________________
 
MULTIPLE CHOICE.  Choose the one alternative that best completes the statement or answers the question. 
1) A field identified in a table as holding the unique identifier of the table's records is called the 1) _______ 
A) key field. B) unique ID. C) primary field. D) primary key. 
 
2) The organization's rules for sharing, disseminating, acquiring, standardizing, classifying, and inventorying information is
called a(n)  2) _______ 
A) data definition file. B) data quality audit. 
C) information policy. D) data governance policy. 
 
3) Data cleansing not only corrects errors but also  3) _______ 
A) enforces consistency among different sets of data. 
B) structures data. 
C) normalizes data. 
D) establishes logical relationships between data.  
 
4) DBMSs typically include report­generating tools in order to 4) _______ 
A) retrieve and display data. B) display data in graphs. 
C) perform predictive analysis. D) display data in an easier­to­read format. 
 
5) Which of the following is a main disadvantage to a distributed database system? 5) _______ 
A) requires more expensive computers B) lack of flexibility 
C) poor responsiveness to local users D) susceptibility to data inconsistency 
 
6) Jane Clark is student at the university.  Jane is also employed by the university library.  Jane got married two weeks 
ago and her new last name is Jones.  Jane receives her work cheque in the mail addressed to Jane Clark but her grades 
that come in the mail are addressed Jane Jones.  This is an example of ________ of Jane's information. 6) _______ 
A) data bits B) data inconsistency 
C) program­data independence D) data sort 
 
7) The logical view 7) _______ 
A) allows the creation of supplementary reports. 
B) presents an entry screen to the user. 
C) presents data as they would be perceived by end users. 
D) shows how data are organized and structured on the storage media. 
 
8) A data mart usually can be constructed more rapidly and at lower cost than a data warehouse because 8) _______ 
A) a data mart uses a Web interface. 
B) all the information is historical. 
C) a data mart typically focuses on a single subject area or line of business. 
D) all of the information belongs to a single company. 
 
9) A DBMS makes the 9) _______ 
A) logical database available for different analytical views. 
B) physical database available for different logical views. 
C) physical database available for different analytical views. 
D) relational database available for different physical views. 
 
10) The tool that enables users to view the same data in different ways using multiple dimensions is 10) ______ 
A) OLAP. B) predictive analysis. 
C) data mining. D) SQL. 
 
11) ________ tools are used to analyze large unstructured data sets, such as e­mail, memos, survey responses, etc., to 
discover patterns and relationships.  11) ______ 
A) Text mining B) Web mining 
C) Web content mining D) OLAP 
 
12) In a relational database, the three basic operations used to develop useful sets of data are 12) ______ 
A) select, project, and where. B) select, project, and join. 
C) select, from, and join. D) select, join, and where. 
 
13) An automated or manual file that stores information about data elements and data characteristics such as usage, 
physical representation, ownership, authorization, and security is the 13) ______ 
A) entity­relationship diagram. B) relationship dictionary. 
C) data definition diagram. D) data dictionary. 
 
14) The confusion created by ________ makes it difficult for companies to create customer relationship management, 
supply chain management, or enterprise systems that integrate data from different sources. 14) ______ 
A) online processing B) data redundancy 
C) data independence D) batch processing 
 
15) Which of the following is NOT a method for performing a data quality audit? 15) ______ 
A) surveying data definition and query files 
B) surveying end users about their perceptions of data quality 
C) surveying entire data files 
D) surveying samples from data files 
 
16) In a table for customers, the information about a single customer would reside in a single 16) ______ 
A) table. B) row. C) column. D) field. 
 
17) A government agency wants to analyze their data. Their data consists of e­mail, memos, survey responses, legal 
cases, patent descriptions, and service reports.  What tools should they use to analyze their data? 17) ______ 
A) predictive analysis B) data mining 
C) text mining D) OLAP 
 
18) The process of streamlining data to minimize redundancy and awkward many­to­many relationships is called 18) 
______ 
A) data cleansing. B) normalization. C) data scrubbing. D) data defining. 
 
19) Data mining is a tool for allowing users to 19) ______ 
A) quickly compare transaction data gathered over many years. 
B) obtain online answers to ad hoc questions in a rapid amount of time. 
C) find hidden relationships in data. 
D) summarize massive amounts of data into much smaller, traditional reports. 
 
20) A ________ represents the smallest unit of data a computer can handle. 20) ______ 
A) field B) byte C) record D) bit 
 
21) Which of the following database types is useful for storing java applets as well as processing large numbers of 
transactions? 21) ______ 
A) relational DBMS B) hierarchical DBMS 
C) OODBMS D) object­relational DBMS 
 
22) Which common database challenge is illustrated by the text's discussion of receiving multiple pieces of the same 
direct mail advertising? 22) ______ 
A) data inconsistency B) data accuracy 
C) data redundancy D) data normalization 
 
23) The special organizational function whose responsibilities include the technical and operational aspects of managing 
data, including physical database design and maintenance, is called 23) ______ 
A) data administration. B) information policy administration. 
C) database administration. D) data auditing. 
 
24) A one­to­one relationship between two entities is symbolized in a diagram by a line that ends with 24) ______ 
A) a crow's foot. B) two short marks. 
C) a crow's foot topped by a short mark. D) one short mark. 
 
25) Tools for consolidating, analyzing, and providing access to vast amounts of data to help users make better business 
decisions are known as 25) ______ 
A) data mining. B) OLAP. 
C) business intelligence. D) DSS. 
 
26) Jess Wilde works for a large law firm.  Every week he gets reports on the cases each lawyer in the firm is working on. 
He wants to get the files that deal with billing hours for each lawyer and combine that information with the files on 
individual cases that each lawyer is working on.  He discovers that information cannot flow freely across different parts of 
the organization in this traditional file system.  This is an example of ________.  26) ______ 
A) program­data dependence B) poor security 
C) lack of flexibility D) lack of data sharing and availability 
 
27) A one­to­many relationship between two entities is symbolized in a diagram by a line that ends with 27) ______ 
A) a crow's foot. B) two short marks. 
C) one short mark. D) a crow's foot topped by a short mark. 
 
28) A group of records of the same type is called a ________. 28) ______ 
A) record B) field C) bit D) file 
 
29) A group of related fields, such as a student’s name, the course taken, date, and grade, comprises a ________. 29) 
______ 
A) byte B) field C) bit D) record 
 
30) The join operation 30) ______ 
A) creates a subset consisting of columns in a table. 
B) organizes elements into segments. 
C) identifies the table from which the columns will be selected. 
D) combines relational tables to provide the user with more information than is otherwise available. 
 
31) The project operation 31) ______ 
A) combines relational tables to provide the user with more information than is otherwise available. 
B) identifies the table from which the columns will be selected. 
C) organizes elements into segments. 
D) creates a subset consisting of columns in a table. 
 
32) As discussed in the Interactive Session: Technology, what problem was MySpace facing in its data management? 32)
______ 
A) data redundancy B) data quality 
C) scalability D) program­data dependence 
 
33) Darren Pepper works for a large medical clinic.  They are running out of 5 digit patient numbers and they want to 
expand the patient number to 7 digits.  It will cost a great deal of money to make this switch because three of the clinic's 
programs will no longer work with this new number of digits in the patient number.  The clinic is using a traditional file 
system.  This is an example of ________.  33) ______ 
A) lack of data sharing and availability B) lack of flexibility 
C) poor security D) program­data dependence 
 
34) Oracle Database Lite is a(n) 34) ______ 
A) mainframe relational DBMS. 
B) Internet DBMS. 
C) DBMS for small handheld computing devices. 
D) DBMS for midrange computers. 
 
35) ________ recognizes patterns that describe the group to which an item belongs by examining existing items that have
been classified and by inferring a set of rules.  35) ______ 
A) Classification  B) Associations C) Sequences D) Clustering 
 
36) In terms of data relationships, associations refers to 36) ______ 
A) occurrences linked to a single event. 
B) patterns that describe a group to which an item belongs. 
C) events linked over time. 
D) undiscovered groupings. 
 
37) In a relational database, a record is referred to in technical terms as a(n) 37) ______ 
A) field. B) entity. C) tuple. D) row. 
 
38) A data warehouse is composed of 38) ______ 
A) historic and current internal data. B) current data. 
C) internal and external data sources. D) historical data from legacy systems. 
 
39) A schematic of the entire database that describes the relationships in a database is called a(n) 39) ______ 
A) entity­relationship diagram. B) intersection relationship diagram. 
C) data definition diagram. D) data dictionary. 
 
40) The select operation 40) ______ 
A) identifies the table from which the columns will be selected. 
B) combines relational tables to provide the user with more information than is otherwise available. 
C) creates a subset consisting of columns in a table. 
D) creates a subset consisting of all records in the file that meet stated criteria. 
 
41) Which of the following non­digital data storage items is most similar to a database? 41) ______ 
A) doctor's office invoice. B) list of sales totals on a spreadsheet. 
C) library card catalog. D) cash register receipt. 
 
42) The most prominent data manipulation language today is 42) ______ 
A) Access. B) SQL. 
C) Crystal Reports. D) DB2. 
 
43) Detecting and correcting data in a database or file that are incorrect, incomplete, improperly formatted, or redundant is
called 43) ______ 
A) data optimization. B) data scrubbing. 
C) defragmentation. D) data auditing. 
 
44) A grouping of characters into a word, a group of words, or a complete number (such as a person’s name or age) is 
called a ________. 44) ______ 
A) byte B) bit C) field D) record 
 
45) The type of logical database model that treats data as if they were stored in two­dimensional tables is the 45) ______ 
A) pre­digital DBMS. B) relational DBMS. 
C) OODBMS. D) hierarchical DBMS. 
 
46) OLAP is a tool for enabling 46) ______ 
A) programmers to quickly diagram data relationships. 
B) programmers to normalize data. 
C) users to view both logical and physical views of data. 
D) users to obtain online answers to ad hoc questions in a rapid amount of time. 
 
47) The Bank of Canada has large amounts of data collected over many years.  It wants to get value from this data.  They
decide they want to analyze this large amount of data.  They don't have any particular question in mind, they just want to 
find out if there are any hidden trends in the data.  What tools should they use to analyze the data? 47) ______ 
A) predictive analysis B) data mining 
C) text mining D) OLAP 
 
48) DBMS for midrange computers include all of the following EXCEPT 48) ______ 
A) Oracle. B) Microsoft Access. 
C) DB2. D) Microsoft SQL Server. 
 
49) Duplicate data in multiple data files is called data ________. 49) ______ 
A) repetition B) independence C) partitions D) redundancy 
 
50) A characteristic or quality describing an entity is called a(n) 50) ______ 
A) tuple. B) attribute. C) key field. D) field. 
 
51) The type of database management approach that can handle multimedia is the 51) ______ 
A) hierarchical DBMS. B) network DBMS. 
C) object­oriented DBMS. D) relational DBMS. 
 
52) Which of the following is NOT one of the main problems with a traditional file environment? 52) ______ 
A) program­data independence 
B) lack of flexibility in creating ad hoc reports 
C) poor security 
D) data inconsistency 
 
53) The Giant Hardware Company sells four different products – screws, nails, hammers, and bolts–in the East, West, 
and Prairie regions.  They want to know how many hammers sold in each of their sales regions and compare actual 
results with projected sales.  What tools should they use to analyze the data? 53) ______ 
A) text mining B) data mining 
C) OLAP D) predictive analysis 
 
54) A DBMS reduces data redundancy and inconsistency by  54) ______ 
A) utilizing a data dictionary.  
B) uncoupling program and data. 
C) enforcing referential integrity.  
D) minimizing isolated files with repeated data. 
 
55) Gord Smith works for a large pizza chain.  Every week he gets reports on the sales in each store across Canada. He 
sees a problem in one of the stores in Ontario.  He wants and ad hoc report for sales at that store after 9 p.m. on 
weekdays.  He is told that no such report can be created by the traditional file system.  This is an example of ________.  
55) ______ 
A) program­data dependence B) lack of flexibility 
C) lack of data sharing and availability D) poor security 
 
56) The data dictionary serves as an important data management tool by 56) ______ 
A) creating an inventory of data contained in the database. 
B) maintaining data in updated form. 
C) assigning attributes to the data. 
D) presenting data as end users or business specialists would perceive them. 
 
57) In what type of a database system is the entire central database duplicated at all remote locations? 57) ______ 
A) networked B) partitioned C) normalized D) replicated 
 
58) Frito Lay wants to introduce a new flavour of potato chips in Canada.  They have a great deal of data to help them 
make the decision to introduce this flavour.  They plan on using data­mining techniques, historical data, and assumptions 
about future conditions to predict outcomes of introducing the new flavour.  What tools should they use to analyze the 
data? 58) ______ 
A) data mining B) predictive analysis 
C) OLAP D) text mining 
 
59) An alternative to using application server software for interfacing between a Web server and back­end databases is 
59) ______ 
A) SQL. B) Java. C) HTML. D) CGI. 
 
60) Microsoft SQL Server is a(n) 60) ______ 
A) Internet DBMS. 
B) desktop relational DBMS. 
C) DBMS for midrange computers. 
D) DBMS for small handheld computing devices. 
 
61) A group of bits, called a ________, represents a single character, which can be a letter, a number, or another symbol. 
61) ______ 
A) record B) bit C) field D) byte 
 
62) Which of the following best illustrates the relationship between entities and attributes? 62) ______ 
A) the entity CUSTOMER with the attribute PRODUCT 
B) the entity PRODUCT with the attribute PURCHASE 
C) the entity CUSTOMER with the attribute PURCHASE 
D) the entity PRODUCT with the attribute CUSTOMER 
 
63) Don Gibb works for a large retail chain.  Every month he gets reports on the wages in each store across Canada. He 
notices that one employee received a 20 percent raise.  He calls payroll to find who put this raise into the traditional file 
system.  He is told that there is no way to know who entered that raise in the system.  This is an example of ________.  
63) ______ 
A) lack of flexibility B) lack of data sharing and availability 
C) poor security D) program­data dependence 
 
64) The specialized language programmers use to add and change data in the database is called 64) ______ 
A) a data manipulation language. B) a data access language. 
C) structured Query language. D) a data definition language. 
 
SHORT ANSWER.  Write the word or phrase that best completes each statement or answers the question. 
65) ________ refers to the coupling of data stored in files and the specific programs required to update and maintain 
those files so that changes in programs require changes to the data.  65)  _____________ 
 
66) A more rigorous definition of a ________ is a collection of data organized to serve many applications efficiently by 
centralizing the data and controlling redundant data. 66)  _____________ 
 
67) The discovery and analysis of useful patterns and information from hypertext documents on the Internet is called 
________.  67)  _____________ 
 
68) Microsoft Access is a relational DBMS for ________ systems.  68)  _____________ 
 
69) A(n) ________ view shows data as it is actually organized and structured on the data storage media. 69)  
_____________ 
 
70) The data warehouse makes the data available for anyone to access as needed, but it cannot be ________. 70)  
_____________ 
 
71) A ________ is a field in a database table that enables users to find related information in another database table. 71)  
_____________ 
 
72) A group of records of the same type is called a ________. 72)  _____________ 
 
73) A data warehouse system also provides a range of ad hoc and standardized query tools, ________ tools, and 
graphical reporting facilities.  73)  _____________ 
 
74) The ________ operation combines relational tables to provide the user with more information than is available in 
individual tables.  74)  _____________ 
 
75) A ________ , represents a single character, which can be a letter, a number, or another symbol. 75)  _____________ 
 
76) ________ are the formal rules governing the maintenance, distribution, and use of information in an organization. 76)  
_____________ 
 
77) A group of related files makes up a ________. 77)  _____________ 
 
78) DBMS have a(n) ________ capability to specify the structure of the content of the database. 78)  _____________ 
 
79) Oracle Database Lite is a DBMS for small ________ computing devices. 79)  _____________ 
 
80) ________, is where the same attribute may have different values.  80)  _____________ 
 
81) The process of creating small, stable, yet flexible and adaptive data structures from complex groups of data is called 
________. 81)  _____________ 
 
82) In ________, a data mining tool discovers different groupings within data, such as finding affinity groups for bank 
cards. 82)  _____________ 
 
83) Databases record information about general categories of information referred to as ________. 83)  _____________ 
 
84) A(n) ________ database is one that is stored in more than one physical location. 84)  _____________ 
 
85) The ________ operation creates a subset consisting of columns in a table, permitting the user to create new tables 
that contain only the information required.  85)  _____________ 
 
86)  ________ are applications and technologies to help users make better business decisions. 86)  _____________ 
 
87) A ________ is a database that stores current and historical data of potential interest to decision makers throughout 
the company.  87)  _____________ 
 
88) The most prominent data manipulation language today is ________. 88)  _____________ 
 
89) A ________ represents the smallest unit of data a computer can handle. 89)  _____________ 
 
90) A line connecting two entities that ends in two short marks designates a ________ relationship 90)  _____________ 
 
91) A DBMS includes capabilities and tools for ________, managing, and accessing the data in the database.  91)  
_____________ 
 
92) A group of related fields, such as a student’s name, the course taken, date, and grade, comprises a ________. 92)  
_____________ 
 
93) Microsoft SQL Server are ________ DBMS for large mainframes and mid­range computers.  93)  _____________ 
 
94) Microsoft Access and other DBMS include capabilities for ________ so that the data of interest can be displayed in a 
more structured and polished format. 94)  _____________ 
 
95) The ________ database design describes how the data elements in the database are to be grouped.  95)  
_____________ 
 
96) RDBMSs use ________ rules to ensure that relationships between coupled tables remain consistent. 96)  
_____________ 
 
97) A(n) ________ is software that handles all application operations between browser­based computers and a 
company's back­end business applications or databases. 97)  _____________ 
 
98) Microsoft Access has a rudimentary ________ capability that displays information about the size, format, and other 
characteristics of each field in a database.  98)  _____________ 
 
99) A DBMS ________ data redundancy and inconsistency by minimizing isolated files in which the same data are 
repeated.  99)  _____________ 
 
100) Because pieces of information in different files and different parts of the organization cannot be ________ to one 
another, it is virtually impossible for information to be shared or accessed in a timely manner.  100)  ____________ 
 
101) A grouping of characters into a word, a group of words, or a complete number (such as a person’s name or age) is 
called a ________. 101)  ____________ 
 
102) The use of a ________ approach to file processing encourages each functional area in a corporation to develop 
specialized applications.   102)  ____________ 
 
103) Database designers document their data model with ________. 103)  ____________ 
 
104) ________ is the presence of duplicate data in multiple data files so that the same data are stored in more than one 
place or location.  104)  ____________ 
 
105) Data ________ describes a situation in which the same attribute of a data entity may have different values.  105)  
____________ 
 
106) Most DBMS have a specialized language called a ________ that is used to add, change, delete, and retrieve the 
data in the database. 106)  ____________ 
 
107) A ________ is software that permits an organization to centralize data, manage them efficiently, and provide access 
to the stored data by application programs.  107)  ____________ 
 
108) An ________ is a person, place, thing, or event about which we store and maintain  108)  ____________ 
 
109) A ________ is a subset of a data warehouse in which a summarized or highly focused portion of the organization’s 
data is placed in a separate database for a specific population of users.  109)  ____________ 
 
110) A ________ is a field in a record that uniquely identifies instances of that record so that it can be retrieved, updated, 
or sorted. 110)  ____________ 
 
111) The ________ operation creates a subset consisting of all records in the file that meet stated criteria.  111)  
____________ 
 
112) An ________ stores the data and procedures that act on those data as objects that can be automatically retrieved 
and shared.  112)  ____________ 
 
TRUE/FALSE.  Write 'T' if the statement is true and 'F' if the statement is false. 
113) A data dictionary is a language associated with a database management system that end users and programmers 
use to manipulate data in the database. 113) _____ 
 
114) Most DBMS have a specialized language called a data manipulation language that is used to add, change, delete, 
and retrieve the data in the database. 114) _____ 
 
115) . Rows are commonly referred to as records, or in technical terms, as tulips. 115) _____ 
 
116) Each characteristic or quality describing a particular entity is called an attribute. 116) _____ 
 
117) Data inconsistency, is where the same attribute may have different values.  117) _____ 
 
118) A group of bytes, called a bit, represents a single character, which can be a letter, a number, or another symbol.  
118) _____ 
 
119) A database management system (DBMS) is software that permits an organization to centralize data, manage them 
efficiently, and provide access to the stored data by application programs.  119) _____ 
 
120) A data warehouse is typically comprised of several smaller data marts. 120) _____ 
 
121) A DBMS reduces data redundancy and inconsistency by maximizing isolated files in which the same data are 
repeated.  121) _____ 
 
122) A group of related fields, such as a student’s name, the course taken, date, and grade, comprises a file. 122) _____ 
 
123) A grouping of characters into a word, a group of words, or a complete number is called a record. 123) _____ 
 
124) A group of records of the same type is called a file. 124) _____ 
 
125) An object­oriented DBMS stores the data and procedures that act on those data as objects that can be automatically 
retrieved and shared.  125) _____ 
 
126) Oracle Database Lite is a DBMS for small handheld computing devices. 126) _____ 
 
127) Microsoft Access is a relational DBMS for desktop systems. 127) _____ 
 
128) Predictive analysis is synonymous with data mining. 128) _____ 
 
129) Many applications today require databases that can store and retrieve multimedia. 129) _____ 
 
130) OLAP enables users to obtain online answers to ad hoc questions in a fairly rapid amount of time, except when the 
data are stored in very large databases. 130) _____ 
 
131) Data redundancy is the presence of duplicate data in multiple data files so that the same data are stored in more 
than one place or location.  131) _____ 
 
132) Common Gateway Interface is a specification for processing data on a Web server. 132) _____ 
 
133) DBMS designed for organizing structured data into rows and columns are not well suited to handling graphics­based 
or multimedia applications. 133) _____ 
 
134) The most prominent data manipulation language today is Structured Query Language (SQL). 134) _____ 
 
135) Microsoft SQL Server are relational DBMS for large mainframes and mid­range computers.  135) _____ 
 
136) Program­data dependence refers to the coupling of data stored in files and software programs that use this data 
such that changes in programs require changes to the data. 136) _____ 
 
137) A group of related files makes up a database. 137) _____ 
 
138) Each characteristic or quality describing a particular entity is called an attribute.  138) _____ 
 
139) OODBMS are slower than relational DBMS. 139) _____ 
 
140) Data administration is a special organizational function that manages the policies and procedures through which data
can be managed as an organizational resource. 140) _____ 
 
141) A DBMS separates the logical and physical views of the data. 141) _____ 
 
142) A bit represents the smallest unit of data a computer can handle. 142) _____ 
 
143) The use of a traditional approach to file processing encourages each functional area in a corporation to develop 
specialized applications.  143) _____ 
 
144) Program­data independence refers to the coupling of data stored in files and the specific programs required to 
update and maintain those files so that changes in programs require changes to the data.  144) _____ 
 
145) OLAP is a key tool of BI. 145) _____ 
 
146) A more rigorous definition of a database is a collection of data organized to serve many applications efficiently by 
centralizing the data and controlling redundant data.  146) _____ 
 
147) Data cleansing is the same process as data scrubbing. 147) _____ 
 
148) The select operation creates a subset consisting of columns in a table, permitting the user to create new tables that 
contain only the information required.  148) _____ 
 
149) A data warehouse may be updated by a legacy system. 149) _____ 
 
150) A Web interface requires changes to the internal database. 150) _____ 
 
151) One of the drawbacks to OODBMS are that they cannot work with applets. 151) _____ 
 
152) In a relational database, complex groupings of data must be streamlined to eliminate awkward many­to­many 
relationships. 152) _____ 
 
153) Every record in a file should contain at least one key field. 153) _____ 
 
154) Rows are commonly referred to as records, or in technical terms, as tulips. 154) _____ 
 
155) A traditional file system can deliver routine scheduled reports after extensive programming efforts, it can also deliver 
ad hoc reports or respond to unanticipated information requirements in a timely fashion.  155) _____ 
 
156) In a Web­based database, middleware is used to transfer information from the organization's internal database back 
to the Web server for delivery in the form of a Web page to the user. 156) _____ 
 
ESSAY.  Write your answer in the space provided or on a separate sheet of paper. 
157) Helen just wants to design and implement a DBMS in her organization.  She is very technical and has a great 
aptitude for this type of work.  Her outside consultant is telling her that she must make some management decisions about
information policy and data quality assurance because they are essential in managing the firm's resources.  How would 
you advise her and why? 
 
158) What types of relationships are possible in a relational database? Describe and give an example of each. 
 
159) Susan is putting in a new DBMS in her fashion design business.  She wants to do this right.  She has asked you to 
outline some important principles of database design.  How would you advise her and why? 
 
160) List and describe three main capabilities or tools of a DBMS. 
 
161) Describe the ways in which database technologies could be used by an office stationery supply company to achieve 
product differentiation. 
 
162) Identify and describe three basic operations used to extract useful sets of data from a relational database. 
 
163) Jill started a paint store 12 years ago.  She put in a traditional file system to meet her marketing needs when she 
started her business.  Two years later she put in a traditional file system to take care of accounting and operations.  Just 
three years ago they put in another system to handle marketing and CRM.  Jill is looking at installing another traditional 
file system this year to handle purchasing and SCM.  Jill has been reading that perhaps they should be using a DBMS 
instead of these individual traditional file systems.  How would you advise her and why? 
 
164) List at least three conditions that contribute to data redundancy and inconsistency. 
 
165) What are the differences between data mining and OLAP? When would you advise a company to use OLAP? 
 
166) What makes data mining an important business tool? What types of information does data mining produce? In what 
type of circumstance would you advise a company to use data mining? 
 
167) The small publishing company you work for wants to create a new database for storing information about all of their 
author contracts. What factors will influence how you design the database? 
 
168) When you design the new contracts database for the publishing house mentioned above, what fields do you 
anticipate needing? Which of these fields might be in use in other databases used by the company? 
 
169) Describe the ways in which database technologies could be used by an office stationery supply company to achieve 
low­cost leadership. 
 
1) D 
2) C 
3) A 
4) D 
5) D 
6) B 
7) C 
8) C 
9) B 
10) A 
11) A 
12) B 
13) D 
14) B 
15) A 
16) B 
17) C 
18) B 
19) C 
20) D 
21) D 
22) A 
23) C 
24) B 
25) C 
26) D 
27) D 
28) D 
29) D 
30) D 
31) D 
32) C 
33) D 
34) C 
35) A 
36) A 
37) C 
38) A 
39) A 
40) D 
41) C 
42) B 
43) B 
44) C 
45) B 
46) D 
47) B 
48) B 
49) D 
50) B 
51) C 
52) A 
53) C 
54) D 
55) B 
56) A 
57) D 
58) B 
59) D 
60) C 
61) D 
62) C 
63) C 
64) A 
65) Program­data dependence  
66) database 
67) Web mining 
68) desktop  
69) physical 
70) altered 
71) foreign key 
72)  record 
73) analytical  
74) join 
75) byte 
76) Information policies 
77) database 
78) data definition 
79) handheld  
80)  Data inconsistency 
81) normalization 
82) clustering 
83) entities 
84) distributed 
85) project  
86) Business intelligence 
87) data warehouse 
88) Structured Query Language 
89) bit  
90) one­to­one  
91) organizing 
92)  record 
93) relational  
94) report generation  
95) conceptual  
96) referential integrity 
97) application server 
98) data dictionary  
99) reduces  
100) related 
101) field 
102) traditional 
103) entity­relationship diagrams 
104) Data redundancy  
105) inconsistency 
106) data manipulation language  
107) database management system (DBMS) 
108) entity  
109) data mart  
110) key field  
111) select  
112) object­oriented DBMS  
113) FALSE 
114) TRUE 
115) FALSE 
116) TRUE 
117) TRUE 
118) FALSE 
119) TRUE 
120) FALSE 
121) FALSE 
122) FALSE 
123) FALSE 
124) TRUE 
125) TRUE 
126) TRUE 
127) TRUE 
128) FALSE 
129) TRUE 
130) FALSE 
131) TRUE 
132) TRUE 
133) TRUE 
134) TRUE 
135) TRUE 
136) TRUE 
137) TRUE 
138) TRUE 
139) TRUE 
140) TRUE 
141) TRUE 
142) TRUE 
143) TRUE 
144) FALSE 
145) TRUE 
146) TRUE 
147) TRUE 
148) FALSE 
149) TRUE 
150) FALSE 
151) FALSE 
152) TRUE 
153) TRUE 
154) FALSE 
155) FALSE 
156) TRUE 
157) Developing a database environment requires policies and procedures for managing organizational data as well as a 
good data model and database technology. A formal information policy governs the maintenance, distribution, and use of 
information in the organization. In large corporations, a formal data administration function is responsible for information 
policy, as well as for data planning, data dictionary development, and monitoring data usage in the firm.  Data that are 
inaccurate, incomplete, or inconsistent create serious operational and financial problems for businesses because they 
may create inaccuracies in product pricing, customer accounts, and inventory data, and lead to inaccurate decisions 
about the actions that should be taken by the firm. Firms must take special steps to make sure they have a high level of 
data quality. These include using enterprise­wide data standards, databases designed to minimize inconsistent and 
redundant data, data quality audits, and data cleansing software. 
158) A one­to­one relationship occurs when each record in one table has only one related record in a second table. An 
example might be a table of salespeople and a separate table of company cars. Each salesperson can only have one car,
or be related to the one car in the database.
A one­to­many relationship occurs when a record in one table has many related records in a second table. An 
example might be a table of salespeople and clients. Each salesperson may have several clients.
A many­to­many relationship occurs when records in one table have many related records in a second table, and 
the records in the second table have many related records in the first table. An example might be a clients table and a 
products table. Clients may buy more than one product, and products are sold to more than one client. 
159) Designing a database requires both a logical design and a physical design. The logical design models the database 
from a business perspective. The organization’s data model should reflect its key business processes and decision­
making requirements. The process of creating small, stable, flexible, and adaptive data structures from complex groups of
data when designing a relational database is termed normalization. A well­designed relational database will not have 
many­to­many relationships, and all attributes for a specific entity will apply only to that entity. It will try to enforce 
referential integrity rules to ensure that relationships between linked tables remain consistent. An entity­relationship 
diagram (ERD) graphically depicts the relationship between entities (tables) in a relational database. Database design 
also considers whether a complete database or portions of the database can be distributed to more than one location to 
increase responsiveness and reduce vulnerability and costs. There are two major types of distributed databases: 
replicated databases and partitioned databases. 
160) A  
d a t a  
d e f i n
i t i o n
c a p a b
i l i t y
t o  
s p e c i
f y  
t h e  
s t r u c
t u r e  
o f  
t h e  
c o n t e
n t   o f
t h e  
d a t a b
a s e .  
T h i s  
c a p a b
i l i t y
w o u l d
b e  
u s e d  
t o  
c r e a t
e  
d a t a b
A data dictionary to store definitions of data elements in the database and their characteristics. In large corporate 
databases, the data dictionary may capture additional information, such as usage; ownership; authorization; security; and 
the individuals, business functions, programs, and reports that use each data element.
A data manipulation language, such as SQL, that is used to add, change, delete, and retrieve the data in the 
database. This language contains commands that permit end users and programming specialists to extract data from the 
database to satisfy information requests and develop applications. 
161) Product databases could be made available to customers for greater convenience when ordering online. Databases 
could be used to track customer preferences and to help anticipate customer desires. Sales databases could also help a 
client anticipate when they would need to re­supply, providing an additional service. Data mining could help anticipate 
trends in sales or other factors to help determine new services and products to sell to the clients. 
162) The select operation creates a subset consisting of all records (rows) in the table that meets stated criteria. The join 
operation combines relational tables to provide the user with more information than is available in individual tables. The 
project operation creates a subset consisting of columns in a table, permitting the user to create new tables that contain 
only the information required. 
163) Traditional file management techniques make it difficult for organizations to keep track of all of the pieces of data 
they use in a systematic way and to organize these data so that they can be easily accessed. Different functional areas 
and groups were allowed to develop their own files independently. Over time, this traditional file management environment
creates problems such as data redundancy and inconsistency, program­data dependence, inflexibility, poor security, and 
lack of data sharing and availability. A database management system (DBMS) solves these problems with software that 
permits centralization of data and data management so that businesses have a single consistent source for all their data 
needs. Using a DBMS minimizes redundant and inconsistent files. 
164) Data redundancy occurs when different divisions, functional areas, and groups in an organization independently 
collect the same piece of information. Because it is collected and maintained in so many different places, the same data 
item may have: (1) different meanings in different parts of the organization, (2) different names may be used for the same 
item, and (3) different descriptions for the same condition. In addition, the fields into which the data is gathered may have 
different field names, different attributes, or different constraints. 
165) Data mining uncovers hidden relationships and is used when you are trying to discover data and new relationships. It
is used to answer questions such as: Are there any product sales that are related in time to other product sales?
In contrast, OLAP is used to analyze multiple dimensions of data and is used to find answers to complex, but 
known, questions, such as: What were sales of a product broken down by month and geographical region, and how did
those sales compare to sales forecasts? 
166) Data mining is one of the data analysis tools that helps users make better business decisions and is one of the key 
tools of business intelligence. Data mining allows users to analyze large amounts of data and find hidden relationships 
between data that otherwise would not be discovered. For example, data mining might find that a customer that buys 
product X is ten times more likely to buy product Y than other customers.
Data mining finds information such as:
• Associations or occurrences that are linked to a single event.
• Sequences, events that are linked over time.
• Classification, patterns that describe the group to which an item belongs, found by examining existing items that have 
been classified and by inferring a set of rules.
• Clusters, unclassified but related groups.
I would advise a company to use data mining when they are looking for new products and services, or when they are 
looking for new marketing techniques or new markets. Data mining might also be helpful when trying to analyze 
unanticipated problems with sales whose causes are difficult to identify. 
167) Student answers will vary, but should include some assessment of data quality; business processes and user needs;
and relationship to existing IT systems. Key points to include are:
Data accuracy when the new data is input, establishing a good data model, determining which data is important 
and anticipating what the possible uses for the data will be, beyond looking up contract information, technical difficulties 
linking this system to existing systems, new business processes for data input and handling, and contracts management, 
determining how end users will use the data, making data definitions consistent with other databases, what methods to 
use to cleanse the data.  
168) Author first name, author last name, author address, agent name and address, title of book, book ISBN, date of 
contract, amount of money, payment schedule, date contract ends.
Other databases might be an author database (author names, address, and agent details), a book title database 
(title and ISBN of book), and financial database (payments made). 
169) 
S a l e s
d a t a b
a s e s  
c o u l d
b e  
u s e d  
t o  
m a k e  
t h e  
s u p p l
y  
c h a i n
m o r e  
e f f i c
i e n t  
a n d  
m i n i m
i z e  
w a r e h
o u s i n
g   a n d
t r a n s
p o r t a
t i o n  
c o s t s
.   Y o u
c a n  
a l s o  
u s e  
s a l e s
d a t a b
a s e s  
t o  
d e t e r
m i n e  
w h a t  
s u p p l
i e s  
a r e  
i n  
d e m a
n d   b y
w h i c h
c u s t o
m e r s ,
a n d  
w h e t h
e r  
n e e d s
a r e  
d i f f e
r e n t  
i n  
d i f f e
r e n t  
g e o g r
a p h i c
a l  
a r e a s
.   D S S
d a t a b
a s e s  
u s i n g
b u s i n
e s s  
i n t e l
l i g e n
c e  
c o u l d
b e  
u s e d  
t o  
p r e d i
c t  
f u t u r
e  
t r e n d
s   i n  
o f f i c
e  
s u p p l
y  
n e e d s
,   t o  
h e l p  
a n t i c
i p a t e
d e m a
n d ,   a

You might also like