Professional Documents
Culture Documents
DoAnOLAP
DoAnOLAP
Đồ Án OLAP
IS217.K13.HTCL
Mục Lục
1 Mô tả dữ liệu.......................................................................................................................... 6
1.1. Nguồn dữ liệu.................................................................................................................. 6
1.2. ERD database OLTP ..................................................................................................... 6
1.3. Mô tả database OLTP .................................................................................................... 6
1.3.1. Bảng: Sales.Customer ............................................................................................. 6
1.3.2. Bảng: Sales.CustomerCategories........................................................................... 9
1.3.3. Bảng: Sales.Invoices.............................................................................................. 10
1.3.4. Bảng: Sales.Invoicelines ....................................................................................... 13
1.3.5. Bảng: Application.Cities....................................................................................... 14
1.3.6. Bảng: Application.Countries ............................................................................... 15
1.3.7. Bảng: Application.StateProvinces ....................................................................... 16
1.3.8. Bảng : Applicaion.People ..................................................................................... 17
1.3.9. Bảng: Warehouse. StockItems ............................................................................. 23
1.3.10. Bảng: Warehouse.PackageTypes ..................................................................... 25
1.3.11. Bảng: Warehouse.Colors .................................................................................. 26
2 Mô tả database database warehouse ................................................................................. 27
2.1. Diagram database warehouse ..................................................................................... 27
2.2. Bảng: DimCustomers ................................................................................................... 27
2.3. Bảng: DimDates ............................................................................................................ 28
2.4. Bảng: DimSalesPersons ............................................................................................... 28
2.5. Bảng: DimStockItems .................................................................................................. 28
2.6. Bảng: FactSale .............................................................................................................. 28
3 SSIS database warehouse ................................................................................................... 30
3.1. Mô hình SSIS ................................................................................................................ 30
3.1.1. Reset Database ...................................................................................................... 30
4 Sequence Container: Load Dimension Tables ................................................................. 32
4.1. Load DimCustomer ...................................................................................................... 32
4.1.1. ADO NET Source: Customer Data Source ........................................................ 32
4.1.2. Sort Transformation Editor: Customer Sort ..................................................... 34
4.1.3. ADO NET Source: Customer Category Source ................................................. 35
4.1.4. Sort Transformation Editor: Customer Sort ..................................................... 36
2
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
3
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
4
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
5
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
1 Mô tả dữ liệu
1.1. Nguồn dữ liệu
- Đây là một bộ dữ liệu mô tả về các quy trình sale của bán xe
đạp của một nhà máy
- Nguồn: https://github.com/Microsoft/sql-server-
samples/releases/tag/wide-world-importers-v1.0
(WideWorldImporters-Full.bak)
1.2. ERD database OLTP
Hình 1. Sơ đồ Diagram
6
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
7
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Liên kết:
Table Join Title/Name/Description
Sales.Customers.Buyin FK_Sales_Customers_BuyingGroupI
Sales.BuyingGro gGroupID = D_Sales_BuyingGroups
ups Sales.BuyingGroups.Bu Tham chiếu ràng buộc khóa ngoại
yingGroupID BuyingGroups.BuyingGroupID
Sales.Customers.Delive FK_Sales_Customers_DeliveryCityI
Application.Citie ryCityID = D_Application_Cities
s Application.Cities.CityITham chiếu ràng buộc khóa ngoại
D Cities.CityID
Sales.Customers.Postal FK_Sales_Customers_PostalCityID_
Application.Citie CityID = Application_Cities
s Application.Cities.CityITham chiếu ràng buộc khóa ngoại
D Cities.CityID
Sales.Customers.Custo FK_Sales_Customers_CustomerCate
merCategoryID = goryID_Sales_CustomerCategories
Sales.CustomerC
Sales.CustomerCategorie Tham chiếu ràng buộc khóa ngoại
ategories
s.CustomerCategoryID CustomerCategories.CustomerCateg
oryID
Sales.Customers.BillTo FK_Sales_Customers_BillToCustom
CustomerID = erID_Sales_Customers
Sales.Customers
Sales.Customers.Custo Tham chiếu ràng buộc khóa ngoại
merID Customers.CustomerID
Sales.Customers.Delive FK_Sales_Customers_DeliveryMeth
Application.Deli ryMethodID = odID_Application_DeliveryMethods
veryMethods Application.DeliveryMet Tham chiếu ràng buộc khóa ngoại
hods.DeliveryMethodID DeliveryMethods.DeliveryMethodID
Sales.Customers.Altern FK_Sales_Customers_AlternateCont
Application.Peop ateContactPersonID = actPersonID_Application_People
le Application.People.Pers Tham chiếu ràng buộc khóa ngoại
onID People.PersonID
Application.Peop Sales.Customers.LastEd FK_Sales_Customers_Application_P
le itedBy = eople
8
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
9
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Liên kết:
Table Join Title/Name/Description
Applicatio Sales.CustomerCategories. FK_Sales_CustomerCategories_Applicati
n.People LastEditedBy = on_People
Application.People.PersonI Tham chiếu ràng buộc khóa ngoại
D People.PersonID
Sales.Cust Sales.Customers.CustomerC FK_Sales_CustomerCategories_Applicati
omers ategoryID on_People
= Sales.CustomerCategori Tham chiếu ràng buộc khóa ngoại
es.CustomerCategoryID People.PersonID
Sales.Spe Sales.Customers.CustomerC FK_Sales_SpecialDeals_CustomerCateg
cialDeals ategoryID oryID_Sales_CustomerCategories
= Sales.CustomerCategori Tham chiếu ràng buộc khóa ngoại
es.CustomerCategoryID CustomerCategories.CustomerCategoryI
D
10
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
11
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Liên kết:
Table Join Title/Name/Description
Sales.Customers Sales.Invoices.Customer FK_Sales_Invoices_CustomerID_Sal
ID = es_Customers
Sales.Customers.Custom Tham chiếu ràng buộc khóa ngoại
erID Customers.CustomerID
Sales.Customers Sales.Invoices.BillToCu FK_Sales_Invoices_BillToCustomer
stomerID = ID_Sales_Customers
Sales.Customers.Custom Tham chiếu ràng buộc khóa ngoại
erID Customers.CustomerID
Application.Deliv Sales.Invoices.Delivery FK_Sales_Invoices_DeliveryMethod
eryMethods MethodID = ID_Application_DeliveryMethods
Application.DeliveryMet Tham chiếu ràng buộc khóa ngoại
hods.DeliveryMethodID DeliveryMethods.DeliveryMethodI
D
Sales.Orders Sales.Invoices.OrderID FK_Sales_Invoices_OrderID_Sales_
= Sales.Orders.OrderID Orders
Tham chiếu ràng buộc khóa ngoại
Orders.OrderID
Application.Peop Sales.Invoices.PackedBy FK_Sales_Invoices_PackedByPerson
le PersonID = ID_Application_People
Application.People.Perso Tham chiếu ràng buộc khóa ngoại
nID People.PersonID
Application.Peop Sales.Invoices.Salespers FK_Sales_Invoices_SalespersonPers
le onPersonID = onID_Application_People
Application.People.Perso Tham chiếu ràng buộc khóa ngoại
nID People.PersonID
Application.Peop Sales.Invoices.Accounts FK_Sales_Invoices_AccountsPerson
le PersonID = ID_Application_People
Application.People.Perso Tham chiếu ràng buộc khóa ngoại
nID People.PersonID
Application.Peop Sales.Invoices.LastEdite FK_Sales_Invoices_Application_Peo
le dBy = ple
Application.People.Perso Tham chiếu ràng buộc khóa ngoại
nID People.PersonID
Application.Peop Sales.Invoices.ContactPe FK_Sales_Invoices_ContactPersonI
le rsonID = D_Application_People
12
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
13
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Liên kết:
Table Join Title/Name/Description
Sales.Invoices Sales.InvoiceLines.Invo FK_Sales_InvoiceLines_InvoiceID_Sale
iceID = s_Invoices
Sales.Invoices.InvoiceI Tham chiếu ràng buộc khóa ngoại
D Invoices.InvoiceID
Warehouse.Pa Sales.InvoiceLines.Pac FK_Sales_InvoiceLines_PackageTypeI
ckageTypes kageTypeID = D_Warehouse_PackageTypes
Warehouse.PackageTyp Tham chiếu ràng buộc khóa ngoại
es.PackageTypeID PackageTypes.PackageTypeID
Application.Pe Sales.InvoiceLines.Last FK_Sales_InvoiceLines_Application_Pe
ople EditedBy = ople
Application.People.Pers Tham chiếu ràng buộc khóa ngoại
onID People.PersonID
Warehouse.Sto Sales.InvoiceLines.Stoc FK_Sales_InvoiceLines_StockItemID_
ckItems kItemID = Warehouse_StockItems
Warehouse.StockItems. Tham chiếu ràng buộc khóa ngoại
StockItemID StockItems.StockItemID
14
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
15
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
16
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
17
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
18
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Sales.Invoices.Acco FK_Sales_Invoices_AccountsPersonID_A
untsPersonID pplication_People
Sales.Invoices
= Application.Peop Tham chiếu ràng buộc khóa ngoại
le.PersonID People.PersonID
Sales.Invoices.LastEdit FK_Sales_Invoices_Application_People
edBy Tham chiếu ràng buộc khóa ngoại
Sales.Invoices
= Application.People People.PersonID
.PersonID
19
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
FK_Sales_Invoices_ContactPersonID_Ap
Sales.Invoices.Cont plication_People
actPersonID Tham chiếu ràng buộc khóa ngoại
Sales.Invoices
= Application.Peop People.PersonID
le.PersonID
FK_Sales_Invoices_PackedByPersonID_
Sales.Invoices.Pack Application_People
edByPersonID Tham chiếu ràng buộc khóa ngoại
Sales.Invoices
= Application.Peop People.PersonID
le.PersonID
FK_Sales_Invoices_SalespersonPersonID
Sales.Invoices.Sales _Application_People
personPersonID Tham chiếu ràng buộc khóa ngoại
Sales.Invoices
= Application.Peop People.PersonID
le.PersonID
Sales.OrderLines.La FK_Sales_OrderLines_Application_Peopl
stEditedBy e
Sales.OrderLines
= Application.Peop Tham chiếu ràng buộc khóa ngoại
le.PersonID People.PersonID
Sales.Orders.LastEd FK_Sales_Orders_Application_People
itedBy Tham chiếu ràng buộc khóa ngoại
Sales.Orders
= Application.Peop People.PersonID
le.PersonID
Sales.Orders.Contac FK_Sales_Orders_ContactPersonID_Appl
tPersonID ication_People
Sales.Orders
= Application.Peop Tham chiếu ràng buộc khóa ngoại
le.PersonID People.PersonID
Sales.Orders.Picked FK_Sales_Orders_PickedByPersonID_Ap
ByPersonID plication_People
Sales.Orders
= Application.Peop Tham chiếu ràng buộc khóa ngoại
le.PersonID People.PersonID
Sales.Orders.Salesp FK_Sales_Orders_SalespersonPersonID_
ersonPersonID Application_People
Sales.Orders
= Application.Peop Tham chiếu ràng buộc khóa ngoại
le.PersonID People.PersonID
Warehouse.Package FK_Warehouse_PackageTypes_Applicati
Warehouse.Pack Types.LastEditedBy on_People
ageTypes = Application.Peop Tham chiếu ràng buộc khóa ngoại
le.PersonID People.PersonID
Application.Paymen FK_Application_PaymentMethods_Applic
Application.Pay
tMethods.LastEdite ation_People
mentMethods
dBy
20
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
21
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Warehouse.StockIte FK_Warehouse_StockItemTransactions_A
Warehouse.Stoc mTransactions.Last pplication_People
kItemTransactio EditedBy Tham chiếu ràng buộc khóa ngoại
ns = Application.Peop People.PersonID
le.PersonID
Purchasing.Supplier FK_Purchasing_SupplierCategories_Appli
Categories.LastEdit cation_People
Purchasing.Supp
edBy Tham chiếu ràng buộc khóa ngoại
lierCategories
= Application.Peop People.PersonID
le.PersonID
Purchasing.Supplier FK_Purchasing_Suppliers_AlternateConta
s.AlternateContactP ctPersonID_Application_People
Purchasing.Supp
ersonID Tham chiếu ràng buộc khóa ngoại
liers
= Application.Peop People.PersonID
le.PersonID
Purchasing.Supplier FK_Purchasing_Suppliers_Application_Pe
Purchasing.Supp s.LastEditedBy ople
liers = Application.Peop Tham chiếu ràng buộc khóa ngoại
le.PersonID People.PersonID
Purchasing.Supplier FK_Purchasing_Suppliers_PrimaryContac
s.PrimaryContactPe tPersonID_Application_People
Purchasing.Supp
rsonID Tham chiếu ràng buộc khóa ngoại
liers
= Application.Peop People.PersonID
le.PersonID
Purchasing.Supplier FK_Purchasing_SupplierTransactions_Ap
Transactions.LastEd plication_People
Purchasing.Supp
itedBy Tham chiếu ràng buộc khóa ngoại
lierTransactions
= Application.Peop People.PersonID
le.PersonID
Application.System FK_Application_SystemParameters_Appli
Parameters.LastEdit cation_People
Application.Syst
edBy Tham chiếu ràng buộc khóa ngoại
emParameters
= Application.Peop People.PersonID
le.PersonID
Application.Transac FK_Application_TransactionTypes_Appli
tionTypes.LastEdite cation_People
Application.Tran
dBy Tham chiếu ràng buộc khóa ngoại
sactionTypes
= Application.Peop People.PersonID
le.PersonID
22
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
23
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Warehouse.PackageT FK_Warehouse_StockItems_ColorID_
Warehouse.Colo ypes.LastEditedBy = Warehouse_Colors
rs Application.People.Pers Foreign key constraint referencing
onID Colors.ColorID
Sales.InvoiceLines.Pac FK_Warehouse_StockItems_OuterPac
Warehouse.Pack kageTypeID = kageID_Warehouse_PackageTypes
ageTypes Warehouse.PackageT Foreign key constraint referencing
ypes.PackageTypeID PackageTypes.PackageTypeID
Sales.OrderLines.Packa FK_Warehouse_StockItems_UnitPacka
Warehouse.Pack geTypeID = geID_Warehouse_PackageTypes
ageTypes Warehouse.PackageT Foreign key constraint referencing
ypes.PackageTypeID PackageTypes.PackageTypeID
Purchasing.PurchaseOr FK_Warehouse_StockItems_Applicati
derLines.PackageTypeI on_People
Application.Peop
D Foreign key constraint referencing
le
= Warehouse.Package People.PersonID
Types.PackageTypeID
Warehouse.StockItems. FK_Warehouse_StockItems_SupplierI
Purchasing.Supp OuterPackageID = D_Purchasing_Suppliers
liers Warehouse.PackageT Foreign key constraint referencing
ypes.PackageTypeID Suppliers.SupplierID
Warehouse.StockItems. FK_Sales_InvoiceLines_StockItemID_
Sales.InvoiceLin UnitPackageID = Warehouse_StockItems
es Warehouse.PackageT Foreign key constraint referencing
ypes.PackageTypeID StockItems.StockItemID
Sales.OrderLines.Stock FK_Sales_OrderLines_StockItemID_
ItemID Warehouse_StockItems
Sales.OrderLines
= Warehouse.StockIte Foreign key constraint referencing
ms.StockItemID StockItems.StockItemID
Purchasing.PurchaseOr FK_Purchasing_PurchaseOrderLines_S
Purchasing.Purc derLines.StockItemID tockItemID_Warehouse_StockItems
haseOrderLines = Warehouse.StockIte Foreign key constraint referencing
ms.StockItemID StockItems.StockItemID
Sales.SpecialDeals.Stoc FK_Sales_SpecialDeals_StockItemID_
Sales.SpecialDea kItemID Warehouse_StockItems
ls = Warehouse.StockIte Foreign key constraint referencing
ms.StockItemID StockItems.StockItemID
Warehouse.StockItemH FK_Warehouse_StockItemHoldings_St
Warehouse.Stoc oldings.StockItemID ockItemID_Warehouse_StockItems
kItemHoldings = Warehouse.StockIte Foreign key constraint referencing
ms.StockItemID StockItems.StockItemID
Warehouse.Stoc Warehouse.StockItemS FK_Warehouse_StockItemStockGroup
kItemStockGrou tockGroups.StockItemI s_StockItemID_Warehouse_StockItem
ps D s
24
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
25
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
= Warehouse.Package
Types.PackageTypeID
Warehouse.StockItems. FK_Warehouse_StockItems_OuterPacka
Warehouse.Sto OuterPackageID = geID_Warehouse_PackageTypes
ckItems Warehouse.PackageT Tham chiếu ràng buộc khóa ngoại
ypes.PackageTypeID PackageTypes.PackageTypeID
Warehouse.StockItems. FK_Warehouse_StockItems_UnitPackag
Warehouse.Sto UnitPackageID = eID_Warehouse_PackageTypes
ckItems Warehouse.PackageT Tham chiếu ràng buộc khóa ngoại
ypes.PackageTypeID PackageTypes.PackageTypeID
Liên kết:
Table Join Title/Name/Description
Warehouse.Colors.La FK_Warehouse_Colors_Application_Pe
Application.Pe stEditedBy = ople
ople Application.People.Per Tham chiếu ràng buộc khóa ngoại
sonID People.PersonID
Warehouse.StockItems. FK_Warehouse_StockItems_ColorID_
Warehouse.Sto ColorID = Warehouse_Colors
ckItems Warehouse.Colors.Co Tham chiếu ràng buộc khóa ngoại
lorID Colors.ColorID
26
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
ColorID PK_Warehouse_Colors
(Khóa chính)
ColorName UQ_Warehouse_Colors_ColorName
(Khóa độc nhất)
Hình 2. Sơ đồ Diagram DW
27
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Liên kết:
Table Join Title/Name/Description
FactSale. FK_FactSale_DimCustomer_CustomerKey
CustomerKey = Tham chiếu ràng buộc khóa ngoại
DimCustomers
DimCustomer. DimCustomers.CustomerKey.
CustomerKey
FactSale. FK_FactSale_DimCustomer_CustomerKey
ProductKey = Tham chiếu ràng buộc khóa ngoại
DimProducts
DimCustomer. DimProducts.ProductKey.
ProductKey
FactSale. FK_FactSale_DimDates _OrderDateKey _
OrderDateKey = CalendarDateKey
DimDates DimDates. Tham chiếu ràng buộc khóa ngoại
CalendarDateKey DimDates.CalendarDateKey cho
OrderDateKey.
FactSale. FK_FactSale_DimDates
ShipDateKey = _ShipDateKey_CalendarDateKey
DimDates DimDates. Tham chiếu ràng buộc khóa ngoại
CalendarDateKey DimDates.CalendarDateKey cho
ShipDateKey.
29
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
30
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
31
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
32
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
33
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
34
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
35
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
36
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
37
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
38
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
39
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
40
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
41
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
43
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
45
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
47
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
48
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
49
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
50
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
o Customer&City&StateProvince.DeliveryCity(output:
DeliveryCity)
o Customer&City&StateProvinces.DeliveryStateProvice(ou
tput: DeliveryStateProvice)
o Country.CountryName(output: CountryName)
4.1.18. Sort Transformation Editor: Customer & City &
StateProvince & Country Sort
51
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
52
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
53
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
54
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
55
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
56
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
57
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
58
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
59
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
60
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
61
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
62
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
63
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
64
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
4.3. DimSalesPersons
66
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
67
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
- Chọn column:
o PersonID
4.3.4. ADO NET Destination: Load DimSalesPersons
68
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
69
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
-- Lấy ra ngày bắt đầu của năm nhỏ nhất trong OrderDate
Select @StartDate = '01-01-' + Cast(Year(Min(InvoiceDate)) as nvarchar(50))
From WideWorldImporters.Sales.Invoices;
-- Lấy ra ngày cuối cùng của năm lớn nhất trong OrderDate
Select @EndDate = '12-31-' + Cast(Year(Max(InvoiceDate)) as nvarchar(50))
From WideWorldImporters.Sales.Invoices;
70
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
71
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
4.5. FactSales
72
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
73
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
74
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
75
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
76
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
77
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
78
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
80
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
81
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
82
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
83
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
85
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
86
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
87
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
89
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
90
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
91
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
92
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
93
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
94
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
95
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
96
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
97
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
98
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
- Sales&StockItems&SalesPerson&Customer. TaxAmount
(output: TaxAmount)
- Sales&StockItems&SalesPerson&Customer. LineProfit (output:
LineProfit)
- Sales&StockItems&SalesPerson&Customer. InvoiceDate
(output: InvoiceDate)
- Sales&StockItems&SalesPerson&Customer. StockItemKey
(output: StockItemKey)
- Sales&StockItems&SalesPerson&Customer. SalesPersonKey
(output: SalesPersonKey)
- Sales&StockItems&SalesPerson&Customer. CustomerKey
(output: CustomerKey)
- DimDates. InvoiceDateKey(output: InvoiceDateKey)
4.5.22. SortTransformation: Sort
99
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
100
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
101
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
5 SSAS
5.1. Tạo project mới
- Mở Visual Studios
- Chọn File -> New -> Project
- Chọn Analysis Services Multidimensional and Data Mining Project
102
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
103
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
104
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
105
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
107
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
108
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
109
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
5.5.1. DimDate
- Chọn Use an existing table
110
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
- Chọn những thuộc tính muốn add và đổi tên theo ý muốn
111
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
112
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
113
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
114
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
115
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
- Chọn những thuộc tính muốn add và đổi tên theo ý muốn
116
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
117
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
5.7. Chỉnh sửa lại các thuộc tính của các bảng Dim
5.7.1. DimSalesPerson
- Sửa tên của bảng trong Properties thuộc tính Name
118
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
- Ở đây thuộc tính NameColumn là none nên dữ liệu sẽ được sắp xếp theo
mặc định là khóa chính của bảng
119
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
- Để thay đổi qua cột muốn hiện lên khi sắp xếp ta chọn cột cho thuộc tính
NameColumn, ở đây mình chọn cột SalesPersonName
120
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
121
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
5.7.2. DimCustomers
- Tương tự DimSalesPerson
- Di chuyển các thuộc tính đưa vào sắp xếp
122
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
123
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
124
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
125
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
126
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
127
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
128
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
129
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
- Tại file .dsv t thêm New Named Calculation cho bảng DimDate
130
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
131
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
132
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
133
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
134
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
- tab Browser chọn biểu tượng trên thanh tool bar có hình Excel
135
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
136
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
137
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
- Chỉnh các kiểu dữ liệu lại ở tab Format String trong Properties
o Với Quantity chỉnh thành #,# (có ngăn cách dấu phẩy ở đơn vị)
o Với Unit Price, Tax Amount, Line Profit, Extended Price chỉnh
thành Currency
138
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
139
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
140
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
141
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Hình 2. Kết quả truy vấn của Hình 1 thực hiện trên SSMS
Hình 3 Tạo Name Sets tương ứng với câu truy vấn của Hình 1
142
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Hình 5. Kết quả truy vấn của Hình 1 trên Pivot Excel
6.2. Câu 2:
- Mô tả bằng ngôn ngữ tự nhiên: Truy vấn ra những tiểu bang có chữ cái đầu là “C” và sắp
xếp tăng dần theo tổng giá [Extended Price].
143
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
144
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
145
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Hình 10. Kết quả truy vấn của Hình 6 trên Pivot Excel
6.3. Câu 3:
- Mô tả bằng ngôn ngữ tự nhiên: Trong mỗi quý năm 2016 truy vấn ra 5 thành phố có
nhiều hoá đơn mua hàng nhất.
146
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Hình 12. Kết quả truy vấn của Hình 11 trên SSMS
Hình 13. Tạo Name Sets của câu truy vấn Hình 11
147
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Hình 14. Kết quả truy vấn của Hình 11 trên VS Studio
Hình 15. Kết quả truy vấn của Hình 11 trên Pivot Excel
6.4. Câu 4:
- Mô tả bằng ngôn ngữ tự nhiên: Trong bộ dữ liệu gồm các tiểu bang Alabama, California,
Hawaii, Iowa. Truy vấn drill down tiểu bang Iowa và sắp xếp tất cả theo thứ tự giảm dần
của giá chưa tính thuế [Unit Price] trong năm 2016.
148
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Hình 17. Kết quả truy vấn của Hình 16 trên SSMS
149
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Hình 18. Tạo Name Sets của câu truy vấn Hình 16
Hình 19. Kết quả truy vấn của Hình 16 trên VS Studio
150
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Hình 20. Kết quả truy vấn của Hình 16 trên Pivot Excel
6.5. Câu 5:
- Mô tả bằng ngôn ngữ tự nhiên: Trong mỗi tiểu bang, truy vấn ra 5 thành phố trả số tiền
thuế [Tax Amount] khi mua những sản phẩm có loại đóng gói là [Packet] theo thứ tự
giảm dần.
151
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Hình 22. Kết quả truy vấn của Hình 21 trên SSMS
Hình 23. Tạo Name Sets của câu truy vấn Hình 21
152
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Hình 24. Kết quả truy vấn của Hình 21 trên VS Studio
Hình 25. Kết quả truy vấn của Hình 21 trên Pivot Excel
6.6. Câu 6:
- Mô tả bằng ngôn ngữ tự nhiên: Truy vấn ra những khách hàng vừa mua sản phẩm [Dim
Stock Items].[Stock Item].&[1] và vừa mua sản phẩm [Dim Stock Items].[Stock
Item].&[3], và mua mỗi sản phẩm từ 30 cái trở lên.
153
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Hình 27. Kết quả truy vấn của Hình 26 trên SSMS
154
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Hình 28. Tạo Name Sets của câu truy vấn Hình 26
Hình 29. Kết quả truy vấn của Hình 26 trên VS Studio
155
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Hình 30. Kết quả truy vấn của Hình 26 trên Pivot Excel
6.7. Câu 7:
- Mô tả bằng ngôn ngữ tự nhiên: Trong tháng 1, 2 ,3 của quý 1 của mỗi năm truy vấn ra 5
tiểu bang có số hoá đơn [InvoiceDistinct Count] giảm dần.
156
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Hình 32. Kết quả truy vấn của Hình 31 trên SSMS
Hình 33. Tạo Name Sets của câu truy vấn Hình 31
157
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Hình 34. Kết quả truy vấn của Hình 31 trên VS Studio
Hình 35. Kết quả truy vấn Hình 31 trên Pivot Excel
6.8. Câu 8:
- Mô tả bằng ngôn ngữ tự nhiên: Sử dụng member [Extend Price Prev] là tổng giá của quý
trước, [Extend Price Diff] là tổng giá của quý hiện tại [Extended Price] trừ đi tổng giá của
quý trước [Extend Price Prev]. Truy vấn tổng giá của quý hiện tại, tổng giá của quý trước
đó và so sánh tổng giá của 2 quý này.
158
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Hình 37. Kết quả truy vấn của Hình 36 trên SSMS
159
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Hình 38 Tạo Calculated Member [Extend Price Prev] của truy vấn Hình 36
Hình 39. Tạo Calculated Member [Extend Price Diff] của truy vấn Hình 36
160
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Hình 41. Kết quả truy vấn của Hình 36 trên Pivot Excel
6.9. Câu 9:
- Mô tả bằng ngôn ngữ tự nhiên: Truy vấn ra những tiểu bang vừa mua sản phẩm [Top
Quantity Item 2015] và vừa mua sản phẩm [Top Quantity Item 2016].
- Với Set [Top Quantity Item 2015] là sản phẩm được bán ra nhiều nhất trong năm 2015.
- Với Set [Top Quantity Item 2016] là sản phẩm được bán ra nhiều nhất trong năm 2016.
161
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
- Member [Quantity of Top 1 Quanity Item in 2015] là số lượng đã mua sản phẩm [Top
Quantity Item 2015] trong năm 2015.
- Member [Quantity of Top 1 Quanity Item in 2016] là số lượng đã mua sản phẩm [Top
Quantity Item 2016] trong năm 2016.
Hình 43. Kết quả truy vấn của Hình 42 trên SSMS
162
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
163
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Hình 46. Tạo Calculated Member [Quantity of Top 1 Quanity Item in 2015]
Hình 47. Tạo Calculated Member [Quantity of Top 1 Quanity Item in 2016]
164
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Hình 48. Tạo Names Sets của câu truy vấn Hình 42
Hình 49. Kết quả truy vấn của Hình 42 trên VS Studio
165
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Hình 50. Kết quả truy vấn của Hình 42 trên Pivot Excel
166
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
167
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Hình 53. Tạo Name Set [Top 25 Percent Extended Price Item in 2014]
Hình 54. Tạo Calculated Member [Extended Price of Each Item in Top 25 Percent Extended Price Item in 2014]
168
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Hình 56. Kết quả truy vấn của Hình 51 trên VS Studio
169
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
Hình 57. Kết quả truy vấn của Hình 51 trên Pivot Excel
7 SSRS
7.1. Tạo project SSRS và thêm data source, dataset
• Tạo project SSRS trên Visual Sudio
170
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
171
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
172
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
• Kéo thả các thuộc tính mà đã truy vấn trên dataset vào bảng.
173
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
• Kéo thuộc tính State Province và Stock Item vào Row Groups
• State Province -> Stock Item -> Details
174
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
175
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
• Chuột phải vào cột Stock Item Add Total -> chọn After, đặt tên cho group là State
Province Total
176
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
• Tương tự them vào Grand Total bằng cách chuột phải vào cột State Province chọn
add total -> after
177
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
178
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
• Tiếp theo ta sẽ thêm bảng và kéo thả các dữ liệu cần thiết và thêm grouping và total
• Xem preview và kiểm tra dữ liệu đã hiển thị đúng theo grouping và total hay chưa
179
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
180
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
• Sau khi deploy thành công thì nhập vào đường link để mở report trực tiếp trên server
181
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
8 Data Mining
8.1. Mô tả về dataset dùng để mining.
- Tên dataset : Cardiovascular Disease (Dữ liệu về bệnh tim mạch)
- Link: https://www.kaggle.com/sulianova/cardiovascular-disease-dataset
182
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
183
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
- Excel Source kết nối tới file Excel chứa dataset ban đầu
184
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
185
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
186
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
187
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
- Chọn thuật toán để mining là Microsoft Decision Trees (Thuật toán cây
quyết định).
188
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
- Chọn thuộc tính key là ID, và thuộc tính Predict (dự đoán) là Cardio (tình
trạng có bị bệnh tim hay không).
189
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
190
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
- Chọn 30% bộ dữ liệu để test và 70% dữ liệu để train, số lượng case tối đa để
test là 1000.
191
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
192
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
193
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
194
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
195
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
o Với những người bị bệnh tim có tỷ lệ cao 83.54% là những bệnh nhân
có độ tuổi trên hoặc bằng 61 và có tỉ lệ cholesterol trong máu rất cao.
o Với những người bị bệnh tim có tỷ lệ cao 80.41% là những bệnh nhân
có độ tuổi trên hoặc bằng 53 và nhỏ hơn 57. Có tỉ lệ cholesterol trong
máu rất cao và tỉ lệ Glucose trong máu không phải rất cao.
196
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
o Với những người bị bệnh tim có tỷ lệ cao 79.45% là những bệnh nhân
có độ tuổi trên hoặc bằng 45 và nhỏ hơn 53. Có tỉ lệ cholesterol trong
máu rất cao, tỉ lệ Glucose trong máu rất cao và nặng hơn 85 kg.
197
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
198
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
199
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
200
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
201
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
o Đổi tên Cluster đậm màu nhất thành High (Khả năng bị bệnh tim cao
nhất)
o Đổi tên Cluster nhạt màu nhất thành Low (Khả năng bị bệnh tim thấp
nhất)
o Với Cluster Profiles của Cluster High cho ta thấy tập lục của những
bệnh nhân bị bênh tim chiếm 83.9%
o Tập lục: Những bệnh nhân có huyết áp tâm trương (Ap_lo) bằng 100,
có huyết áp tâm thu (Ap_hi) lớn hơn 124 và nhỏ hơn 184, Cholesterol
trong máu cao hoặc rất cao, Glucose trong máu cao hoặc rất cao, giới
tính là nam, có uống rượu (Alco), độ tuổi trong khoảng 42 đến 64, có
hút thuốc (Smoke), không tập thể dục (Active), có cân nặng trên 114
kg, chiều cao trên 181 cm.
202
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
o Với Cluster Profiles của Cluster Low cho ta thấy tập lục của những
bệnh nhân không bị bênh tim chiếm 78.2%
o Tập lục: Những bệnh nhân có huyết áp tâm trương (Ap_lo) từ 63 đến
83, có huyết áp tâm thu (Ap_hi) bằng 110, Cholesterol trong máu bình
thường, Glucose trong máu bình thường, giới tính là nữ, không uống
rượu (Alco), độ tuổi trong khoảng 36 đến 64 , không hút thuốc
(Smoke), có tập thể dục (Active), có cân nặng từ 47 đến 87 kg, chiều
cao từ 149 đến 176 cm.
203
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
o Cluster Discrimination của thuật toán cho ta thấy sự tương quan giữa
2 cluster High và Low.
204
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
205
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
o Những bệnh nhân có cholesterol bình thường thì khả năng cao sẽ
không bị bệnh tim mạch.
o Những bệnh nhân có cholesterol rất cao thì khả năng cao sẽ bị bệnh
tim mạch.
206
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
o Những bệnh nhân có glucose bình thường thì khả năng cao sẽ không
bị bệnh tim mạch.
8.5. Đánh giá các thuật toán bằng Mining Accuracy Chart
- Thiết lập thông số Input Selection với các bệnh nhân bị bệnh tim mạch
207
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
- Line chart cho ta thấy tỷ lệ chính xác của 3 thuật toán khi mining trường hợp
bệnh nhân bị bệnh tim.
o Microsoft Decision Tree: 0.8 Score.
o Microsoft Clustering: 0.83 Score.
o Microsoft Naive Bayes: 0.77 Score.
- Thiết lập thông số Input Selection với các bệnh nhân không bị bệnh tim
mạch
208
Kho dữ liệu và OLAP Dương Quốc Cường 17520304
IS217.K13.HTCL Mạc Huy Tú 17521196
- Line chart cho ta thấy tỷ lệ chính xác của 3 thuật toán khi mining trường hợp
bệnh nhân không bị bệnh tim.
o Microsoft Decision Tree: 0.8 Score.
o Microsoft Clustering: 0.84 Score.
o Microsoft Naive Bayes: 0.77 Score.
209