Ra quyết định với thông tin không chắc chắn bằng Cây quyết định

Ra quyết định với thông tin không chắc chắn
bằng việc ứng dụng mô hình cây quyết định
Vũ Thị Phương Thảo
Trường Đại học Công nghệ

Luận văn Thạc sĩ ngành: Hệ thông thông tin; Mã số: 60 48 05
Người hướng dẫn: PGS. TS. Đỗ Văn Thành
Năm bảo vệ: 2011
Abstract: Tổng quan về mô hình cây quyết định và thông tin không chắc chắn, giới
thiệu khái niệm về cây quyết định, phân loại cây quyết định, ưu nhược điểm của cây
quyết định trong việc giải quyết bài toán về phân loại, ra quyết định và phương pháp
xây dựng cây quyết định. Trình bày khái niệm, phân loại, cách biểu diễn và ứng dụng
của thông tin không chắc chắn. Phân tích những công cụ hỗ trợ xây dựng mô hình cây
quyết định và lập kế hoạch sản xuất kinh doanh doanh nghiệp, trình bày tóm lược nội
dung và quá trình ra quyết định với thông tin không chắc chắn; giới thiệu
PrecisionTree 5.7, là công cụ để xây dựng cây quyết định nhằm xử lý thông tin không
chắc chắn, hỗ trợ quá trình ra quyết định trong việc lập kế hoạch. Ra quyết định với
thông tin không chắc chắn trong lập kế hoạch sản xuất kinh doanh của doanh nghiệp,
ứng dụng mô hình cây quyết định trong lập kế hoạch sản xuất kinh doanh dựa trên tập
dữ liệu giả định và trên tập dữ liệu thực tế được thu thập từ Công ty cổ phần May
Thăng Long.
Keywords: Công nghệ thông tin; Hệ thống thông tin; Mô hình cây quyết định
Content
MỞ ĐẦU
Lập kế hoạch phát triển sản xuất kinh doanh là một trong những hoạt động rất quan
trọng của doanh nghiệp. Thực tiễn cho thấy trong bối cảnh hoạt động của nền kinh tế thị
trường có sự hội nhập kinh tế toàn cầu ngày càng sâu rộng, cạnh tranh ngày càng sâu sắc như
ở nước ta hiện nay thì việc lập kế hoạch sản xuất kinh doanh doanh nghiệp càng trở lên quan
trọng và trở thành yếu tố có ý nghĩa quyết định đến sự thành công hay thất bại của doanh
nghiệp.
Để nâng cao chất lượng kế hoạch sản xuất kinh doanh doanh nghiệp điều quan trọng là
doanh nghiệp cần nắm bắt đầy đủ, kịp thời và xử lý, khai thác có hiệu quả các thông tin liên
quan đến hoạt động sản xuất kinh doanh của doanh nghiệp, đến thị trường tiêu thụ sản phẩm
hàng hoá và dịch vụ do doanh nghiệp tạo ra.
Quá trình toàn cầu hoá và thông tin hoá diễn ra mạnh mẽ đã làm công tác lập kế hoạch
phát triển sản xuất kinh doanh doanh nghiệp ngày càng phức tạp. Trong quá trình lập kế
hoạch, các doanh nghiệp phải xử lý một số lượng rất lớn thông tin, trong số đó có nhiều thông
tin được biết không chắc chắn, để rút ra những tri thức mới và ra quyết định từ những tri thức
này. Như vậy ngày càng có nhiều thông tin với tốc độ thay đổi rất nhanh để trợ giúp việc ra
quyết định và ngày càng có nhiều câu hỏi mang tính chất định tính cần phải trả lời dựa trên
một khối lượng dữ liệu khổng lồ đã có, đặc biệt trong đó có nhiều dữ liệu không chắc chắn.
Các phương pháp quản trị và khai thác, phân tích dữ liệu truyền thống đã không đáp
ứng được thực tế bùng nổ của thông tin và dữ liệu, đòi hỏi phải có phương pháp, kỹ thuật mới
để tổng hợp, lưu trữ, xử lý và khai thác thông tin, dữ liệu. Lĩnh vực phát hiện tri thức từ các
cơ sở dữ liệu đã được hình thành, trong đó khai phá dữ liệu (data mining) được xem là trung
tâm của lĩnh vực nghiên cứu và ứng dụng này.
Hiện tại, người ta đã xây dựng được khá nhiều kỹ thuật khai phá dữ liệu như phân cụm
phân lớp dữ liệu, mạng nơtron, giải thuật di truyền, luật kết hợp, mạng Bayes, ....Trong các kỹ
thuật này cây quyết định được coi là công cụ mạnh và phổ biến nhất, nó đặc biệt thích hợp cho
những vấn đề khai phá dữ liệu nhằm hỗ trợ quá trình ra quyết định.
Cây quyết định thực chất là công cụ hỗ trợ quyết định, có thể biểu diễn dữ liệu phức
tạp theo một cấu trúc đơn giản hơn rất nhiều dưới dạng cây. Cây quyết định cũng có thể được
sử dụng để xử lý thông tin không chắc chắn.
Luận văn này nằm trong hướng khảo cứu, ứng dụng cây quyết định trong việc xử lý
thông tin không chắc chắn nhằm rút ra tri thức mới, phục vụ ra quyết định trong quá trình lập
kế hoạch phát triển sản xuất kinh doanh của doanh nghiệp.
Không kể các phần mở đầu, kết luận, mục lục, danh mục bảng, hình và tài liệu tham
khảo, luận văn gồm 3 chương nội dung chính, trong đó:
Chƣơng 1: Tổng quan về mô hình cây quyết định và thông tin không chắc chắn sẽ
giới thiệu một số khái niệm và vấn đề chung nhất về những vấn đề này. Cụ thể Chương I sẽ
giới thiệu khái niệm về cây quyết định, phân loại cây quyết định, ưu nhược điểm của cây
quyết định trong việc giải quyết bài toán về phân loại, ra quyết định và phương pháp xây dựng
cây quyết định. Chương 1 cũng giới thiệu khái niệm, phân loại, cách biểu diễn và ứng dụng
của thông tin không chắc chắn. Đó là những kiến thức cơ bản nhất, làm cơ sở để tìm khảo cứu
và ứng dụng mô hình cây quyết định trong việc xử lý thông tin không chắc chắn nhằm hỗ trợ
quá trình lập kế hoạch phát triển sản xuất kinh doanh doanh nghiệp ở các chương tiếp sau.
Chƣơng 2: Công cụ hỗ trợ xây dựng mô hình cây quyết định và lập kế hoạch sản xuất
kinh doanh doanh nghiệp sẽ trình bầy tóm lược nội dung và quá trình ra quyết định với thông
tin không chắc chắn; giới thiệu PrecisionTree 5.7, là công cụ được luận văn sử dụng để xây
dựng cây quyết định nhằm xử lý thông tin không chắc chắn, hỗ trợ quá trình ra quyết định
trong việc lập kế hoạch. Chương này cũng trình bày khái niệm, lợi ích, quy trình, phân loại
các hoạt động lập kế hoạch, các yếu tố chính tác động đến hoạt động lập kế hoạch và một số
nội dung chủ yếu cần được ra quyết định trong quá trình lập kế hoạch sản xuất kinh doanh của
doanh nghiệp.
2
Như đã biết, công việc của các nhà lập kế hoạch trước hết phải đánh giá được tính chất
và mức độ không chắc chắn của môi trường kinh doanh để xác định giải pháp phản ứng của
doanh nghiệp, xây dựng và triển khai các kế hoạch thích hợp. Luận văn khảo cứu quá trình
lập kế hoạch sản xuất kinh doanh doanh nghiệp và đề xuất ứng dụng mô hình cây quyết định
trong quá trình đó.
Chƣơng 3: Ra quyết định với thông tin không chắc chắn trong lập kế hoạch sản xuất
kinh doanh của doanh nghiệp sẽ trình bầy việc ứng dụng mô hình cây quyết định trong lập kế
hoạch sản xuất kinh doanh dựa trên tập dữ liệu giả định và trên tập dữ liệu thực tế được thu
thập từ Công ty cổ phần May Thăng Long.
CHƢƠNG 1: TỔNG QUAN VỀ MÔ HÌNH CÂY QUYẾT ĐỊNH VÀ THÔNG TIN

KHÔNG CHẮC CHẮN
Chương này giới thiệu tổng quan về mô hình cây quyết định và thông tin không chắc
chắn. Luận văn trước hết trình bày lý thuyết chung nhất về cây quyết định như giới thiệu cây
quyết định, phân loại, xây dựng và ứng dụng của cây quyết định. Sau đó trình bày về thông tin
không chắc chắn, gồm khái niệm cơ bản, các cách biểu diễn thông tin không chắc chắn với lý
thuyết xác suất, định lý Bayes, lý thuyết về yếu tố chắc chắn Standford và tập mờ.
1.1 Tổng quan về mô hình cây quyết định
1.1.1 Giới thiệu cây quyết định
Trong lĩnh vực học máy, cây quyết định là một kiểu mô hình dự báo (predictive
model), nghĩa là một ánh xạ từ các quan sát về một sự vật/hiện tượng tới các kết luận về giá
trị mục tiêu của sự vật/hiện tượng [3,12]. Mỗi một nút trong (internal nút) tương ứng với một
biến; đường nối giữa nó với nút con của nó thể hiện một giá trị cụ thể cho biến đó. Mỗi nút lá
đại diện cho giá trị dự báo của biến mục tiêu, cho trước các giá trị của các biến được biểu diễn
bởi đường đi từ nút gốc tới nút lá đó. Kỹ thuật học máy dùng trong cây quyết định được gọi là
học bằng cây quyết định, hay chỉ gọi với cái tên ngắn gọn là cây quyết định.
Học bằng cây quyết định là phương pháp thông dụng trong khai phá dữ liệu. Khi đó,
cây quyết định mô tả một cấu trúc cây, trong đó, các lá đại diện cho các phân loại còn cành
đại diện cho các kết hợp của các thuộc tính dẫn tới phân loại đó. Một cây quyết định có thể
được học bằng cách chia tập hợp nguồn thành các tập con dựa theo một kiểm tra giá trị thuộc
tính. Quá trình này được lặp lại một cách đệ qui cho mỗi tập con dẫn xuất. Quá trình đệ qui
hoàn thành khi không thể tiếp tục thực hiện việc chia tách được nữa, hay khi một phân loại
đơn có thể áp dụng cho từng phần tử của tập con dẫn xuất. Một bộ phân loại rừng ngẫu nhiên
(random forest) sử dụng một số cây quyết định để có thể cải thiện tỉ lệ phân loại[12].
Giải thuật học cây quyết định gồm 2 bước lớn: xây dựng cây (Top-down), cắt nhánh
(Bottom-up) để tránh học vẹt. Quá trình xây dựng cây được làm như sau:
- Bắt đầu nút gốc, tất cả các dữ liệu học ở nút gốc,
3
- Nếu dữ liệu tại 1 nút có cùng lớp thì nút được cho là nút lá, nhãn của nút lá là nhãn của
các phần tử trong nút lá (hay luật bình chọn số đông nếu nút lá có chứa các phần tử có lớp
khác nhau),
- Nếu dữ liệu ở nút quá hỗn loạn (các phần tử có lớp rất khác nhau) thì nút được cho là
nút trong, tiến hành phân hoạch dữ liệu một cách đệ quy bằng việc chọn 1 thuộc tính để thực
hiện phân hoạch tốt nhất có thể.
Quá trình xây dựng cây chủ yếu phụ thuộc vào việc chọn thuộc tính tốt nhất để phân
hoạch dữ liệu. Chọn thuộc tính phân hoạch tốt theo nghĩa, cho ra kết quả là cây nhỏ nhất.
Việc lựa chọn này dựa vào các heuristics: chọn thuộc tính sinh ra các nút thuần khiết nhất.
1.1.2 Các kiểu cây quyết định
Theo tiêu chí phân loại dựa vào giá trị thuộc tính của cây, cây quyết định được chia
thành 2 loại chính:
1.1.2.1 Cây hồi quy: ước lượng các hàm giá có giá trị là số thực thay vì được sử dụng
cho các nhiệm vụ phân loại.
Giá trị thuộc tính liên tục A cần được rời rạc hóa trong cây quyết định. Với các cách
tiếp cận thông thường: ta coi thuộc tính chỉ có một cách rời rạc trong khoảng [ -∞,t] , [t,+∞]
. Cần lựa chọn ngưỡng t: để với mỗi trường hợp của t tính toán độ tăng thông tin của A do sự
rời rạc của t. Chọn t với độ tăng thông tin lớn nhất (t có thể biến đổi với các trường hợp của
A trên cây). Các giá trị của t được xem xét: giá trị của A trong một số trường hợp của dữ liệu
[3,8].
Nói cách khác với thuộc tính liên tục (thuộc tính dạng số) thì tập giá trị là không xác
định trước. Chính vì vậy, trong quá trình phát triển cây, cần sử dụng kiểm tra dạng nhị phân:
value(A) ≤ θ. Với θ là hằng số ngưỡng được lần lượt xác định dựa trên từng giá trị riêng biệt
hay từng cặp giá trị liền nhau (theo thứ tự đã sắp xếp) của thuộc tính liên tục đang xem xét
trong tập dữ liệu [8].
1.1.2.2 Cây phân loại
Nếu biến phụ thuộc nhận giá trị phân loại, tức giá trị biểu trưng (symbol) được sắp
thứ tự. Chẳng hạn như: giới tính (nam hay nữ), kết quả của một trận đấu (thắng hay thua),
trình độ học lực (xuất sắc, giỏi, khá, trung bình, yếu) .... Khi đó các thuộc tính có giá trị rời
rạc [3, 12].
Một cây quyết định phân loại là một mô hình phân loại (bộ phân loại) cho một biến
lớp T khi biết các thuộc tính A. Để phân lớp mẫu dữ liệu chưa biết, giá trị các thuộc tính của
mẫu được đưa vào kiểm tra trên cây quyết định. Mỗi mẫu tương ứng có một đường đi từ gốc
đến lá và lá biểu diễn dự báo giá trị phân lớp mẫu đó.
Ngoài hai loại trên, một cây quyết định có thể được thể hiện gọn như một sơ đồ ảnh
hưởng, tập trung sự chú ý vào các vấn đề và mối quan hệ giữa các sự kiện.
4
1.1.3 Ƣu điểm của cây quyết định
So với các phương pháp khai phá dữ liệu khác, cây quyết định là phương pháp có một
số ưu điểm chính sau:
- Cây quyết định dễ hiểu. Người ta có thể hiểu mô hình cây quyết định sau khi được
giải thích ngắn.
- Việc chuẩn bị dữ liệu cho một cây quyết định là đơn giản hoặc không cần thiết, trong
khi các kỹ thuật khác thường đòi hỏi phải chuẩn hóa dữ liệu, tạo thêm các biến giả và loại bỏ
các giá trị khuyết thiếu.
- Cây quyết định có thể xử lý cả dữ liệu có giá trị bằng số và dữ liệu có giá trị là tên
thể loại (giá trị phân loại).
- Cây quyết định là một mô hình hộp trắng. Nếu có thể quan sát một tình huống cho
trước trong một mô hình, thì có thể dễ dàng giải thích điều kiện đó bằng logic Boolean. Mạng
nơ-ron là một ví dụ về mô hình hộp đen, do lời giải thích cho kết quả quá phức tạp để có thể
hiểu được.
1.1.4 Nhƣợc điểm của cây quyết định
Cây quyết định khó giải quyết được những vấn đề có dữ liệu phụ thuộc thời gian liên
tục, không thích hợp lắm với những bài toán với mục tiêu là dự báo giá trị của các thuộc tính
như lãi suất ngân hàng, tín dụng, ….[3]
* Dễ xẩy ra lỗi khi có quá nhiều lớp
* Chi phí tính toán để xây dựng mô hình cây quyết định cao:
1.1.5 Ứng dụng của cây quyết định
Một trong những ứng dụng của cây quyết định là được sử dụng để phân lớp dữ liệu.
Tuy có nhiều kỹ thuật phân lớp khác đã được đề xuất như: phân lớp Bayes, phân lớp K -
hàng xóm gần nhất, mạng nơron, phân tích thống kê,…, nhưng phân lớp cây quyết định vẫn
được coi là công cụ mạnh, phổ biến và đặc biệt thích hợp cho khai phá dữ liệu [4].
1.1.5.1 Sử dụng để phân lớp dữ liệu
Để phân lớp mẫu dữ liệu chưa biết, giá trị các thuộc tính của mẫu được đưa vào kiểm
tra trên cây quyết định. Mỗi mẫu tương ứng có một đường đi từ gốc đến lá và lá biểu diễn dự
báo giá trị phân lớp mẫu đó.
1.1.5.2 Sử dụng trong các mô hình dự báo
Cây quyết định có thể xử lý tốt các thuộc tính có giá trị liên tục. Do đó có thể được sử
dụng để xây dựng mô hình với các hàm nhận giá trị liên tục.
1.1.5.3 Sử dụng để biểu diễn các vấn đề ra quyết định
5
1.1.6 Xây dựng và ứng dụng cây quyết định
Xây dựng và ứng dụng cây quyết định là quá trình nhiều bước gồm: tạo lập, cắt tỉa cây
quyết định, sau đó trích rút ra các luật, sử dụng các thủ tục suy diễn để rút ra tri thức thu được.
Sau đây luận văn trình bày về các quá trình trên.
1.1.6.1 Thủ tục tạo lập cây quyết định
Quá trình tạo cây quyết định gồm hai giai đoạn [3, 12]
* Giai đoạn thứ nhất phát triển cây quyết định:
Giai đoạn này phát triển bắt đầu từ gốc, đến từng nhánh và phát triển quy nạp theo
cách thức chia để trị cho tới khi đạt được cây quyết định với tất cả các lá được gán nhãn lớp.
Thuật toán xây dựng cây quyết định
Luận văn trình bày giải thuật quy nạp xây dựng cây quyết định ID3 (gọi tắt là ID3) là
một giải thuật học đơn giản nhưng rất thành công trong nhiều lĩnh vực. ID3 là một giải thuật
hay vì cách biểu diễn tri thức học được của nó, vì cách tiếp cận của nó trong việc quản lý tính
phức tạp, vì cách sử dụng phương pháp heuristic để chọn lựa các ứng viên, và tiềm năng của
nó đối với việc xử lý dữ liệu nhiễu [3, 12].
Đầu vào: Một tập hợp các mẫu. Mỗi mẫu bao gồm các thuộc tính mô tả một tình
huống, hay một đối tượng nào đó, và một giá trị phân loại của nó.
Đầu ra: Cây quyết định có khả năng phân loại đúng đắn các mẫu trong tập dữ liệu
huấn luyện, và hy vọng là phân loại đúng cho cả các ví dụ chưa gặp trong tương lai.
* ID3 xây dựng cây quyết định theo giải thuật sau:
Function induce_tree(tập_mẫu, tập_thuộc_tính)
begin
if mọi mẫu trong tập_mẫu đều nằm trong cùng một lớp
then
return một nút lá được gán nhãn bởi lớp đó
else if tập_thuộc_tính là rỗng then
return nút lá được gán nhãn bởi tuyển của tất cả các lớp trong tập_mẫu
else
begin
chọn một thuộc tính P, lấy nó làm gốc cho cây hiện tại;
xóa P ra khỏi tập_thuộc_tính;
với mỗi giá trị V của P
begin
6
tạo một nhánh của cây gán nhãn V;
Đặt vào phân_vùngV các ví dụ trong tập_mẫu có giá trị V
tại thuộc tính P;
Gọi induce_tree(phân_vùngV, tập_thuộc_tính), gắn kết
quả vào nhánh V
end
end
end
Sau khi xây dựng được cây quyết định, bước tiếp theo là cắt tỉa nhánh của cây.
* Giai đoạn thứ hai cắt, tỉa bớt các cành nhánh trên cây quyết định:
1.1.6.2 Ứng dụng trích rút luật từ cây quyết định
Tri thức trong cây quyết định có thể được chiết xuất và trình bày dưới dạng các luật
phân loại IF-THEN. .
Luật suy diễn
Một công thức H được xem là hệ quả logic (logical consequence) của một tập công
thức G ={G1,.....,Gm} nếu trong bất kỳ minh họa nào mà {G1,.....,Gm} đúng thì H cũng đúng,
hay nói cách khác bất kỳ mô hình nào của G cũng là mô hình của H [4].
. Trong các hệ dựa trên luật, có hai phương pháp luận lập luận cơ bản: Lập luận tiến,
và lập luận lùi
Lập luận tiến
Tư tưởng cơ bản của lập luận tiến là áp dụng luật suy diễn Modus Ponens tổng quát.
Trong mỗi bước của thủ tục lập luận tiến, người ta xét một luật trong cơ sở luật. Đối sánh mỗi
điều kiện của luật với các sự kiện trong cơ sở sự kiện, nếu tất cả các điều kiện của luật đều
được thoả mãn thì sự kiện trong phần kết luận của luật được xem là sự kiện được suy ra. Nếu
sự kiện này là sự kiện mới (không có trong bộ nhớ làm việc), thì nó được đặt vào bộ nhớ làm
việc. Quá trình trên được lặp lại cho tới khi nào không có luật nào sinh ra các sự kiện mới.
Lập luận lùi
Trong lập luận lùi, người ta đưa ra các giả thuyết cần được đánh giá. Sử dụng lập luận lùi, giả
thuyết đưa ra hoặc là được chứng minh, hoặc là bị bác bỏ (bởi các sự kiện trong bộ nhớ làm
việc). Lập luận lùi cho phép ta tìm ra các phép thế biến mà giả thuyết đưa ra trở thành đúng
(là hệ quả logic của cơ sở tri thức). Do đó trong hệ dựa trên luật chúng ta có thể sử dụng lập
luận lùi để tìm ra các câu trả lời cho các câu hỏi được đặt ra bởi người sử dụng.
procedure Backward_Chaining (Hyp, );
begin
H  giả thuyết đầu tiên trong danh sách Hyp;
7
for mỗi luật R = (Conds, Q) do
if H hợp nhất với Q bởi phép thế 1 then
1. Loại H khỏi danh sách Hyp;
2. Thêm các điều kiện của luật Conds vào danh sách Hyp;
3. áp dụng phép thế 1 vào các giả thuyết trong danh sách Hyp;
4. Lấy hợp thành của các phép thế  và 1 để nhận được phép thế  mới, tức là 
 1;
if Hyp = [ ] then cho ra 
else Backward_Chaining (Hyp, );
end;
1.2 Tổng quan về thông tin không chắc chắn
Sự không chắc chắn là một thuật ngữ được sử dụng theo những cách khác nhau trong
một số lĩnh vực, bao gồm vật lý, triết học, thống kê, kinh tế, tài chính, bảo hiểm, tâm lý học,
xã hội học, kỹ thuật, và khoa học thông tin. Áp dụng đối với dự báo của các sự kiện trong
tương lai, các phép đo vật lý đã được thực hiện, hoặc chưa biết.
1.2.1 Khái niệm
Sự không chắc chắn: là trạng thái có hiểu biết hạn chế về những hiện tượng tự nhiên-
kinh tế -xã hội, không thể mô tả chính xác tình trạng hiện hành cũng như kết quả trong tương
lai của chúng[1,7].
1.2.2 Phân loại sự không chắc chắn
Sự không chắc chắn có thể được chia thành các bộ phận được xác định rõ và không rõ
nét, gồm đối tượng và chủ thể không chắc chắn. Không chắc chắn cũng được xác định có thể
được phân tích với lý thuyết xác suất. Sự thiếu rõ ràng có thể được chia thành đặc trưng
không và bất hòa. Đặc trưng không thể được phân tích với lý thuyết khả năng và bất hòa có
thể được phân tích với bản thể học.
Nhận thức không chắc chắn Tri thức hướng dẫn quyết định
(epistemological uncertainty) (knowledge guided decision)
Đối tượng không chắc chắn

(objective uncertainty)
Bản thế không chắc chắn Lý trí hướng dẫn quyết định
(ontological uncertainty) (Quasi-rational decision)
Không chắc chắn
(uncertainty)
Đạo đức không chắc chắn Quy tắc hướng dẫn quyết định
( moral uncertainty) (rule guided decision)
Chủ thể không chắc chắn
(subjective uncertainty)
Quy tắc không chắc chắn (rule Trực giác hướng dẫn quyết định
8uncertainty) (intuition guiđe decision)
Hình 4 : Phân loại tư duy của sự không chắc chắn
1.2.3 Ứng dụng thông tin không chắc chắn

Trên thực tế có rất nhiều lĩnh vực có sử dụng các thông tin không chắc chắn vào giải quyết
vấn đề như:
- Sự không chắc chắn được tham gia vào tất cả các đo lường, chẳng hạn như đo
khoảng cách, nhiệt độ, mức độ phụ thuộc vào công cụ hoặc kỹ thuật được sử dụng để làm cho
đo lường. Sự không chắc chắn được sử dụng thiết kế các trò chơi, đáng chú ý nhất là trò chơi
về cờ bạc, nơi mà “cơ hội” là trọng tâm trò chơi.
- Trong khoa học, dự báo các sự kiện trong tương lai nên được hiểu là có một loạt các
giá trị dự kiến, giá trị không chắc chắn.
- Trong dự báo thời tiết hiện nay bao gồm dữ liệu về mức độ sự không chắc chắn trong
thông tin để dự báo thời tiết.
- Trong đánh giá rủi ro và quản lý rủi ro.
1.2.4 Đo lƣờng không chắc chắn
Đo lường không chắc chắn là một khái niệm trung tâm xác định số lượng phân tán hợp
lý của thuộc tính đến một kết quả đo lường. Như vậy không chắc chắn cũng có thể được gọi là
một phép đo lỗi.
1.2.5 Biểu diễn thông tin không chắc chắn
Luận văn trình bày việc biểu diễn thông tin theo hai hướng tiếp cận.Tiếp cận thứ nhất
là tiếp cận thống kê, trong hướng tiếp cận này sẽ trình bày hai phương pháp: lý thuyết xác
suất Bayesian và lý thuyết về đại số hệ số chắc chắn. Tiếp cận thứ hai là biểu diễn thông tin
không chắc chắn theo logic mờ[4,7].
1.2.5.1 Tiếp cận thống kê đối với tính không chắc chắn.
Ở đây, luận văn trình bày lý thuyết xác suất như là cơ sở toán học cho sự biểu diễn
tri thức không chắc chắn.
Người ta sử dụng số p, 0  p  1, là xác suất của một sự kiện hoặc xác suất của một
mệnh đề để biểu diễn khả năng một sự kiện có thể xảy ra hoặc khả năng một mệnh đề có thể
đúng.
* Công thức Bayes đƣợc phát biểu nhƣ sau:
Ký hiệu P(h | e) là xác suất khẳng định giả thuyết h đúng cho trước bằng chứng e.
9
Điểm quan trọng của lý thuyết Bayes là các con số ở vế phải của công thức dễ
dàng xác định, ít nhất là khi so sánh với vế trái
*Công thức Bayes tổng quát
Trong thực tế có nhiều giả thuyết cạnh tranh nhau, vì vậy công thức Bayes tổng quát nhất
là:
* Mạng xác suất

Mô hình được đề suất là mạng xác suất: mạng xác suất là một đồ thị có hướng, không
có chu trình và thoả mãn các điều kiện sau:
- Các đỉnh của đồ thị là các biến ngẫu nhiên;

- Mỗi cung từ đỉnh X đến đỉnh Y biểu diễn sự ảnh hưởng trực tiếp của biến ngẫu
nhiên X đến biến ngẫu nhiên Y (hay Y phụ thuộc trực tiếp vào X). Đỉnh X
được gọi là đỉnh cha của Y;
- Tại một đỉnh được cho phân phối xác suất có điều kiện của đỉnh đó khi cho
trước các cha của nó. Các xác suất này biểu diễn hiệu quả mà các cha tác dụng
vào nó.
Mô hình tổng quát hơn để biểu diễn vấn đề quyết định là mạng quyết định (decision
network hay còn gọi là influence diagram). Mạng quyết định là mở rộng của mạng xác suất
bằng cách đưa thêm vào các đỉnh quyết định và các đỉnh lợi ích.
1.2.5.2 Đại số hệ số chắc chắn Stanford
Khi suy luận với tri thức heuristic, các chuyên gia có thể đưa ra các ước lượng niềm
tin hữu ích về các kết luận. Họ ước lượng các kết luận bằng các thuật ngữ như “có nhiều khả
năng”, “không chắc”, “hầu như chắc chắn” hay “có thể”. * Lý thuyết về đại số hệ số chắc
chắn Stanford
Lý thuyết về độ chắc chắn Stanford [7,13] đưa ra một số giả thiết đơn giản cho việc tạo
ra các độ đo niềm tin và có một số quy tắc đơn giản tương đương cho việc kết hợp những
niềm tin này khi chương trình tiến đến kết luận của nó. Giả thiết thứ nhất là tách “niềm tin
ủng hộ” ra khỏi “niềm tin chống lại” một quan hệ:
Gọi MB(H | E) là độ đo của niềm tin và MD(H | E) là độ đo của sự hoài nghi vào khả
năng đúng của giả thuyết H, khi có bằng chứng E
Giá trị của các độ đo này chỉ rơi vào một trong hai trường hợp:
0 < MB(H | E) < 1 trong khi MD(H | E) = 0,
hoặc: 0 < MD(H | E) < 1 trong khi MB(H | E) = 0
hệ số chắc chắn CF:
10
CF (H | E) = MB(H | E) - MD(H | E)
* Phƣơng pháp suy luận với thông tin không chắc chắn
Như vậy, ở đây có hai loại thông tin không chắc chắn: một là dữ liệu ban đầu được cho
là không chắc chắn, không đủ, không đáng tin cậy,… hai là các luật sử dụng để suy luận không
hợp logic, suy luận ngược từ kết luận về điều kiện, hay có thể gọi là suy luận theo kiểu phỏng
đoán.
Suy luận phỏng đoán thường được ứng dụng trong thực tế để tìm hiểu các hiện tượng xảy
ra, ví dụ:
If hàng hóa áo sơ mi nam bán không đạt chỉ tiêu Then chỉ tiêu quá cao hoặc thị hiếu đã
thay đổi;
1.2.5.2 Tiếp cận theo hƣớng logic mờ
Lý thuyết tập mờ là một công cụ toán học chính xác để mô tả các thông tin không chính
xác, mang tính nhập nhằng, mờ (vagueness, ambiguity).
* Khái niệm về tập mờ:
Cho S là một tập hợp và x là một phần tử của tập hợp đó. Một tập con mờ F của S được
định nghĩa bởi một hàm thành viên μF(x) đo “mức độ” mà theo đó x thuộc về tập F. Hàm A
được gọi là hàm thuộc (hoặc hàm đặc trưng) của tập mờ A còn A(x) được gọi là mức độ thuộc
của x vào tập mờ A. Trong đó, 0 ≤ μF(x) ≤ 1.
Khi μF(x) = 0 nghĩa là x hoàn toàn không thuộc tập F.
Khi μF(x) = 1 nghĩa là x thuộc F hoàn toàn.
Nếu μF(x) = 0 hoặc 1 thì tập F được xem là “giòn”
Như vậy tập mờ là sự tổng quát hoá tập rõ bằng cách cho phép hàm thuộc lấy giá trị bất
kỳ trong khoảng [0,1], trong khi hàm thuộc của tập rõ chỉ lấy hai giá trị 0 hoặc 1.
Người ta biểu diễn tập mờ A trong vũ trụ U bởi tập tất cả các cặp phần tử và mức độ
thuộc của nó: A = {(x, A(x))| x U}
Luật mờ
Một luật mờ là một biểu thức if- then được phát biểu ở dạng ngôn ngữ tự nhiên thể
hiện sự phụ thuộc nhân quả giữa các biến.
Ví dụ : if mẫu hàng là đẹp và giá là rẻ then mua hàng nhiều.
Trong đó: - „mẫu hàng‟, „giá ‟ và „mua hàng ‟ là các biến
- „đẹp‟, „rẻ‟, „nhiều‟ là các giá trị hay chính là các tập mờ.
Thủ tục ra quyết định mờ
Để hệ thống mờ có thể suy luận bằng các luật mờ và đưa ra kết luận từ các số liệu chính
xác ở đầu vào, hệ thống thực hiện 3 bước:
11
1. Mờ hóa: Tính toán các giá trị mờ từ các giá trị chính xác ở đầu vào.
2. Suy luận mờ: Áp dụng tất cả các luật mờ có thể áp dụng để tính ra giá trị mờ cho
kếtluận, sau đó kết hợp các kết quả đầu ra.
3. Phi mờ hóa: Xác định giá trị chính xác từ kết quả mờ có được ở bước 2. Có nhiều
kỹ thuật phi mờ hóa có thể áp dụng được, phương pháp thông dụng nhất là phương pháp trọng
tâm (centriod method).
1.3 Kết luận chƣơng 1.

Trong chương này, luận văn trình bày tổng quan về cây quyết định và thông tin không
chắc chắn, là cơ sở để nghiên cứu, tìm hiểu các ứng dụng mô hình cây quyết định phục vụ quá
trình ra quyết định với thông tin không chắc chắn ở các chương sau.
Có thể sử dụng công thức Bayes để tính xác suất của một giả thuyết khi dữ liệu thuộc
tính của cây quyết định là thông tin không chắc chắn. Luật Bayes dựa trên lý thuyết xác suất
hình thức cho phép sử dụng tri thức về nguyên nhân để suy ra kết luận. Lý thuyết về yếu tố
chắc chắn Standford đưa ra khái niệm hệ số chắc chắn CF cho phép các chuyên gia kết hợp
những niềm tin của mình vào dữ liệu và các luật khi phát biểu. Đồng thời đại số chắc chắn
Standford cũng cung cấp các quy tắc và công thức sử dụng để tính các giá trị CF cho các kết
luận trong quá trình suy luận. Hoặc có thể biểu diễn thông tin không chắc chắn dựa theo lý
thuyết mờ. Lý thuyết mờ đưa ra khái niệm tập mờ và hàm thành viên thể hiện mức độ một
thành viên thuộc vào tập mờ.
Để ra quyết định với thông tin không chắc chắn trong lập kế hoạch sản xuất kinh
doanh doanh nghiệp bằng việc ứng dụng cây quyết định, các chương tiếp theo sẽ tìm hiểu về
công cụ hỗ trợ xây dựng cây quyết định và ứng dụng của nó với nội dung việc lập kế hoạch
sản xuất kinh doanh trong doanh nghiệp.
CHƢƠNG 2: CÔNG CỤ HỖ TRỢ XÂY DỰNG MÔ HÌNH CÂY QUYẾT ĐỊNH VÀ

KẾ HOẠCH SẢN XUẤT KINH DOANH DOANH NGHIỆP
Trong chương này, luận văn trước hết giới thiệu vấn đề ra quyết định với thông tin
không chắc chắn, ở đây chủ yếu là ra quyết định trong lập kế hoạch sản xuất kinh doanh bằng
ứng dụng cây quyết định. Để có thể xây dựng một ứng dụng của cây quyết định, chương này
đã khảo cứu công cụ hỗ trợ, cụ thể là phần mềm PrecisionTree5.7, một Add-in trên Micsoft
Excel, đồng thời trình bày một cách khá hệ thống lý thuyết của quá trình lập kế hoạch sản
xuất kinh doanh trong doanh nghiệp cũng như một số nội dung chủ yếu cần được ra quyết
định trong quá trình này.
2.1 Ra quyết định với thông tin không chắc chắn bằng ứng dụng mô hình cây quyết
định
2.2 Công cụ hỗ trợ xây dựng mô hình cây quyết định
Hiện nay có nhiều công cụ hỗ trợ xây dựng mô hình cây quyết định như Simple
12
Decision Tree, và PrecisionTree, của Palisade Corporation. Trong luận văn nay sử dụng
công cụ PrecisionTree5.7 của Palisade Corporation.
2.2.1 Giới thiệu PrecisionTree
PrecisionTree 5.7 do công ty Palisade có trụ sở chính tại Mỹ và chi nhánh tại nhiều
nơi trên thế giới phát triển, được giới thiệu vào tháng 9 năm 2010, bản mới nhất
PrecisionTree 5.7.1 giới thiệu vào tháng 6 năm 2011.
2.3 Kế hoạch phát triển sản xuất, kinh doanh của doanh nghiệp
2.4 Một số nội dung chủ yếu cần ra quyết định khi lập kế hoạch phát triển sản xuất,
kinh doanh của doanh nghiệp
2.5 Kết luận chƣơng 2
Trong chương này, luận văn giới thiệu tổng quát về công cụ PresicionTree5.7 được sử
dụng trong luận văn để xây dựng mô hình cây quyết định. Đồng thời giới thiệu về lý thuyết
lập kế hoạch sản xuất kinh doanh trong doanh nghiệp, các vấn đề cần ra quyết định trong quá
trình lập kế hoạch sản xuất. Là lý thuyết cơ sở để áp dụng mô hình cây quyết định nhằm rút ra
tri thức từ dữ liệu thực tiễn phục vụ công tác lập kế hoạch sản xuất của doanh nghiệp.
Nhằm ứng dụng lý thuyết trên vào thực tiễn sản xuất của một doanh nghiệp, chương
tiếp theo trình bày việc sử dụng công cụ hỗ trợ xây dựng cây quyết định để giải quyết các bài
toán liên quan đến việc ra quyết định với thông tin không chắc chắn trong lập kế hoạch sản
xuất kinh doanh doanh nghiệp.
CHƢƠNG 3
RA QUYẾT ĐỊNH VỚI THÔNG TIN KHÔNG CHẮC CHẮN TRONG LẬP KẾ
HOẠCH SẢN XUẤT KINH DOANH DOANH NGHIỆP
Chương này đề cập tới vấn đề ra quyết định với thông tin không chắc chắn trong lập
kế hoạch sản xuất kinh doanh của doanh nghiệp bằng việc ứng dụng mô hình cây quyết định.
Luận văn tìm hiểu quá trình đánh giá tính chất và mức độ không chắc chắn của môi trường
kinh doanh để xác định giải pháp của doanh nghiệp và triển khai các kế hoạch thích hợp. Từ
đó áp dụng lập kế hoạch sản xuất kinh doanh cho một sản phẩm của Công ty cổ phần May
Thăng Long với dữ liệu mẫu được thu thập và giả định.
Bằng việc chia nhỏ các tình huống xảy ra khi lập kế hoạch sản xuất cho một sản phẩm
thành các bài toán nhỏ hơn, và sử dụng công cụ PrecisionTree 5.7 để tạo cây quyết định giải
quyết các bài toán nhỏ. Sau đó tổng hợp các kết quả thu được để tạo thành bảng kế hoạch sản
xuất cho sản phẩm đó. Như vậy, việc xây dựng các cây quyết định trực quan hóa các dữ liệu
tình huống và xử lý dữ liệu không chắc chắn thu được trong các tình huống trên góp phần hỗ
trợ quá trình ra quyết định của nhà quản lý trong việc lập kế hoạch sản xuất sản phẩm.
13
3.1 Lƣợc sử vấn đề nghiên cứu
Phân tích ra quyết định với điều kiện không chắc chắn diễn ra thường xuyên ở hầu hết
các mức độ chiến lược của quá trình ra quyết định của các công ty và thường liên quan đến
đội ngũ các nhà quản lý cấp cao. Việc chính thức sử dụng phân tích ra quyết định bắt đầu từ
những năm 1960, nhưng vì thiếu công nghệ thông tin và sự thiếu tin tưởng của các phương
thức của quản lý mức độ cao, nó không bao giờ thực sự tìm được địa vị xứng đáng.
Điều này được khẳng định trong báo cáo bởi hai chuyên gia phân tích ra quyết định
liên quan đến bản thân công ty Du Pont, Krumm and Rolle, trong bài báo của họ “Quản lý và
ứng dụng của quyết định và phân tích rủi ro trong Du Pont” . Việc Du Pont lập kế hoạch sản
xuất kinh doanh dài hạn vào năm 1949 đã khơi mào cho một phong trào “tạo dựng kế hoạch”
tại các công ty. Cho tới năm 1960, toàn bộ 500 công ty được tạp chí Fortune bình chọn đều có
“Giám đốc kế hoạch” và các “Hiệp hội các nhà xây dựng kế hoạch dài hạn cho doanh
nghiệp”, hoạt động ở cả Anh quốc và Hoa Kỳ [9].
3.2. Xác định vấn đề nghiên cứu

Có thể thấy quá trình lập và thực hiện kế hoạch sản xuất kinh doanh chịu sự ảnh
hưởng của tính không chắc chắn của môi trường kinh doanh, được thể hiện dưới ba hình thức
sau:
- Tình trạng không chắc chắn: xảy ra khi toàn bộ hay một phần của môi trường kinh
doanh được coi là không thể tiên đoán được.
- Hậu quả không chắc chắn: là trường hợp mặc dù đã cố gắng nhưng nhà quản lý
không thể tiên đoán được những hậu quả do sự thay đổi của môi trường tác động đến các
doanh nghiệp, do vậy mà dẫn đến sự không chắc chắn.
- Sự phản ứng không chắc chắn: là tình trạng không thể tiên đoán được những hệ quả
của một quyết định cụ thể, sự phản ứng của doanh nghiệp đối với những biến động của môi
trường kinh doanh.
Vì vậy công việc của các nhà lập kế hoạch là phải đánh giá tính chất và mức độ
không chắc chắn của môi trường kinh doanh để xác định giải pháp phản ứng của doanh
nghiệp và triển khai các kế hoạch thích hợp.
Luận văn khảo cứu quá trình lập kế hoạch và thực hiện lập kế hoạch sản xuất kinh
doanh cho Công ty cổ phần May Thăng Long với dữ liệu mẫu được thu thập năm 2006
bằng ứng dụng mô hình cây quyết định. Cụ thể Chương này nhằm giải quyết bài toán đặt
ra là:
Với thực trạng lập kế hoạch sản xuất kinh doanh của công ty May Thăng Long
hiện nay, cần ra quyết định về kế hoạch nhằm đạt sản lượng đề ra trong điều kiện môi
trường kinh doanh và thông tin thu được là không chắc chắn bằng việc ứng dụng mô hình
cụ cây quyết định.
14
3.3. Dữ liệu phục vụ lập kế hoạch sản xuất kinh doanh của doanh nghiệp
3.3.1 Dữ liệu phục vụ lập kế hoạch sản xuất kinh doanh:
- Các bảng dữ liệu trong phần Phụ lục (Nguồn phòng kế hoạch vật tư năm 2005 -
2006).
- Các thông tin kinh tế, thị trường được dự báo bởi các nhà quản lý;
3.3.2 Đánh giá về kế hoạch sản xuất kinh doanh hiện nay của công ty
Dựa theo thực trạng quá trình sản xuất kinh doanh của công ty năm 2005 -2006, kế
hoạch sản xuất kinh doanh được đánh giá.
3.4. Ứng dụng mô hình cây quyết định trong công tác lập kế hoạch sản xuất kinh doanh
3.3.1 Ứng dụng mô hình cây quyết định trong việc ra quyết định với thông tin không
chắc chắn
Trong việc lập kế hoạch sản xuất kinh doanh tại công ty may Thăng Long, có nhiều
tình huống xảy ra, yêu cầu phải xử lý các thông tin không chắc chắn thu thập được trong các
tình huống đó. Yêu cầu này được luận văn giải quyết bằng việc ứng dụng mô hình cây quyết
định.
Đầu vào: các dữ liệu đã thu thập được là các thông tin không chắc chắn như nhu cầu
thị trường, giá cả nguyên vật liệu, nhân công, chi phí phát triển thị trường…
Đầu ra: Số lượng sản phẩm được sản xuất trong năm tới của nhà máy.
Để giải quyết bài toán này, việc trước hết là chia vấn đề thành các bài toán nhỏ. Sử
dụng cây quyết định để giải quyết các bài toán nhỏ trên, sau đó tổng hợp các kết quả tình
huống để đáp ứng yêu câu. Trong khuôn khổ luận văn này, sẽ tìm hiểu các bài toán nhỏ cần
thiết trong việc lập kế hoạch sản xuất như sau:
Bài toán 1
Chi phí phát triển một sản phẩm tại một thị trường thử nghiệm (một địa điểm nào đó
thuộc một địa phương) được đánh giá qua 2 phương án sau:
Phương án 1 Phương Án 2
ĐV (triệu ĐV(triệuđồ
Xác suất Xác suất
đồng) ng)
Chi phí mở đại lý 25 55% 35 65%
Chi phí quản lý 15 35% 25 20%
Chi phí phát sinh 8 10% 15 15%
(nguồn giả định)
Bảng 3: Số liệu chi phí phát triển sản phẩm trên thị trường thử nghiệm
Giải pháp: Xây dựng cây quyết định bằng phần mềm Precisiontree 5.7 từ các dữ liệu bảng
trên.
Kết quả thu được như hình 8:
15
Hình 11: Kết quả xây dựng mô hình cây quyết định cho bài toán 1
Đánh giá kết quả:
Theo kết quả mô hình cây quyết định như trên, giá trị kỳ vọng lớn nhất của phương án
1 là 19,8 (triệu đồng), của phương án 2 là 30 (triệu đồng). Giá trị kỳ vọng lớn nhất của cây là
30 triệu đồng.
Để đạt giá trị kỳ vọng lớn nhất là 30 triệu đồng, ta có đường đi trên cây là từ nút gốc,
đến nút TRUE như hình vẽ.
Ở bài toán này, giả thuyết nhận giá trị thử nghiệm cho thị trường địa phương là 30
triệu đồng. Số liệu này được ứng dụng để giải quyết bài toán 2 sau đây.
Bài toán 2
Công ty cổ phần may Thăng Long lập kế hoạch về việc đưa một sản phẩm ra thị
trường. Như trong nhiều tinh huống của sản phẩm mới, có nhiều sự không chắc chắn về liệu
sản phẩm mới liệu có thể bắt kịp thị trường không. Công ty may Thăng Long tin rằng đó có
thể là một quyết định khôn ngoan khi giới thiệu 1 sản phẩm mới tới một thì trường địa
phương để kiểm tra trước khi giới thiệu nó ra phạm vi quốc gia. Do vậy, quyết định đầu tiên
của công ty là liệu có thực hiện cuộc kiểm tra thị trường không. Công ty may Thăng Long
định lượng rằng giá cố định tại thị trường thử nghiệm là 30 triệu đồng, theo như kết quả bài
toán 1. Nếu nó quyết định thực hiện thử nghiệm đó, Công ty may Thăng Long sau đó phải đợi
kết quả. Dựa vào kết quả của cuộc thử nghiệm, có thể quyết định có nên tung sản phẩm ra thị
trường quốc gia, trong trường hợp nó sẽ phải chịu một chi phí cố định là 900 triệu đồng.
Ngược lại, nếu quyết định ban đầu là không hiệu lực trên thị trường thử nghiệm, thì sau đó
16
quyết định cuối cùng là liệu có tung sản phẩm ra thị trường quốc gia hay không có thể được
thực hiện một cách không trì hoãn. Lợi nhuận đơn vị của Công ty may Thăng Long được tính
bằng sự chênh lệch giữa giá bán sản phẩm và chi phí biến đổi đơn vị, là 18 nghìn đồng (ở thị
trường thử nghiệm và thị trường quốc gia)
Công ty may Thăng Long phân loại kết quả trên thị trường thử nghiệm hoặc thị
trường quốc gia là tốt, khá hay tồi. Một kết quả đi cùng với dự báo về tổng số đơn vị sản
phẩm bán ra. Sản lượng bán ra tương ứng đối với thị trường thử nghiệm là 200, 100, 10 và là
6000, 3000, 900 đối với thị trường quốc gia. Dựa vào kết quả trên thị trường thử nghiệm
trước đó cho sản phẩm tương tự, Công ty may Thăng Long đánh giá rằng xác suất khả năng
đầu ra (hệ số chắc chắn) của 3 thị trường thử nghiệm là 0.3; 0.6 và 0.1. Sau đó căn cứ vào số
liệu lịch sử của các sản phẩm trước đó, công ty này đã đánh giá khả năng đầu ra của thị
trường quốc gia của mỗi thị trường thử nghiệm cụ thể. Nếu kết quả là tốt, xác suất khả năng
đầu ra (hệ số chắc chắn) của thị trường quốc gia là 0.8; 0.15; và 0.05. Nếu kết quả của thị
trường thử nghiệm là khá, những khả năng đầu ra (hệ số chắc chắn) tương ứng của thị trường
quốc gia là 0.3; 0.5 và 0.2. Nếu kết quả của thị trường thử nghiệm là tồi, kết quả tương ứng là
0.05; 0.25 và 0.7 (Chú ý khả năng đầu ra của thị trường quốc ra có xu hướng phản ánh đầu ra
của thị trường thử nghiệm).
Nội dung TT Địa phương TT Toàn quốc
Chi phí cố định 30 triệu đồng 900 triệu đồng

Sản lƣợng bán ra (Sản phẩm) Đơn giá 18 nghìn đồng/sản phẩm
Tốt 200 sp 36 trđ 6000 1080 trđ
sp
Khá 100 sp 18trđ 3000 540 trđ
sp
Tồi 30 sp 5.4trđ 900 sp 162 trd
Xác suất khả năng bán ra sản phẩm
Tốt 0.3
Khá 0.6
Tồi 0.1
Xác suất khả năng bán ra của TT toàn quốc
TT toàn quốc tốt TT toàn quốc khá TT toàn quốc tồi
TT địa phương tốt 0.8 0.15 0.05

TT địa phương khá 0.3 0.5 0.2
TT địa phương tồi 0.05 0.25 0.7
Bảng 4 Dữ liệu bài toán 2
Như vậy bài toán 2 như sau:
Đầu vào: Dữ liệu như Bảng 4.
17
Đầu ra: Công ty muốn sử dụng cây quyết định để trực quan hóa các giải pháp và giải
pháp tốt nhất trong việc đưa ra sản lượng sản xuất sản phẩm.
Để giải bài toán này, trƣớc hết cần phân tích bài toán:
Phân tích bài toán với ba nhân tố cơ bản của những vấn đề ra quyết định: những chiến
lược có thể, những đầu ra và khả năng có thể, và mô hình giá trị.
Công ty may Thăng Long phải đưa ra quyết định liệu có thực hiện thử nghiệm thị
trường hay không. Sau đó nó phải quyết định liệu có nên giới thiệu sản phẩm đó ra thị trường
quốc gia không. Tuy nhiên, đó là quan trọng để nhận ra rằng nếu Công ty may Thăng Long
quyết định thực hiện thử nghiệm thị trường, quyết định về thị trường quốc gia có thể dựa vào
kết quả của thử nghiệm thị trường. Trong trường hợp này chiến lược cuối cùng của công ty
này sẽ là một kế hoạch ngẫu nhiên, ở đó nó thực hiện thử nghiệm thị trường và sau đó giới
thiệu sản phẩm tới thị trường quốc gia nếu nó nhận được đầy đủ kết quả tích cực từ thị trường
thử nghiệm và từ bỏ sản phẩm nếu nhận được kết quả tiêu cực. Chiến lược tối ưu từ những
vấn đề trong việc ra quyết định liên quan tới những kế hoạch ngẫu nhiên.
Điều quan trọng là không thể đơn giản đánh giá 3 khả năng mới đối với trường hợp
đó. Những khả năng này được suy ra từ những khả năng cụ thể. Điều này tuân theo quy luật
của xác suất điều kiện. nếu chúng ta đặt T1, T2, T3 là kết quả tốt, khá, tồi của thị trường thử
nghiệm và N là kết quả bất kỳ của thị trường quốc gia và sau đó bằng quy tắc cộng xác suất
và công thức xác suất điều kiện:
P(N) = P(N|T1)P(T1) + P(N|T2)P(T2) + P(N|T3)P(T3)
Thay số ta có:Khả năng đầu ra của thị trường toàn quốc khi quyết định triển khai mà không
cần kết quả của thị trường thử nghiệm là 0.425; 0.370; 0.205.
Làm cách nào để người ra quyết định có thể xem xét được tất cả các khía cạnh quan
trọng của vấn đề cùng một lúc: các lựa chọn thay thế quyết định, những kết quả không chắc
chắn và xác suất của chúng, những hậu quả kinh tế, và thứ tự thời gian của các sự kiện, ...
Phương pháp và công cụ tin học hỗ trợ giải quyết bài toán: mô hình cây quyết định và
phần mềm Precision Tree5.7.
. Kết quả bài toán 2 thu được là cây quyết định như hình sau:
18
Hình 13 : Kết quả bài toán 2
Phân tích kết quả thu đƣợc:
Tất cả các ứng dụng ra quyết định trong điều kiện không chắc chắn được thực hiện
theo những quy trình sau:
Đầu tiên sẽ xác định những khả năng có thể, đánh giá những khả năng có liên quan, và
tính toán giá trị kỳ vọng.
Sau đó sử dụng mô hình cây quyết định để xác định những lựa chọn có giá trị kỳ vọng
lớn nhất và theo đuổi lựa chọn đó với một sự phân tích toàn diện. Phân tích bản tóm tắt rủi ro
cho những lựa chọn khác nhau. Điều đó sẽ hữu dụng nếu những tiêu chí khác được xem xét.
Giải thích của cây này là khá đơn giản nếu ta nhận xét rằng mỗi giá trị chỉ dưới mỗi
tên nút là một giá trị kỳ vọng. 807 ở ô B49 là giá trị kỳ vọng cho toàn bộ vấn đề quyết định,
có nghĩa là Công ty may Thăng Long sẽ nhận kết quả tốt nhất là 8070 triệu đồng. Sản lượng
tốt nhất có thể tiêu thụ là 449.000 sản phẩm.
Các giá trị kỳ vọng đã được tính toán bắt đầu từ bên phải và hoạt động trở lại phía bên
trái. Công ty có thể tối ưu chiến lược bằng cách theo nhánh TRUE từ trái tới phải. Đầu tiên
cho bán thử nghiệm sản phẩm mới tại thị trường địa phương, nếu kết quả là tốt, thì sản phẩm
sẽ được bán trên toàn quốc. Tuy nhiên nếu kết quả là khá hoặc tồi thì sản phẩm có thể bị dừng
sản xuất. Trong trường hợp thị trường toàn quốc ảm đạm, công ty có thể giảm được thua lỗ,
công ty chịu phí 30 triệu đồng để bán thử tại thị trường địa phương nhưng thu lại được 18
triệu hoặc 5.4 triệu đồng.
19
Như vậy, cây quyết định ở đây dựa vào suy diễn lùi, nhận giá trị tại các nút lá, và phân
tích ngược lên đến kết quả tại gốc của cây.
Với kết quả bài toán 2, có thể quyết định sản lượng sản phẩm mới được sản xuất tại xí nghiệp
1 của công ty. Tuy nhiên, ngoài sản phẩm mới được công ty ưu tiên sản xuất trong chiến lược
phát triển kinh doanh, xí nghiệp còn sản xuất sản phẩm truyền thống. Căn cứ vào năng lực sản
xuất và chỉ tiêu còn lại sau khi thực hiện sản phẩm mới, sản lượng sản phẩm truyền thống
được sản xuất được quyết định trong bài toán 3.
Bài toán 3
Các giá trị bài toán đầu vào, đầu ra như sau:
Đầu vào:
Để tính toán sản lượng sản xuất của nhà máy 1, ngoài sản lượng sản xuất của sản
phẩm mới, cần xem xét thêm sản phẩm truyền thống được lên kế hoạch sản xuất cho năm tới.
Xác định sản lượng của sản phẩm truyền thống tại Xí nghiệp 1 được sản xuất trong
năm tới là bao nhiêu sản phẩm. Dựa vào các căn cứ để lập kế hoạch sản xuất, nhà quản lý đã
đánh giá xác suất xảy ra của các thông tin không chắc chắn về kinh tế thị trường như bảng 5
Đầu ra: Quyết định sản lượng của sản phẩm truyền thống tại xí nghiệp1 được sản
xuất trong năm tới.
(sản phẩm)
Nhu cầu thị trƣờng xấu
Sản phẩm cạnh tranh bán tốt 300,000
Năng lực sản xuất còn lại 655600 50%
Căn cứ đánh giá tình hình thực hiện kế hoạch năm trước 450000 12%
Căn cứ vào kết quả nghiên cứu và dự báo thị trường 700000 30%
Căn cứ vào chỉ tiêu kế hoạch do Tập Đoàn Dệt –May giao. 750000 8%
Sản phẩm cạnh tranh bán xấu 250,000
Nhu cầu thị trƣờng tốt
Sản phẩm cạnh tranh bán tốt 200,000
20
Sản phẩm cạnh tranh bán xấu 150000
Bảng 5: Dữ liệu bài toán 3
Bằng việc tự xác định nút gốc, nhánh và các nút là dựa trên bảng trên, sử dụng phần
mềm PrecisionTree 5.7 trực tiếp trên bảng tính dữ liệu trên thu được kết quả:
21
Hình 14: Kết quả bài toán 3
Đánh giá kết quả thu đƣợc:

Cây quyết định ở đây dựa vào cơ chế suy diễn lùi hay hướng từ mục tiêu, hệ thống sẽ
lần lượt tính toán giá trị kỳ vọng của từng mục tiêu, nhận giá trị tại các nút lá, và phân tích
ngược lên đến kết quả tại gốc của cây
Sản lượng sản phẩm truyền thống nên sản xuất trong năm tới là 506.120 sản phẩm. Để
đạt được kết quả trên, cây quyết định có đường đi từ gốc tới nút TRUE ->TRUE
như mũi tên trong hình 13. Ngoài ra, khi lựa chọn nhánh đi từ gốc tới nút FALSE –>TRUE,
hay nút FALSE –> FALSE thì các sản lượng kỳ vọng sẽ nhận được các giá trị khác nhau.
Như vậy, từ cây quyết định trên, có thể rút ra được một số luật suy diễn sau:
- IF „NCTTtốt = TRUE‟ AND „SPCTBT=TRUE‟ THEN “ SLSX = 506120 sp”

- IF „NCTTtốt = TRUE‟ AND „SPCTBX=FALSE‟ THEN “ SLSX = 30400 sp”
22
- IF „NCTTxấu = FALSE‟ AND „SPCTBT=TRUE‟ THEN “SLSX = 351800 sp”
- IF „NCTTxấu = FALSE‟ AND „SPCTBX=FALSE‟THEN “ SLSX = 348360sp”
(Với các từ viết tắt: SLSX là số lượng sản xuất, NCTT là nhu cầu thị trường, SPCTBX
là sản phẩm cạnh tranh bán xấu, SPCTBT là sản phẩm cạnh tranh bán tốt, sp là sản phẩm)
Để quyết định sản lượng sản xuất cho xí nghiệp 1 của công ty may Thăng Long, cần
tổng hợp kết quả của bài toán 2 và bài toán 3, với yêu cầu sản lượng dự kiến sản xuất trong
năm tương đương tổng sản lượng của sản phẩm mới (SPM) và sản phẩm truyền thống
(SPTT).
Tổng hợp:
Như vậy tổng hợp các bài toán trên có thể xây dựng được bảng kế hoạch sản xuất kinh
doanh cho sản phẩm của Xí nghiệp 1 năm 2007 như sau:
Khách hàng Sản Doanh thu

Năng Sản lượng
Đơn vị Chủng Số tổ lượng Giá bình (1000đ)
SL dự loại suất 1 tổ SPTT/nă
SX Tên SX SPM/nă quân (đ)
kiến/n sp /ngày m /năm
m
Xí SAMW 1,000,000 Sơ mi 6 500 449,000 506,120 20.000 2,000,000
nghiệp
1
Bảng 6: Kế hoạch sản xuất cho một sản phẩm của xí nghiệp 1
3.5 Kết luận chƣơng 3

Chương này đã tìm hiểu quy trình lập kế hoạch sản xuất kinh doanh và thực nghiệm
việc ứng dụng mô hình cây quyết định với thông tin đầu vào là không chắc chắn, để giải quyết
bài toán ra quyết định về sản lượng sản xuất của Xí nghiệp 1 thuộc Công ty May Thăng Long.
Do điều kiện thời gian, Chương này chỉ trình bầy phương pháp giải quyết một trong
những nội dung của bài toán lập kế hoạch sản xuất kinh doanh doanh nghiệp. Kết quả thực
nghiệm cho thấy khả năng có thể ra quyết định với thông tin không chắc chắn bằng việc công
cụ PrecisionTree trên tập dữ liệu thực tế trong quá trình lập kế hoạch.
KẾT LUẬN
Luận văn tập trung khảo cứu lý thuyết về cây quyết định, về thông tin không chắc
chắn, về qui trình lập kế hoạch sản xuất kinh doanh của doanh nghiệp và thực hành việc ra
quyết định trong lập kế hoạch sản xuất kinh doanh doanh nghiệp với thông tin không chắc
chắn bằng việc ứng dụng mô hình cây quyết định.
23
Do điều kiện thời gian và khuôn khổ cho phép, luận văn mới thực hành xây dựng mô
hình cây quyết định phục vụ ra quyết định trong lập kế hoạch sản xuất kinh doanh của một
sản phẩm thuộc một Công ty, chưa bao quát các sản phẩm cũng như toàn bộ quá trình lập kế
hoạch.
Tuy nhiên, những kết quả thu được chứng tỏ khả năng ứng dụng to lớn của mô hình
cây quyết định trong việc xử lý thông tin không chắc chắn, trong việc giúp chuyển đổi quá
trình ra quyết định mang tính chủ quan của người quản lý sang quyết định mang tính khách
quan, chính xác hơn.
Những kết quả chính mà luận văn thực hiện được là:
- Về lý thuyết: Luận văn tập trung tìm hiểu lý thuyết về cây quyết định, thông tin
không chắc chắn, quá trình ra quyết định và lập kế hoạch sản xuất kinh doanh của doanh
nghiệp.
- Về thực tiễn: Luận văn đã thực nghiệm việc lập một kế hoạch sản xuất cho doanh
nghiệp bằng việc ứng dụng mô hình cây quyết định. Kết quả thu được có thể ứng dụng vào
thực tiễn nhằm cải tiến và nâng cao chất lượng công tác lập kế hoạch sản xuất kinh doanh
trong doanh nghiệp, tư vấn cho hoạt động sản xuất kinh doanh của doanh nghiệp
Hướng phát triển tiếp theo của luận văn có thể là:
- Tiếp tục nghiên cứu quá trình ra quyết định với thông tin không chắc chắn trong lập kế
hoạch phát triển kinh tế xã hội cấp tỉnh và cấp quốc gia bằng việc ứng dụng mô hình cây
quyết định.
- Hoàn thiện quy trình ứng dụng mô hình cây quyết định với thông tin không chắc
chắn trong việc lập kế hoạch sản xuất kinh doanh doanh nghiệp, giải quyết trọn vẹn bài toán
lập kế hoạch sản xuất kinh doanh doanh nghiệp nhằm nâng cao chất lượng công tác lập kế
hoạch và tư vấn, hỗ trợ doanh nghiệp.
References
Tiếng Việt:
1. Cao Hào Thi. Giáo trình xác suất thống kê. . Trung Tâm Viện Công Nghệ Châu Á tại
Việt Nam (AITCV) -2008.
2. Đoàn Thị Thu Hà - Nguyễn Thị Ngọc Huyền, Khoa học quản lý tập 1. NXB Khoa học
Kỹ thuật, 2004.
3. Đỗ Thanh Nghị, Giáo trình khai thác dữ liệu, Đại học Cần Thơ – 2008.
4. Đinh Mạnh Tƣờng, Giáo trình trí tuệ nhân tạo, ĐH Công Nghệ -2007.
5. Nguyễn Thị Hồng Thuỷ -Nguyễn Thị Ngọc Huyền, Lý thuyết quản trị kinh doanh –
NXB Khoa học Kỹ thuật, 1997.
6. Trần Bình Minh Thực trạng lập kế hoạch sản xuất kinh doanh tại công ty cổ phần may
Thăng Long. Báo cáo chuyên đề, Đại học Kinh tế Quốc dân, 2007.
7. Võ Huỳnh Trâm –Trần Ngân Bình, Giáo trình trí tuệ nhân tạo, ĐH Cần Thơ -2008.
24
Tiếng Anh
8. Breiman, L., Friedman, J., Olshen, R., Stone, C.: Classification and Regression Trees.
Chapman & Hall, New York, 1984.
9. Douglas H., "How to Measure Anything: Finding the Value of Intangibles in Business",
John Wiley & Sons, 2007.
10. Do, T-N., Lenca, P. and Lallich, S., Enhancing network intrusion classification with the
Kolmogorov-Smirnov splitting criterion. in proc. of ICTACS‟10, The 3rd International
Conference on Theories and Applications of Computer Sciences, Vietnam, 2010.
11. Miheev, V., Vopilov, A., Shabalin, I.: The mp13 approach to the kdd‟99 classifer
learning. SIGKDD Explorations 1(2) (2000) 76–77.
12. Quinlan, J., C4.5: Programs for Machine Learning. Morgan Kaufmann Publishers, 1993.
13. Robert F. Stewart, SWOT analysis modelStandford, Menlo Park, California, 1980.
14. Shannon, C-E., A mathematical theory of communication. Bell System Technological
Journal (27):379–423, 623–656, 1948.
15. Zhang, J., Zulkernine, M., Network intrusion detection using random forests. In: Third
Annual Conference on Privacy, Security and Trust, 2005.
25

Ra quyết định với thông tin không chắc chắn bằng Cây quyết định

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Ra quyết định với thông tin không chắc chắn bằng Cây quyết định

Uploaded by

Copyright:

Available Formats

Ra quyết định với thông tin không chắc chắn

bằng việc ứng dụng mô hình cây quyết định

Vũ Thị Phương Thảo

Trường Đại học Công nghệ

CHƢƠNG 1: TỔNG QUAN VỀ MÔ HÌNH CÂY QUYẾT ĐỊNH VÀ THÔNG TIN

Đối tượng không chắc chắn

1.2.3 Ứng dụng thông tin không chắc chắn

* Công thức Bayes đƣợc phát biểu nhƣ sau:

* Mạng xác suất

- Các đỉnh của đồ thị là các biến ngẫu nhiên;

1.3 Kết luận chƣơng 1.

CHƢƠNG 2: CÔNG CỤ HỖ TRỢ XÂY DỰNG MÔ HÌNH CÂY QUYẾT ĐỊNH VÀ

3.2. Xác định vấn đề nghiên cứu

Nội dung TT Địa phương TT Toàn quốc

Chi phí cố định 30 triệu đồng 900 triệu đồng

TT địa phương tốt 0.8 0.15 0.05

Đánh giá kết quả thu đƣợc:

- IF „NCTTtốt = TRUE‟ AND „SPCTBT=TRUE‟ THEN “ SLSX = 506120 sp”

Khách hàng Sản Doanh thu

3.5 Kết luận chƣơng 3

You might also like