You are on page 1of 12

การพัฒนาโปรแกรมด้วย WEKA เบื้ องต้น

Waikato Environment for Knowledge Analysis

Go >>>

Exit

CS@KMUTNB
Presentation By : Mr.Wassanun Sangjun [Nick]
Topics in presentation today

1) Explorer Application
1.1) How to use data ? - วิธีในการนำขอ ์ ่ีสนับสนุ น
้ มูลเขา้ และรู ปแบบไฟลท
1.2) Preprocess Tab – สว่ นการแสดงผลทางสถิติเบื้องตน ้
1.3) Classify Tab - สว่ นการวิเคราะหข์ อ
้ มูลแยกตามคลาสหลักหรื อเป้าหมาย 
        ที่กำหนด

2) Classify Tab
2.1) Test Option - ตัวเลือกกระบวนการในการทดสอบ 4 รู ปแบบ
2.2) Classifier Output – ความหมายและความสำคัญของผลลัพธ ์

3) Multilayer Perceptron [MLP]


3.1) Principle of MLP – หลักการและแนวคิดของ MLP

Next
Explorer Application

้ มูลเขา้ และรู ปแบบไฟลที่โปรแกรม


How to use data ? - วิธีในการนำขอ
WEKA สนับสนุ น

เมื่อเขา้ โปรแกรมก็จะมีหน้าตา่ งลักษณะดังนี้ ใหเ้ ราเริ่ ม


การทำงานโดยกดคลิกที่ป่ ุม Explorer

ทางดา้ นซา้ ยมือ คือ หน้าจอการทำงานของ


สว่ น  Application Explorer
ใหเ้ ราเลือก Open file… เพื่อนำขอ ้ มูลเขา้

Next
Explorer Application

้ มูลที่โปรแกรมสนับสนุ น ที่ไดล
ลักษณะไฟลข์ อ ้ องนำมาใชง้ าน คือ ไฟลใ์ นสกุล .CSV
และ .ARFF

้ มูลในตารางเพื่อบันทึกเป็นไฟล ์ .CSV ใน MS Excel


ลักษณะไฟลข์ อ

Next
Explorer Application

@relation name – เป็นสว่ นที่บอก


วา่ จัดการกับไฟลข์ อ
้ มูลอะไร
@attribute ‘column name’ data
type – เป็นสว่ นที่บอกวา่ มีตัวแปรอะไร
บา้ ง และเป็นตัวแปรประเภทใด ซ่ึงจะมี
แบบที่เป็น
- Numeric คือ ขอ ้ มูลแบบตัวเลข
- Nominal คือ ขอ ้ มูลแบบอื่นที่ไมใ่ ช่
ตัวเลข เชน่  String , Date Time
เป็นตน ้
รวมถึงการกำหนดคลาสของตัวแปรตา่ งๆ
ได้

@data – เป็นสว่ นของขอ ้ มูลที่กำหนด


ขึ้นตาม attribute ตา่ งๆ

้ มูลในรู ปแบบ .ARFF


ลักษณะไฟลข์ อ Next
1 2

เมื่อนำขอ
้ มูลเขา้ ไดสำ
้ เร็จก็จะไดผ
้ ลลัพธด
์ ั งภาพดา้ นบน Next
Explorer Application

จากรู ปภาพที่ ผ่านมานั้นสามารถอธิบายรายละเอี ยดของสว


่ นต่างๆ ดังนี้

1 คือปุ่ม Preprocess Tab ไวใ้ ชสำ ้ มูลทางสถิติเบื้อง


้ หรับดูการวิเคราะหข์ อ
ตน ่ การหาคา่  Maximum , Minimum , Mean , SD
้  เชน

คือปุ่ม Classify Tab สว่ นการวิเคราะหข์ อ


้ มูลแยกตามคลาสหลักหรื อเป้าหมาย
2
ที่กำหนด ซ่ึงจะกลา่ วในเรื่ องถัดไป

คือสว่ นของหน้าจอที่แสดง attribute ตา่ งๆ ที่เรามีโดยเราสามารถเลือกกด


3 เปลี่ยนไปมาได ้ เพื่อดูคา่ ของขอ
้ มูลตา่ งๆ และกราฟ

4 คือสว่ นของหน้าจอแสดงคา่ ทางสถิติของ attribute ที่ถูกเลือก ซ่ึงจะประกอบไป


ดว้ ยคา่  Maximum , Minimum , Mean , SD

5 คือสว่ นของหน้าจอที่แสดงกราฟของแตล่ ะ attribute ซ่ึงเราจะเห็นความถี่บน


แทง่ กราฟไดท้ ่ีน่ี  โดยกราฟจะถูกเปลี่ยนแปลงไปตาม attribute ที่ถูกเลือก

Next
Classify Tab

1
2
เมื่อกดปุ่ม
Classify
Tab ก็จะได้
3 หน้าจอดังภาพ
ดา้ นซ้าย

Next
Classify Tab

จากรู ปภาพที่ ผ่านมานั้นสามารถอธิบายรายละเอี ยดของสว


่ นต่างๆ ดังนี้

1 เป็ นสว่ นของการเลือกวิธีการในการจัดการกับขอ ้ มูล ซ่ึงมีอยูอ่ ยา่ งหลากหลายรู ป


แบบ เชน ้ มูลดว้ ยการใชว้ ธิ ี Multilayer Perceptron
่  การทดสอบและเรี ยนรู้ ขอ
เป็ นตน้

เป็นสว่ นของตัวเ้ลือกวิธีการในการทดสอบและการเรี ยนรู ้ ของระบบซ่ึงมีอยูด


่ ้วย
2
กัน 4 รู ปแบบ ดังจะอธิบายในหน้าถัดไป

คือสว่ นของหน้าจอแสดงผลลัพธท ์ ่ีเกิดจากการรันผลจากการวิเคราะหข์ อ ้ มูลของ


3 ระบบตามการเรี ยนรู้ ท่ีป้อนเขา้ ไป ซ่ึงจะเป็นคา่ ทางสถิติ เชน
่ คา่ สั มประสทิ ธิ์สห
สัมพันธ์ (Correlation Coefficient) คา่ ความผิดพลาดสัมบูรณ์ (Mean
Absolute Error) เป็ นตน ้ ซ่ึงผลที่ไดจ้ ะมีความแตกตา่ งกันออกไปขึ้นอยูก ่ ับ
attribute อันดับสุดทา้ ยวา่ เป็น numeric หรื อ nominal

Next
Classify Tab

Test Option มี อยู ่ด้วยกันทั้งหมด 4 รู ปแบบ คื อ

1) Use Training Set – Use all data to train and test.

2) Supplied test set – Can separate data for train and test by yourself.

3) Cross – validation folds – Separate all data into number of group


then leave one out for test and the other for train. Repeat it until
all of data’s group being tested.
Example : Have data 3 groups (3 cycles) , so the cycle as follows.
3.1) group 1 for test , group 2,3 for train.
3.2) group 2 for test , group 1,3 for train.
3.3) group 3 for test , group 1,2 for train.

4) Percentage split – Data sampling as a percentage.


Example : 25% means 25% for train and 75% for test.

Next
Multilayer Perceptron [MLP]

หลักการและแนวคิดของ Multilayer Perceptron (ระบบโครงข่ายประสาทเที ยม


แบบหลายชั ้ น)

Next
Multilayer Perceptron [MLP]

์ ระกอบที่ น่าสนใจ 4 สว
จากภาพจะเห็ นองคป ่ น ได้แก่

้ มูลขาเขา้  ซ่ึงมีคา่ อยูใ่ นชว่ ง ระหวา่ ง -1 ถึง 1


1) Input Layer – สว่ นของขอ

2) Hidden Layer – สว่ นของการรับคา่ ขอ ้ มูลเขา้ ที่ไดร้ ั บการคิดกับคา่ ที่ weight


บนเสน้ เช่ือม (neurons) โดยระดับชั นของ
้  hidden layer จะมีก่ีระดับก็ไดแ ้ ต่
้  โดยหน้าที่ในชั นนี
้ อมากกวา่ นัน
้ ่ 1 ชั นหรื
ตังแต ้ ้  คือพยายามรับคา่ จาก input ที่เขา้
มาและพยายามจัดใหแ ้ ยกแยะความแตกตา่ งไดโ้ ดยใชเ้ สน ้ ตรงเสน ้ เดียว

3) Output Layer – สว่ นของขอ ์ ่ีคาดหวังจากการทำนาย


้ มูลขาออกหรื อผลลัพธท

4) Neurons – โหนดที่เป็ นตัวประสาทเทียมที่ถูกเช่ือมไวด ้ ที่ถว่ งคา่ น้ำหนักเอาไว้


้ ว้ ยเสน

Exit

You might also like