You are on page 1of 91

โครงงานวิศวกรรมไฟฟ้า

ภาควิชาวิศวกรรมไฟฟ้า
คณะวิศวกรรมศาสตร์ มหาวิทยาลัยเกษตรศาสตร์

เรื่อง

การจาแนกผู้ป่วยโรคอัลไซเมอร์แบบอัตโนมัติด้วยภาพเอ็มอาร์ไอและการ
เรียนรู้ของเครื่อง
Automated Classification of Alzheimer's Disease using MRI
Images and Machine Learning Techniques

โดย
ลภัสรดา สุทธิคนึง 6110501719
ประกายแก้ว สังข์ทอง 6110551511

พ.ศ. 2564
การจำแนกผู้ป่วยโรคอัลไซเมอร์แบบอัตโนมัติด้วยภาพเอ็มอาร์ไอและการเรียนรู้ของเครื่อง
Automated Classification of Alzheimer's Disease using MRI Images and Machine Learning Techniques

โดย
ลภัสรดา สุทธิคนึง 6110501719
ประกายแก้ว สังข์ทอง 6110551511

โครงงานวิศวกรรมไฟฟ้า
ภาควิชาวิศวกรรมไฟฟ้า
คณะวิศวกรรมศาสตร์ มหาวิทยาลัยเกษตรศาสตร์

ตามหลักสูตร
วิศวกรรมศาสตรบัณฑิต สาขาวิศวกรรมไฟฟ้า

ได้รับการพิจารณาเห็นชอบโดย
อาจารย์ที่ปรึกษาโครงงาน ผศ.ดร.พันศักดิ์ เทียนวิบูลย์ วันที่........เดือน…....…........พ.ศ.…………
(.....................................................................)
กรรมการ ผศ.ดร.กาญจนพันธุ์ สุขวิชชัย วันที่............เดือน…....…….……....พ.ศ.…………
(.....................................................................)

ii
ลภัสรดา สุทธิคนึง 6110501719 ปีการศึกษา 2564
ประกายแก้ว สังข์ทอง 6110551511 ปีการศึกษา 2564

การจำแนกผู้ป่วยโรคอัลไซเมอร์แบบอัตโนมัติด้วยภาพเอ็มอาร์ไอและการเรียนรู้ของเครื่อง
ปริญญาวิศวกรรมศาสตรบัณฑิต (สาขาวิศวกรรมไฟฟ้า) ภาควิชาวิศวกรรมไฟฟ้า
คณะวิศวกรรมศาสตร์ มหาวิทยาลัยเกษตรศาสตร์

บทคัดย่อ

เมื่อพิจารณาจากข้อจำกัดทางการแพทย์ในปัจจุบัน การวินิจฉั ยภาพ MRI ของผู้ป่วยโรคอัลไซเมอร์โ ดยแพทย์


ผู้เชี่ยวชาญจำเป็นจะต้องใช้เ วลาพอสมควรในการวินิจ ฉัย ดังนั้นเราจึง หาวิธีการวินิจฉัยที่สามารถประหยัดเวลา และ
สามารถจำแนกภาพ MRI ของโรคอัลไซเมอร์ (AD) ได้อัตโนมัติโดยผ่านการเรียนรู้ของเครื่องและการเรียนรู้เชิงลึก ซึ่งเราจะ
สร้างและพัฒนาอัลกอริธึมที่ใช้ในการจำแนก ทั้งการวินิจฉัยโรคอัลไซเมอร์ (AD) และภาวะปกติทางปัญญา (CN) เพื่อให้ได้
ผลลัพธ์และความแม่นยำตามที่ต้องการมากที่สุด โดยมีการอิงจากภาพการสแกนของโครงสร้างสมอง (MRI) ในงานวิจัยนี้
เราได้มีการนำชุดข้อมูลในการทำวิจัยมาทั้งหมด 400 ชุดข้อมูล (200 ข้อมูลของโรคอัลไซเมอร์ [AD] และ 200 ข้อมูลของ
Cognitively Normal [CN]) โดยนำข้อมูลทั้งหมดมาจาก Alzheimer's Disease Neuroimaging Initiative (ADNI)
การวิจัยในครั้งนี้จะประกอบไปด้วยการดำเนินงานสองส่วนหลัก โดยแต่ละส่วนมีวิธีการเตรียมข้อมูล ที่แตกต่างกัน
ส่วนแรกจะมีการนำข้อมูลภาพสามมิติของการสแกนโครงสร้างสมอง (MRI) ไปใช้โดยตรงในการจำแนกประเภทโดยใช้
เทคนิคโครงข่ายประสาทเทียม ส่วนที่สองจะมีการนำข้อมูลภาพสามมิติของการสแกนโครงสร้างสมอง (MRI) ไปทำการดึง
คุณสมบัติปริมาตรของแต่ละส่วนโครงสร้างสมอง โดยใช้เทคนิคการแบ่งส่วนสมองด้วยซอฟแวร์มัลเพม (MALPEM) จากนั้น
นำมาจำแนกโดยผ่านการเรียนรู้ของเครื่องหรือการเรียนรู้เชิงลึก
หลังจากวิธีการดำเนินงานที่กล่าวข้างต้น เราจะทำการนำผลลัพธ์ของการดำเนินงานทั้งสองวิธี นำมาเปรียบเทียบดู
ความถูกต้องแม่นยำของการจำแนกในแต่ละวิธีการ และพยายามพัฒนาอัลกอริธึม ความน่าเชื่อถือให้มากขึ้นอ้างอิงตาม
ความแม่นยำ ซึ่งผลลัพธ์มีความแม่นยำมากพอสมควร ในอนาคตเราอาจจะสามารถนำอัลกอริธึมนีไ้ ปใช้ในทางการแพทย์ได้
จริง หรือจะสามารถประยุกต์ใช้ในการวิจัยอื่นๆต่อไป

คาสาคัญ โรคอัลไซเมอร์,การเรียนรู้เชิงลึก, การจำแนก, โครงข่ายประสาทเทียม, มัลเพม

เลขทีเ่ อกสารอ้างอิงภาควิชา E5066-PST-2-2564

iii
Lapasrada Sutthikanung 6010551358 Academic Year 2020
Prakaikeaw Sungthong 6110551511 Academic Year 2020
Automated Classification of Alzheimer's Disease using MRI Images and Machine Learning Techniques
Bachelor’s Degree in Electrical Engineering Department Electrical Engineering
Faculty of Engineering, Kasetsart University

Abstract

Currently, diagnosing Alzheimer's patients with an MRI by a skilled physician takes time due to
medical limitations. As a result, this project presents on how to design and develop classification
algorithms that can automatically classify MRI pictures of Alzheimer's Disease (AD) by using machine
learning and deep learning to achieve the optimal results when diagnosing Alzheimer's Disease (AD) and
Cognitive Normal (CN). In this research, a scan of brain structures (MRI) was used. We used 400 datasets
(200 for AD and 200 for CN) from the Alzheimer's Disease Neuroimaging Initiative (ADNI).

There are two main approaches to this project. Each approach uses a different data preparation
method. The first section directly uses the 3D images of the brain structure scan (MRI) for classification
using neural network techniques (CNN). In the last approach, 3D images of the brain structure scan (MRI)
are used to extract the volumes features of each brain structure using brain segmentation techniques
with the MALPEM method (MALPEM) and classify by using machine learning or deep learning.

From the classification result. After utilizing the operating methods, the study focuses on combining
the outcomes of both operations and comparing them to see how accurate each method's classification
is. This project is aiming to improve the algorithm to make results more accurate. If the results are
accurate enough, this algorithm could be able to use in medical treatment, or it may be used in other
research in the future.

Keywords: Alzheimer’s disease, Deep learning, Classification, CNN, MALPEM

Department Reference No. E5066-PST-2-2564

iv
กิตติกรรมประกาศ
โครงงานวิศวกรรมไฟฟ้า และรายงานฉบับนี้จะไม่สามารถสำเร็จตามวัตถุประสงค์ ที่ตั้งไว้ได้ ถ้าหากปราศจากการ
ได้รับความช่วยเหลือ ของ ผศ.ดร.พันศักดิ์ เทียนวิบูลย์ อาจารย์ที่ปรึกษาโครงงาน และผศ.ดร.กาญจนพันธุ์ สุขวิชชัย
อาจารย์กรรมการ ที่ ได้ช่วยกรุณาให้คำแนะนำ คำปรึกษา ตลอดจนคำติชม เพื่อที่จะนำไปทำให้โครงงานวิศวกรรมไฟฟ้า
และรายงานฉบับนี้สามารถพัฒนาแก้ไขปรับปรุงข้อผิดพลาดต่างๆไปในทางที่ดีขึ้นได้ ทั้งนี้ผู้จัดทำได้มีความตระหนักถึง
ความเอาใจใส่และความทุ่มเทตั้งใจจริงในการให้ความช่วยเหลือ ของอาจารย์ทั้งสองท่าน ผู้จัดทำจึงขอกราบขอบพระคุณ
เป็นอย่างสูง ณ โอกาสนี้

ขอขอบพระคุณบิดามารดา ที่ ได้สนับสนุน และให้กำลังใจมาตลอดจนโครงงานวิศวกรรมไฟฟ้า และรายงานฉบับนี้


ประสบความสำเร็จตามวัตถุประสงค์ที่ตั้งไว้ได้

ขอขอบพระคุณคณะวิศวกรรมศาสตร์ มหาวิทยาลัยเกษตรศาสตร์ ที่ได้ให้การสนับสนุนเป็นเงินทุนในการจัดทำ


โครงงานวิศวกรรมไฟฟ้านี้

ขอขอบคุณนายปัณณธร จันทร์พิทักษ์ ที่ได้ให้ความช่วยเหลือ และได้ให้คำแนะนำตลอดจนโครงงานวิศวกรรมไฟฟ้า

นอกจากนี้ยังมีบุคคลที่ทางข้าพเจ้าไม่ได้กล่าวถึงอีกเป็นจำนวนมาก อาทิ อาจารย์ท่านอื่น รวมถึงเพื่อนของ ทาง


ผู้จัดทำ ที่คอยให้ความช่วยเหลือในการทำโครงงานวิศวกรรมไฟฟ้า มาเสมอ ผู้จัดทำขอขอบพระคุณเป็นอย่างสูง จาก
การศึกษาโครงงานในครั้งนี้ ผู้จัดทำจะนำความรู้ ประสบการณ์ ประโยชน์ และคุณค่า ที่ได้รับมานำไปประยุกต์ใช้ให้เกิด
ประโยชน์ในอนาคตต่อไป

ลภัสรดา สุทธิคนึง 6110501719


ประกายแก้ว สังข์ทอง 6110551511
ผู้จัดทำ

v
สารบัญ

บทคัดย่อ III
ABSTRACT IV
กิตติกรรมประกาศ V
สารบัญ VI
สารบัญภาพ VIII
สารบัญตาราง XII
คำอธิบายสัญลักษณ์และคำย่อ XIII
1 บทนำ 1
1.1. วัตถุประสงค์ของโครงงาน 1
1.2. ขอบเขตของโครงงาน 1
2 ทฤษฎีที่เกี่ยวข้อง 2
2.1 โรคอัลไซเมอร์ (ALZHEIMER’S DISEASE) 2
2.2 การใช้คลื่นสนามเเม่เหล็กในการถ่ายภาพของโรคอัลไซเมอร์ (3D MRI IMAGE) 4
2.3 การเรี ยนรู ้ของเครื่ อง (MACHINE LEARNING) 6
2.4 การเรี ยนรู ้เชิงลึก (DEEP LEARNING) 6
2.5 การถ่ายทอดการเรี ยนรู ้ (TRANSFER LEARNING) 9
2.6 มัลเพม (MALPEM) 9
2.7 ปริ มาตรของสมอง (BRAIN VOLUMES FEATURE) 10
2.8 การวิเคราะห์การจำแนกประเภทเชิงเส้น (LINEAR DISCRIMINANT ANALYSIS) 12
2.9 STANDARDIZATION (Z-SCORE NORMALIZATION) 12
2.10 ค่าสหสัมพันธ์ (CORRELATION) 12
3 เครื่องมือที่ใช้ในการทำโครงงาน 13
3.1 HARDWARE 13
3.2 SOFTWARE 13
4 วิธีการดำเนินโครงงาน 16

vi
การดาเนินงานในส่วนที่ 1) 16
แผนผังการดาเนินงานในส่วนที่ 1) 18
การดาเนินงานในส่วนที่ 2) 19
แผนผังการดาเนินงานในส่วนที่ 2) 22
5 ผลการดำเนินโครงงานและวิจารณ์ 23
ผลดาเนินงานในส่วนที่ 1) 23
ผลดาเนินงานในส่วนที่ 2) 44
6 สรุปผลการดำเนินงานและข้อเสนอแนะ 74
สรุ ปผลการดาเนินงาน 74
ข้อเสนอแนะ 76
7 บรรณานุกรม 77
ประวัตินิสิต 78

vii
สารบัญภาพ
รูปที่ 1 โครงสร้างสมองแต่ละส่วน ........................................................................................................................................2
รูปที่ 2 เปรียบเทียบสมองผู้ป่วยปกติ กับผูป้ ่วยโรคอัลไซเมอร์...............................................................................................2
รูปที่ 3แสดงเซรีบรัมคอร์เทกซ์ส่วนจัดเก็บความทรงจำ.........................................................................................................3
รูปที่ 4 การทำลายสมองของโรคอัลไซเมอร์โดยจะเริ่มทำลายจากสมองส่วนฮิปโปแคมปัส ....................................................3
รูปที่ 5 เซลล์ประสาทหรือนิวรอนปกติ .................................................................................................................................3
รูปที่ 6 เซลล์ประสาทถูกทำลายโดยโรคอัลไซเมอร์ โดยเริ่มจากสมองส่วนฮิปโปแคมปัส .......................................................4
รูปที่ 7 เบต้า-อะไมลอยด์ (BETA-AMYLOID) ชนิดไม่ละลายน้ำซึ่งเมื่อไปจับกับเซลล์ประสาทหรือนิวรอนจะส่งผลให้เซลล์
ประสาทเสื่อมและฝ่อลง ..........................................................................................................................................4
รูปที่ 8 ภาพถ่าย MRI ของสมองปกติ ระยะแรกของของอัลไซเมอร์ และสมองผูป้ ่วยโรคอัลไซเมอร์ ......................................5
รูปที่ 9 การตัดสมองที่ใช้ในทางการแพทย์ โดยจะตัดเห็นส่วยฮิปโปแคมปัสของสมอง ...........................................................6
รูปที่ 10 โมแดล CONVOLUTION NEURON NETWORK โมเดล 1-3 .........................................................................................7
รูปที่ 11 โมเดล CONVOLUTION NEURON NETWORK โมเดล 4-5 ที่ได้รับแรงบันดาลใจมาจากโมเดล GOOGLENET ในส่วน
INCEPTION ..............................................................................................................................................................7
รูปที่ 12 โมเดล CONVOLUTION NEURON NETWORK โมเดล 6-7 ที่ได้รบั แรงบันดาลใจมาจากโมเดล GOOGLENET และ
RESNET ..................................................................................................................................................................8
รูปที่ 13 ผลลัพธ์ความแม่นยำของโมเดล (ACCURACY) .........................................................................................................8
รูปที่ 14 การทำงานของเทคนิคถ่ายทอดการเรียนรู้ ..............................................................................................................9
รูปที่ 15 ขั้นตอนการทำงานของ MALPEM..........................................................................................................................9
รูปที่ 16 การแบ่งปริมาตรในแต่ละส่วนของสมอง .............................................................................................................. 10
รูปที่ 17 โครงสร้างของสมองที่แยกย่อยออกมาทั้งหมด 138 โครงสร้าง ............................................................................. 11
รูปที่ 18 ชื่อแต่ละส่วนของโครงสร้างสมอง ........................................................................................................................ 11
รูปที่ 19 ตัวอย่างโปรแกรม MANGO .................................................................................................................................. 14
รูปที่ 20 ตัวอย่างโปรแกรม SPM....................................................................................................................................... 15
รูปที่ 21 แผนผัง FLOW CHART การดำเนินงานในส่วนที่1 .................................................................................................. 18
รูปที่ 22 แผนผัง FLOW CHART การดำเนินงานในส่วนที่2 .................................................................................................. 22
รูปที่ 23 ประสิทธิภาพโมเดลจากการศึกษาบทความ ......................................................................................................... 23
รูปที่ 24 ตัวอย่างผลลัพธ์ข้อมูลรูปภาพ3มิติมาสไลด์เป็นรูปภาพ2มิติผ่านของผู้ป่วย 1 คน.................................................. 23
viii
รูปที่ 25 สร้าง MODEL CONVOLUTION NEURAL NETWORK ผ่าน DEEP NETWORK DESIGNER APP..................................... 24
รูปที่ 26 นำข้อมูลรูปภาพเข้าผ่าน DEEP NETWORK DESIGNER APP โดย LABEL 2 CLASS AD และ CN ............................. 25
รูปที่ 27 ACCURACY และ LOSS ของโมเดล โดยได้ VALIDATION ACCURACY 57% ............................................................ 26
รูปที่ 28 การตัดสไลด์รูปภาพแบบใหม่(HORIZONTAL CUT FIXED Y).................................................................................. 27
รูปที่ 29 การปรับขนาดไฟล์ภาพ(RESIZE) เป็นขนาด 224*224 .......................................................................................... 27
รูปที่ 30 การเพิ่มค่าสีที่ขอบภาพ(PADDING) เป็นขนาด 224*224 ...................................................................................... 28
รูปที่ 31 ผลลัพธ์ความแม่นยำ(ACCURACY) ของการเพิ่มค่าสีที่ขอบภาพ(PADDING (ACCURACY) 50% .............................. 28
รูปที่ 32 ผลลัพธ์ความแม่นยำ(ACCURACY) ของการปรับขนาดไฟล์ภาพ(RESIZE) 60.71% ................................................ 29
รูปที่ 33 ผลลัพธ์ความแม่นยำ(ACCURACY) ของโมเดล GOOGLENET 68.18% และ ค่าการสูญเสีย(LOSS) 0.8.................. 29
รูปที่ 34 แสดงผลลัพธ์ความแม่นยำ(ACCURACY) ของโมเดล VGG-16 65.91% และค่าการสูญเสีย(LOSS) 0.8................. 30
รูปที่ 35 ผลลัพธ์ความแม่นยำ(ACCURACY) ของโมเดล ALEXNET 79.55% และ ค่าการสูญเสีย(LOSS) 0.5 ........................ 30
รูปที่ 36 โมเดล ALEXNET.................................................................................................................................................. 31
รูปที่ 37 แสดงผลลัพธ์ความแม่นยำ(ACCURACY) ของโมเดล ALEXNET 85% และ ค่าการสูญเสีย(LOSS) 0.48................... 32
รูปที่ 38 ผลลัพธ์ความแม่นยำ(ACCURACY) ของโมเดล ALEXNET 87.50% และ ค่าการสูญเสีย(LOSS) 0.4 ........................ 32
รูปที่ 39 ผลลัพธ์ของโมเดล ALEXNET ในการจำแนก 3 ประเภทสมอง โดยค่าความแม่นยำ(ACCURACY) 78.33 % และ ค่าการ
สูญเสีย(LOSS) 0.5 ............................................................................................................................................... 33
รูปที่ 40 โค้ด MATLAB ในการจำแนกประเภทสมองโดยเทคนิคการการถ่ายทอดการเรียนรู้............................................. 34
รูปที่ 41 ผลลัพธ์เทคนิคการถ่ายโอนข้อมูลของโมเดล GOOGLENET ในการจำแนก 2 ประเภทสมอง โดยค่าความแม่นยำ
(ACCURACY) 85 % และ ค่าการสูญเสีย(LOSS) 0.4 .............................................................................................. 35
รูปที่ 42 การจำแนกประเภทของส่วนสำหรับทดสอบหาว่าโมเดลทำงานได้ดี (VALIDATION)............................................... 35
รูปที่ 43 แสดงผลลัพธ์เทคนิคการถ่ายโอนข้อมูลของโมเดล GOOGLENET ในการจำแนก 3 ประเภทสมอง โดยค่าความแม่นยำ
(ACCURACY) 68.33 % และ ค่าการสูญเสีย(LOSS) 0.7......................................................................................... 36
รูปที่ 44 ตัวอย่างผลลัพธ์ข้อมูลปริมาตรในแต่ละส่วนของโครสร้างสมองของผูป้ ่วย 1 คน ................................................... 44
รูปที่ 45 ผลลัพธ์ข้อมูลต้นฉบับปริมาตรในแต่ละส่วนของโครสร้างสมองของผูป้ ่วยทั้งหมด 300 คน ................................... 45
รูปที่ 46 ตัวอย่าง FEATURE ใหม่ของปริมาตรในแต่ละส่วนของโครสร้างสมอง.................................................................... 46
รูปที่ 47 ผลลัพธ์ข้อมูลการรวมจับคูป่ ริมาตรในแต่ละส่วนของโครสร้างสมองของผู้ป่วยทัง้ หมด 300 คน............................ 46
รูปที่ 48 การนำข้อมูลปริมาตรในแต่ละส่วนของโครสร้างสมองของผู้ป่วยทัง้ หมด 200 คนเข้ามา (CN/AD)....................... 47
รูปที่ 49 ข้อมูลไม่มีการสูญหายเกิดขึ้น............................................................................................................................... 47
รูปที่ 50 แสดงจำนวนผูป้ ่วยในแต่ละคลาส ........................................................................................................................ 48
ix
รูปที่ 51 การเปรียบเทียบโครงสร้างสมองของผู้ป่วยปกติกับผู้ป่วยอัลไซเมอร์ .................................................................... 48
รูปที่ 52 ค่า CORRELATION ของ AMYGDALA กับ HIPPOCAMPUS ...................................................................................... 49
รูปที่ 53 การกระจายตัวของกลุ่มข้อมูล (CLASSES) เมือ่ ใช้ AMYGDALA กับ HIPPOCAMPUS............................................... 49
รูปที่ 54 การกระจายตัวของกลุม่ ข้อมูล (CLASSES) 3RDVENTRICLE+AMYGDALA (ซ้าย) กับ 3RDVENTRICLE+HIPPOCAMPUS
(ขวา) ................................................................................................................................................................... 50
รูปที่ 55 การกระจายตัวของกลุ่มข้อมูล (CLASSES) 4THVENTRICLE+AMYGDALA (ซ้าย) กับ 4THVENTRICLE+HIPPOCAMPUS
(ขวา) ................................................................................................................................................................... 50
รูปที่ 56 การกระจายตัวของกลุ่มข้อมูล (CLASSES) INFLATVENT+AMYGDALA (ซ้าย) กับ ................................................. 51
รูปที่ 57 การกระจายตัวของกลุ่มข้อมูล (CLASSES)BASAL FOREBRAIN+AMYGDALA(ซ้าย) กับ
BASALFOREBRAIN+HIPPOCAMPUS (ขวา) ........................................................................................................... 51
รูปที่ 58 การกระจายตัวของกลุ่มข้อมูล (CLASSES) ENTA+AMYGDALA (ซ้าย) กับ ENTA+HIPPOCAMPUS (ขวา) .............. 52
รูปที่ 59 การกระจายตัวของกลุ่มข้อมูล (CLASSES) TMP+AMYGDALA (ซ้าย) กับ TMP+HIPPOCAMPUS (ขวา)................. 52
รูปที่ 60 ข้อมูลของผูป้ ่วยที่เลือกปริมาตรสมองมา 8 ส่วน .................................................................................................. 53
รูปที่ 61 ข้อมูลของผู้ป่วยทีเ่ ลือกปริมาตรสมองมา 8 ส่วน พร้อมกับทำการ NORMALIZE ข้อมูล.......................................... 53
รูปที่ 62 ข้อมูลในส่วน TRAIN จำนวน 160 คน (CN 80 /AD 80) ....................................................................................... 54
รูปที่ 63 ข้อมูลในส่วน TEST จำนวน 40 คน (CN 20 /AD 20) ........................................................................................... 54
รูปที่ 64 การนำข้อมูลปริมาตรในแต่ละส่วนของโครสร้างสมองของผู้ป่วยทัง้ หมด 300 คนเข้ามา (CN/MCI/AD) .............. 55
รูปที่ 65 ข้อมูลไม่มีการสูญหายเกิดขึ้น............................................................................................................................... 55
รูปที่ 66 แสดงจำนวนผูป้ ่วยในแต่ละคลาส ........................................................................................................................ 56
รูปที่ 67 ข้อมูลของผูป้ ่วยที่เลือกปริมาตรสมองมา 8 ส่วน .................................................................................................. 56
รูปที่ 68 ข้อมูลของผูป้ ่วยที่เลือกปริมาตรสมองมา 8 ส่วน พร้อมกับทำการ NORMALIZE ข้อมูล .......................................... 57
รูปที่ 69 ข้อมูลในส่วน TRAIN จำนวน 240 คน (CN 80 /AD 80/MCI 80) .......................................................................... 57
รูปที่ 70 ข้อมูลในส่วน TEST จำนวน 40 คน CN (20 /AD 20/MCI 20).............................................................................. 58
รูปที่ 71 จำนวนข้อมูลที่นำเข้า MATLAB (X_SUM=TRAIN, Y_SUM=TEST) ................................................................... 58
รูปที่ 72 ข้อมูลในส่วน TRAIN............................................................................................................................................. 59
รูปที่ 73 ข้อมูลในส่วน TEST .............................................................................................................................................. 59
รูปที่ 74 CONFUSION MATRIX ในการ TRAIN ของโมเดล RANDOM FOREST....................................................................... 59
รูปที่ 75 CONFUSION MATRIX ในการ TEST ของโมเดล RANDOM FOREST ........................................................................ 60
รูปที่ 76 การนำข้อมูลเข้า CLASSIFICATION LEARNER APP ............................................................................................... 61
x
รูปที่ 77 การเลือกใช้โมเดลบน CLASSIFICATION LEARNER APP ........................................................................................ 61
รูปที่ 78 CONFUSION MATRIX ในการ TRAIN ของโมเดล LINEAR SVM .............................................................................. 62
รูปที่ 79 CONFUSION MATRIX ในการ TEST ของโมเดล LINEAR SVM ................................................................................ 62
รูปที่ 80 CONFUSION MATRIX ในการ TRAIN ของโมเดล TRI LAYERED NEURAL NETWORK............................................... 63
รูปที่ 81 CONFUSION MATRIX ในการ TEST ของโมเดล TRI LAYERED NEURAL NETWORK ................................................ 64
รูปที่ 82 ผลลัพธ์ในการจำแนกผูป้ ่วยจำนวน 40 คน........................................................................................................... 65
รูปที่ 83 จำนวนข้อมูลที่นำเข้า MATLAB (X_SUM=TRAIN, Y_SUM=TEST) ................................................................... 66
รูปที่ 84 ข้อมูลในส่วน TRAIN............................................................................................................................................. 66
รูปที่ 85 ข้อมูลในส่วน TEST .............................................................................................................................................. 66
รูปที่ 86 CONFUSION MATRIX ในการ TRAIN ของโมเดล RANDOM FOREST....................................................................... 67
รูปที่ 87 CONFUSION MATRIX ในการ TEST ของโมเดล RANDOM FOREST ........................................................................ 67
รูปที่ 88 การนำข้อมูลเข้า CLASSIFICATION LEARNER APP ............................................................................................... 68
รูปที่ 89 การเลือกใช้โมเดลบน CLASSIFICATION LEARNER APP ........................................................................................ 69
รูปที่ 90 CONFUSION MATRIX ในการ TRAIN ของโมเดล LINEAR SVM .............................................................................. 69
รูปที่ 91 CONFUSION MATRIX ในการ TEST ของโมเดล LINEAR SVM ................................................................................ 70
รูปที่ 92 CONFUSION MATRIX ในการ TRAIN ของโมเดล TRI LAYERED NEURAL NETWORK............................................... 71
รูปที่ 93 CONFUSION MATRIX ในการ TEST ของโมเดล TRI LAYERED NEURAL NETWORK ................................................ 71
รูปที่ 94 ผลลัพธ์ในการจำแนกผู้ป่วยจำนวน 60 คน........................................................................................................... 73

xi
สารบัญตาราง
ตารางที่ 1 ตารางเปรียบเทียบผลลัพธ์ความแม่นยำ(ACCURACY) และ ค่าการสูญเสีย(LOSS) ของโมเดล ............................ 31
ตารางที่ 2 ผลลัพธ์การ TEST ระหว่าง CN และ AD ของโมเดล ALEXNET .......................................................................... 37
ตารางที่ 3 จำนวนการทายถูกผิดของการ TEST ระหว่าง CN และ AD ของโมเดล ALEXNET.............................................. 38
ตารางที่ 4 ACCURACY และ CONFUSION MATRIX ของโมเดล ALEXNET ............................................................................ 39
ตารางที่ 5 ผลลัพธ์การ TEST ข้อมูลผูป้ ่วยระหว่าง CN และ AD ของโมเดล GOOGLENET ................................................. 39
ตารางที่ 6 จำนวนการทายถูกผิดของการ TEST ระหว่าง CN และ AD ของโมเดล GOOGLENET ....................................... 41
ตารางที่ 7 ACCURACY และ CONFUSION MATRIX ระหว่าง CN และ AD ของโมเดล GOOGLENET ................................... 41
ตารางที่ 8 เปรียบเทียบผลลัพธ์ ACCURACY และ CONFUSION MATRIX ระหว่าง CN และ AD ของโมเดล GOOGLENET และ
ALEXNET ............................................................................................................................................................. 41
ตารางที่ 9 จำนวนการทายถูกผิดของการ TEST ระหว่าง CN ,MCIและ AD ของโมเดล ALEXNET ..................................... 42
ตารางที่ 10 จำนวนการทายถูกผิดของการ TEST ระหว่าง CN , MCIและ AD ของโมเดล GOOGLENET ............................ 42
ตารางที่ 11 เปรียบเทียบผลลัพธ์ ACCURACY และ CONFUSION MATRIX ระหว่าง CN ,MCIและ AD ของโมเดล GOOGLENET
และ ALEXNET ..................................................................................................................................................... 43
ตารางที่ 12 ACCURACY และ CONFUSION MATRIX ของโมเดล RANDOM FOREST ............................................................. 60
ตารางที่ 13 ACCURACY และ CONFUSION MATRIX ของโมเดล LINEAR SVM .................................................................... 63
ตารางที่ 14 ACCURACY และ CONFUSION MATRIX ของโมเดล TRI LAYERED NEURAL NETWORK..................................... 64
ตารางที่ 15 เปรียบเทียบ ACCURACY และ CONFUSION MATRIX ของแต่ละโมเดล............................................................. 65
ตารางที่ 16 ACCURACY และ CONFUSION MATRIX ของโมเดล RANDOM FOREST ............................................................. 68
ตารางที่ 17 ACCURACY และ CONFUSION MATRIX ของโมเดล LINEAR SVM .................................................................... 70
ตารางที่ 18 ACCURACY และ CONFUSION MATRIX ของโมเดล TRI LAYERED NEURAL NETWORK..................................... 72
ตารางที่ 19 การเปรียบเทียบประสิทธิภาพของแต่ละโมเดลในส่วนที่ 2.............................................................................. 72
ตารางที่ 20 เปรียบเทียบประสิทธิภาพ ACCURACY และ CONFUSION MATRIX ของ BINARY CLASSIFICATIONระหว่าง CN และ
AD ของโมเดลทั้งสองส่วน .................................................................................................................................... 74
ตารางที่ 21 เปรียบเทียบผลลัพธ์ ACCURACY และ CONFUSION MATRIX แบบ MULTICLASS CLASSIFICATIONระหว่าง CN
,MCIและ AD ของโมเดลทั้งสองส่วน.................................................................................................................... 75

xii
คาอธิบายสัญลักษณ์และคาย่อ

AD ย่อมาจาก Alzheimer’s disease


CN / HC ย่อมาจาก Cognitively normal
MCI ย่อมาจาก mild cognitive impairment
ADNI ย่อมาจาก Alzheimer’s Disease Neuroimaging Initiative
MRI ย่อมาจาก Magnetic resonance imaging
CT ย่อมาจาก Computerized Tomography
3DT1WI ย่อมาจาก 3D T1-weighted images
KNN ย่อมาจาก K-Nearest Neighbors
SVM ย่อมาจาก Support Vector Machines
CNN ย่อมาจาก Convolution Neural Network
MALPEM ย่อมาจาก Multi-Atlas Label Propagation with Expectation–Maximization
based refinement
LDA ย่อมาจาก linear discriminant analysis

xiii
1 บทนา

การทำวิจัยในครั้งนี้ เกิดมาจากการที่ในปัจจุบันโรคอัลไซเมอร์เป็นสาเหตุหลักของการนำไปสู่ภาวะสมอง
เสื่อม โดยมีสาเหตุมาจากประสิทธิภาพของสมองจะมีการลดลงอย่างต่อเนื่อง และสมองในส่วนของฮิบโปแคมปัส
จะมีประสิทธิภาพลดลงเป็นอันดับแรก ซึ่งภาวะของโรคนี้จะเป็นอันตรายทั้งต่อผู้ป่วยและคนรอบข้างที่จะได้รับ
ผลกระทบ ดังนั้นการวินิจฉัยภาวะของโรคอัลไซเมอร์จึงเป็นสิ่งที่สำคัญมาก ทั้งในเรื่องของเวลาในการวินิจฉัยและ
ประสิทธิภาพความแม่นยำถูกต้องในการวินิจฉัย เพราะถ้าสามารถวินิจฉัยได้ภายในเวลารวดเร็วและมีความแม่นยำ
ถูกต้อง ก็จะทำให้ผู้ป่วยได้รับการรักษาเร็วยิ่งขึ้น ซึ่งจะสามารถส่งผลกระทบหรือผลเสียได้ ลดลง โดยทางเราได้
ตระหนักถึงปัญหาที่กล่าวมา เราจึงมีความต้องการที่ จะแก้ไขในเรื่องของระยะเวลาในการวินิจฉัย หรือรวมถึง
พัฒนาประสิทธิภาพในการวินิจฉัย ให้มีความน่าเชื่อถือมากยิ่งขึ้น เพื่อจะสามารถนำไปประยุกต์ใช้ได้จริงในทาง
การแพทย์

1.1. วัตถุประสงค์ของโครงงาน
ต้องการที่จะจำแนกประเภทรูปภาพ MRI ว่าคนไข้คนใด เป็นผู้ป่วยโรคอัลไซเมอร์หรือไม่ได้ป่วยเป็นโรคอัล
ไซเมอร์ โดยจะสามารถจำแนกอัตโนมัติผ่านการเรียนรู้ของเครื่องคอมพิวเตอร์

1.2. ขอบเขตของโครงงาน
โครงงานวิศวกรรมไฟฟ้าในครั้งนี้ จะมีการแบ่งขอบเขตที่ชัดเจนออกเป็น 2 ส่วนหลัก ได้แก่
ส่วนที่1 จะเป็นวิธีการแรกที่เราจะนำข้อมูลรูปภาพสามมิติ MRI มาจำแนกประเภทโดยตรงผ่านวิธีการเรียนรู้
อัตโนมัตขิ องเครื่องคอมพิวเตอร์โดยใช้เทคนิคโครงข่ายประสาทเทียมแบบ Convolution Neural Network
ส่วนที่2 จะเป็นอีกวิธีการในการเตรียมข้อมูลโดยเราจะนำข้อมูลรูปภาพสามมิติ MRI เข้าไปทำตัดแบ่งส่วนสมอง
(Brain Segmentation) ให้ได้ผลลัพธ์ออกมาเป็นปริมาตร (Volumes feature) ในแต่ละส่วนของสมอง แล้วจึง
ค่อยนำปริมาตรในแต่ละส่วนของสมองมาทำการจำแนกผ่านวิธีการเรียนรู้อัตโนมัตขิ องเครื่องคอมพิวเตอร์

1
2 ทฤษฎีที่เกี่ยวข้อง
2.1 โรคอัลไซเมอร์ (Alzheimer’s Disease)
สมองของมนุษย์แบ่งออกเป็น 3 ส่วน คือ สมองส่วนเซรีบรัม เซรีเบลลัม และก้านสมอง โดยสมองส่วนเซ
รีบรัมเป็นส่วนที่ใหญ่ที่สดุ และเกี่ยวข้องกับความจำ การแก้ปัญหา ความคิด ความรู้สึก และควบคุมการเคลื่อนไหว
และสมองส่วนเซรีเบลลัมควบคุมการทรงตัวและการประสานงานของกล้ามเนื้อ และก้านสมอง ควบคุมการทำงาน
อัตโนมัติของร่างกายเช่น การหายใจ การทำงานของหัวใจ และการบีบตัวของหลอดเลือด โดยเมื่อผู้ป่วยเป็น
โรคอัลไซเมอร์ สมองจะถูกโรคอัลไซเมอร์ทำลายสมองเกือบทั้งหมด โดยจะทำลายเซลล์ประสาทและเนื้อเยื่อสมอง
เมื่อเวลาผ่านไปสมองจะหดตัวเล็กลงอย่างมาก

สมองส่วนเซรีบรัม สมองส่วนเซรีเบลลัม ก้านสมอง


รูปที่ 1 โครงสร้างสมองแต่ละส่วน

รูปที่ 2 สมองปกติ สมองผู้ป่วยโรคอัลไซเมอร์ เปรียบเทียบสมองปกติ


และสมองผู้ป่วยโรคอัลไซเมอร์
รูปที่ 2 เปรียบเทียบสมองผู้ป่วยปกติ กับผู้ป่วยโรคอัลไซเมอร์

โดยส่วนที่จะถูกทำลายก่อนเป็นอันดับแรกเริ่มจากสมองส่วนฮิปโปแคมปัส (hippocampus) ที่มีบทบาท


สำคัญในการจดจำข้อมูลใหม่ๆ เมื่อเซลล์สมองส่วนนี้ถูกทำลาย ผู้ป่วยจะเริ่มมีปัญหาเรื่องความจำโดยเฉพาะ
ความจำระยะสั้น จากนั้นความเสียหายที่เกิดขึ้น จะแพร่กระจายไปสู่สมองส่วนอื่น ๆ และส่งผลต่อการเรียนรู้
ความรู้สึกนึกคิด ภาษา และพฤติกรรม โดยจะอยู่ข้างในของชั้นเซรีบรัมคอร์เทกซ์

2
รูปที่3แสดงเซรีบรัมคอร์เทกซ์ส่วนจัดเก็บความทรงจำ
(ฮิปโปแคมปัสอยู่ข้างในของชั้นเซรีบรัมคอร์เทกซ์)

รูปที่ 4 การทำลายสมองของโรคอัลไซเมอร์โดยจะเริ่มทำลายจากสมองส่วนฮิปโปแคมปัส

โรคอัลไซเมอร์ เป็นความเสื่อมที่เกิดจากโปรตีนชนิดหนึ่งที่เรียกว่า เบต้า -อะไมลอยด์ (beta-amyloid)


ชนิดไม่ละลายน้ำซึ่งเมื่อไปจับกับเซลล์ประสาทหรือนิวรอนจะส่งผลให้เซลล์ประสาทเสื่อมและฝ่อลง รวมถึงทำให้
การสื่อสารระหว่างเซลล์ประสาทเสียหายจากการลดลงของสารอะซีติลโคลีน (acetylcholine) ซึ่งเป็นสารสื่อ
ประสาทที่ส่งผลโดยตรงกับความทรงจำ และการสะสมของเบต้า-อะไมลอยด์ส่งผลให้ประสิทธิภาพการทำงานของ
สมองค่อย ๆ ลดลง เริ่มจากสมองส่วนฮิปโปแคมปัส (hippocampus)

รูปที่ 5 เซลล์ประสาทหรือนิวรอนปกติ
3
รูปที่ 6 เซลล์ประสาทถูกทำลายโดยโรคอัลไซเมอร์ โดยเริม่ จากสมองส่วนฮิปโปแคมปัส

รูปที่ 7 เบต้า-อะไมลอยด์ (beta-amyloid) ชนิดไม่ละลายน้ำซึ่งเมื่อไปจับกับเซลล์ประสาทหรือนิวรอนจะ


ส่งผลให้เซลล์ประสาทเสื่อมและฝ่อลง

ดังนั้นโรคอัลไซเมอร์จึงเกี่ยวข้องอย่างมากกับสมองส่วนฮิปโปแคมปัส เพราะเป็นจุดเริ่มต้นในการโดนทำลาย
จึงต้องทำการวินิจฉัยดูในส่วนฮิปโปแคมปัส และสมองรอบข้างว่าเกิดการทำลายเนื้อเยือ่ จนหดตัวเล็กลง

2.2 การใช้ คลืน่ สนามเเม่เหล็กในการถ่ายภาพของโรคอัลไซเมอร์ (3D MRI image)


รูป ภาพ MRI จะเเสดงเกี่ยวกับสมองของโรคอัลไซเมอร์ ที่ได้ร ับ การทำลายจนเกิดความผิดปกติ การ
วิเคราะห์จะเป็นการพิจารณาเกี่ยวกับการนำคลื่นเเม่เหล็กมาใช้ทางด้านเทคนิคด้านการถ่ายภาพสนามเเม่เหล็ก
เเละทางด้านการแพทย์เกีย่ วกับโรคอัลไซเมอร์ ซึ่งตัวรังสีจะครอบคลุมโครงสร้างคลื่นสนามเเม่เหล็กในการถ่ายภาพ
เเสดงถึ ง การถ่ า ยภาพเทนเซอร์ แ พร่ (DTI) การติ ด ฉลากหลอดเลื อ ดแดง (ASL) สเปกโทรสโกปี ด ้ ว ยคลื่น
สนามแม่เหล็ก (MRS) และคลื่นสนามเเม่เหล็กในการถ่ายภาพเชิงฟังก์ชัน (fMRI)

4
โรคอัลไซเมอร์ (AD) เป็นโรคที่เกิดจากความผิดปกติของระบบประสาทและทำให้เกิดภาวะสมองเสื่อม ความ
บกพร่องทางสติปัญญาระดับอ่อน (MCI) เป็นรูปแบบระยะแรกของของอัลไซเมอร์ และมีลักษณะเฉพาะตัวของ
ความผิดปกติของระบบประสาท แต่ไม่ได้นับว่าอยู่ในขอบเขตของภาวะสมองเสื่อม และเป็นปัญหาเล็กน้อยใน
ความสามารถในการทำงาน โรคอัลไซเมอร์ มีส่วนเกี่ยวข้องกับการผลิตโปรตีนตั้งต้นของ amyloid มากเกินไป ซึ่ง
ส่งผลให้เกิดคราบจุลินทรีย์ในระบบประสาทเพิ่มขึ้น ทำให้เกิดความเครียดจากปฏิกิริยาออกซิเดชันและการอักเสบ
ซึ่งก่อให้เกิดความเสียหายต่อเซลล์ประสาท การวิจัยเกี่ยวกับการถ่ายภาพด้วยคลื่นสนามแม่เหล็กเป็นส่วนสำคัญที่
ใช้ในการระบุทางการเเพทย์ของ ผู้ป่วยโรคอัลไซเมอร์ ด้วยการสร้างภาพจำลองทางระบบประสาทในกายภาพ

รูปที่ 8 ภาพถ่าย MRI ของสมองปกติ ระยะแรกของของอัลไซเมอร์ และสมองผู้ป่วยโรคอัลไซเมอร์

ภาพถ่าย MRI เเสดงให้เห็นการฝ่อลงของสมองและความผิดปกติของเนื้อเยื่อ กระบวนการของการฝ่อที่


เกิดขึ้นจากสมองธรรมดา ระยะเริ่มแรกของผู้ป่วยอัลไซเมอร์ และสมองผู้ป่วยโรคอัลไซเมอร์ ในโครงสร้างส่วนตรง
กลางกลีบขมับ เยื่อหุ้มสมอง และฮิปโปแคมปัสจะเป็นส่วนที่สมองถูกทำลายไปแรกสุด เมื่อเปรียบเทียบ ปริมาณ
ฮิปโปแคมปัสของผู้ป่วยโรคอัลไซเมอร์ จะลดลง 26–27% และปริมาตร เยื่อหุ้มสมองลดลง 38–40% ปริมาณของ
ฮิปโปแคมปัสของสมองนั้นมีความเกี่ยวข้องในการทำงานของการบริหารหน่วยความจำสำหรับผูป้ ่วยโรคอัลไซเมอร์
การฝ่อของสมองจะขยายไปถึงส่วนที่เหลือของ กลีบขมับส่วนกลางโดยที่การสูญเสียสสารสีเทา(GM) เกิดขึ้นในวง
แหวนขมับที่อยู่ตรงกลาง พาราฮิปโปแคมปัส และไจริรูปฟิวซิฟอร์ม และขั้วขมับ

5
รูปที่ 9 การตัดสมองที่ใช้ในทางการแพทย์ โดยจะตัดเห็นส่วยฮิปโปแคมปัสของสมอง

2.3 การเรียนรู้ของเครื่อง (Machine Learning)


Machine Learning คือ ส่วนการเรียนรู้ของเครื่อง ในการสร้างความฉลาดการเรียนรู้ของเครื่อง เรียนรู้จาก
สิ่งที่เราส่งเข้าไปกระตุ้น แล้วจดจำเอาไว้เป็นมันสมอง ส่งผลลัพธ์ออกมาเป็นตัวเลข หรือโค้ดที่ส่งต่อไปแสดงผล
กระทำการเรียนรู้ของเครื่องเองสามารถเอาไปใช้งานได้หลายรูปแบบ ต้องอาศัยกลไกที่เป็นโปรแกรม หรือเรียกว่า
Algorithm หนึ่งใน Algorithm ที่ได้รับความนิยมสูง คือการเรียนรู้เชิงลึก (Deep Learning)

2.4 การเรียนรู้เชิงลึก (Deep Learning)


การเรียนรู้เชิงลึก คือวิธีการเรียนรู้แบบอัตโนมัติด้วยการ เลียนแบบการทำงานของโครงข่ายประสาทของ
มนุษย์ (Neurons) โดยนำระบบโครงข่ายประสาท (Neural Network) มาซ้อนกัน หลายชั้น (Layer) และทำการ
เรียนรู้ข้อมูลตัวอย่าง ซึ่งข้อมูล ดังกล่าวจะถูกนำไปใช้ในการตรวจจับรูปแบบ (Pattern) หรือจัด หมวดหมู่ข้อมูล
(Classify the Data)
การเรียนรู้ด้วยเครื่องยังขาดความสามารถในการแยกคุณสมบัติใหม่เพื่อทำการอนุมานทางชีวภาพ ด้วย
วิธีการแยกด้วยโมเดลการเรียนรู้เชิ งลึก Convolution Neuron Network (CNN) จึงสามารถทำงานอัตโนมัติได้
และคุณสมบัติเชิงพื้นที่ที่เกี่ยวข้อง แบบจำลอง CNN ทั่วไปประกอบด้วยชั้นคอนโวลูชัน (convolutional layers)
ชั้นพูลลิ่ง(pooling layers) และชั้นเชื่อมต่ออย่างสมบูรณ์(fully connected layers) และbackpropagation เพื่อ
เรียนรู้คุณสมบัติหลายระดับ

6
ยกตัวอย่างจากงานวิจัยโดยทำการเปรียบเทียบความแม่นยำของโมเดลการเรียนรู้ของเครื่อง และการเรียนรู้
เชิงลึก โดยการเรียนรู้ของเครื่องทำการใช้ Linear SVM และ Non-Linear SVM และการเรียนรู้เชิงลึกใช้โมเดล
Convolution Neuron Network (CNN) ที่มีชั้นที่แตกต่างกัน และใช้โมเดล pretrained คือ โมเดล Resnet และ
ใช้โมเดลที่ได้รับแรงบันดาลใจมาจากโมเดล GoogLeNet

รูปที่ 10 โมแดล Convolution Neuron Network โมเดล 1-3

รูปที่ 11 โมเดล Convolution Neuron Network โมเดล 4-5 ที่ได้รับแรงบันดาลใจมาจากโมเดล


GoogLeNet ในส่วน Inception

7
รูปที่ 12 โมเดล Convolution Neuron Network โมเดล 6-7 ที่ได้รบั แรงบันดาลใจมาจากโมเดล
GoogLeNet และ ResNet

รูปที่ 13 ผลลัพธ์ความแม่นยำของโมเดล (accuracy)

โดยจะสรุปได้ว่าโมเดลการเรียนรู้เชิงลึก Convolution Neuron Network จะได้ผลลัพธ์ในการจำแนกของ


โมเดลได้ดีกว่าโมเดลการเรียนรู้ของเครื่อง Linear SVM และ Non-Linear SVM และ โมเดล Pretrained คือ
GoogLeNet และ ResNet จะได้ผลลัพธ์ในการจำแนกของโมเดลดีกว่าโมเดล Convolution Neuron Network

8
2.5 การถ่ายทอดการเรียนรู้ (Transfer Learning)
Transfer Learning คือ เทคนิคที่ช่วยลดเวลาในการเทรนโมเดลการเรียนรู้เชิงลึก ด้วยการนำบางส่วนของ
โมเดลที่ทำการเรียนรู้เรียบร้อยแล้ว มาใช้เป็นส่วนหนึ่งของโมเดลใหม่ ในทางปฏิบัติการเทรน Convolutional
Neural Network ตั้งแต่ต้นเป็นเรื่องที่ทำได้ยาก เนื่องจากไม่มีชุดข้อมูลที่ใหญ่เพีย งพอ ดังนั้นจึงใช้วิธีนำโมเดล
Convolutional Neural Network ที ่ ม ี อ ยู ่ แ ล้ ว (ConvNet) ที ่ เ ทรนกั บ ชุ ด ข้ อ มู ล ขนาดใหญ่ ซึ ่ ง ก็ ค ื อ โมเดล
Pretrained โดยการนำโมเดลนั้นมาเป็นโมเดลตั้งต้นเพื่อทำการเรียนรู้ต่อไป กับชุดข้อมูลขนาดเล็กในงานเฉพาะ
ทาง หรือ ใช้สกัด Feature สำหรับงานที่ต้องการออกมา

รูปที่ 14 การทำงานของเทคนิคถ่ายทอดการเรียนรู้

2.6 มัลเพม (MALPEM)


MALPEM ย่อมาจาก Multi-Atlas Label Propagation with Expectation–Maximization based
refinement ประกอบด้วยซอฟต์แวร์ทจี่ ำเป็นในการใช้แยกสมอง และการแบ่งส่วนสมองของภาพสมอง 3D MRI
ด้วยคลื่นสนามแม่เหล็ก และจะได้ผลลัพธ์ออกมาเป็นเป็นโครงสร้าง 138 โครงสร้างปริมาตรสมอง โดยแบ่ง
ออกเป็น 40 ส่วนโครงสร้างสมองส่วนที่ไม่มีเยือ่ หุ้ม และอีก 98 ส่วนเป็นโครงสร้างสมองที่มเี ยื่อหุม้ โดยได้รับการ
พัฒนาโดย Christian Ledig ในกลุ่ม BioMedia ที่ Imperial College London ณ สหราชอาณาจักร

รูปที่ 15 ขั้นตอนการทำงานของ MALPEM


9
รูปที่ 16 การแบ่งปริมาตรในแต่ละส่วนของสมอง

2.7 ปริมาตรของสมอง (Brain volumes feature)


พื้นฐานทางศาสตร์ที่ศึกษาเกี่ยวกับสมองและระบบประสาทของมนุษย์ คือการทำความเข้าใจโครงสร้างของ
สมอง การทำงานและการตอบสนองต่อสิ่งเร้าต่าง ๆ โครงสร้างภายในสมองได้รับการยอมรับว่ามีการทำงานที่
สำคัญ และมีการเชื่อมโยงอย่างแน่นหนากับหน้าที่การรับรู้ต่าง ๆ โครงสร้างการทำงานของสมองได้แสดงให้เห็น
ความสัมพันธ์กับปริมาตรและขนาดของสมอง ดังนั้น จึงสามารถตั้งสมมติฐานความเชื่อมโยงระหว่างโครงสร้าง
ภายในสมองกับปริมาตรของสมองได้ และปริมาตรของสมองอาจส่งผลต่อการทำงานภายในสมองของมนุษย์ ดังนั้น
การที่ผู้ป่วยเป็นผู้ป่วยโรคอัลไซเมอร์จะต้องมีการฝ่อตั วของโครงสร้างภายในสมอง จึงส่งผลให้เกิดการทดลอง
วิเคราะห์ จำแนก ผู้ป่วยโรคอัลไซเมอร์ด้วยข้อมูลปริมาตรของโครงสร้างภายในสมองอีกวิธีหนึ่งนอกเหนือจากการ
ใช้ข้อมูลรูปภาพ 3D MRI เข้าไปจำแนกโดยตรง ในการหาปริมาตรของสมองจะแบ่งส่วนโครงสร้างสมองในการแบ่ง
ออกเป็น 2 ส่วนหลัก คือโครงสร้างส่วนที่ไม่มีเยื่อหุ้มสมอง และโครงสร้างส่วนที่มีเยื่อหุ้มสมอง โดยในส่วนหลักจะ
สามารถแบ่งเป็นส่วนย่อยได้อีก ซึ่งในโครงสร้างส่วนที่ไม่มีเยื่อหุ้มสมองจะสามารถแบ่งย่อยได้ 40 โครงสร้าง และ
โครงสร้างส่วนที่มีเยื่อหุ้มสมองสามารถแบ่งย่อยได้ 98 โครงสร้าง โดยแต่ละโครงสร้างมีชื่อดังแสดงในรูปภาพ

10
รูปที่ 17 โครงสร้างของสมองที่แยกย่อยออกมาทั้งหมด 138 โครงสร้าง

รูปที่ 18 ชื่อแต่ละส่วนของโครงสร้างสมอง

11
2.8 การวิเคราะห์การจาแนกประเภทเชิงเส้น (linear discriminant analysis)
การวิเคราะห์การจำแนกประเภทเชิงเส้น (LDA) จะมีการพิจารณาแยกการกระจายตัวของแต่ละกลุ่ม
(Classes) ซึ่งในการวิเคราะห์การจำแนกประเภทเชิงเส้นนั้น สิ่งที่พจิ ารณาเป็นสำคัญคือ การทีม่ ีข้อมูลต่างกลุ่มกัน
คนละคลาส มีการกระจายตัวระหว่างกันอยูห่ ่างกันที่สุด ซึง่ สามารถบ่งบอกได้ว่าข้อมูลที่นำมาทำการวิเคราะห์การ
จำแนกประเภทเชิงเส้นสามารถทีจ่ ะนำไปทำการใช้จำแนกข้อมูลแต่ละกลุ่มได้

2.9 Standardization (Z-Score Normalization)


การทำให้เป็นมาตรฐานเดียวกัน (Z-Score Standardization) คือ การทำให้เป็นมาตรฐานนี้ เป็นวิธีที่ใช้
มากในการ วิเคราะห์ทางสถิติ โดยเฉพาะอย่างยิ่งการทำให้เป็นการคำนวณหาสัดส่วน ระหว่างผลต่างของค่าตัว
แปรและค่าเฉลี่ยของตัว แปรเมื่อเทียบกับค่าของส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation) ของค่าตัวแปร
จะมีค่าอยู่ ในช่วง -4 ถึง 4

2.10 ค่าสหสัมพันธ์ (Correlation)


ค่าสหสัมพันธ์เป็นการดูทิศทางความสัมพันธ์ระหว่างตัวแปร 2 ตัว โดยมี Correlation Coefficient (r) หรือ
ค่าสัมประสิทธิ์สหสัมพันธ์ เป็นตัวบ่งชี้ถึงความสัมพันธ์นี้ ซึ่งค่าสัมประสิทธิ์สหสัมพันธ์นี้จะมีค่าอยู่ระหว่าง -1.0 ถึง
+1.0 ซึง่ หากมีค่าใกล้ -1.0 นั้นหมายความว่าตัวแปรทั้งสองตัวมีความสัมพันธ์กันอย่างมากในเชิงตรงกันข้าม หากมี
ค่าใกล้ +1.0 นั้นหมายความว่า ตัวแปรทั้งสองมีความสัมพันธ์กันโดยตรงอย่างมาก และหากมีค่าเป็น 0 นั้น
หมายความว่า ตัวแปรทั้งสองตัวไม่มีความสัมพันธ์ต่อกัน

12
3 เครื่องมือที่ใช้ในการทาโครงงาน
3.1 Hardware

• Computer : Dell G3 15, Intel(R) Core(TM) i5–8300H CPU @2.3GHz, NVDIA GEFORCE
GTX 1050, RAM 12 GB ,HDD ,SSD ,Storage: 1TB, Display 15.6 inch, OS: windows
• Computer : Asus VivoBook 15, AMD Ryzen 7 3700U, Radeon RX Vega 10, RAM 8 GB
2400 MHz, 512 GB SSD PCIe M.2, Display 15.6 inch, OS: windows
• DESKTOP PC, DELL VOSTRO, Intel(R) Core(TM) i7, RAM 8 GB , 64-bit operating system,
NVIDIA GeForce GTX 745, Ubuntu 16.04.7 LTS (Xenial Xerus)

3.2 Software

• Python
ภาษาโปรแกรม Python คือภาษาโปรแกรมคอมพิวเตอร์ระดับสูง โดยถูกออกแบบมาให้เป็นภาษาสคริปต์ที่
อ่านง่าย โดยตัดความซับซ้อนของโครงสร้างและไวยกรณ์ของภาษาออกไป ในส่วนของการแปลงชุดคำสั่งที่เรา
เขียนให้เป็นภาษาเครื่อง Python มีการทำงานแบบ Interpreter คือเป็นการแปลชุดคำสั่งทีละบรรทัด เพื่อ
ป้อนเข้าสูห่ น่วยประมวลผลให้คอมพิวเตอร์ทำงานตามที่ต้องการ
ซึ่งในส่วนการทำโครงงานวิศวกรรมไฟฟ้าในครัง้ นี้ จะใช้ภาษาโปรแกรม Python ในขั้นตอนการนำข้อมูล
รูปภาพ 3D MRI image มาผ่านโมเดล Deep learning ในการ classify รูปภาพ 3D MRI image และนำ
Python มาใช้ในการเตรียมข้อมูลเบื้องต้นในส่วนของปริมาตรของสมอง (Volumes feature) เพื่อนำข้อมูลไปใช้
ต่อในการใช้จำแนกว่าเป็น ผู้ป่วย Alzheimer’s Disease หรือไม่
• MATLAB
โปรแกรมแมทแลป เป็นซอฟต์แวร์ในการคำนวณและการเขียนโปรแกรม โปรแกรมหนึ่ง ที่มีความสามารถ
ครอบคลุมตั้งแต่การพัฒนาอัลกอริธึม การสร้างแบบจำลองทางคณิตศาสตร์ และการทำซิมเู ลชั่นของระบบ การ
สร้างระบบควบคุม และโดยเฉพาะเรือ่ ง image processing
ซึ่งในส่วนการทำโครงงานวิศวกรรมไฟฟ้าในครัง้ นี้ จะใช้ภาษาโปรแกรม MATLAB ในขั้นตอนการทำโมเดล
Deep learning ใน Application Deep network designer ในโปรแกรม MATLAB ใช้ทำโมเดล Deep
learning ในการ classify รูปภาพ 3D MRI image และในอีกส่วนจะมีการใช้ Classification Learner App ที่มี

13
อยู่ในโปรแกรม MATLAB ในการจำแนกข้อมูลปริมาตรของสมอง (Volumes feature) ว่าเป็นผู้ป่วย
Alzheimer’s Disease หรือไม่
• Linux
ลินุก ซ์ เป็นระบบปฏิบัติก ารพื้นฐานที่เป็นแบบ Open source software โดยมีก ารพัฒนาแจกจ่ายให้
ผู้ใช้งานต่างๆสามารถใช้ได้ฟรี และสามารถเข้ามาพัฒนาระบบได้ หรือจะกล่าวได้ว่า ระบบปฏิบัติการลินุกซ์ทำ
หน้าที่เป็นตัวกลางเชื่อมต่อระหว่าง Hardware และ Application เพื่อที่จะบริหารจัดการ Resource ที่มีอยู่ให้
เหมาะสม
ซึ่งในส่วนของการทำโครงงานวิศวกรรมไฟฟ้าในครั้งนี้ จะใช้เครื่องมือระบบปฏิบัติการลินุกซ์ในขั้นตอน
Brain Segmentation และจะได้ผลลัพ ธ์ออกมาเป็น Volume feature แล้วจะนำข้อมูลในส่วนนี้มาทำต่อใน
ขั้นตอนถัดไป
• MALPEM
MALPEM เป็นซอฟแวร์ที่ถูกจัดทำขึ้นมาเพื่อแบ่งส่วนภาพสมอง MRI จะประกอบไปด้วยซอฟต์แวร์และ
ไฟล์ข้อมูลสำหรับการแก้ไขอคติ การแยกสมอง (pincram) และการแบ่งส่วนภาพการสแกนโครงสร้างสมอง (MRI)
ซึ่ง ในส่วนของการทำโครงงานวิ ศวกรรมไฟฟ้ า ในครั ้ง นี้ จะใช้ ซ อฟแวร์ MALPEM ในขั้นตอน Brain
Segmentation และจะได้ผลลัพธ์ออกมาเป็น Volume feature แล้วจะนำข้อมูลในส่วนนี้มาทำต่อในขั้นตอน
ถัดไป
• Mango

รูปที่ 19 ตัวอย่างโปรแกรม Mango


14
โปรแกรม Mango เป็นโปรแกรมที่เหมาะสมสำหรับการดูภาพที่ใช้ วิจัย หรือวินิจฉัยทางการแพทย์ มี
เครื่องมือวิเคราะห์และเครื่องมืออื่นๆ สำหรับผู้ใช้เพื่อวิจัย หรือวินิจฉัยภาพที่ได้เข้ามา โปรแกรม Mango มีสาม
เวอร์ชัน โดยแต่ละเวอร์ชันจะเหมาะสำหรับแพลตฟอร์มที่แตกต่างกัน
ซึ่งในส่วนของการทำโครงงานวิศวกรรมไฟฟ้าในครั้งนี้ จะใช้เครื่องมือโปรแกรม Mango ในเวอร์ชนั ที่เป็น
Mango – Desktop สำหรับระบบปฏิบัติการ Mac OS X, Windows และ Linux โดยจะใช้โปรแกรมนี้ ในการ
อ่านไฟล์ภาพ NIFTI ที่ได้เข้ามาเพื่อจะสามารถดูภาพสมอง หรือรวมถึงการเตรียมขัอมูล เพื่อจะสามารถนำข้อมูล
ไปใช้ในขั้นตอนอื่นๆต่อไปได้
• Statistical Parametric Mapping (SPM)

รูปที่ 20 ตัวอย่างโปรแกรม SPM

โปรแกรม SPM เป็นซอฟต์แวร์ในชุดของฟังก์ชัน MATLAB (MathWorks) ถูกเขียนขึ้นเพื่อจัดระเบียบและ


ตีความข้อมูลการทำงานของ neuroimaging ซึ่งนำมาใช้เพื่อที่จะจัดการกับข้อมูลที่เข้ามาก่อนการนำข้อมูล ไปใช้
ในการจำแนกและวินิจฉัยทางการแพทย์
ซึ่งในส่วนของการทำโครงงานวิศวกรรมไฟฟ้าในครั้งนี้ จะใช้เครื่องมือโปรแกรม SPM สำหรับขั้นตอนการ
เตรียมขัอมูล โดยใช้ในการตัดกะโหลกศีรษะของภาพ MRI เพื่อจะสามารถนำข้อมูลไปใช้ในขั้นตอนอื่นๆต่อไปได้

15
4 วิธีการดาเนินโครงงาน
ได้แบ่งการทำวิจัยในครั้งนี้ออกเป็นสองส่วน ซึ่งในแต่ละส่วนจะมีวิธีการจัดเตรียมข้อมูลหรือวิธีการ
ดำเนินงานทีเ่ หมือน และแตกต่างกัน ดังต่อไปนี้

การดาเนินงานในส่ วนที่ 1)
ขั้นตอนที่1 เริ่มการดำเนินงานในส่วนนี้ โดยการหาบทความที่เกี่ยวข้องกับโครงงาน และได้เริ่มการศึกษา
งานวิจ ัย “3D image classification from CT scans” เมื่อได้ข้อมูล ในส่วนนี้ม าแล้ว ผู้จ ัดทำได้ม ีก ารศึก ษา
บทความเพิ่มส่วนในส่วนนี้แล้ว จึงได้ทำการศึกษาบทความ “การสร้าง Convolutional Neural Network (CNN)
เพื่อทำนายการปรากฏตัวของโรคปอดบวมจากไวรัสในการสแกนด้วยเครื่องเอกซเรย์คอมพิวเตอร์ ( CT)” เพื่อ
นำมาใช้เป็นแนวทางในการออกแบบโปรแกรมสำหรับการวิเคราะห์จำแนกภาพ MRI ของโรคอัลไซเมอร์โดยอาศัย
เทคนิคการเรียนรู้ของเครื่อง
ขั้นตอนที่2 เพื่อให้การการวิเคราะห์จำแนกรูปภาพสะท้อนในสนามแม่เหล็กของโรคอัลไซเมอร์สมบูรณ์ยิ่ง
ขี้น จำเป็นจะต้องทำการศึกษารูปภาพสะท้อนในสนามแม่เหล็ก เพื่อนำมาประยุกต์ใช้กับการจำลองการทำโมเดล
จำแนก ซึ่งประกอบด้วย การนำไปประยุกต์ใช้ในการทำ ขั้นตอนการเตรียมข้อมูล (preprocessing) และการเพิ่ม
จำนวนข้อมูลรูปภาพ (Augmentation) แล้วจึงสุ่มจำนวนรูปภาพที่เ ข้ามาใช้ง านในโมเดล และทดลองทำตาม
ข้อมูลที่ศึกษามา และวัดประสิทธิภาพโมเดล
ขั้นตอนที่3 จะเป็นการนำข้อมูลต้นฉบับจากฐานข้อมูล ADNI ซึงเป็นภาพ MRI 3มิติเข้ามา และไปทำการ
เตรียมข้อมูลโดยนำรูปภาพ3มิติมาสไลด์เป็นรูปภาพ2มิติผ่านโปรแกรมแมทแลป
ขั้นตอนที่4 หลังจากการนำข้อมูลตันฉบับไปสไลด์ในขั้นตอนที่ 3แล้ว เราจะได้ผลลัพธ์ออกมาเป็นภาพไฟล์
.jpg โดย 1 รูป ภาพ 3 มิติของโครงสร้างสมองของผู้ป ่วยแต่ละคนจะสไลด์อ อกมาทั้ง หมด 256 รูป ภาพ แล้ว
หลังจากนั้นเราจะคัดเลือกนำรูปภาพส่วนที่สำคัญของสมองมาคนละ 51 รูปภาพ โดยเป็นไฟล์ที่ 129-180 มา
รวมกันเพื่อที่จะนำไปใช้งานต่อในขั้นตอนถัดไป
ขั้นตอนที่5 ขั้นตอนนี้จะเป็นการทำงานของโปรแกรมที่สร้างเพื่อจะใช้ในการจำแนกจากโปรแกรมภาษา
แมทแลป เป็นส่วนของข้อมูลจากขั้นตอนที่4 มาให้เครื่องเรียนรู้ผ่านการสร้าง Convolutional Neural Network
(CNN) ผ่านแอพลิเคชั่น Deep Network designer โดยอ้างอิงโมเดลจากข้อมูลที่ศึกษามา หลังจากเริ่มการทำงาน
ของโปรแกรม จะวัดประสิทธิภาพของข้อมูล

16
ขั้นตอนที่6 พัฒนาโมเดลในโปรแกรมแมทแลป ในส่วนนี้จะประกอบไปด้วยขั้นตอนการเตรียมข้อมูลโดยใช้
จำนวนรูปภาพ 96 รูปภาพ โดยเป็น 48 รูปสมองผู้ป่วยอัลไซเมอร์(AD) และ 48 รูปสมองคนปกติ(CN) โดยทำการ
สไลด์รูปภาพแบบใหม่(Horizontal Cut Fixed Y) และทำการทำให้ขนาดรูปภาพเป็นขนาด 224*224 โดยการ
ปรับขนาดไฟล์ภาพ(resize) และการเพิ่มค่าสีที่ขอบภาพ(padding) เพื่อทำการเข้าโมเดล Pretrained และโมเดล
Pretrained ที่ใช้คือโมเดล GoogLeNet
ขั้นตอนที่7 นำข้อมูลรูปภาพที่สไลด์แบบใหม่ และปรับขนาดรูปภาพแล้วมาเข้าโมเดล Pretrained หลาย
โมเดลมากขึ้น ได้แก่ GoogLeNet ,VGG-16 และ AlexNet โดยทำการเพิ่ม จำนวนรูป ภาพเป็นรูป ภาพ 196
รูปภาพ โดยเป็นรูปภาพ 98 รูปสมองผู้ป่วยอัลไซเมอร์(AD) และ 98 รูปสมองคนปกติ(CN) และเพิ่มจำนวนรูปภาพ
เป็นจำนวนรูปภาพ 400 รูปภาพ โดยเป็นรูปภาพ 200 รูปสมองผู้ป่วยอัลไซเมอร์( AD) และ 200 รูปสมองคน
ปกติ(CN) ตามลำดับ
ขั้นตอนที8่ เพิ่มการจำแนกประเภทรูปภาพโดยเพิ่มระยะแรกของการเป็นอัลไซเมอร์( MCI) ที่ยังไม่ได้จัดอยู่
ในประเภทสมองผู้ป่วยโรคอัลไซเมอร์ โดยใช้ข้อมูลรูปภาพระยะแรกของการเป็นอัลไซเมอร์(MCI) จำนวน 200
รูปภาพ และทำการจำแนกด้วยโมเดล Pretrained โดยที่ใช้คือโมเดล AlexNet
ขั้นตอนที่9 กลับมาจำแนกประเภทรูปภาพโดยจำแนก 2 ประเภทเหมือนเดิมก่อนโดยยังไม่ใช้ชุดข้อมูล
ระยะแรกของการเป็นอัลไซเมอร์(MCI) ที่ยังไม่ได้จัดอยู่ในประเภทสมองผู้ป่วยโรคอัลไซเมอร์ โดยใช้ข้อมูลรูปภาพ
รูปภาพ 200 รูปสมองผู้ป่วยอัลไซเมอร์( AD) และ 200 รูปสมองคนปกติ (CN) และทำการใช้เทคนิคการถ่ายทอด
การเรียนรู้ (Transfer Learning) โดยโมเดล GoogLeNet
ขั้นตอนที่10 จำแนกประเภทรูปภาพโดยจำแนก 3 ประเภทโดยใช้ชุดข้อมูลระยะแรกของการเป็นอัลไซ
เมอร์(MCI) ที่ยังไม่ได้จัดอยู่ในประเภทสมองผู้ป่วยโรคอัลไซเมอร์ 200 รูปภาพ, รูปภาพสมองผู้ป่วยอัลไซเมอร์(AD)
200 รูปภาพ และรูปภาพสมองคนปกติ(CN) 200 รูปภาพ และทำการใช้เทคนิคการถ่ายทอดการเรียนรู้ (Transfer
Learning) โดยโมเดล GoogLeNet
ขั้นตอนที่ 11 เปรียบเทียบการ Train และ Test ข้อมูล classification ระหว่าง CN และ AD และ
เปรียบเทียบการ Train และ Test ข้อมูล multiclass classification ระหว่าง CN MCI และ AD

17
แผนผังการดาเนินงานในส่ วนที่ 1)

Transfer learning

รูปที่ 21 แผนผัง Flow Chart การดำเนินงานในส่วนที่1


18
การดาเนินงานในส่ วนที่ 2)
ในส่วนวิธีการดำเนินงานในส่วนที่2 จะทำการอธิบายรายละเอียดในแต่ละขั้นตอนพอสังเขป โดยจะอ้างอิง
ขั้นตอนตามในรูปที่ 6 แผนผัง Flow Chart การดำเนินงานในส่วนที่2 ดังนี้

ขั้นตอนที่1 จะเริ่มจากการไปทำการศึกษาอ่านบทความที่เกี่ยวข้องกับการวิจัย ซึ่งได้เลือกบทความที่มีชื่อ


ว่า Structural brain imaging in Alzheimer’s disease and mild cognitive impairment มาทำการศึกษา

ขั้นตอนที่2 จะเป็นการนำข้อมูลต้นฉบับจากฐานข้อมูล ADNI ซึงเป็นภาพ MRI 3มิติเข้ามา และไปทำการ


เตรียมข้อมูลโดยจะใช้วิธีการที่อ้างอิงมาจากบทความที่ได้ทำการศึกษา ซึ่งเป็นวิธี Brain Segmentation โดยขั้น
ตอนนี้จะทำผ่านซอฟแวร์ที่มีชื่อว่า MALPEM ซึ่งจะใช้งานบนระบบปฏิบัติการลินุกซ์

3D MRI images MALPEM Volumes feature


บนระบบปฏิบัติการลินุกซ์

ขั้นตอนที่3 หลังจากการนำข้อมูลตันฉบับไปผ่าน Brain Segmentation ในขั้นตอนที่2แล้ว จะได้ผลลัพธ์


ออกมาเป็น Volumes feature ของแต่ละส่วนโครงสร้างสมองของผู้ป่วยแต่ล ะคน แล้วหลังจากนั้นเราจะนำ
ผลลัพธ์ปริมาตรสมองของผู้ป่วยทุกคนมารวมไว้ในไฟล์เดียวกัน เพื่อที่จะนำไปใช้งานต่อในขั้นตอนถัดไป
ขั้นตอนที่4 ขั้นตอนนี้จะเป็นการทำงานของโปรแกรมที่สร้างเพื่อจะใช้ในการจำแนก ซึ่งงานวิจัยในครั้งนี้
จะแบ่งตัวโปรแกรมออกเป็น 2 ประเภทที่ได้นำมาใช้ ดังนี้

4.1) โปรแกรมที่1 จะเป็นโปรแกรมภาษาไพทอนซึ่งจะทำบน Google Colab จะเป็นการนำข้อมูลที่ผ่าน


การรวมข้อมูลมาแล้ว และเป็นข้อมูล Volumes feature ของผู้ป่วยทุกคนเข้ามาทำการเตรียมข้อมูลต่อเพิ่มเติม
ก่อนนำข้อมูลในส่วนนี้ไปใช้งานต่อในการจำแนกในโปรแกรมแมทแลป โดยมีขั้นตอนการดำเนินงานดังนี้
4.1.1 การเตรียมข้อมูล Binary classification คือ ผู้ป่วยปกติ (CN) และผู้ป่วยโรคอัลไซเมอร์ (AD)
ขั้นตอนที่ 4.1.1.1 เป็นการนำข้อมูลจากในขั้นตอนที่ 3 เข้าสู่ Google Colab
ขั้นตอนที่ 4.1.1.2 เป็นการเตรียมข้อมูลขั้นต้นโดยใช้ภาษาไพทอน โดยจะมีการเตรียมข้อมูลในการ
ตรวจสอบว่าข้อมูลปริมาตรสมองของผู้ป่วยแต่ละคนในไฟล์ที่ได้นำเข้ามา มีการขาดหายของข้อมูลหรือไม่ และ
ตรวจสอบว่าข้อมูลระหว่างผูป้ ่วยปกติ (CN) และผู้ป่วยโรคอัลไซเมอร์ (AD) ว่าทั้งสองคลาสมีข้อมูลที่พอ ๆ กัน
หรือไม่ (Balanced Data)
19
ขั้นตอนที่ 4.1.1.3 ทดลองเลือก feature ที่ได้ทำการการศึกษาอ้างอิงมาจากบทความต่าง ๆ ใน
อินเทอร์เน็ต ว่า feature ตัวใดที่มีความเกี่ยวข้องและส่งผลกระทบในกรณีผู้ป่วยโรคอัลไซเมอร์ เพือ่ จะช่วยในการ
จำแนกผูป้ ่วยได้แม่นยำยิ่งขึ้น
ขั้นตอนที่ 4.1.1.4 หลังจากได้ทดลองเลือก feature ทัง้ หมดเสร็จแล้ว หลังจากนั้นจะมีการเตรียมข้อมูลต่อ
โดยการทำการ Normalize ข้อมูล โดยวิธีการ Standardization (Z-Score Normalization) เพื่อช่วยในการทำ
ให้ข้อมูลปริมาตรของสมองอยู่ในช่วงเดียวกัน หรือเรียกว่าเป็นการเตรียมข้อมูลให้มมี าตรฐานร่วมกัน
ขั้นตอนที่ 4.1.1.5 ได้ทำการเตรียมข้อมูลเสร็จ ก็จะทำการบันทึก (save) ไฟล์ข้อมูล เพือ่ ที่จะนำไปใช้ต่อใน
โปรแกรมแมทแลป โดยการบันทึกไฟล์ข้อมูลจะแบ่งเป็น 2 ไฟล์ ประกอบด้วย ไฟล์ข้อมูลในส่วนที่จะนำไปใช้ใน
การ Train จำนวน 160 คน แบ่งเป็นผูป้ ่วยปกติ (CN) 80 คน และผู้ป่วยโรคอัลไซเมอร์ (AD) 80 คน ในไฟล์ข้อมูล
ถัดมาจะเป็นข้อมูลในส่วนทีจ่ ะนำไปใช้ในการ Test จำนวน 40 คน แบ่งเป็นผูป้ ่วยปกติ (CN) 20 คน และผู้ป่วย
โรคอัลไซเมอร์ (AD) 20 คน
4.1.2 การเตรีย มข้อมูล multiclass classification คือ ผู้ป ่วยปกติ (CN) ผู้ป ่วยภาวะความรู้คิ ด
บกพร่องเล็กน้อย (MCI) และผู้ป่วยโรคอัลไซเมอร์ (AD)
ขั้นตอนที่ 4.1.2.1 จะเป็นการนำข้อมูลจากในขั้นตอนที่ 3 เข้าสู่ Google Colab
ขั้นตอนที่ 4.1.2.2 จะมีการเตรียมข้อมูลโดยใช้ภาษาไพทอน โดยจะมีการเตรียมข้อมูลในการตรวจสอบว่า
ข้อมูลปริมาตรสมองของผูป้ ่วยแต่ละคนในไฟล์ที่ได้นำเข้ามา มีการขาดหายของข้อมูลหรือไม่ และตรวจสอบว่า
ข้อมูลระหว่างผู้ป่วยปกติ (CN) ผู้ป่วยภาวะความรู้คิดบกพร่องเล็กน้อย (MCI) และผู้ป่วยโรคอัลไซเมอร์ (AD) ว่าทั้ง
สามคลาสมีข้อมูลทีพ่ อ ๆ กันหรือไม่ (Balanced Data)
ขั้นตอนที่ 4.1.2.3 ทดลองเลือก feature ที่ได้ทำการการศึกษาอ้างอิงมาจากบทความต่าง ๆ ใน
อินเทอร์เน็ต ว่า feature ตัวใดที่มีความเกี่ยวข้องและส่งผลกระทบในกรณีผู้ป่วยโรคอัลไซเมอร์ เพือ่ จะช่วยในการ
จำแนกผูป้ ่วยได้แม่นยำยิ่งขึ้น
ขั้นตอนที่ 4.1.2.4 หลังจากได้ทดลองเลือก feature ทัง้ หมดเสร็จแล้ว หลังจากนั้นจะมีการเตรียมข้อมูลต่อ
โดยการทำการ Normalize ข้อมูล โดยวิธีการ Standardization (Z-Score Normalization) เพื่อช่วยในการทำ
ให้ข้อมูลปริมาตรของสมองอยู่ในช่วงเดียวกัน หรือเรียกว่าเป็นการเตรียมข้อมูลให้มมี าตรฐานร่วมกัน
ขั้นตอนที่ 4.1.2.5 ได้ทำการเตรียมข้อมูลเสร็จ ก็จะทำการบันทึก (save) ไฟล์ข้อมูล เพือ่ ที่จะนำไปใช้ต่อใน
โปรแกรมแมทแลป โดยการบันทึกไฟล์ข้อมูลจะแบ่งเป็น 2 ไฟล์ ประกอบด้วย ไฟล์ข้อมูลในส่วนที่จะนำไปใช้ใน
การ Train จำนวน 240 คน แบ่งเป็นผูป้ ่วยปกติ (CN) 80 คน ผู้ป่วยภาวะความรู้คิดบกพร่องเล็กน้อย (MCI) 80
คน และผู้ป่วยโรคอัลไซเมอร์ (AD) 80 คน ในไฟล์ข้อมูลถัดมาจะเป็นข้อมูลในส่วนทีจ่ ะนำไปใช้ในการ Test
จำนวน 60 คน แบ่งเป็นผู้ป่วยปกติ (CN) 20 คน ผู้ป่วยภาวะความรู้คิดบกพร่องเล็กน้อย (MCI) 20 คน และผู้ป่วย
โรคอัลไซเมอร์ (AD) 20 คน
20
4.2) โปรแกรมที่2 เป็นโปรแกรมภาษาแมทแลปซึ่งจะทำบนโปรแกรม MATLAB จะเป็นการนำข้อมูล
Volumes feature ของผู้ป่วยทุกคนที่ผ่านการเตรียมข้อมูลมาแล้วเรียบร้อยในโปรแกรมภาษาไพทอนบน Google
Colab นำเข้าไปทำการจำแนกผ่านแอพลิเคชั่น Classification Learner ที่มีอยู่ในโปรแกรมแมทแลป โดยจะทำ
การเลือกอัลกอริธึมที่จะเป็นการเรียนรู้ของเครื่องหรือการเรียนรู้เชิงลึกในแอพลิแคชั่นมาจำแนก ได้มีการจำแนก
เป็นทั้ง แบบสองคลาส (Binary classification) และแบบสามคลาส (multiclass classification) หลัง จากการ
จำแนกจะดูผลลัพธ์ประสิทธิภ าพอัลกอริธึม ที่ได้เลือกมาใช้งานว่าตัวไหนมีประสิทธิภาพที่ดีและเหมาะสมที่จะ
สามารถนำไปใช้งานได้จริงต่อไป โดยในส่วนนี้มีขั้นตอนในการทำงานดังนี้
4.2.1 การ Train และ Test ข้อมูลแบบ Binary classification ระหว่าง CN และ AD
ขั้นตอนที่ 4.2.1.1 เป็นการนำข้อมูลทีผ่ ่านการเตรียมข้อมูลแล้วจากในขั้นตอนที่ 4.1เข้าสู่ MATLAB
ขั้นตอนที่ 4.2.1.2 เป็นการเตรียมข้อมูลโดยใช้ภาษาแมทแลป โดยจะมีการเตรียมข้อมูลในการตัดข้อมูลใน
คอลัมน์ของ ID ผู้ป่วย และคอลัมน์ Target Classes ออกจากข้อมูลทัง้ ในส่วน Train และTest ก่อนการนำไปเข้า
Classification Learner App เพื่อทีจ่ ะได้เหลือข้อมูลเฉพาะในส่วนปริมาตรแต่ละส่วนของสมอง และจะทำสร้าง
ตัวแปรขึ้นมาเพื่อทำการเก็บข้อมูลในส่วน Target Classes แยกเก็บไว้ พร้อมทั้งทำการเปลี่ยนแปลง Target
Classes จาก CN เป็น 0 และจากAD เป็น 1
ขั้นตอนที่ 4.2.1.3 ทำการ Train ข้อมูลบน MATLAB โดยใช้โมเดล Random Forest หลังจากนั้นนำ
ข้อมูลส่วน Train เข้า Classification Learner App โดยมีการใช้ Cross Validation ด้วย
ขั้นตอนที่ 4.2.1.4 ทำการทดลองเลือกโมเดลทีจ่ ะนำมาใช้ในการ Train ข้อมูล แล้วดูค่า Accuracy และ
Confusion matrix แล้วจึงทำการนำข้อมูลในส่วน Test เข้า Classification Learner App เข้าไปแล้วทำการ
Test หลังจากนั้นดูค่า Accuracy และ Confusion matrix ใช้ในการเลือกโมเดลที่ดีที่สุด เพื่อจะนำโมเดลออกมา
ใช้ในการจำแนกข้อมูลผูป้ ่วยคนต่อคนบน MATLAB ภายนอก Classification Learner App
4.2.2 การ Train และ Test ข้อมูลแบบ multiclass classification ระหว่าง CN MCI และ AD
ขั้นตอนที่ 4.2.2.1 เป็นการนำข้อมูลทีผ่ ่านการเตรียมข้อมูลแล้วจากในขั้นตอนที่ 4.1เข้าสู่ MATLAB
ขั้นตอนที่ 4.2.2.2 เป็นการเตรียมข้อมูลโดยใช้ภาษาแมทแลป โดยจะมีการเตรียมข้อมูลในการตัดข้อมูลใน
คอลัมน์ของ ID ผู้ป่วย และคอลัมน์ Target Classes ออกจากข้อมูลทัง้ ในส่วน Train และTest ก่อนการนำไปเข้า
Classification Learner App เพื่อทีจ่ ะได้เหลือข้อมูลเฉพาะในส่วนปริมาตรแต่ละส่วนของสมอง และจะทำสร้าง
ตัวแปรขึ้นมาเพื่อทำการเก็บข้อมูลในส่วน Target Classes แยกเก็บไว้ พร้อมทั้งทำการเปลี่ยนแปลง Target
Classes จาก CN เป็น 0 จากAD เป็น 1 และจาก MCI เป็น 2
ขั้นตอนที่ 4.2.2.3 ทำการ Train ข้อมูลบน MATLAB โดยใช้โมเดล Random Forest หลังจากนั้นนำ
ข้อมูลส่วน Train เข้า Classification Learner App โดยมีการใช้ Cross Validation ด้วย

21
ขั้นตอนที่ 4.2.2.4 ทำการทดลองเลือกโมเดลทีจ่ ะนำมาใช้ในการ Train ข้อมูล แล้วดูค่า Accuracy และ
Confusion matrix แล้วจึงทำการนำข้อมูลในส่วน Test เข้า Classification Learner App เข้าไปแล้วทำการ
Test หลังจากนั้นดูค่า Accuracy และ Confusion matrix ใช้ในการเลือกโมเดลที่ดีที่สุด เพื่อจะนำโมเดลออกมา
ใช้ในการจำแนกข้อมูลผูป้ ่วยคนต่อคนบน MATLAB ภายนอก Classification Learner App

แผนผังการดาเนินงานในส่ วนที่ 2)

รูปที่ 22 แผนผัง Flow Chart การดำเนินงานในส่วนที่2

22
5 ผลการดาเนินโครงงานและวิจารณ์
ผลดาเนินงานในส่ วนที่ 1)

ผลการดาเนินงานในขั้นตอนที่1 -2 จากการศึกษาบทความที่ได้ทำการเลือกมา และศึกษาข้อมูลเพิ่มเติม


โดยทดลองทำตามข้อมูลที่ศึกษามา และวัดประสิทธิภาพโมเดลซึ่งจะทำให้ได้ผลลัพธ์มาค่อนข้างพึงพอใจ

รูปที่ 23 ประสิทธิภาพโมเดลจากการศึกษาบทความ

ผลการดาเนินงานในขัน้ ตอนที่ 3 จากการเตรียมข้อมูลผ่านการนำรูปภาพ3มิติมาสไลด์เป็นรูปภาพ2มิติผา่ น


โปรแกรมแมทแลปทั้งหมด 96 คน โดยเป็นผู้ป่วยโรคอัลไซเมอร์ 48 คน และสมองปกติ 48 คน และจะแสดง
ตัวอย่างผลลัพธ์รูปภาพของผู้ป่วย 1 คนที่ได้ข้อมูลออกมาเป็น256รูปภาพดังรูป

รูปที่ 24 ตัวอย่างผลลัพธ์ข้อมูลรูปภาพ3มิติมาสไลด์เป็นรูปภาพ2มิติผ่านของผู้ป่วย 1 คน

23
ผลการดาเนินงานในขั้นตอนที่ 4 หลังจากการนำข้อมูลตันฉบับไปสไลด์ในขั้นตอนที่3 ได้ผลลัพธ์ออกมา
เป็นภาพไฟล์ .png โดยหลังจากนั้นเราจะคัดเลือกนำรูปภาพส่วนที่สำคัญของสมองมาคนละ 51 รูปภาพ โดยเป็น
ไฟล์ที่ 129-180 มารวมกัน

ผลการดาเนินงานในขั้นตอนที่ 5 จะเป็นภาพผลลัพธ์จากโปรแกรมภาษา MATLAB ซึ่งได้ใช้แอพลิเคชั่นใน


โปรแกรมโดยมีชื่อว่า Deep Network Designer มาใช้ในการจำแนก โดยรูปภาพที่ได้แสดงทางด้านล่างต่อไปนี้
เป็นการสร้างโมเดล CNN ด้วย Deep Network Designer โดยอ้างอิงจากบทความที่ค้นคว้า และรูปต่อไปเป็นการ
นำข้อมูลผู้ป่วยทั้งหมด 88 คนเข้าในแอพลิเคชั่นเพื่อจะนำไปทำการจำแนก และต่อมาจะเป็นรูปภาพประสิทธิภาพ
ในการจำแนกของโมเดล CNN ได้ประสิทธิภาพที่ 57%

รูปที่ 25 สร้าง model Convolution neural network ผ่าน Deep Network Designer App

24
รูปที่ 26 นำข้อมูลรูปภาพเข้าผ่าน Deep Network Designer App โดย label 2 class AD และ CN

25
รูปที่ 27 Accuracy และ loss ของโมเดล โดยได้ validation accuracy 57%

ซึ่งจะเห็นว่ามีผลลัพธ์ในการจำแนกของโมเดล 2D-CNN ที่เลือกมา ยังได้ผลลัพธ์ที่ยังไม่น่าพึงพอใจ เพราะ


ประสิทธิภาพของรูปภาพลดลงเนื่องจากการสูญเสียข้อมูลสำหรับงานถ่ายภาพทางการแพทย์

26
ผลการดาเนินงานในขั้นตอนที่ 6 จากการตัดสไลด์รปู ภาพแบบใหม่(Horizontal Cut Fixed Y) และทำ
การทำให้ขนาดรูปภาพเป็นขนาด 224*224 โดยการปรับขนาดไฟล์ภาพ(resize) และการเพิ่มค่าสีที่ขอบภาพ
(padding) เพื่อทำการเข้าโมเดล Pretrained

สมองผูป้ ่วยโรคอัลไซเมอร์ สมองคนปกติ

รูปที่ 28 การตัดสไลด์รปู ภาพแบบใหม่(Horizontal Cut Fixed Y)

สมองผู้ป่วยโรคอัลไซเมอร์ สมองคนปกติ

รูปที่ 29 การปรับขนาดไฟล์ภาพ(resize) เป็นขนาด 224*224

27
สมองผูป้ ่วยโรคอัลไซเมอร์ สมองคนปกติ

รูปที่ 30 การเพิ่มค่าสีที่ขอบภาพ(padding) เป็นขนาด 224*224

และเมือ่ นำชุดข้อมูลเข้าโมเดล Pretrained โดยใช้โมเดล GoogLeNet โดยใช้ชุดข้อมูลจำนวน 96 รูปภาพ


จากสมองผู้ป่วยโรคอัลไซเมอร์ 48 คน และสมองคนปกติ 48 คน แบ่งข้อมูลไว้ใช้ในการเทรน(train) 70% และ
สำหรับทดสอบหาว่าโมเดลทำงานได้ดี(validation) 30% ได้ผลลัพธ์ในการจำแนกประเภทโดยใช้ชุดข้อมูลที่ทำการ
ปรับขนาดไฟล์ภาพ(resize) ดีกว่าการเพิ่มค่าสีที่ขอบภาพ(padding)

รูปที่ 31 ผลลัพธ์ความแม่นยำ(accuracy) ของการเพิ่มค่าสีที่ขอบภาพ(padding (accuracy) 50%

28
รูปที่ 32 ผลลัพธ์ความแม่นยำ(accuracy) ของการปรับขนาดไฟล์ภาพ(resize) 60.71%

ผลการดาเนินงานในขั้นตอนที่ 7 ผลลัพธ์จากการนำมาเข้าโมเดล Pretrained หลายโมเดลมากขึ้น ได้แก่


GoogLeNet ,VGG-16 และ AlexNet โดยทำการเพิ่มจำนวนรูปภาพเป็นรูปภาพ 196 รูปภาพ โดยเป็นรูปภาพ 98
รูปสมองผูป้ ่วยอัลไซเมอร์(AD) และ 98 รูปสมองคนปกติ(CN) โดยแบ่งข้อมูลไว้ใช้ในการเทรน(train) 70% และ
สำหรับทดสอบหาว่าโมเดลทำงานได้ดี(validation) 30%

รูปที่ 33 ผลลัพธ์ความแม่นยำ(accuracy) ของโมเดล GoogLeNet 68.18% และ ค่าการสูญเสีย(Loss) 0.8

29
รูปที่ 34 แสดงผลลัพธ์ความแม่นยำ(accuracy) ของโมเดล VGG-16 65.91% และค่าการสูญเสีย(Loss) 0.8

รูปที่ 35 ผลลัพธ์ความแม่นยำ(accuracy) ของโมเดล AlexNet 79.55% และ ค่าการสูญเสีย(Loss) 0.5

30
ตารางที่ 1 ตารางเปรียบเทียบผลลัพธ์ความแม่นยำ(accuracy) และ ค่าการสูญเสีย(Loss) ของโมเดล

GoogLeNet ความแม่นยำ(accuracy) 68.18% , ค่าการสูญเสีย(Loss) 0.8

VGG-16 ความแม่นยำ(accuracy) 65.91% , ค่าการสูญเสีย(Loss) 0.8

AlexNet ความแม่นยำ(accuracy) 79.55% , ค่าการสูญเสีย(Loss) 0.5

จากตารางจะพบว่าโมเดล AlexNet จะได้ผลลัพธ์ความแม่นยำ(accuracy)และ ค่าการสูญเสีย(Loss) ดีทสี่ ุด


และโมเดล GoogLeNet ยังมีความน่าสนใจ แต่โมเดล VGG-16 สิ้นเปลืองพารามิเตอร์ จึงไม่ทำโมเดล VGG-16
ต่อไป

และเพิม่ จำนวนชุดข้อมูลโดยรูปภาพเป็นจำนวนรูปภาพ 400 รูปภาพ โดยเป็นรูปภาพ 200 รูปสมองผู้ป่วย


โรคอัลไซเมอร์(AD) และ 200 รูปสมองคนปกติ(CN) โดยใช้โมเดล AlexNet และแบ่งข้อมูลไว้ใช้ในการเทรน(train)
90% และสำหรับทดสอบหาว่าโมเดลทำงานได้ดี(validation) 10%

รูปที่ 36 โมเดล AlexNet


31
รูปที่ 37 แสดงผลลัพธ์ความแม่นยำ(accuracy) ของโมเดล AlexNet 85% และ ค่าการสูญเสีย(Loss) 0.48

จะเห็นได้ว่าผลลัพธ์ความแม่นยำ(accuracy) และค่าการสูญเสีย(Loss) ที่ใช้โมเดล AlexNet ดีขึ้นเป็นอย่าง


มาก และเมื่อทำการปรับพารามิเตอร์ ทำให้ได้ผลลัพธ์สูงถึง 87.50%

รูปที่ 38 ผลลัพธ์ความแม่นยำ(accuracy) ของโมเดล AlexNet 87.50% และ ค่าการสูญเสีย(Loss) 0.4

32
ผลการดาเนินงานในขั้นตอนที่ 8 ผลลัพธ์ของการเพิ่มการจำแนกประเภทรูปภาพโดยเพิ่มระยะแรกของ
การเป็นอัลไซเมอร์(MCI) ที่ยังไม่ได้จัดอยู่ในประเภทสมองผู้ป่วยโรคอัลไซเมอร์ โดยใช้ข้อมูลรูปภาพระยะแรกของ
การเป็นอัลไซเมอร์( MCI) จำนวน 200 รูป ภาพ และทำการจำแนกด้วยโมเดล Pretrained โดยที่ใช้คือโมเดล
AlexNet

รูปที่ 39 ผลลัพธ์ของโมเดล AlexNet ในการจำแนก 3 ประเภทสมอง โดยค่าความแม่นยำ(accuracy)


78.33 % และ ค่าการสูญเสีย(Loss) 0.5

ผลการดาเนินงานในขั้นตอนที่ 9 ผลลัพธ์จำแนกประเภทรูปภาพโดยจำแนก 2 ประเภท โดยใช้ข้อมู ล


รูปภาพรูปภาพ 200 รูปสมองผู้ป่วยอัลไซเมอร์ (AD) และ 200 รูปสมองคนปกติ (CN) และทำการใช้เทคนิคการ
ถ่ายทอดการเรียนรู้ (Transfer Learning) โดยโมเดล GoogLeNet และแบ่งข้อมูลไว้ใช้ในการเทรน(train) 90%
และสำหรับทดสอบหาว่าโมเดลทำงานได้ดี (validation) 10%

33
รูปที่ 40 โค้ด MATLAB ในการจำแนกประเภทสมองโดยเทคนิคการการถ่ายทอดการเรียนรู้
(Transfer Learning) โดยโมเดล GoogLeNet
34
รูปที่ 41 ผลลัพธ์เทคนิคการถ่ายโอนข้อมูลของโมเดล GoogLeNet ในการจำแนก 2 ประเภทสมอง โดยค่า
ความแม่นยำ(accuracy) 85 % และ ค่าการสูญเสีย(Loss) 0.4

จะเห็นได้ว่าผลลัพธ์ของโมเดล GoogLeNet ดีขึ้นอย่างมากเมื่อทำเทคนิคการถ่ายโอนข้อมูล(Transfer Learning)

รูปที่ 42 การจำแนกประเภทของส่วนสำหรับทดสอบหาว่าโมเดลทำงานได้ดี (validation)

35
ผลการดาเนินงานในขั้นตอนที่ 10 ผลลัพธ์ในการจำแนกประเภทรูปภาพโดยจำแนก 3 ประเภทโดยใช้ชุด
ข้อมูลระยะแรกของการเป็นอัลไซเมอร์(MCI) 200 รูปภาพ, รูปภาพสมองผู้ป่วยอัลไซเมอร์(AD) 200 รูปภาพ และ
รูปภาพสมองคนปกติ(CN) 200 รูปภาพ และทำการใช้เทคนิคการถ่ายทอดการเรียนรู้ (Transfer Learning) โดย
โมเดล GoogLeNet

รูปที่ 43 แสดงผลลัพธ์เทคนิคการถ่ายโอนข้อมูลของโมเดล GoogLeNet ในการจำแนก 3 ประเภทสมอง


โดยค่าความแม่นยำ(accuracy) 68.33 % และ ค่าการสูญเสีย(Loss) 0.7

36
ผลการดาเนินงานในขั้นตอนที่ 11 ผลลัพธ์การ Test ข้อมูล classification ระหว่าง CN และ AD ของ
โมเดล AlexNet จำนวน 20 รูปภาพต่อประเภท ดังนี้

ตารางที่ 2 ผลลัพธ์การ Test ระหว่าง CN และ AD ของโมเดล AlexNet

AD

37
CN

ตารางที่ 3 จำนวนการทายถูกผิดของการ Test ระหว่าง CN และ AD ของโมเดล AlexNet

Predicted
class AD CN
True AD 13 7
CN 4 16

38
ตารางที่ 4 Accuracy และ Confusion matrix ของโมเดล AlexNet

Result AlexNet
Training Training Accuracy 87.5%
Testing Test Accuracy 72.5%
Precision 0.80
CN Recall 0.70
F1-score 0.74
Precision 0.65
AD Recall 0.76
F1-score 0.7

และผลลัพธ์การ Test ข้อมูล classification ระหว่าง CN และ AD ของโมเดล GoogLeNet จำนวน


20 รูปภาพต่อประเภท

ตารางที่ 5 ผลลัพธ์การ Test ข้อมูลผู้ป่วยระหว่าง CN และ AD ของโมเดล GoogLeNet

AD

39
CN

40
ตารางที่ 6 จำนวนการทายถูกผิดของการ Test ระหว่าง CN และ AD ของโมเดล GoogLeNet

Predicted
class AD CN
True AD 8 12
CN 0 20

ตารางที่ 7 Accuracy และ Confusion matrix ระหว่าง CN และ AD ของโมเดล GoogLeNet

Result GoogLeNet
Training Training Accuracy 85%
Testing Test Accuracy 70%
Precision 1.00
CN Recall 0.63
F1-score 0.77
Precision 0.40
AD Recall 1.00
F1-score 0.57

ตารางที่ 8 เปรียบเทียบผลลัพธ์ Accuracy และ Confusion matrix ระหว่าง CN และ AD ของโมเดล


GoogLeNet และ AlexNet

Result GoogLeNet AlexNet


Training Training Accuracy 85% 87.5%
Testing Test Accuracy 70% 72.5%
Precision 1.00 0.80
CN Recall 0.63 0.70
F1-score 0.77 0.74

41
Precision 0.40 0.65
AD Recall 1.00 0.76
F1-score 0.57 0.7

ผลลัพธ์การ Test ข้อมูล multiclass classification ระหว่าง CN ,MCI และ AD ของโมเดล AlexNet
จำนวน 20 รูปภาพต่อประเภท โดยจะทำนายออกมาเป็นประเภทของแต่ละรูปภาพเหมือนตารางด้านบน

ตารางที่ 9 จำนวนการทายถูกผิดของการ Test ระหว่าง CN ,MCIและ AD ของโมเดล AlexNet

Predicted
class AD CN MCI
AD 13 2 5
True CN 2 14 4
MCI 3 5 12

ตารางที่ 10 จำนวนการทายถูกผิดของการ Test ระหว่าง CN , MCIและ AD ของโมเดล GoogleNet

Predicted
class AD CN MCI
AD 5 6 9
True CN 0 20 0
MCI 4 3 13

42
ตารางที่ 11 เปรียบเทียบผลลัพธ์ Accuracy และ Confusion matrix ระหว่าง CN ,MCIและ AD ของโมเดล
GoogLeNet และ AlexNet

Result GoogLeNet AlexNet


Training Training Accuracy 71.67% 78.33%
Testing Test Accuracy 63.33% 65%
Precision 1.00 0.70
CN Recall 0.69 0.67
F1-score 0.82 0.68
Precision 0.25 0.65
AD Recall 0.56 0.72
F1-score 0.34 0.68
Precision 0.65 0.60
MCI Recall 0.59 0.57
F1-score 0.62 0.59

43
ผลดาเนินงานในส่ วนที่ 2)

ผลการดาเนินงานในส่วนที่ 2 ในขั้นตอนที่ 1 จากการศึกษาบทความ “Structural brain imaging in


Alzheimer’s disease and mild cognitive impairment” ที่ได้ทำการเลือกมา ทำให้สามารถเรียนรู้ขั้นตอนใน
การเตรียมข้อมูล การเลือกใช้โมเดล และสามารถนำมาประยุกต์ใช้กับโครงงานได้ ซึ่งจะทำให้ได้ผลลัพธ์ในขั้นตอน
ถัดไป
ผลการดาเนินงานในส่วนที่ 2 ในขั้นตอนที่ 2 จากการเตรียมข้อมูลผ่าน MALPEM บนระบบปฏิบัติการลิ
นุกซ์ โดยวิธี Brain Segmentation จะแสดงตัวอย่างผลลัพธ์ของผู้ป่วย 1 คนที่ได้ข้อมูลผลลัพธ์ออกมาเป็น
ปริมาตรในแต่ละส่วนของโครงสร้างสมอง หรือ Brain volumes feature ทั้งหมด 138 ส่วน ดังรูป

รูปที่ 44 ตัวอย่างผลลัพธ์ข้อมูลปริมาตรในแต่ละส่วนของโครสร้างสมองของผู้ป่วย 1 คน

44
ผลการดาเนินงานในส่วนที่ 2 ในขั้นตอนที่ 3 ภาพผลลัพธ์ที่มีการนำข้อมูลผลลัพธ์ Brain volumes
feature ของผู้ป่วยแต่ละคนมารวบรวมใส่ตาราง Excel ไว้ในไฟล์เดียวกันดังภาพด้านล่าง เพื่อนำไปใช้ต่อในการ
เตรียมข้อมูลและใช้ข้อมูลในการจำแนก ซึ่งในตาราง Excel จะมีข้อมูลของผูป้ ่วยแต่ละคน (ID) และมีข้อมูล
ปริมาตรในแต่ละส่วนของโครงสร้างภายในสมองทั้งหมด 139 โครงสร้าง (ชื่อแต่ละโครงสร้างสมองจะเป็นชื่อในแต่
ละหัวคอลัมน์) โดยข้อมูลปริมาตรสมองจะมีการแบ่งออกเป็นซีกซ้ายกับซีกขวาของแต่ละโครงสร้างภายในสมอง
โดยในโครงงานครั้งนี้ได้ทำการรวบรวมข้อมูลจากการนำภาพ 3D MRI images ไปทำการแยกโครงสร้างสมองให้
ได้ผลลัพธ์ปริมาตรสมองทั้งสิ้น 300 คน โดยจะแบ่งออกเป็น CN = 100 คน, AD = 100 คน และ MCI = 100 คน

รูปที่ 45 ผลลัพธ์ข้อมูลต้นฉบับปริมาตรในแต่ละส่วนของโครสร้างสมองของผูป้ ่วยทั้งหมด 300 คน

โดยในขั้นตอนนี้จะมีการเตรียมข้อมูลเพิ่มเติมจากข้อมูลต้นฉบับ ในการนำปริมาตรของโครสร้างสมอง
ทางด้านซีกซ้ายกับซีกขวาที่เป็นคู่กันของโครงสร้างสมองเดียวกัน นำปริมาตรทั้งสองส่วนมารวมจับคูเ่ ข้าด้วยกัน
เป็นปริมาตรของโครสร้างภายในสมองที่รวมทัง้ ซีกซ้ายและขวาในคอลัมน์เดียวกัน แต่จะมีบางส่วนของโครงสร้าง
สมองที่จะเป็นโครงสร้างเดียวไม่มีการจับคู่ จะไม่นำไปทำการรวมกันกับส่วนอื่น ๆ โดยจะมีทั้งหมด 8 โครงสร้าง
ดังนี้ 3rdVentricle, 4thVentricle, BrainStem, CSF, OpticChiasm, CerebellarVermalLobulesI-V,
CerebellarVermalLobulesVI-VII และ CerebellarVermalLobulesVIII-X

45
หลังจากที่ได้มีการจับคูร่ วมปริมาตรสมองในส่วนเดียวกันเข้าด้วยกัน ดังนั้นจะทำให้ไฟล์ Excel เหลือ
โครงสร้างสมองหรือเรียกว่า Feature ทัง้ หมด 73 โครงสร้าง โดยจะแสดงภาพตัวอย่างชื่อ feature ใหม่ และภาพ
ไฟล์ Excel ผลการจับคู่รวมปริมาตรสมองดังรูปต่อไปนี้

รูปที่ 46 ตัวอย่าง feature ใหม่ของปริมาตรในแต่ละส่วนของโครสร้างสมอง

รูปที่ 47 ผลลัพธ์ข้อมูลการรวมจับคูป่ ริมาตรในแต่ละส่วนของโครสร้างสมองของผู้ป่วยทัง้ หมด 300 คน

46
ผลการดาเนินงานในส่วนที่ 2 ในขั้นตอนที่ 4

ในส่วนของ 4.1 จะเป็นการนำข้อมูลจากในขั้นตอนที่ 3 มาทำการเตรียมข้อมูลโดยใช้ภาษาไพทอนผ่านบน


Google Colab จะมีผลการดำเนินงานตามขั้นตอนดังนี้

4.1.1 การเตรียมข้อมูล Binary classification คือ ผู้ป่วยปกติ (CN) และผู้ป่วยโรคอัลไซเมอร์ (AD)

ผลการดาเนินงานในขั้นตอนที่ 4.1.1.1 การนำข้อมูลจากในขั้นตอนที่ 3 เข้าสู่ Google Colab

รูปที่ 48 การนำข้อมูลปริมาตรในแต่ละส่วนของโครสร้างสมองของผู้ป่วยทัง้ หมด 200 คนเข้ามา (CN/AD)

ผลการดาเนินงานในขั้นตอนที่ 4.1.1.2 จากการเตรียมข้อมูลทำให้ได้ผลว่า ไม่เกิดการสูญหายของข้อมูล และ


ข้อมูลที่ได้นำมามีความเท่ากัน ซึง่ ถือ Balanced Data

รูปที่ 49 ข้อมูลไม่มีการสูญหายเกิดขึ้น
47
รูปที่ 50 แสดงจำนวนผู้ป่วยในแต่ละคลาส

ผลการดาเนินงานในขั้นตอนที่ 4.1.1.3 มีการทดลองเลือก feature ที่ได้ทำการการศึกษาอ้างอิงมาจากบทความ


ต่าง ๆ ในอินเทอร์เน็ต ว่า feature ตัวใดที่มีความเกี่ยวข้องและส่งผลกระทบในกรณีผู้ป่วยโรคอัลไซเมอร์ ซึ่งจาก
การศึกษาพบว่าจะมีโครงสร้างสมอง 2 ส่วนหลัก ๆ ที่มีความเกี่ยวข้องและน่าสนใจ จึงได้นำมาใช้ทำการทดลอง
คือ ในส่วนชอง Amygdala กับ Hippocampus

รูปที่ 51 การเปรียบเทียบโครงสร้างสมองของผูป้ ่วยปกติกบั ผู้ป่วยอัลไซเมอร์


48
จากรูปภาพที่ 52 จะเห็นได้ชัดเจนอย่างยิง่ โดยเฉพาะโครงสร้างสมองในส่วนฮิปโปแคมปัส
(hippocampus) และอะมิกดาลา (Amygdala) ของผูป้ ่วยปกติ (CN) จะมีขนาดที่ใหญ่กว่า และช่องด้านข้างที่
เล็กกว่าของผูป้ ่วยโรคอัลไซเมอร์ AD ดังนั้นจากการศึกษาจะสามารถทำการวิเคราะห์ได้ว่า โครงสร้างสมองใน 2
ส่วนหลักนี้ได้รับผลกระทบอย่างมากในผู้ป่วยโรคอัลไซเมอร์ จึงได้มีการนำโครงสร้างสมองทั้งคูเ่ ป็น feature หลัก
และพื้นฐานในการใช้จำแนก
ดังนั้นจึงนำข้อมูลในส่วนของ 2 features มาทำการวิเคราะห์โดยใช้ Correlation ในการดูความสัมพันธ์
ของข้อมูล ซึง่ พบว่าในรูปที่ 20 มีความสัมพันธ์ของข้อมูลใน 2 features โดยตรงเป็นอย่างมาก เนื่องจากมีค่า
Correlation เท่ากับ 0.82 ซึ่งมีค่าเข้าใกล้ 1

รูปที่ 53 ค่า Correlation ของ Amygdala กับ Hippocampus

นอกจากนีจ้ ะดูความสัมพันธ์ของข้อมูลในส่วนของ 2 features โดยวิเคราะห์ผ่านการใช้ LDA โดยจากรูปที่


53 จะวิเคราะห์ได้ว่า ข้อมูลของทั้ง 2 features สามารถที่จะจำแนกได้ว่า ผู้ป่วยคนใดเป็นผู้ป่วยปกติและผู้ป่วยคน
ใดเป็นผูป้ ่วยอัลไซเมอร์ เนื่องจากวิเคราะห์จากการห่างกันของกลุม่ คลาสข้อมูลทั้งสองคลาส

รูปที่ 54 การกระจายตัวของกลุม่ ข้อมูล (Classes) เมื่อใช้ Amygdala กับ Hippocampus

49
หลังจากนั้นก็ได้มีการเตรียมข้อมูลเพิม่ โดยการหา feature จากการศึกษาเกี่ยวกับสมองส่วนที่ได้รับ
ผลกระทบจากโรคอัลไซเมอร์ และนำ feature นั้น ๆ มาทำการเปรียบเทียบกับทั้ง 2 features หลัก Amygdala
กับ Hippocampus ผ่านการวิเคราะห์แบบ LDA แล้วจะเห็นว่า คลาสของกลุม่ ข้อมูลสามารเกิดการแบ่งระหว่าง
กันได้อย่างชัดเจน โดยจะมี feature ที่ได้ทำการนำมาวิเคราะห์และนำมาใช้ในการทำโครงงานครั้งนี้ ดังนี้
• 3rdVentricle

รูปที่ 55 การกระจายตัวของกลุม่ ข้อมูล (Classes) 3rdVentricle+Amygdala (ซ้าย) กับ


3rdVentricle+Hippocampus (ขวา)

• 4thVentricle

รูปที่ 56 การกระจายตัวของกลุม่ ข้อมูล (Classes) 4thVentricle+Amygdala (ซ้าย) กับ


4thVentricle+Hippocampus (ขวา)
50
• InfLatVent (inferior lateral ventricle)

รูปที่ 57 การกระจายตัวของกลุม่ ข้อมูล (Classes) InfLatVent+Amygdala (ซ้าย) กับ


InfLatVent+Hippocampus (ขวา)

• Basal Forebrain

รูปที่ 58 การกระจายตัวของกลุม่ ข้อมูล (Classes) Basal Forebrain+Amygdala (ซ้าย) กับ Basal


Forebrain+Hippocampus (ขวา)

51
• EntA (Ententorhinal Area)

รูปที่ 59 การกระจายตัวของกลุม่ ข้อมูล (Classes) EntA+Amygdala (ซ้าย) กับ EntA+Hippocampus


(ขวา)
• TMP (Temporalpole)

รูปที่ 60 การกระจายตัวของกลุม่ ข้อมูล (Classes) TMP+Amygdala (ซ้าย) กับ TMP+Hippocampus


(ขวา)

ทำให้วิเคราะห์ได้ว่า ทั้ง 6 features ที่ได้นำมาทำการวิเคราะห์คู่กับ features หลัก ๆ (Amygdala,


Hippocampus) สามารถที่จะแบ่งข้อมูลแต่ละคลาสออกจากกันได้ระดับหนึ่ง จึงจะนำ features ทัง้ หมด 8 ตัว
นำไปใช้ในการจำแนกผู้ป่วย มี 8 features ดังนี้ 3rdVentricle, 4thVentricle, Amygdala, Hippocampus,
InfLatVent, BasalForebrain, EntA และ TMP
52
ผลการดาเนินงานในขั้นตอนที่ 4.1.1.4 จะได้ข้อมูลทีเ่ หลือเฉพาะ feature ทีเ่ ลือกใช้ จำนวน 8 features ดังใน
ภาพที่ 60 หลังจากนั้นจะเป็นภาพผลัพธ์การนำข้อมูลมาทำการ Normalize ข้อมูล โดยวิธีการ Standardization
(Z-Score Normalization)

รูปที่ 61 ข้อมูลของผูป้ ่วยที่เลือกปริมาตรสมองมา 8 ส่วน

รูปที่ 62 ข้อมูลของผูป้ ่วยที่เลือกปริมาตรสมองมา 8 ส่วน พร้อมกับทำการ Normalize ข้อมูล

ผลการดาเนินงานในขั้นตอนที่ 4.1.1.5 บันทึก (save) ไฟล์ข้อมูล เพื่อที่จะนำไปใช้ต่อในโปรแกรมแมทแลป


แบ่งเป็น 2 ไฟล์ ดังรูปที่แสดงด้านล่าง

53
รูปที่ 63 ข้อมูลในส่วน Train จำนวน 160 คน (CN 80 /AD 80)

รูปที่ 64 ข้อมูลในส่วน Test จำนวน 40 คน (CN 20 /AD 20)


54
4.1.2 การเตรียมข้อมูล multiclass classification คือ ผู้ป่วยปกติ (CN) ผู้ป่วยภาวะความรู้คิด
บกพร่องเล็กน้อย (MCI) และผู้ป่วยโรคอัลไซเมอร์ (AD)

ผลการดาเนินงานในขั้นตอนที่ 4.1.2.1 จะเป็นการนำข้อมูลจากในขั้นตอนที่ 3 เข้าสู่ Google Colab

รูปที่ 65 การนำข้อมูลปริมาตรในแต่ละส่วนของโครสร้างสมองของผู้ป่วยทัง้ หมด 300 คนเข้ามา


(CN/MCI/AD)

ผลการดาเนินงานในขั้นตอนที่ 4.1.2.2 จากการเตรียมข้อมูลทำให้ได้ผลว่า ไม่เกิดการสูญหายของข้อมูล และ


ข้อมูลที่ได้นำมามีความเท่ากัน ซึง่ ถือ Balanced Data

รูปที่ 66 ข้อมูลไม่มีการสูญหายเกิดขึ้น

55
รูปที่ 67 แสดงจำนวนผู้ป่วยในแต่ละคลาส

ผลการดาเนินงานในขั้นตอนที่ 4.1.2.3 ผลลัพธ์ feature จากการศึกษาอ้างอิงมาจากบทความต่าง ๆ และจากที่


ผ่านการวิเคราะห์ผ่าน LDA ซึ่งในขั้นตอนนี้จะมีผลการดำเนินงาน และผลลัพธ์เหมือนในขั้นตอนที่ 4.1.1.3

ผลการดาเนินงานในขั้นตอนที่ 4.1.2.4 จะได้ข้อมูลทีเ่ หลือเฉพาะ feature ทีเ่ ลือกใช้ จำนวน 8 features ดังใน
ภาพที่ 67 หลังจากนั้นจะเป็นภาพผลัพธ์การนำข้อมูลมาทำการ Normalize ข้อมูล โดยวิธีการ Standardization
(Z-Score Normalization)

รูปที่ 68 ข้อมูลของผูป้ ่วยที่เลือกปริมาตรสมองมา 8 ส่วน

56
รูปที่ 69 ข้อมูลของผู้ป่วยทีเ่ ลือกปริมาตรสมองมา 8 ส่วน พร้อมกับทำการ Normalize ข้อมูล

ผลการดาเนินงานในขั้นตอนที่ 4.1.2.5 บันทึก (save) ไฟล์ข้อมูล เพื่อที่จะนำไปใช้ต่อในโปรแกรมแมทแลป


แบ่งเป็น 2 ไฟล์ ดังรูปที่แสดงด้านล่าง

รูปที่ 70 ข้อมูลในส่วน Train จำนวน 240 คน (CN 80 /AD 80/MCI 80)

57
รูปที่ 71 ข้อมูลในส่วน Test จำนวน 40 คน CN (20 /AD 20/MCI 20)

ในส่วนของ 4.2 จะเป็นการนำข้อมูลทีผ่ ่านการเตรียมข้อมูลจากในขั้นตอนที่ 4.1 เข้ามาทำการจำแนกคลาส


บนโปรแกรม MATLAB จะมีผลการดำเนินงานตามขั้นตอนดังนี้

4.2.1 การ Train และ Test ข้อมูลแบบ Binary classification ระหว่าง CN และ AD

ผลการดาเนินงานในขั้นตอนที่ 4.2.1.1 เป็นการนำข้อมูลทีผ่ ่านการเตรียมข้อมูลแล้วจากในขั้นตอนที่ 4.1เข้าสู่


MATLAB

รูปที่ 72 จำนวนข้อมูลที่นำเข้า MATLAB (X_SUM=Train, Y_SUM=Test)

58
ผลการดาเนินงานในขั้นตอนที่ 4.2.1.2 เตรียมข้อมูลโดยใช้ภาษาแมทแลป ตัดข้อมูลในคอลัมน์ของ ID ผู้ป่วย
และคอลัมน์ Target Classes ออกจากข้อมูลทัง้ ในส่วน Train และTest ก่อนการนำไปใช้จำแนก จะเหลือข้อมูล
เฉพาะในส่วนปริมาตร 8 features รวมทั้งสร้างตัวแปรขึ้นมาเพื่อทำการเก็บข้อมูลในส่วน Target Classes แยก
เก็บไว้ทั้งในส่วน Train และTest พร้อมทั้งทำการเปลี่ยนแปลง Target Classes จาก CN เป็น 0 และจาก AD
เป็น 1

รูปที่ 73 ข้อมูลในส่วน Train

รูปที่ 74 ข้อมูลในส่วน Test

ผลการดาเนินงานในขั้นตอนที่ 4.2.1.3 ผล Confusion matrix ของ Train และ Test ในการจำแนกข้อมูลบน


MATLAB โดยใช้โมเดล Random Forest

รูปที่ 75 Confusion Matrix ในการ Train ของโมเดล Random Forest


59
รูปที่ 76 Confusion Matrix ในการ Test ของโมเดล Random Forest

ได้ผลลัพธ์ประสิทธิภาพ Accuracy และ Confusion matrix ของโมเดล Random Forest ดังตารางที่ 12

ตารางที่ 12 Accuracy และ Confusion matrix ของโมเดล Random Forest

Result Random Forest


Training
Training Accuracy 100%
Testing Test Accuracy 82.5%
CN Precision 0.81
Recall 0.85
F1-Score 0.83
AD Precision 0.84
Recall 0.80
F1-Score 0.82

60
ภาพการนำข้อมูลส่วน Train เข้า Classification Learner App โดยมีการใช้ Cross Validation ด้วย เพื่อ
ป้องกันการเกิด Overfit ของโมเดล เมื่อจะนำโมเดลไปใช้ตอ่ รวมถึงการที่ใช้ Cross Validation จะเป็นการช่วย
ทำให้มองเห็นภาพรวมของประสิทธิภาพโมเดลได้ ดังนั้นเราจึงต้องมีเทคนิคหรือวิธีการประเมินตรวจสอบระบบ
และโมเดลของเราว่ามีผลลัพธ์ดังที่เราต้องการและสามารถใช้งานได้จริงหรือไม่

รูปที่ 77 การนำข้อมูลเข้า Classification Learner App

ผลการดาเนินงานในขั้นตอนที่ 4.2.1.4 ได้ทดลองเลือกโมเดลมา Train ข้อมูล แล้วดูค่า Accuracy และ


Confusion matrix ของทุกโมเดลที่ได้มีการทดลอง

รูปที่ 78 การเลือกใช้โมเดลบน Classification Learner App


61
หลังจากนั้นได้มกี ารเลือกโมเดลที่มีประสิทธิภาพที่ดีมาแสดงผลให้ดู 2 โมเดล ดังนี้
• โมเดล Linear SVM

รูปที่ 79 Confusion Matrix ในการ Train ของโมเดล Linear SVM

นำข้อมูลในส่วน Test เข้า Classification Learner App แล้วทำการ Test หลังจากนั้นดูค่า Accuracy
และ Confusion matrix ของโมเดล Linear SVM

รูปที่ 80 Confusion Matrix ในการ Test ของโมเดล Linear SVM


62
ได้ผลลัพธ์ประสิทธิภาพ Accuracy และ Confusion matrix ของโมเดล Linear SVM ดังตารางที่ 13

ตารางที่ 13 Accuracy และ Confusion matrix ของโมเดล Linear SVM

Result Linear SVM


Training
Training Accuracy 88.13%
Testing Test Accuracy 90%
CN Precision 0.90
Recall 0.90
F1-Score 0.90
AD Precision 0.90
Recall 0.90
F1-Score 0.90

• โมเดล Tri Layered Neural Network

รูปที่ 81 Confusion Matrix ในการ Train ของโมเดล Tri Layered Neural Network

63
นำข้อมูลในส่วน Test เข้า Classification Learner App แล้วทำการ Test หลังจากนั้นดูค่า Accuracy
และ Confusion matrix ของ Tri Layered Neural Network

รูปที่ 82 Confusion Matrix ในการ Test ของโมเดล Tri Layered Neural Network

ได้ผลลัพธ์ประสิทธิภาพ Accuracy และ Confusion matrix ของโมเดล Tri Layered Neural Network
ดังตารางที่ 14

ตารางที่ 14 Accuracy และ Confusion matrix ของโมเดล Tri Layered Neural Network

Result Tri Layered Neural Network


Training
Training Accuracy 82.5%
Testing Test Accuracy 85%
CN Precision 0.85
Recall 0.85
F1-Score 0.85
AD Precision 0.85
Recall 0.85
F1-Score 0.85

64
นำประสิทธิภาพในการ Train และ Test ข้อมูลแบบ Binary classification ของแต่ละโมเดลมาเปรียบเทียบกัน

ตารางที่ 15 เปรียบเทียบ Accuracy และ Confusion matrix ของแต่ละโมเดล

Result Linear SVM Random Forest Tri Layered Neural


Training Network
Training Accuracy 88.1% 100% 82.5%
Testing Test Accuracy 90% 82.5% 85%
CN Precision 0.9 0.81 1.00
Recall 0.9 0.85 0.20
F1-Score 0.9 0.83 0.33
AD Precision 0.9 0.84 0.80
Recall 0.9 0.80 1.00
F1-Score 0.9 0.82 0.89

จะเห็นว่ามีผลลัพธ์ประสิทธิภาพในการจำแนกข้อมูลแบบ Binary classification ระหว่างผูป้ ่วยปกติ (CN)


และผูป้ ่วยโรคอัลไซเมอร์ (AD) ของโมเดลที่ดีทสี่ ุดทีเ่ ลือกมา คือ โมเดล Linear SVM จะเห็นว่ามีค่า Accuracyสูง
ถึง 90% ดังนั้นทำให้พบการจำแนกผิดพลาดในชุดข้อมูล Test เป็นจำนวน 4 คน จากทั้งหมด 40 คน รวมถึงมีค่า
Recall ของในแต่ละคลาสสูงถึง 90% ซึ่งถือว่ามีผลลัพธ์และประสิทธิภาพในการใช้จำแนกข้อมูลผูป้ ่วย

รูปที่ 83 ผลลัพธ์ในการจำแนกผู้ป่วยจำนวน 40 คน
65
4.2.2 การ Train ข้อมูลแบบ multiclass classification ระหว่าง CN MCI และ AD

ผลการดาเนินงานในขั้นตอนที่ 4.2.2.1 เป็นการนำข้อมูลทีผ่ ่านการเตรียมข้อมูลแล้วจากในขั้นตอนที่ 4.1 เข้าสู่


MATLAB

รูปที่ 84 จำนวนข้อมูลที่นำเข้า MATLAB (X_SUM=Train, Y_SUM=Test)

ผลการดาเนินงานในขั้นตอนที่ 4.2.2.2 เตรียมข้อมูลโดยใช้ภาษาแมทแลป ตัดข้อมูลในคอลัมน์ของ ID ผู้ป่วย


และคอลัมน์ Target Classes ออกจากข้อมูลทัง้ ในส่วน Train และTest ก่อนการนำไปใช้จำแนก จะเหลือข้อมูล
เฉพาะในส่วนปริมาตร 8 features รวมทั้งสร้างตัวแปรขึ้นมาเพื่อทำการเก็บข้อมูลในส่วน Target Classes แยก
เก็บไว้ทั้งในส่วน Train และTest พร้อมทั้งทำการเปลี่ยนแปลง Target Classes จาก CN เป็น 0 จาก AD เป็น 1
และจาก MCI เป็น 2

รูปที่ 85 ข้อมูลในส่วน Train

รูปที่ 86 ข้อมูลในส่วน Test

ผลการดาเนินงานในขั้นตอนที่ 4.2.2.3 ผล Confusion matrix Train และ Test ในการจำแนกข้อมูลบน


MATLAB โดยใช้โมเดล Random Forest

66
รูปที่ 87 Confusion Matrix ในการ Train ของโมเดล Random Forest

รูปที่ 88 Confusion Matrix ในการ Test ของโมเดล Random Forest

67
ได้ผลลัพธ์ประสิทธิภาพ Accuracy และ Confusion matrix ดังตารางที่ 16

ตารางที่ 16 Accuracy และ Confusion matrix ของโมเดล Random Forest

Result Random Forest


Training Training Accuracy 100%
Testing Test Accuracy 0.60
CN Precision 0.65
Recall 0.65
F1-Score 0.65
AD Precision 0.59
Recall 0.65
F1-Score 0.62
MCI Precision 0.56
Recall 0.50
F1-Score 0.53

ภาพการนำข้อมูลส่วน Train เข้า Classification Learner App โดยมีการใช้ Cross Validation ด้วย เพื่อ
ป้องกันการเกิด Overfit ของโมเดล เมื่อจะนำโมเดลไปใช้ตอ่ รวมถึงการที่ใช้ Cross Validation จะเป็นการช่วย
ทำให้มองเห็นภาพรวมของประสิทธิภาพโมเดลได้ ดังนั้นเราจึงต้องมีเทคนิคหรือวิธีการประเมินตรวจสอบระบบ
และโมเดลของเราว่ามีผลลัพธ์ดังที่เราต้องการและสามารถใช้งานได้จริงหรือไม่

รูปที่ 89 การนำข้อมูลเข้า Classification Learner App


68
ผลการดาเนินงานในขั้นตอนที่ 4.2.2.4 ได้ทดลองเลือกโมเดลมา Train ข้อมูล แล้วดูค่า Accuracy และ
Confusion matrix ของทุกโมเดลที่ได้มีการทดลอง

รูปที่ 90 การเลือกใช้โมเดลบน Classification Learner App

หลังจากนั้นได้มกี ารเลือกโมเดลที่มีประสิทธิภาพที่ดีมาแสดงผลให้ดู 2 โมเดล ดังนี้


• โมเดล Linear SVM

รูปที่ 91 Confusion Matrix ในการ Train ของโมเดล Linear SVM

69
นำข้อมูลในส่วน Test เข้า Classification Learner App แล้วทำการ Test หลังจากนั้นดูค่า Accuracy
และ Confusion matrix ของโมเดล Linear SVM

รูปที่ 92 Confusion Matrix ในการ Test ของโมเดล Linear SVM

ได้ผลลัพธ์ประสิทธิภาพ Accuracy และ Confusion matrix ของโมเดล Linear SVM ดังตารางที่ 3

ตารางที่ 17 Accuracy และ Confusion matrix ของโมเดล Linear SVM

Result Linear SVM


Training Training Accuracy 53.8%
Testing Test Accuracy 56.7%
CN Precision 0.64
Recall 0.80
F1-Score 0.71
AD Precision 0.61
Recall 0.70
F1-Score 0.65
MCI Precision 0.33
Recall 0.20
F1-Score 0.25

70
• โมเดล Tri Layered Neural Network

รูปที่ 93 Confusion Matrix ในการ Train ของโมเดล Tri Layered Neural Network

นำข้อมูลในส่วน Test เข้า Classification Learner App แล้วทำการ Test หลังจากนั้นดูค่า Accuracy
และ Confusion matrix ของ Tri Layered Neural Network

รูปที่ 94 Confusion Matrix ในการ Test ของโมเดล Tri Layered Neural Network

71
ได้ผลลัพธ์ประสิทธิภาพ Accuracy และ Confusion matrix ของโมเดล Tri Layered Neural Network
ดังตารางที่ 18

ตารางที่ 18 Accuracy และ Confusion matrix ของโมเดล Tri Layered Neural Network

Result Tri Layered Neural Network


Training Training Accuracy 49.6%
Testing Test Accuracy 58.3%
CN Precision 0.63
Recall 0.85
F1-Score 0.72
AD Precision 0.57
Recall 0.60
F1-Score 0.59
MCI Precision 0.50
Recall 0.30
F1-Score 0.38

ตารางที่ 19 การเปรียบเทียบประสิทธิภาพของแต่ละโมเดลในส่วนที่ 2

Result Linear SVM Random Forest Tri Layered Neural Network


Training Training Accuracy 53.8% 100% 49.6%
Testing Test Accuracy 56.7% 60% 58.3%
CN Precision 0.64 0.65 0.63
Recall 0.80 0.65 0.85
F1-Score 0.71 0.65 0.72
AD Precision 0.61 0.59 0.57
Recall 0.70 0.65 0.60
F1-Score 0.65 0.62 0.59
MCI Precision 0.33 0.56 0.50
Recall 0.20 0.50 0.30
F1-Score 0.25 0.53 0.38

72
จะเห็นว่ามีผลลัพธ์ ประสิทธิภาพในการจำแนกข้อมูลแบบ Multiclass classification ระหว่างผู้ป่วยปกติ
(CN) ผู้ป่วยภาวะความรู้คิดบกพร่องเล็กน้อย (MCI) และผู้ป่วยโรคอัลไซเมอร์ (AD) ของโมเดลที่ดีที่สุดที่เลือกมา
คือ โมเดล Random Forest จะเห็นว่ามีค่า Accuracy ประมาณ 60% ดังนั้นทำให้พบการจำแนกผิดพลาดในชุด
ข้อมูล Test เป็นจำนวน 24 คน จากทั้งหมด 60 คน จะสังเกตุได้ว่า เนื่องจากการเพิ่มคลาส MCI เข้ามาในการ
จำแนก จะทำให้มีความสับสนของข้อมูลเกิดขึ้น ดังนั้นถือว่ามีผลลัพธ์และประสิทธิภาพในการใช้จำแนกข้อมูล
ผู้ป่วยได้ไม่ดีเทียบเท่าการจำแนกแบบ Binary classification

รูปที่ 95 ผลลัพธ์ในการจำแนกผู้ป่วยจำนวน 60 คน

73
6 สรุปผลการดาเนินงานและข้อเสนอแนะ

สรุปผลการดาเนินงาน

การสรุปผลการดำเนินงานในงานวิจัยจะสามารถสรุปทัง้ สองส่วนหลักได้ดังนี้

ตารางที่ 20 เปรียบเทียบประสิทธิภาพ Accuracy และ Confusion matrix ของ Binary classification


ระหว่าง CN และ AD ของโมเดลทั้งสองส่วน

Random Tri Layered


Result GoogLeNet AlexNet Linear SVM Forest Neural Network
Training Training 85% 87.5% 88.1% 76.25% 82.5%
Accuracy
Testing Test Accuracy 70% 72.5% 90% 76% 85%
Precision 1.00 0.80 0.90 0.81 1.00
CN
Recall 0.63 0.70 0.90 0.85 0.20
F1-score 0.77 0.74 0.90 0.83 0.33
Precision 0.40 0.65 0.90 0.84 0.80
AD
Recall 1.00 0.76 0.90 0.80 1.00
F1-score 0.57 0.7 0.90 0.82 0.89

จากตารางจะเห็นได้ว่าเมื่อทำการแยกประเภทเพียง 2 ประเภทคือสมองผู้ป่วยโรคอัลไซเมอร์และสมองคน
ปกติ การเตรียมข้อมูลผ่าน MALPEM บนระบบปฏิบัติการลินุกซ์ โดยวิธี Brain Segmentation ได้ข้อมูลผลลัพธ์
ออกมาเป็นปริมาตรในแต่ละส่วนของโครงสร้างสมอง หรือ Brain volumes feature และทำการแยกประเภทโดย
โมเดล Linear SVM ได้ความแม่นยำ (Accuracy) มากที่สุดในการ Test และเมื่อดู precision ,Recall และ F1-
score แล้วนั้นก็ได้ค่าความถูก ต้องและความแม่นยำมากที่ส ุด จึง ทำให้ชนะโมเดลการเรียนรู้เ ชิง ลึก (Deep
Learning) แต่ถ้าเปรียบเทียบโมเดลการเรียนรู้เ ชิง ลึก (Deep Learning) ได้แก่ GoogLeNet และ AlexNet

74
เปรี ย บเที ย บกั บ โมเดล Random Forest และ Tri Layered Neural Network เมื ่ อ คำนึ ง ถึ ง ความแม่ น ยำ
(Accuracy) ในการ Test และ precision ,Recall และ F1-score จึ ง จั ด อั น ดั บ โมเดลเป็ น Random forest
,AlexNet ,GoogLeNet และ Tri Layered Neural Network ตามลำดับ

ตารางที่ 21 เปรียบเทียบผลลัพธ์ Accuracy และ Confusion matrix แบบ Multiclass classification


ระหว่าง CN ,MCIและ AD ของโมเดลทั้งสองส่วน

Random Tri Layered


Result GoogLeNet AlexNet Linear SVM Forest Neural Network
Training Training Accuracy 71.67% 78.33% 53.8% 100% 49.6%
Testing Test Accuracy 63.33% 65% 56.7% 60% 58.3%
Precision 1.00 0.70 0.64 0.65 0.63
CN Recall 0.69 0.67 0.80 0.65 0.85
F1-score 0.82 0.68 0.71 0.65 0.72
Precision 0.25 0.65 0.61 0.59 0.57
AD Recall 0.56 0.72 0.70 0.65 0.60
F1-score 0.34 0.68 0.65 0.62 0.59
Precision 0.65 0.60 0.33 0.56 0.50
MCI Recall 0.59 0.57 0.20 0.50 0.30
F1-score 0.62 0.59 0.25 0.53 0.38

จากตารางที่ 21 จะเห็นได้ว่าเมื่อข้อมูลมีข้อมูลที่ต้องตัดสินใจสำหรับงานถ่ายภาพทางการแพทย์เพิ่มมากขึ้น
ทำให้การแยกประเภทสมอง 3 ประเภทคือสมองผู้ป่วยโรคอัลไซเมอร์ สมองคนปกติ และสมองระยะแรกของ
โรคอัลไซเมอร์ การใช้โมเดลการเรียนรู้เชิงลึก (Deep Learning) ในการตัดสไลด์แบบ (Horizontal Cut Fixed Y)
ที่ทำให้เห็นข้อมูลรูปภาพทางการแพทย์คือส่วนฮิปโปแคมปัส และส่วนรอบๆสมอง และทำการแยกประเภทโดย
โมเดล AlexNet ได้ความแม่นยำ (Accuracy) มากที่สุดในการ Test และเมื่อดู precision ,Recall และ F1-score
แล้วนั้นก็ได้ค่าความถูกต้องและความแม่นยำโดยรวมดีที่สุด จึงทำให้ชนะโมเดลอื่นๆ แต่ผลลัพธ์ของโมเดลส่วนที่
สองโดยรวมแล้ว Random Forest ได้เป็นอันดับที่2 และ โมเดล GoogLeNet ,Linear SVM และ Tri Layered
Neural Network ตามลำดับ

75
ข้อเสนอแนะ

ในส่วนการทำงานของส่วนที่ 1 ของการทำโมเดลการเรียนรู้เชิงลึก (Deep Learning) ผลลัพธ์อาจดีขึ้นถ้า


เพิ่มจำนวนชุดข้อมูลแต่ละประเภทให้มากขึ้น และ อาจทดลองกับโมเดล Pretrained อื่นๆ เพื่อสังเกตผลลัพธ์
และในส่วนโมเดล GoogLeNet และ AlexNet หากลองปรับพารามิเตอร์อื่นๆ อาจได้ผลลัพธ์ที่ดีมากขึ้น
ในส่วนการทำงานของส่วนที่ 2 ต้องมีการศึกษาเพิ่มเติมเกี่ยวกับการเลือก Brain volumes feature ในการ
นำมาใช้จำแนกผู้ป่วย

76
7 บรรณานุกรม
[1] C A. Raji et al., “Age, Alzheimer disease, and brain structure,” in American Academy of
Neurology, Dec. 2009, doi: 10.1212/WNL.0b013e3181c3f293
[2] Sidong Liu et al., "Brain volumetric and fractal analysis of synthetic MRI: A comparative
study with conventional 3D T1-weighted images," in European journal of radiology , vol. 141,
Aug. 2021, doi: https://doi.org/10.1016/j.ejrad.2021.109782
[3] Ewelina bebas et al., “Machine-learning-based classification of the histological subtype
of non-small-cell lung cancer using MRI texture analysis,” in Biomedical Signal Processing and
Control, vol. 66, Apr. 2021, doi :https://doi.org/10.1016/j.bspc.2021.102446
[4] Silvia Basaia et al.,“ Automated classification of Alzheimer's disease and mild cognitive
impairment using a single MRI and deep neural networks,” NeuroImage: Clinical21 ,2019
[5] K.R.Kruthika et al., “CBIR system using Capsule Networks and 3D CNN for Alzheimer's
disease diagnosis,” in Informatics in Medicine Unlocked, vol. 14, pp.59-68, 2019 ,
doi: https://doi.org/10.1016/j.imu.2018.12.001
[6] Arijit De and Ananda S. Chowdhury., “DTI based Alzheimer’s disease classification with
rank modulated fusion of CNNs and random forest,” in Expert Systems with Applications, vol.
169, May. 2021, doi: https://doi.org/10.1016/j.eswa.2020.114338
[7] Md. Kamrul Hasan et al., “COVID-19 identification from volumetric chest CT scans
using a progressively resized 3D-CNN incorporating segmentation, augmentation, and class-
rebalancing” in Informatics in Medicine Unlocked, vol. 26, 2021, doi:
https://doi.org/10.1016/j.imu.2021.100709
[8] Loni. “Alzheimer's Disease Neuroimaging Initiative (ADNI)”. Internet: https://www.
http://adni.loni.usc.edu/data-samples/access-data/, Oct. 25, 2017 [Nov. 11, 2021].
[9] C. Ledig, R. A. Heckemann, A. Hammers, J. C. Lopez, V. F. J. Newcombe, A.
Makropoulos, J. Loetjoenen, D. Menon and D. Rueckert, "Robust whole-brain segmentation:
Application to traumatic brain injury", Medical Image Analysis, 21(1), pp. 40-58, 2015
[10] R. Heckemann, C. Ledig, K. R. Gray, P. Aljabar, D. Rueckert, J. V. Hajnal, and A.
Hammers, "Brain extraction using label propagation and group agreement: pincram", PLoS ONE,
10(7), pp. e0129211, 2015
77
ประวัตินิสิต

1. ชื่อ-นามสกุล ลภัสรดา สุทธิคนึง เลขประจำตัวนิสิต 6110501719


ภาควิชาวิศวกรรมไฟฟ้า คณะวิศวกรรมศาสตร์ มหาวิทยาลัยเกษตรศาสตร์
ที่อยู่ปัจจุบัน 34 ซอยลาดพร้าววังหิน48 ถนนลาดพร้าววังหิน เขต/แขวงลาดพร้าว กทม. 10230
โทรศัพท์ ที่บ้าน - โทรศัพท์เคลื่อนที่ 0917177505
สถานที่ทำงาน(ถ้ามี) -
โทรศัพท์ที่ทำงาน (ถ้ามี) - E-mail lapasrada.su@ku.th
ระดับการศึกษา: ปริญญาตรี
คุณวุฒิการศึกษา จากโรงเรียน/สถาบัน ปีการศึกษาที่จบ
มัธยมศึกษาตอนปลาย โรงเรียนสตรีวิทยา 2 2560
มัธยมศึกษาตอนต้น โรงเรียนสตรีวิทยา 2 2557

2. ชื่อ-นามสกุล ประกายแก้ว สังข์ทอง เลขประจำตัวนิสิต 6110551511


ภาควิชาวิศวกรรม ไฟฟ้า คณะวิศวกรรมศาสตร์ มหาวิทยาลัยเกษตรศาสตร์
ที่อยู่ปจั จุบัน 58/4 หมู่11 หมู่บ้านกฤษดานคร18 อัญมณี37/11 แขวงศาลาธรรมสพน์ เขตทวีวัฒนา กทม.
10170
โทรศัพท์ ที่บ้าน - โทรศัพท์เคลื่อนที่ 0869369245
สถานที่ทำงาน(ถ้ามี) -
โทรศัพท์ที่ทำงาน (ถ้ามี) - E-mail Prakaikeaw.s@ku.th
ระดับการศึกษา: ปริญญาตรี
คุณวุฒิการศึกษา จากโรงเรียน/สถาบัน ปีการศึกษาที่จบ
มัธยมศึกษาตอนปลาย โรงเรียนสตรีวิทยา 2560
มัธยมศึกษาตอนต้น โรงเรียนสตรีวิทยา 2557

78

You might also like