Professional Documents
Culture Documents
ภาควิชาวิศวกรรมไฟฟ้า
คณะวิศวกรรมศาสตร์ มหาวิทยาลัยเกษตรศาสตร์
เรื่อง
การจาแนกผู้ป่วยโรคอัลไซเมอร์แบบอัตโนมัติด้วยภาพเอ็มอาร์ไอและการ
เรียนรู้ของเครื่อง
Automated Classification of Alzheimer's Disease using MRI
Images and Machine Learning Techniques
โดย
ลภัสรดา สุทธิคนึง 6110501719
ประกายแก้ว สังข์ทอง 6110551511
พ.ศ. 2564
การจำแนกผู้ป่วยโรคอัลไซเมอร์แบบอัตโนมัติด้วยภาพเอ็มอาร์ไอและการเรียนรู้ของเครื่อง
Automated Classification of Alzheimer's Disease using MRI Images and Machine Learning Techniques
โดย
ลภัสรดา สุทธิคนึง 6110501719
ประกายแก้ว สังข์ทอง 6110551511
โครงงานวิศวกรรมไฟฟ้า
ภาควิชาวิศวกรรมไฟฟ้า
คณะวิศวกรรมศาสตร์ มหาวิทยาลัยเกษตรศาสตร์
ตามหลักสูตร
วิศวกรรมศาสตรบัณฑิต สาขาวิศวกรรมไฟฟ้า
ได้รับการพิจารณาเห็นชอบโดย
อาจารย์ที่ปรึกษาโครงงาน ผศ.ดร.พันศักดิ์ เทียนวิบูลย์ วันที่........เดือน…....…........พ.ศ.…………
(.....................................................................)
กรรมการ ผศ.ดร.กาญจนพันธุ์ สุขวิชชัย วันที่............เดือน…....…….……....พ.ศ.…………
(.....................................................................)
ii
ลภัสรดา สุทธิคนึง 6110501719 ปีการศึกษา 2564
ประกายแก้ว สังข์ทอง 6110551511 ปีการศึกษา 2564
การจำแนกผู้ป่วยโรคอัลไซเมอร์แบบอัตโนมัติด้วยภาพเอ็มอาร์ไอและการเรียนรู้ของเครื่อง
ปริญญาวิศวกรรมศาสตรบัณฑิต (สาขาวิศวกรรมไฟฟ้า) ภาควิชาวิศวกรรมไฟฟ้า
คณะวิศวกรรมศาสตร์ มหาวิทยาลัยเกษตรศาสตร์
บทคัดย่อ
iii
Lapasrada Sutthikanung 6010551358 Academic Year 2020
Prakaikeaw Sungthong 6110551511 Academic Year 2020
Automated Classification of Alzheimer's Disease using MRI Images and Machine Learning Techniques
Bachelor’s Degree in Electrical Engineering Department Electrical Engineering
Faculty of Engineering, Kasetsart University
Abstract
Currently, diagnosing Alzheimer's patients with an MRI by a skilled physician takes time due to
medical limitations. As a result, this project presents on how to design and develop classification
algorithms that can automatically classify MRI pictures of Alzheimer's Disease (AD) by using machine
learning and deep learning to achieve the optimal results when diagnosing Alzheimer's Disease (AD) and
Cognitive Normal (CN). In this research, a scan of brain structures (MRI) was used. We used 400 datasets
(200 for AD and 200 for CN) from the Alzheimer's Disease Neuroimaging Initiative (ADNI).
There are two main approaches to this project. Each approach uses a different data preparation
method. The first section directly uses the 3D images of the brain structure scan (MRI) for classification
using neural network techniques (CNN). In the last approach, 3D images of the brain structure scan (MRI)
are used to extract the volumes features of each brain structure using brain segmentation techniques
with the MALPEM method (MALPEM) and classify by using machine learning or deep learning.
From the classification result. After utilizing the operating methods, the study focuses on combining
the outcomes of both operations and comparing them to see how accurate each method's classification
is. This project is aiming to improve the algorithm to make results more accurate. If the results are
accurate enough, this algorithm could be able to use in medical treatment, or it may be used in other
research in the future.
iv
กิตติกรรมประกาศ
โครงงานวิศวกรรมไฟฟ้า และรายงานฉบับนี้จะไม่สามารถสำเร็จตามวัตถุประสงค์ ที่ตั้งไว้ได้ ถ้าหากปราศจากการ
ได้รับความช่วยเหลือ ของ ผศ.ดร.พันศักดิ์ เทียนวิบูลย์ อาจารย์ที่ปรึกษาโครงงาน และผศ.ดร.กาญจนพันธุ์ สุขวิชชัย
อาจารย์กรรมการ ที่ ได้ช่วยกรุณาให้คำแนะนำ คำปรึกษา ตลอดจนคำติชม เพื่อที่จะนำไปทำให้โครงงานวิศวกรรมไฟฟ้า
และรายงานฉบับนี้สามารถพัฒนาแก้ไขปรับปรุงข้อผิดพลาดต่างๆไปในทางที่ดีขึ้นได้ ทั้งนี้ผู้จัดทำได้มีความตระหนักถึง
ความเอาใจใส่และความทุ่มเทตั้งใจจริงในการให้ความช่วยเหลือ ของอาจารย์ทั้งสองท่าน ผู้จัดทำจึงขอกราบขอบพระคุณ
เป็นอย่างสูง ณ โอกาสนี้
v
สารบัญ
บทคัดย่อ III
ABSTRACT IV
กิตติกรรมประกาศ V
สารบัญ VI
สารบัญภาพ VIII
สารบัญตาราง XII
คำอธิบายสัญลักษณ์และคำย่อ XIII
1 บทนำ 1
1.1. วัตถุประสงค์ของโครงงาน 1
1.2. ขอบเขตของโครงงาน 1
2 ทฤษฎีที่เกี่ยวข้อง 2
2.1 โรคอัลไซเมอร์ (ALZHEIMER’S DISEASE) 2
2.2 การใช้คลื่นสนามเเม่เหล็กในการถ่ายภาพของโรคอัลไซเมอร์ (3D MRI IMAGE) 4
2.3 การเรี ยนรู ้ของเครื่ อง (MACHINE LEARNING) 6
2.4 การเรี ยนรู ้เชิงลึก (DEEP LEARNING) 6
2.5 การถ่ายทอดการเรี ยนรู ้ (TRANSFER LEARNING) 9
2.6 มัลเพม (MALPEM) 9
2.7 ปริ มาตรของสมอง (BRAIN VOLUMES FEATURE) 10
2.8 การวิเคราะห์การจำแนกประเภทเชิงเส้น (LINEAR DISCRIMINANT ANALYSIS) 12
2.9 STANDARDIZATION (Z-SCORE NORMALIZATION) 12
2.10 ค่าสหสัมพันธ์ (CORRELATION) 12
3 เครื่องมือที่ใช้ในการทำโครงงาน 13
3.1 HARDWARE 13
3.2 SOFTWARE 13
4 วิธีการดำเนินโครงงาน 16
vi
การดาเนินงานในส่วนที่ 1) 16
แผนผังการดาเนินงานในส่วนที่ 1) 18
การดาเนินงานในส่วนที่ 2) 19
แผนผังการดาเนินงานในส่วนที่ 2) 22
5 ผลการดำเนินโครงงานและวิจารณ์ 23
ผลดาเนินงานในส่วนที่ 1) 23
ผลดาเนินงานในส่วนที่ 2) 44
6 สรุปผลการดำเนินงานและข้อเสนอแนะ 74
สรุ ปผลการดาเนินงาน 74
ข้อเสนอแนะ 76
7 บรรณานุกรม 77
ประวัตินิสิต 78
vii
สารบัญภาพ
รูปที่ 1 โครงสร้างสมองแต่ละส่วน ........................................................................................................................................2
รูปที่ 2 เปรียบเทียบสมองผู้ป่วยปกติ กับผูป้ ่วยโรคอัลไซเมอร์...............................................................................................2
รูปที่ 3แสดงเซรีบรัมคอร์เทกซ์ส่วนจัดเก็บความทรงจำ.........................................................................................................3
รูปที่ 4 การทำลายสมองของโรคอัลไซเมอร์โดยจะเริ่มทำลายจากสมองส่วนฮิปโปแคมปัส ....................................................3
รูปที่ 5 เซลล์ประสาทหรือนิวรอนปกติ .................................................................................................................................3
รูปที่ 6 เซลล์ประสาทถูกทำลายโดยโรคอัลไซเมอร์ โดยเริ่มจากสมองส่วนฮิปโปแคมปัส .......................................................4
รูปที่ 7 เบต้า-อะไมลอยด์ (BETA-AMYLOID) ชนิดไม่ละลายน้ำซึ่งเมื่อไปจับกับเซลล์ประสาทหรือนิวรอนจะส่งผลให้เซลล์
ประสาทเสื่อมและฝ่อลง ..........................................................................................................................................4
รูปที่ 8 ภาพถ่าย MRI ของสมองปกติ ระยะแรกของของอัลไซเมอร์ และสมองผูป้ ่วยโรคอัลไซเมอร์ ......................................5
รูปที่ 9 การตัดสมองที่ใช้ในทางการแพทย์ โดยจะตัดเห็นส่วยฮิปโปแคมปัสของสมอง ...........................................................6
รูปที่ 10 โมแดล CONVOLUTION NEURON NETWORK โมเดล 1-3 .........................................................................................7
รูปที่ 11 โมเดล CONVOLUTION NEURON NETWORK โมเดล 4-5 ที่ได้รับแรงบันดาลใจมาจากโมเดล GOOGLENET ในส่วน
INCEPTION ..............................................................................................................................................................7
รูปที่ 12 โมเดล CONVOLUTION NEURON NETWORK โมเดล 6-7 ที่ได้รบั แรงบันดาลใจมาจากโมเดล GOOGLENET และ
RESNET ..................................................................................................................................................................8
รูปที่ 13 ผลลัพธ์ความแม่นยำของโมเดล (ACCURACY) .........................................................................................................8
รูปที่ 14 การทำงานของเทคนิคถ่ายทอดการเรียนรู้ ..............................................................................................................9
รูปที่ 15 ขั้นตอนการทำงานของ MALPEM..........................................................................................................................9
รูปที่ 16 การแบ่งปริมาตรในแต่ละส่วนของสมอง .............................................................................................................. 10
รูปที่ 17 โครงสร้างของสมองที่แยกย่อยออกมาทั้งหมด 138 โครงสร้าง ............................................................................. 11
รูปที่ 18 ชื่อแต่ละส่วนของโครงสร้างสมอง ........................................................................................................................ 11
รูปที่ 19 ตัวอย่างโปรแกรม MANGO .................................................................................................................................. 14
รูปที่ 20 ตัวอย่างโปรแกรม SPM....................................................................................................................................... 15
รูปที่ 21 แผนผัง FLOW CHART การดำเนินงานในส่วนที่1 .................................................................................................. 18
รูปที่ 22 แผนผัง FLOW CHART การดำเนินงานในส่วนที่2 .................................................................................................. 22
รูปที่ 23 ประสิทธิภาพโมเดลจากการศึกษาบทความ ......................................................................................................... 23
รูปที่ 24 ตัวอย่างผลลัพธ์ข้อมูลรูปภาพ3มิติมาสไลด์เป็นรูปภาพ2มิติผ่านของผู้ป่วย 1 คน.................................................. 23
viii
รูปที่ 25 สร้าง MODEL CONVOLUTION NEURAL NETWORK ผ่าน DEEP NETWORK DESIGNER APP..................................... 24
รูปที่ 26 นำข้อมูลรูปภาพเข้าผ่าน DEEP NETWORK DESIGNER APP โดย LABEL 2 CLASS AD และ CN ............................. 25
รูปที่ 27 ACCURACY และ LOSS ของโมเดล โดยได้ VALIDATION ACCURACY 57% ............................................................ 26
รูปที่ 28 การตัดสไลด์รูปภาพแบบใหม่(HORIZONTAL CUT FIXED Y).................................................................................. 27
รูปที่ 29 การปรับขนาดไฟล์ภาพ(RESIZE) เป็นขนาด 224*224 .......................................................................................... 27
รูปที่ 30 การเพิ่มค่าสีที่ขอบภาพ(PADDING) เป็นขนาด 224*224 ...................................................................................... 28
รูปที่ 31 ผลลัพธ์ความแม่นยำ(ACCURACY) ของการเพิ่มค่าสีที่ขอบภาพ(PADDING (ACCURACY) 50% .............................. 28
รูปที่ 32 ผลลัพธ์ความแม่นยำ(ACCURACY) ของการปรับขนาดไฟล์ภาพ(RESIZE) 60.71% ................................................ 29
รูปที่ 33 ผลลัพธ์ความแม่นยำ(ACCURACY) ของโมเดล GOOGLENET 68.18% และ ค่าการสูญเสีย(LOSS) 0.8.................. 29
รูปที่ 34 แสดงผลลัพธ์ความแม่นยำ(ACCURACY) ของโมเดล VGG-16 65.91% และค่าการสูญเสีย(LOSS) 0.8................. 30
รูปที่ 35 ผลลัพธ์ความแม่นยำ(ACCURACY) ของโมเดล ALEXNET 79.55% และ ค่าการสูญเสีย(LOSS) 0.5 ........................ 30
รูปที่ 36 โมเดล ALEXNET.................................................................................................................................................. 31
รูปที่ 37 แสดงผลลัพธ์ความแม่นยำ(ACCURACY) ของโมเดล ALEXNET 85% และ ค่าการสูญเสีย(LOSS) 0.48................... 32
รูปที่ 38 ผลลัพธ์ความแม่นยำ(ACCURACY) ของโมเดล ALEXNET 87.50% และ ค่าการสูญเสีย(LOSS) 0.4 ........................ 32
รูปที่ 39 ผลลัพธ์ของโมเดล ALEXNET ในการจำแนก 3 ประเภทสมอง โดยค่าความแม่นยำ(ACCURACY) 78.33 % และ ค่าการ
สูญเสีย(LOSS) 0.5 ............................................................................................................................................... 33
รูปที่ 40 โค้ด MATLAB ในการจำแนกประเภทสมองโดยเทคนิคการการถ่ายทอดการเรียนรู้............................................. 34
รูปที่ 41 ผลลัพธ์เทคนิคการถ่ายโอนข้อมูลของโมเดล GOOGLENET ในการจำแนก 2 ประเภทสมอง โดยค่าความแม่นยำ
(ACCURACY) 85 % และ ค่าการสูญเสีย(LOSS) 0.4 .............................................................................................. 35
รูปที่ 42 การจำแนกประเภทของส่วนสำหรับทดสอบหาว่าโมเดลทำงานได้ดี (VALIDATION)............................................... 35
รูปที่ 43 แสดงผลลัพธ์เทคนิคการถ่ายโอนข้อมูลของโมเดล GOOGLENET ในการจำแนก 3 ประเภทสมอง โดยค่าความแม่นยำ
(ACCURACY) 68.33 % และ ค่าการสูญเสีย(LOSS) 0.7......................................................................................... 36
รูปที่ 44 ตัวอย่างผลลัพธ์ข้อมูลปริมาตรในแต่ละส่วนของโครสร้างสมองของผูป้ ่วย 1 คน ................................................... 44
รูปที่ 45 ผลลัพธ์ข้อมูลต้นฉบับปริมาตรในแต่ละส่วนของโครสร้างสมองของผูป้ ่วยทั้งหมด 300 คน ................................... 45
รูปที่ 46 ตัวอย่าง FEATURE ใหม่ของปริมาตรในแต่ละส่วนของโครสร้างสมอง.................................................................... 46
รูปที่ 47 ผลลัพธ์ข้อมูลการรวมจับคูป่ ริมาตรในแต่ละส่วนของโครสร้างสมองของผู้ป่วยทัง้ หมด 300 คน............................ 46
รูปที่ 48 การนำข้อมูลปริมาตรในแต่ละส่วนของโครสร้างสมองของผู้ป่วยทัง้ หมด 200 คนเข้ามา (CN/AD)....................... 47
รูปที่ 49 ข้อมูลไม่มีการสูญหายเกิดขึ้น............................................................................................................................... 47
รูปที่ 50 แสดงจำนวนผูป้ ่วยในแต่ละคลาส ........................................................................................................................ 48
ix
รูปที่ 51 การเปรียบเทียบโครงสร้างสมองของผู้ป่วยปกติกับผู้ป่วยอัลไซเมอร์ .................................................................... 48
รูปที่ 52 ค่า CORRELATION ของ AMYGDALA กับ HIPPOCAMPUS ...................................................................................... 49
รูปที่ 53 การกระจายตัวของกลุ่มข้อมูล (CLASSES) เมือ่ ใช้ AMYGDALA กับ HIPPOCAMPUS............................................... 49
รูปที่ 54 การกระจายตัวของกลุม่ ข้อมูล (CLASSES) 3RDVENTRICLE+AMYGDALA (ซ้าย) กับ 3RDVENTRICLE+HIPPOCAMPUS
(ขวา) ................................................................................................................................................................... 50
รูปที่ 55 การกระจายตัวของกลุ่มข้อมูล (CLASSES) 4THVENTRICLE+AMYGDALA (ซ้าย) กับ 4THVENTRICLE+HIPPOCAMPUS
(ขวา) ................................................................................................................................................................... 50
รูปที่ 56 การกระจายตัวของกลุ่มข้อมูล (CLASSES) INFLATVENT+AMYGDALA (ซ้าย) กับ ................................................. 51
รูปที่ 57 การกระจายตัวของกลุ่มข้อมูล (CLASSES)BASAL FOREBRAIN+AMYGDALA(ซ้าย) กับ
BASALFOREBRAIN+HIPPOCAMPUS (ขวา) ........................................................................................................... 51
รูปที่ 58 การกระจายตัวของกลุ่มข้อมูล (CLASSES) ENTA+AMYGDALA (ซ้าย) กับ ENTA+HIPPOCAMPUS (ขวา) .............. 52
รูปที่ 59 การกระจายตัวของกลุ่มข้อมูล (CLASSES) TMP+AMYGDALA (ซ้าย) กับ TMP+HIPPOCAMPUS (ขวา)................. 52
รูปที่ 60 ข้อมูลของผูป้ ่วยที่เลือกปริมาตรสมองมา 8 ส่วน .................................................................................................. 53
รูปที่ 61 ข้อมูลของผู้ป่วยทีเ่ ลือกปริมาตรสมองมา 8 ส่วน พร้อมกับทำการ NORMALIZE ข้อมูล.......................................... 53
รูปที่ 62 ข้อมูลในส่วน TRAIN จำนวน 160 คน (CN 80 /AD 80) ....................................................................................... 54
รูปที่ 63 ข้อมูลในส่วน TEST จำนวน 40 คน (CN 20 /AD 20) ........................................................................................... 54
รูปที่ 64 การนำข้อมูลปริมาตรในแต่ละส่วนของโครสร้างสมองของผู้ป่วยทัง้ หมด 300 คนเข้ามา (CN/MCI/AD) .............. 55
รูปที่ 65 ข้อมูลไม่มีการสูญหายเกิดขึ้น............................................................................................................................... 55
รูปที่ 66 แสดงจำนวนผูป้ ่วยในแต่ละคลาส ........................................................................................................................ 56
รูปที่ 67 ข้อมูลของผูป้ ่วยที่เลือกปริมาตรสมองมา 8 ส่วน .................................................................................................. 56
รูปที่ 68 ข้อมูลของผูป้ ่วยที่เลือกปริมาตรสมองมา 8 ส่วน พร้อมกับทำการ NORMALIZE ข้อมูล .......................................... 57
รูปที่ 69 ข้อมูลในส่วน TRAIN จำนวน 240 คน (CN 80 /AD 80/MCI 80) .......................................................................... 57
รูปที่ 70 ข้อมูลในส่วน TEST จำนวน 40 คน CN (20 /AD 20/MCI 20).............................................................................. 58
รูปที่ 71 จำนวนข้อมูลที่นำเข้า MATLAB (X_SUM=TRAIN, Y_SUM=TEST) ................................................................... 58
รูปที่ 72 ข้อมูลในส่วน TRAIN............................................................................................................................................. 59
รูปที่ 73 ข้อมูลในส่วน TEST .............................................................................................................................................. 59
รูปที่ 74 CONFUSION MATRIX ในการ TRAIN ของโมเดล RANDOM FOREST....................................................................... 59
รูปที่ 75 CONFUSION MATRIX ในการ TEST ของโมเดล RANDOM FOREST ........................................................................ 60
รูปที่ 76 การนำข้อมูลเข้า CLASSIFICATION LEARNER APP ............................................................................................... 61
x
รูปที่ 77 การเลือกใช้โมเดลบน CLASSIFICATION LEARNER APP ........................................................................................ 61
รูปที่ 78 CONFUSION MATRIX ในการ TRAIN ของโมเดล LINEAR SVM .............................................................................. 62
รูปที่ 79 CONFUSION MATRIX ในการ TEST ของโมเดล LINEAR SVM ................................................................................ 62
รูปที่ 80 CONFUSION MATRIX ในการ TRAIN ของโมเดล TRI LAYERED NEURAL NETWORK............................................... 63
รูปที่ 81 CONFUSION MATRIX ในการ TEST ของโมเดล TRI LAYERED NEURAL NETWORK ................................................ 64
รูปที่ 82 ผลลัพธ์ในการจำแนกผูป้ ่วยจำนวน 40 คน........................................................................................................... 65
รูปที่ 83 จำนวนข้อมูลที่นำเข้า MATLAB (X_SUM=TRAIN, Y_SUM=TEST) ................................................................... 66
รูปที่ 84 ข้อมูลในส่วน TRAIN............................................................................................................................................. 66
รูปที่ 85 ข้อมูลในส่วน TEST .............................................................................................................................................. 66
รูปที่ 86 CONFUSION MATRIX ในการ TRAIN ของโมเดล RANDOM FOREST....................................................................... 67
รูปที่ 87 CONFUSION MATRIX ในการ TEST ของโมเดล RANDOM FOREST ........................................................................ 67
รูปที่ 88 การนำข้อมูลเข้า CLASSIFICATION LEARNER APP ............................................................................................... 68
รูปที่ 89 การเลือกใช้โมเดลบน CLASSIFICATION LEARNER APP ........................................................................................ 69
รูปที่ 90 CONFUSION MATRIX ในการ TRAIN ของโมเดล LINEAR SVM .............................................................................. 69
รูปที่ 91 CONFUSION MATRIX ในการ TEST ของโมเดล LINEAR SVM ................................................................................ 70
รูปที่ 92 CONFUSION MATRIX ในการ TRAIN ของโมเดล TRI LAYERED NEURAL NETWORK............................................... 71
รูปที่ 93 CONFUSION MATRIX ในการ TEST ของโมเดล TRI LAYERED NEURAL NETWORK ................................................ 71
รูปที่ 94 ผลลัพธ์ในการจำแนกผู้ป่วยจำนวน 60 คน........................................................................................................... 73
xi
สารบัญตาราง
ตารางที่ 1 ตารางเปรียบเทียบผลลัพธ์ความแม่นยำ(ACCURACY) และ ค่าการสูญเสีย(LOSS) ของโมเดล ............................ 31
ตารางที่ 2 ผลลัพธ์การ TEST ระหว่าง CN และ AD ของโมเดล ALEXNET .......................................................................... 37
ตารางที่ 3 จำนวนการทายถูกผิดของการ TEST ระหว่าง CN และ AD ของโมเดล ALEXNET.............................................. 38
ตารางที่ 4 ACCURACY และ CONFUSION MATRIX ของโมเดล ALEXNET ............................................................................ 39
ตารางที่ 5 ผลลัพธ์การ TEST ข้อมูลผูป้ ่วยระหว่าง CN และ AD ของโมเดล GOOGLENET ................................................. 39
ตารางที่ 6 จำนวนการทายถูกผิดของการ TEST ระหว่าง CN และ AD ของโมเดล GOOGLENET ....................................... 41
ตารางที่ 7 ACCURACY และ CONFUSION MATRIX ระหว่าง CN และ AD ของโมเดล GOOGLENET ................................... 41
ตารางที่ 8 เปรียบเทียบผลลัพธ์ ACCURACY และ CONFUSION MATRIX ระหว่าง CN และ AD ของโมเดล GOOGLENET และ
ALEXNET ............................................................................................................................................................. 41
ตารางที่ 9 จำนวนการทายถูกผิดของการ TEST ระหว่าง CN ,MCIและ AD ของโมเดล ALEXNET ..................................... 42
ตารางที่ 10 จำนวนการทายถูกผิดของการ TEST ระหว่าง CN , MCIและ AD ของโมเดล GOOGLENET ............................ 42
ตารางที่ 11 เปรียบเทียบผลลัพธ์ ACCURACY และ CONFUSION MATRIX ระหว่าง CN ,MCIและ AD ของโมเดล GOOGLENET
และ ALEXNET ..................................................................................................................................................... 43
ตารางที่ 12 ACCURACY และ CONFUSION MATRIX ของโมเดล RANDOM FOREST ............................................................. 60
ตารางที่ 13 ACCURACY และ CONFUSION MATRIX ของโมเดล LINEAR SVM .................................................................... 63
ตารางที่ 14 ACCURACY และ CONFUSION MATRIX ของโมเดล TRI LAYERED NEURAL NETWORK..................................... 64
ตารางที่ 15 เปรียบเทียบ ACCURACY และ CONFUSION MATRIX ของแต่ละโมเดล............................................................. 65
ตารางที่ 16 ACCURACY และ CONFUSION MATRIX ของโมเดล RANDOM FOREST ............................................................. 68
ตารางที่ 17 ACCURACY และ CONFUSION MATRIX ของโมเดล LINEAR SVM .................................................................... 70
ตารางที่ 18 ACCURACY และ CONFUSION MATRIX ของโมเดล TRI LAYERED NEURAL NETWORK..................................... 72
ตารางที่ 19 การเปรียบเทียบประสิทธิภาพของแต่ละโมเดลในส่วนที่ 2.............................................................................. 72
ตารางที่ 20 เปรียบเทียบประสิทธิภาพ ACCURACY และ CONFUSION MATRIX ของ BINARY CLASSIFICATIONระหว่าง CN และ
AD ของโมเดลทั้งสองส่วน .................................................................................................................................... 74
ตารางที่ 21 เปรียบเทียบผลลัพธ์ ACCURACY และ CONFUSION MATRIX แบบ MULTICLASS CLASSIFICATIONระหว่าง CN
,MCIและ AD ของโมเดลทั้งสองส่วน.................................................................................................................... 75
xii
คาอธิบายสัญลักษณ์และคาย่อ
xiii
1 บทนา
การทำวิจัยในครั้งนี้ เกิดมาจากการที่ในปัจจุบันโรคอัลไซเมอร์เป็นสาเหตุหลักของการนำไปสู่ภาวะสมอง
เสื่อม โดยมีสาเหตุมาจากประสิทธิภาพของสมองจะมีการลดลงอย่างต่อเนื่อง และสมองในส่วนของฮิบโปแคมปัส
จะมีประสิทธิภาพลดลงเป็นอันดับแรก ซึ่งภาวะของโรคนี้จะเป็นอันตรายทั้งต่อผู้ป่วยและคนรอบข้างที่จะได้รับ
ผลกระทบ ดังนั้นการวินิจฉัยภาวะของโรคอัลไซเมอร์จึงเป็นสิ่งที่สำคัญมาก ทั้งในเรื่องของเวลาในการวินิจฉัยและ
ประสิทธิภาพความแม่นยำถูกต้องในการวินิจฉัย เพราะถ้าสามารถวินิจฉัยได้ภายในเวลารวดเร็วและมีความแม่นยำ
ถูกต้อง ก็จะทำให้ผู้ป่วยได้รับการรักษาเร็วยิ่งขึ้น ซึ่งจะสามารถส่งผลกระทบหรือผลเสียได้ ลดลง โดยทางเราได้
ตระหนักถึงปัญหาที่กล่าวมา เราจึงมีความต้องการที่ จะแก้ไขในเรื่องของระยะเวลาในการวินิจฉัย หรือรวมถึง
พัฒนาประสิทธิภาพในการวินิจฉัย ให้มีความน่าเชื่อถือมากยิ่งขึ้น เพื่อจะสามารถนำไปประยุกต์ใช้ได้จริงในทาง
การแพทย์
1.1. วัตถุประสงค์ของโครงงาน
ต้องการที่จะจำแนกประเภทรูปภาพ MRI ว่าคนไข้คนใด เป็นผู้ป่วยโรคอัลไซเมอร์หรือไม่ได้ป่วยเป็นโรคอัล
ไซเมอร์ โดยจะสามารถจำแนกอัตโนมัติผ่านการเรียนรู้ของเครื่องคอมพิวเตอร์
1.2. ขอบเขตของโครงงาน
โครงงานวิศวกรรมไฟฟ้าในครั้งนี้ จะมีการแบ่งขอบเขตที่ชัดเจนออกเป็น 2 ส่วนหลัก ได้แก่
ส่วนที่1 จะเป็นวิธีการแรกที่เราจะนำข้อมูลรูปภาพสามมิติ MRI มาจำแนกประเภทโดยตรงผ่านวิธีการเรียนรู้
อัตโนมัตขิ องเครื่องคอมพิวเตอร์โดยใช้เทคนิคโครงข่ายประสาทเทียมแบบ Convolution Neural Network
ส่วนที่2 จะเป็นอีกวิธีการในการเตรียมข้อมูลโดยเราจะนำข้อมูลรูปภาพสามมิติ MRI เข้าไปทำตัดแบ่งส่วนสมอง
(Brain Segmentation) ให้ได้ผลลัพธ์ออกมาเป็นปริมาตร (Volumes feature) ในแต่ละส่วนของสมอง แล้วจึง
ค่อยนำปริมาตรในแต่ละส่วนของสมองมาทำการจำแนกผ่านวิธีการเรียนรู้อัตโนมัตขิ องเครื่องคอมพิวเตอร์
1
2 ทฤษฎีที่เกี่ยวข้อง
2.1 โรคอัลไซเมอร์ (Alzheimer’s Disease)
สมองของมนุษย์แบ่งออกเป็น 3 ส่วน คือ สมองส่วนเซรีบรัม เซรีเบลลัม และก้านสมอง โดยสมองส่วนเซ
รีบรัมเป็นส่วนที่ใหญ่ที่สดุ และเกี่ยวข้องกับความจำ การแก้ปัญหา ความคิด ความรู้สึก และควบคุมการเคลื่อนไหว
และสมองส่วนเซรีเบลลัมควบคุมการทรงตัวและการประสานงานของกล้ามเนื้อ และก้านสมอง ควบคุมการทำงาน
อัตโนมัติของร่างกายเช่น การหายใจ การทำงานของหัวใจ และการบีบตัวของหลอดเลือด โดยเมื่อผู้ป่วยเป็น
โรคอัลไซเมอร์ สมองจะถูกโรคอัลไซเมอร์ทำลายสมองเกือบทั้งหมด โดยจะทำลายเซลล์ประสาทและเนื้อเยื่อสมอง
เมื่อเวลาผ่านไปสมองจะหดตัวเล็กลงอย่างมาก
2
รูปที่3แสดงเซรีบรัมคอร์เทกซ์ส่วนจัดเก็บความทรงจำ
(ฮิปโปแคมปัสอยู่ข้างในของชั้นเซรีบรัมคอร์เทกซ์)
รูปที่ 4 การทำลายสมองของโรคอัลไซเมอร์โดยจะเริ่มทำลายจากสมองส่วนฮิปโปแคมปัส
รูปที่ 5 เซลล์ประสาทหรือนิวรอนปกติ
3
รูปที่ 6 เซลล์ประสาทถูกทำลายโดยโรคอัลไซเมอร์ โดยเริม่ จากสมองส่วนฮิปโปแคมปัส
ดังนั้นโรคอัลไซเมอร์จึงเกี่ยวข้องอย่างมากกับสมองส่วนฮิปโปแคมปัส เพราะเป็นจุดเริ่มต้นในการโดนทำลาย
จึงต้องทำการวินิจฉัยดูในส่วนฮิปโปแคมปัส และสมองรอบข้างว่าเกิดการทำลายเนื้อเยือ่ จนหดตัวเล็กลง
4
โรคอัลไซเมอร์ (AD) เป็นโรคที่เกิดจากความผิดปกติของระบบประสาทและทำให้เกิดภาวะสมองเสื่อม ความ
บกพร่องทางสติปัญญาระดับอ่อน (MCI) เป็นรูปแบบระยะแรกของของอัลไซเมอร์ และมีลักษณะเฉพาะตัวของ
ความผิดปกติของระบบประสาท แต่ไม่ได้นับว่าอยู่ในขอบเขตของภาวะสมองเสื่อม และเป็นปัญหาเล็กน้อยใน
ความสามารถในการทำงาน โรคอัลไซเมอร์ มีส่วนเกี่ยวข้องกับการผลิตโปรตีนตั้งต้นของ amyloid มากเกินไป ซึ่ง
ส่งผลให้เกิดคราบจุลินทรีย์ในระบบประสาทเพิ่มขึ้น ทำให้เกิดความเครียดจากปฏิกิริยาออกซิเดชันและการอักเสบ
ซึ่งก่อให้เกิดความเสียหายต่อเซลล์ประสาท การวิจัยเกี่ยวกับการถ่ายภาพด้วยคลื่นสนามแม่เหล็กเป็นส่วนสำคัญที่
ใช้ในการระบุทางการเเพทย์ของ ผู้ป่วยโรคอัลไซเมอร์ ด้วยการสร้างภาพจำลองทางระบบประสาทในกายภาพ
5
รูปที่ 9 การตัดสมองที่ใช้ในทางการแพทย์ โดยจะตัดเห็นส่วยฮิปโปแคมปัสของสมอง
6
ยกตัวอย่างจากงานวิจัยโดยทำการเปรียบเทียบความแม่นยำของโมเดลการเรียนรู้ของเครื่อง และการเรียนรู้
เชิงลึก โดยการเรียนรู้ของเครื่องทำการใช้ Linear SVM และ Non-Linear SVM และการเรียนรู้เชิงลึกใช้โมเดล
Convolution Neuron Network (CNN) ที่มีชั้นที่แตกต่างกัน และใช้โมเดล pretrained คือ โมเดล Resnet และ
ใช้โมเดลที่ได้รับแรงบันดาลใจมาจากโมเดล GoogLeNet
7
รูปที่ 12 โมเดล Convolution Neuron Network โมเดล 6-7 ที่ได้รบั แรงบันดาลใจมาจากโมเดล
GoogLeNet และ ResNet
8
2.5 การถ่ายทอดการเรียนรู้ (Transfer Learning)
Transfer Learning คือ เทคนิคที่ช่วยลดเวลาในการเทรนโมเดลการเรียนรู้เชิงลึก ด้วยการนำบางส่วนของ
โมเดลที่ทำการเรียนรู้เรียบร้อยแล้ว มาใช้เป็นส่วนหนึ่งของโมเดลใหม่ ในทางปฏิบัติการเทรน Convolutional
Neural Network ตั้งแต่ต้นเป็นเรื่องที่ทำได้ยาก เนื่องจากไม่มีชุดข้อมูลที่ใหญ่เพีย งพอ ดังนั้นจึงใช้วิธีนำโมเดล
Convolutional Neural Network ที ่ ม ี อ ยู ่ แ ล้ ว (ConvNet) ที ่ เ ทรนกั บ ชุ ด ข้ อ มู ล ขนาดใหญ่ ซึ ่ ง ก็ ค ื อ โมเดล
Pretrained โดยการนำโมเดลนั้นมาเป็นโมเดลตั้งต้นเพื่อทำการเรียนรู้ต่อไป กับชุดข้อมูลขนาดเล็กในงานเฉพาะ
ทาง หรือ ใช้สกัด Feature สำหรับงานที่ต้องการออกมา
รูปที่ 14 การทำงานของเทคนิคถ่ายทอดการเรียนรู้
10
รูปที่ 17 โครงสร้างของสมองที่แยกย่อยออกมาทั้งหมด 138 โครงสร้าง
รูปที่ 18 ชื่อแต่ละส่วนของโครงสร้างสมอง
11
2.8 การวิเคราะห์การจาแนกประเภทเชิงเส้น (linear discriminant analysis)
การวิเคราะห์การจำแนกประเภทเชิงเส้น (LDA) จะมีการพิจารณาแยกการกระจายตัวของแต่ละกลุ่ม
(Classes) ซึ่งในการวิเคราะห์การจำแนกประเภทเชิงเส้นนั้น สิ่งที่พจิ ารณาเป็นสำคัญคือ การทีม่ ีข้อมูลต่างกลุ่มกัน
คนละคลาส มีการกระจายตัวระหว่างกันอยูห่ ่างกันที่สุด ซึง่ สามารถบ่งบอกได้ว่าข้อมูลที่นำมาทำการวิเคราะห์การ
จำแนกประเภทเชิงเส้นสามารถทีจ่ ะนำไปทำการใช้จำแนกข้อมูลแต่ละกลุ่มได้
12
3 เครื่องมือที่ใช้ในการทาโครงงาน
3.1 Hardware
• Computer : Dell G3 15, Intel(R) Core(TM) i5–8300H CPU @2.3GHz, NVDIA GEFORCE
GTX 1050, RAM 12 GB ,HDD ,SSD ,Storage: 1TB, Display 15.6 inch, OS: windows
• Computer : Asus VivoBook 15, AMD Ryzen 7 3700U, Radeon RX Vega 10, RAM 8 GB
2400 MHz, 512 GB SSD PCIe M.2, Display 15.6 inch, OS: windows
• DESKTOP PC, DELL VOSTRO, Intel(R) Core(TM) i7, RAM 8 GB , 64-bit operating system,
NVIDIA GeForce GTX 745, Ubuntu 16.04.7 LTS (Xenial Xerus)
3.2 Software
• Python
ภาษาโปรแกรม Python คือภาษาโปรแกรมคอมพิวเตอร์ระดับสูง โดยถูกออกแบบมาให้เป็นภาษาสคริปต์ที่
อ่านง่าย โดยตัดความซับซ้อนของโครงสร้างและไวยกรณ์ของภาษาออกไป ในส่วนของการแปลงชุดคำสั่งที่เรา
เขียนให้เป็นภาษาเครื่อง Python มีการทำงานแบบ Interpreter คือเป็นการแปลชุดคำสั่งทีละบรรทัด เพื่อ
ป้อนเข้าสูห่ น่วยประมวลผลให้คอมพิวเตอร์ทำงานตามที่ต้องการ
ซึ่งในส่วนการทำโครงงานวิศวกรรมไฟฟ้าในครัง้ นี้ จะใช้ภาษาโปรแกรม Python ในขั้นตอนการนำข้อมูล
รูปภาพ 3D MRI image มาผ่านโมเดล Deep learning ในการ classify รูปภาพ 3D MRI image และนำ
Python มาใช้ในการเตรียมข้อมูลเบื้องต้นในส่วนของปริมาตรของสมอง (Volumes feature) เพื่อนำข้อมูลไปใช้
ต่อในการใช้จำแนกว่าเป็น ผู้ป่วย Alzheimer’s Disease หรือไม่
• MATLAB
โปรแกรมแมทแลป เป็นซอฟต์แวร์ในการคำนวณและการเขียนโปรแกรม โปรแกรมหนึ่ง ที่มีความสามารถ
ครอบคลุมตั้งแต่การพัฒนาอัลกอริธึม การสร้างแบบจำลองทางคณิตศาสตร์ และการทำซิมเู ลชั่นของระบบ การ
สร้างระบบควบคุม และโดยเฉพาะเรือ่ ง image processing
ซึ่งในส่วนการทำโครงงานวิศวกรรมไฟฟ้าในครัง้ นี้ จะใช้ภาษาโปรแกรม MATLAB ในขั้นตอนการทำโมเดล
Deep learning ใน Application Deep network designer ในโปรแกรม MATLAB ใช้ทำโมเดล Deep
learning ในการ classify รูปภาพ 3D MRI image และในอีกส่วนจะมีการใช้ Classification Learner App ที่มี
13
อยู่ในโปรแกรม MATLAB ในการจำแนกข้อมูลปริมาตรของสมอง (Volumes feature) ว่าเป็นผู้ป่วย
Alzheimer’s Disease หรือไม่
• Linux
ลินุก ซ์ เป็นระบบปฏิบัติก ารพื้นฐานที่เป็นแบบ Open source software โดยมีก ารพัฒนาแจกจ่ายให้
ผู้ใช้งานต่างๆสามารถใช้ได้ฟรี และสามารถเข้ามาพัฒนาระบบได้ หรือจะกล่าวได้ว่า ระบบปฏิบัติการลินุกซ์ทำ
หน้าที่เป็นตัวกลางเชื่อมต่อระหว่าง Hardware และ Application เพื่อที่จะบริหารจัดการ Resource ที่มีอยู่ให้
เหมาะสม
ซึ่งในส่วนของการทำโครงงานวิศวกรรมไฟฟ้าในครั้งนี้ จะใช้เครื่องมือระบบปฏิบัติการลินุกซ์ในขั้นตอน
Brain Segmentation และจะได้ผลลัพ ธ์ออกมาเป็น Volume feature แล้วจะนำข้อมูลในส่วนนี้มาทำต่อใน
ขั้นตอนถัดไป
• MALPEM
MALPEM เป็นซอฟแวร์ที่ถูกจัดทำขึ้นมาเพื่อแบ่งส่วนภาพสมอง MRI จะประกอบไปด้วยซอฟต์แวร์และ
ไฟล์ข้อมูลสำหรับการแก้ไขอคติ การแยกสมอง (pincram) และการแบ่งส่วนภาพการสแกนโครงสร้างสมอง (MRI)
ซึ่ง ในส่วนของการทำโครงงานวิ ศวกรรมไฟฟ้ า ในครั ้ง นี้ จะใช้ ซ อฟแวร์ MALPEM ในขั้นตอน Brain
Segmentation และจะได้ผลลัพธ์ออกมาเป็น Volume feature แล้วจะนำข้อมูลในส่วนนี้มาทำต่อในขั้นตอน
ถัดไป
• Mango
15
4 วิธีการดาเนินโครงงาน
ได้แบ่งการทำวิจัยในครั้งนี้ออกเป็นสองส่วน ซึ่งในแต่ละส่วนจะมีวิธีการจัดเตรียมข้อมูลหรือวิธีการ
ดำเนินงานทีเ่ หมือน และแตกต่างกัน ดังต่อไปนี้
การดาเนินงานในส่ วนที่ 1)
ขั้นตอนที่1 เริ่มการดำเนินงานในส่วนนี้ โดยการหาบทความที่เกี่ยวข้องกับโครงงาน และได้เริ่มการศึกษา
งานวิจ ัย “3D image classification from CT scans” เมื่อได้ข้อมูล ในส่วนนี้ม าแล้ว ผู้จ ัดทำได้ม ีก ารศึก ษา
บทความเพิ่มส่วนในส่วนนี้แล้ว จึงได้ทำการศึกษาบทความ “การสร้าง Convolutional Neural Network (CNN)
เพื่อทำนายการปรากฏตัวของโรคปอดบวมจากไวรัสในการสแกนด้วยเครื่องเอกซเรย์คอมพิวเตอร์ ( CT)” เพื่อ
นำมาใช้เป็นแนวทางในการออกแบบโปรแกรมสำหรับการวิเคราะห์จำแนกภาพ MRI ของโรคอัลไซเมอร์โดยอาศัย
เทคนิคการเรียนรู้ของเครื่อง
ขั้นตอนที่2 เพื่อให้การการวิเคราะห์จำแนกรูปภาพสะท้อนในสนามแม่เหล็กของโรคอัลไซเมอร์สมบูรณ์ยิ่ง
ขี้น จำเป็นจะต้องทำการศึกษารูปภาพสะท้อนในสนามแม่เหล็ก เพื่อนำมาประยุกต์ใช้กับการจำลองการทำโมเดล
จำแนก ซึ่งประกอบด้วย การนำไปประยุกต์ใช้ในการทำ ขั้นตอนการเตรียมข้อมูล (preprocessing) และการเพิ่ม
จำนวนข้อมูลรูปภาพ (Augmentation) แล้วจึงสุ่มจำนวนรูปภาพที่เ ข้ามาใช้ง านในโมเดล และทดลองทำตาม
ข้อมูลที่ศึกษามา และวัดประสิทธิภาพโมเดล
ขั้นตอนที่3 จะเป็นการนำข้อมูลต้นฉบับจากฐานข้อมูล ADNI ซึงเป็นภาพ MRI 3มิติเข้ามา และไปทำการ
เตรียมข้อมูลโดยนำรูปภาพ3มิติมาสไลด์เป็นรูปภาพ2มิติผ่านโปรแกรมแมทแลป
ขั้นตอนที่4 หลังจากการนำข้อมูลตันฉบับไปสไลด์ในขั้นตอนที่ 3แล้ว เราจะได้ผลลัพธ์ออกมาเป็นภาพไฟล์
.jpg โดย 1 รูป ภาพ 3 มิติของโครงสร้างสมองของผู้ป ่วยแต่ละคนจะสไลด์อ อกมาทั้ง หมด 256 รูป ภาพ แล้ว
หลังจากนั้นเราจะคัดเลือกนำรูปภาพส่วนที่สำคัญของสมองมาคนละ 51 รูปภาพ โดยเป็นไฟล์ที่ 129-180 มา
รวมกันเพื่อที่จะนำไปใช้งานต่อในขั้นตอนถัดไป
ขั้นตอนที่5 ขั้นตอนนี้จะเป็นการทำงานของโปรแกรมที่สร้างเพื่อจะใช้ในการจำแนกจากโปรแกรมภาษา
แมทแลป เป็นส่วนของข้อมูลจากขั้นตอนที่4 มาให้เครื่องเรียนรู้ผ่านการสร้าง Convolutional Neural Network
(CNN) ผ่านแอพลิเคชั่น Deep Network designer โดยอ้างอิงโมเดลจากข้อมูลที่ศึกษามา หลังจากเริ่มการทำงาน
ของโปรแกรม จะวัดประสิทธิภาพของข้อมูล
16
ขั้นตอนที่6 พัฒนาโมเดลในโปรแกรมแมทแลป ในส่วนนี้จะประกอบไปด้วยขั้นตอนการเตรียมข้อมูลโดยใช้
จำนวนรูปภาพ 96 รูปภาพ โดยเป็น 48 รูปสมองผู้ป่วยอัลไซเมอร์(AD) และ 48 รูปสมองคนปกติ(CN) โดยทำการ
สไลด์รูปภาพแบบใหม่(Horizontal Cut Fixed Y) และทำการทำให้ขนาดรูปภาพเป็นขนาด 224*224 โดยการ
ปรับขนาดไฟล์ภาพ(resize) และการเพิ่มค่าสีที่ขอบภาพ(padding) เพื่อทำการเข้าโมเดล Pretrained และโมเดล
Pretrained ที่ใช้คือโมเดล GoogLeNet
ขั้นตอนที่7 นำข้อมูลรูปภาพที่สไลด์แบบใหม่ และปรับขนาดรูปภาพแล้วมาเข้าโมเดล Pretrained หลาย
โมเดลมากขึ้น ได้แก่ GoogLeNet ,VGG-16 และ AlexNet โดยทำการเพิ่ม จำนวนรูป ภาพเป็นรูป ภาพ 196
รูปภาพ โดยเป็นรูปภาพ 98 รูปสมองผู้ป่วยอัลไซเมอร์(AD) และ 98 รูปสมองคนปกติ(CN) และเพิ่มจำนวนรูปภาพ
เป็นจำนวนรูปภาพ 400 รูปภาพ โดยเป็นรูปภาพ 200 รูปสมองผู้ป่วยอัลไซเมอร์( AD) และ 200 รูปสมองคน
ปกติ(CN) ตามลำดับ
ขั้นตอนที8่ เพิ่มการจำแนกประเภทรูปภาพโดยเพิ่มระยะแรกของการเป็นอัลไซเมอร์( MCI) ที่ยังไม่ได้จัดอยู่
ในประเภทสมองผู้ป่วยโรคอัลไซเมอร์ โดยใช้ข้อมูลรูปภาพระยะแรกของการเป็นอัลไซเมอร์(MCI) จำนวน 200
รูปภาพ และทำการจำแนกด้วยโมเดล Pretrained โดยที่ใช้คือโมเดล AlexNet
ขั้นตอนที่9 กลับมาจำแนกประเภทรูปภาพโดยจำแนก 2 ประเภทเหมือนเดิมก่อนโดยยังไม่ใช้ชุดข้อมูล
ระยะแรกของการเป็นอัลไซเมอร์(MCI) ที่ยังไม่ได้จัดอยู่ในประเภทสมองผู้ป่วยโรคอัลไซเมอร์ โดยใช้ข้อมูลรูปภาพ
รูปภาพ 200 รูปสมองผู้ป่วยอัลไซเมอร์( AD) และ 200 รูปสมองคนปกติ (CN) และทำการใช้เทคนิคการถ่ายทอด
การเรียนรู้ (Transfer Learning) โดยโมเดล GoogLeNet
ขั้นตอนที่10 จำแนกประเภทรูปภาพโดยจำแนก 3 ประเภทโดยใช้ชุดข้อมูลระยะแรกของการเป็นอัลไซ
เมอร์(MCI) ที่ยังไม่ได้จัดอยู่ในประเภทสมองผู้ป่วยโรคอัลไซเมอร์ 200 รูปภาพ, รูปภาพสมองผู้ป่วยอัลไซเมอร์(AD)
200 รูปภาพ และรูปภาพสมองคนปกติ(CN) 200 รูปภาพ และทำการใช้เทคนิคการถ่ายทอดการเรียนรู้ (Transfer
Learning) โดยโมเดล GoogLeNet
ขั้นตอนที่ 11 เปรียบเทียบการ Train และ Test ข้อมูล classification ระหว่าง CN และ AD และ
เปรียบเทียบการ Train และ Test ข้อมูล multiclass classification ระหว่าง CN MCI และ AD
17
แผนผังการดาเนินงานในส่ วนที่ 1)
Transfer learning
21
ขั้นตอนที่ 4.2.2.4 ทำการทดลองเลือกโมเดลทีจ่ ะนำมาใช้ในการ Train ข้อมูล แล้วดูค่า Accuracy และ
Confusion matrix แล้วจึงทำการนำข้อมูลในส่วน Test เข้า Classification Learner App เข้าไปแล้วทำการ
Test หลังจากนั้นดูค่า Accuracy และ Confusion matrix ใช้ในการเลือกโมเดลที่ดีที่สุด เพื่อจะนำโมเดลออกมา
ใช้ในการจำแนกข้อมูลผูป้ ่วยคนต่อคนบน MATLAB ภายนอก Classification Learner App
แผนผังการดาเนินงานในส่ วนที่ 2)
22
5 ผลการดาเนินโครงงานและวิจารณ์
ผลดาเนินงานในส่ วนที่ 1)
รูปที่ 23 ประสิทธิภาพโมเดลจากการศึกษาบทความ
รูปที่ 24 ตัวอย่างผลลัพธ์ข้อมูลรูปภาพ3มิติมาสไลด์เป็นรูปภาพ2มิติผ่านของผู้ป่วย 1 คน
23
ผลการดาเนินงานในขั้นตอนที่ 4 หลังจากการนำข้อมูลตันฉบับไปสไลด์ในขั้นตอนที่3 ได้ผลลัพธ์ออกมา
เป็นภาพไฟล์ .png โดยหลังจากนั้นเราจะคัดเลือกนำรูปภาพส่วนที่สำคัญของสมองมาคนละ 51 รูปภาพ โดยเป็น
ไฟล์ที่ 129-180 มารวมกัน
รูปที่ 25 สร้าง model Convolution neural network ผ่าน Deep Network Designer App
24
รูปที่ 26 นำข้อมูลรูปภาพเข้าผ่าน Deep Network Designer App โดย label 2 class AD และ CN
25
รูปที่ 27 Accuracy และ loss ของโมเดล โดยได้ validation accuracy 57%
26
ผลการดาเนินงานในขั้นตอนที่ 6 จากการตัดสไลด์รปู ภาพแบบใหม่(Horizontal Cut Fixed Y) และทำ
การทำให้ขนาดรูปภาพเป็นขนาด 224*224 โดยการปรับขนาดไฟล์ภาพ(resize) และการเพิ่มค่าสีที่ขอบภาพ
(padding) เพื่อทำการเข้าโมเดล Pretrained
สมองผู้ป่วยโรคอัลไซเมอร์ สมองคนปกติ
27
สมองผูป้ ่วยโรคอัลไซเมอร์ สมองคนปกติ
28
รูปที่ 32 ผลลัพธ์ความแม่นยำ(accuracy) ของการปรับขนาดไฟล์ภาพ(resize) 60.71%
29
รูปที่ 34 แสดงผลลัพธ์ความแม่นยำ(accuracy) ของโมเดล VGG-16 65.91% และค่าการสูญเสีย(Loss) 0.8
30
ตารางที่ 1 ตารางเปรียบเทียบผลลัพธ์ความแม่นยำ(accuracy) และ ค่าการสูญเสีย(Loss) ของโมเดล
32
ผลการดาเนินงานในขั้นตอนที่ 8 ผลลัพธ์ของการเพิ่มการจำแนกประเภทรูปภาพโดยเพิ่มระยะแรกของ
การเป็นอัลไซเมอร์(MCI) ที่ยังไม่ได้จัดอยู่ในประเภทสมองผู้ป่วยโรคอัลไซเมอร์ โดยใช้ข้อมูลรูปภาพระยะแรกของ
การเป็นอัลไซเมอร์( MCI) จำนวน 200 รูป ภาพ และทำการจำแนกด้วยโมเดล Pretrained โดยที่ใช้คือโมเดล
AlexNet
33
รูปที่ 40 โค้ด MATLAB ในการจำแนกประเภทสมองโดยเทคนิคการการถ่ายทอดการเรียนรู้
(Transfer Learning) โดยโมเดล GoogLeNet
34
รูปที่ 41 ผลลัพธ์เทคนิคการถ่ายโอนข้อมูลของโมเดล GoogLeNet ในการจำแนก 2 ประเภทสมอง โดยค่า
ความแม่นยำ(accuracy) 85 % และ ค่าการสูญเสีย(Loss) 0.4
35
ผลการดาเนินงานในขั้นตอนที่ 10 ผลลัพธ์ในการจำแนกประเภทรูปภาพโดยจำแนก 3 ประเภทโดยใช้ชุด
ข้อมูลระยะแรกของการเป็นอัลไซเมอร์(MCI) 200 รูปภาพ, รูปภาพสมองผู้ป่วยอัลไซเมอร์(AD) 200 รูปภาพ และ
รูปภาพสมองคนปกติ(CN) 200 รูปภาพ และทำการใช้เทคนิคการถ่ายทอดการเรียนรู้ (Transfer Learning) โดย
โมเดล GoogLeNet
36
ผลการดาเนินงานในขั้นตอนที่ 11 ผลลัพธ์การ Test ข้อมูล classification ระหว่าง CN และ AD ของ
โมเดล AlexNet จำนวน 20 รูปภาพต่อประเภท ดังนี้
AD
37
CN
Predicted
class AD CN
True AD 13 7
CN 4 16
38
ตารางที่ 4 Accuracy และ Confusion matrix ของโมเดล AlexNet
Result AlexNet
Training Training Accuracy 87.5%
Testing Test Accuracy 72.5%
Precision 0.80
CN Recall 0.70
F1-score 0.74
Precision 0.65
AD Recall 0.76
F1-score 0.7
AD
39
CN
40
ตารางที่ 6 จำนวนการทายถูกผิดของการ Test ระหว่าง CN และ AD ของโมเดล GoogLeNet
Predicted
class AD CN
True AD 8 12
CN 0 20
Result GoogLeNet
Training Training Accuracy 85%
Testing Test Accuracy 70%
Precision 1.00
CN Recall 0.63
F1-score 0.77
Precision 0.40
AD Recall 1.00
F1-score 0.57
41
Precision 0.40 0.65
AD Recall 1.00 0.76
F1-score 0.57 0.7
ผลลัพธ์การ Test ข้อมูล multiclass classification ระหว่าง CN ,MCI และ AD ของโมเดล AlexNet
จำนวน 20 รูปภาพต่อประเภท โดยจะทำนายออกมาเป็นประเภทของแต่ละรูปภาพเหมือนตารางด้านบน
Predicted
class AD CN MCI
AD 13 2 5
True CN 2 14 4
MCI 3 5 12
Predicted
class AD CN MCI
AD 5 6 9
True CN 0 20 0
MCI 4 3 13
42
ตารางที่ 11 เปรียบเทียบผลลัพธ์ Accuracy และ Confusion matrix ระหว่าง CN ,MCIและ AD ของโมเดล
GoogLeNet และ AlexNet
43
ผลดาเนินงานในส่ วนที่ 2)
รูปที่ 44 ตัวอย่างผลลัพธ์ข้อมูลปริมาตรในแต่ละส่วนของโครสร้างสมองของผู้ป่วย 1 คน
44
ผลการดาเนินงานในส่วนที่ 2 ในขั้นตอนที่ 3 ภาพผลลัพธ์ที่มีการนำข้อมูลผลลัพธ์ Brain volumes
feature ของผู้ป่วยแต่ละคนมารวบรวมใส่ตาราง Excel ไว้ในไฟล์เดียวกันดังภาพด้านล่าง เพื่อนำไปใช้ต่อในการ
เตรียมข้อมูลและใช้ข้อมูลในการจำแนก ซึ่งในตาราง Excel จะมีข้อมูลของผูป้ ่วยแต่ละคน (ID) และมีข้อมูล
ปริมาตรในแต่ละส่วนของโครงสร้างภายในสมองทั้งหมด 139 โครงสร้าง (ชื่อแต่ละโครงสร้างสมองจะเป็นชื่อในแต่
ละหัวคอลัมน์) โดยข้อมูลปริมาตรสมองจะมีการแบ่งออกเป็นซีกซ้ายกับซีกขวาของแต่ละโครงสร้างภายในสมอง
โดยในโครงงานครั้งนี้ได้ทำการรวบรวมข้อมูลจากการนำภาพ 3D MRI images ไปทำการแยกโครงสร้างสมองให้
ได้ผลลัพธ์ปริมาตรสมองทั้งสิ้น 300 คน โดยจะแบ่งออกเป็น CN = 100 คน, AD = 100 คน และ MCI = 100 คน
โดยในขั้นตอนนี้จะมีการเตรียมข้อมูลเพิ่มเติมจากข้อมูลต้นฉบับ ในการนำปริมาตรของโครสร้างสมอง
ทางด้านซีกซ้ายกับซีกขวาที่เป็นคู่กันของโครงสร้างสมองเดียวกัน นำปริมาตรทั้งสองส่วนมารวมจับคูเ่ ข้าด้วยกัน
เป็นปริมาตรของโครสร้างภายในสมองที่รวมทัง้ ซีกซ้ายและขวาในคอลัมน์เดียวกัน แต่จะมีบางส่วนของโครงสร้าง
สมองที่จะเป็นโครงสร้างเดียวไม่มีการจับคู่ จะไม่นำไปทำการรวมกันกับส่วนอื่น ๆ โดยจะมีทั้งหมด 8 โครงสร้าง
ดังนี้ 3rdVentricle, 4thVentricle, BrainStem, CSF, OpticChiasm, CerebellarVermalLobulesI-V,
CerebellarVermalLobulesVI-VII และ CerebellarVermalLobulesVIII-X
45
หลังจากที่ได้มีการจับคูร่ วมปริมาตรสมองในส่วนเดียวกันเข้าด้วยกัน ดังนั้นจะทำให้ไฟล์ Excel เหลือ
โครงสร้างสมองหรือเรียกว่า Feature ทัง้ หมด 73 โครงสร้าง โดยจะแสดงภาพตัวอย่างชื่อ feature ใหม่ และภาพ
ไฟล์ Excel ผลการจับคู่รวมปริมาตรสมองดังรูปต่อไปนี้
46
ผลการดาเนินงานในส่วนที่ 2 ในขั้นตอนที่ 4
รูปที่ 49 ข้อมูลไม่มีการสูญหายเกิดขึ้น
47
รูปที่ 50 แสดงจำนวนผู้ป่วยในแต่ละคลาส
49
หลังจากนั้นก็ได้มีการเตรียมข้อมูลเพิม่ โดยการหา feature จากการศึกษาเกี่ยวกับสมองส่วนที่ได้รับ
ผลกระทบจากโรคอัลไซเมอร์ และนำ feature นั้น ๆ มาทำการเปรียบเทียบกับทั้ง 2 features หลัก Amygdala
กับ Hippocampus ผ่านการวิเคราะห์แบบ LDA แล้วจะเห็นว่า คลาสของกลุม่ ข้อมูลสามารเกิดการแบ่งระหว่าง
กันได้อย่างชัดเจน โดยจะมี feature ที่ได้ทำการนำมาวิเคราะห์และนำมาใช้ในการทำโครงงานครั้งนี้ ดังนี้
• 3rdVentricle
• 4thVentricle
• Basal Forebrain
51
• EntA (Ententorhinal Area)
53
รูปที่ 63 ข้อมูลในส่วน Train จำนวน 160 คน (CN 80 /AD 80)
รูปที่ 66 ข้อมูลไม่มีการสูญหายเกิดขึ้น
55
รูปที่ 67 แสดงจำนวนผู้ป่วยในแต่ละคลาส
ผลการดาเนินงานในขั้นตอนที่ 4.1.2.4 จะได้ข้อมูลทีเ่ หลือเฉพาะ feature ทีเ่ ลือกใช้ จำนวน 8 features ดังใน
ภาพที่ 67 หลังจากนั้นจะเป็นภาพผลัพธ์การนำข้อมูลมาทำการ Normalize ข้อมูล โดยวิธีการ Standardization
(Z-Score Normalization)
56
รูปที่ 69 ข้อมูลของผู้ป่วยทีเ่ ลือกปริมาตรสมองมา 8 ส่วน พร้อมกับทำการ Normalize ข้อมูล
57
รูปที่ 71 ข้อมูลในส่วน Test จำนวน 40 คน CN (20 /AD 20/MCI 20)
4.2.1 การ Train และ Test ข้อมูลแบบ Binary classification ระหว่าง CN และ AD
58
ผลการดาเนินงานในขั้นตอนที่ 4.2.1.2 เตรียมข้อมูลโดยใช้ภาษาแมทแลป ตัดข้อมูลในคอลัมน์ของ ID ผู้ป่วย
และคอลัมน์ Target Classes ออกจากข้อมูลทัง้ ในส่วน Train และTest ก่อนการนำไปใช้จำแนก จะเหลือข้อมูล
เฉพาะในส่วนปริมาตร 8 features รวมทั้งสร้างตัวแปรขึ้นมาเพื่อทำการเก็บข้อมูลในส่วน Target Classes แยก
เก็บไว้ทั้งในส่วน Train และTest พร้อมทั้งทำการเปลี่ยนแปลง Target Classes จาก CN เป็น 0 และจาก AD
เป็น 1
60
ภาพการนำข้อมูลส่วน Train เข้า Classification Learner App โดยมีการใช้ Cross Validation ด้วย เพื่อ
ป้องกันการเกิด Overfit ของโมเดล เมื่อจะนำโมเดลไปใช้ตอ่ รวมถึงการที่ใช้ Cross Validation จะเป็นการช่วย
ทำให้มองเห็นภาพรวมของประสิทธิภาพโมเดลได้ ดังนั้นเราจึงต้องมีเทคนิคหรือวิธีการประเมินตรวจสอบระบบ
และโมเดลของเราว่ามีผลลัพธ์ดังที่เราต้องการและสามารถใช้งานได้จริงหรือไม่
นำข้อมูลในส่วน Test เข้า Classification Learner App แล้วทำการ Test หลังจากนั้นดูค่า Accuracy
และ Confusion matrix ของโมเดล Linear SVM
รูปที่ 81 Confusion Matrix ในการ Train ของโมเดล Tri Layered Neural Network
63
นำข้อมูลในส่วน Test เข้า Classification Learner App แล้วทำการ Test หลังจากนั้นดูค่า Accuracy
และ Confusion matrix ของ Tri Layered Neural Network
รูปที่ 82 Confusion Matrix ในการ Test ของโมเดล Tri Layered Neural Network
ได้ผลลัพธ์ประสิทธิภาพ Accuracy และ Confusion matrix ของโมเดล Tri Layered Neural Network
ดังตารางที่ 14
ตารางที่ 14 Accuracy และ Confusion matrix ของโมเดล Tri Layered Neural Network
64
นำประสิทธิภาพในการ Train และ Test ข้อมูลแบบ Binary classification ของแต่ละโมเดลมาเปรียบเทียบกัน
รูปที่ 83 ผลลัพธ์ในการจำแนกผู้ป่วยจำนวน 40 คน
65
4.2.2 การ Train ข้อมูลแบบ multiclass classification ระหว่าง CN MCI และ AD
66
รูปที่ 87 Confusion Matrix ในการ Train ของโมเดล Random Forest
67
ได้ผลลัพธ์ประสิทธิภาพ Accuracy และ Confusion matrix ดังตารางที่ 16
ภาพการนำข้อมูลส่วน Train เข้า Classification Learner App โดยมีการใช้ Cross Validation ด้วย เพื่อ
ป้องกันการเกิด Overfit ของโมเดล เมื่อจะนำโมเดลไปใช้ตอ่ รวมถึงการที่ใช้ Cross Validation จะเป็นการช่วย
ทำให้มองเห็นภาพรวมของประสิทธิภาพโมเดลได้ ดังนั้นเราจึงต้องมีเทคนิคหรือวิธีการประเมินตรวจสอบระบบ
และโมเดลของเราว่ามีผลลัพธ์ดังที่เราต้องการและสามารถใช้งานได้จริงหรือไม่
69
นำข้อมูลในส่วน Test เข้า Classification Learner App แล้วทำการ Test หลังจากนั้นดูค่า Accuracy
และ Confusion matrix ของโมเดล Linear SVM
70
• โมเดล Tri Layered Neural Network
รูปที่ 93 Confusion Matrix ในการ Train ของโมเดล Tri Layered Neural Network
นำข้อมูลในส่วน Test เข้า Classification Learner App แล้วทำการ Test หลังจากนั้นดูค่า Accuracy
และ Confusion matrix ของ Tri Layered Neural Network
รูปที่ 94 Confusion Matrix ในการ Test ของโมเดล Tri Layered Neural Network
71
ได้ผลลัพธ์ประสิทธิภาพ Accuracy และ Confusion matrix ของโมเดล Tri Layered Neural Network
ดังตารางที่ 18
ตารางที่ 18 Accuracy และ Confusion matrix ของโมเดล Tri Layered Neural Network
ตารางที่ 19 การเปรียบเทียบประสิทธิภาพของแต่ละโมเดลในส่วนที่ 2
72
จะเห็นว่ามีผลลัพธ์ ประสิทธิภาพในการจำแนกข้อมูลแบบ Multiclass classification ระหว่างผู้ป่วยปกติ
(CN) ผู้ป่วยภาวะความรู้คิดบกพร่องเล็กน้อย (MCI) และผู้ป่วยโรคอัลไซเมอร์ (AD) ของโมเดลที่ดีที่สุดที่เลือกมา
คือ โมเดล Random Forest จะเห็นว่ามีค่า Accuracy ประมาณ 60% ดังนั้นทำให้พบการจำแนกผิดพลาดในชุด
ข้อมูล Test เป็นจำนวน 24 คน จากทั้งหมด 60 คน จะสังเกตุได้ว่า เนื่องจากการเพิ่มคลาส MCI เข้ามาในการ
จำแนก จะทำให้มีความสับสนของข้อมูลเกิดขึ้น ดังนั้นถือว่ามีผลลัพธ์และประสิทธิภาพในการใช้จำแนกข้อมูล
ผู้ป่วยได้ไม่ดีเทียบเท่าการจำแนกแบบ Binary classification
รูปที่ 95 ผลลัพธ์ในการจำแนกผู้ป่วยจำนวน 60 คน
73
6 สรุปผลการดาเนินงานและข้อเสนอแนะ
สรุปผลการดาเนินงาน
การสรุปผลการดำเนินงานในงานวิจัยจะสามารถสรุปทัง้ สองส่วนหลักได้ดังนี้
จากตารางจะเห็นได้ว่าเมื่อทำการแยกประเภทเพียง 2 ประเภทคือสมองผู้ป่วยโรคอัลไซเมอร์และสมองคน
ปกติ การเตรียมข้อมูลผ่าน MALPEM บนระบบปฏิบัติการลินุกซ์ โดยวิธี Brain Segmentation ได้ข้อมูลผลลัพธ์
ออกมาเป็นปริมาตรในแต่ละส่วนของโครงสร้างสมอง หรือ Brain volumes feature และทำการแยกประเภทโดย
โมเดล Linear SVM ได้ความแม่นยำ (Accuracy) มากที่สุดในการ Test และเมื่อดู precision ,Recall และ F1-
score แล้วนั้นก็ได้ค่าความถูก ต้องและความแม่นยำมากที่ส ุด จึง ทำให้ชนะโมเดลการเรียนรู้เ ชิง ลึก (Deep
Learning) แต่ถ้าเปรียบเทียบโมเดลการเรียนรู้เ ชิง ลึก (Deep Learning) ได้แก่ GoogLeNet และ AlexNet
74
เปรี ย บเที ย บกั บ โมเดล Random Forest และ Tri Layered Neural Network เมื ่ อ คำนึ ง ถึ ง ความแม่ น ยำ
(Accuracy) ในการ Test และ precision ,Recall และ F1-score จึ ง จั ด อั น ดั บ โมเดลเป็ น Random forest
,AlexNet ,GoogLeNet และ Tri Layered Neural Network ตามลำดับ
จากตารางที่ 21 จะเห็นได้ว่าเมื่อข้อมูลมีข้อมูลที่ต้องตัดสินใจสำหรับงานถ่ายภาพทางการแพทย์เพิ่มมากขึ้น
ทำให้การแยกประเภทสมอง 3 ประเภทคือสมองผู้ป่วยโรคอัลไซเมอร์ สมองคนปกติ และสมองระยะแรกของ
โรคอัลไซเมอร์ การใช้โมเดลการเรียนรู้เชิงลึก (Deep Learning) ในการตัดสไลด์แบบ (Horizontal Cut Fixed Y)
ที่ทำให้เห็นข้อมูลรูปภาพทางการแพทย์คือส่วนฮิปโปแคมปัส และส่วนรอบๆสมอง และทำการแยกประเภทโดย
โมเดล AlexNet ได้ความแม่นยำ (Accuracy) มากที่สุดในการ Test และเมื่อดู precision ,Recall และ F1-score
แล้วนั้นก็ได้ค่าความถูกต้องและความแม่นยำโดยรวมดีที่สุด จึงทำให้ชนะโมเดลอื่นๆ แต่ผลลัพธ์ของโมเดลส่วนที่
สองโดยรวมแล้ว Random Forest ได้เป็นอันดับที่2 และ โมเดล GoogLeNet ,Linear SVM และ Tri Layered
Neural Network ตามลำดับ
75
ข้อเสนอแนะ
76
7 บรรณานุกรม
[1] C A. Raji et al., “Age, Alzheimer disease, and brain structure,” in American Academy of
Neurology, Dec. 2009, doi: 10.1212/WNL.0b013e3181c3f293
[2] Sidong Liu et al., "Brain volumetric and fractal analysis of synthetic MRI: A comparative
study with conventional 3D T1-weighted images," in European journal of radiology , vol. 141,
Aug. 2021, doi: https://doi.org/10.1016/j.ejrad.2021.109782
[3] Ewelina bebas et al., “Machine-learning-based classification of the histological subtype
of non-small-cell lung cancer using MRI texture analysis,” in Biomedical Signal Processing and
Control, vol. 66, Apr. 2021, doi :https://doi.org/10.1016/j.bspc.2021.102446
[4] Silvia Basaia et al.,“ Automated classification of Alzheimer's disease and mild cognitive
impairment using a single MRI and deep neural networks,” NeuroImage: Clinical21 ,2019
[5] K.R.Kruthika et al., “CBIR system using Capsule Networks and 3D CNN for Alzheimer's
disease diagnosis,” in Informatics in Medicine Unlocked, vol. 14, pp.59-68, 2019 ,
doi: https://doi.org/10.1016/j.imu.2018.12.001
[6] Arijit De and Ananda S. Chowdhury., “DTI based Alzheimer’s disease classification with
rank modulated fusion of CNNs and random forest,” in Expert Systems with Applications, vol.
169, May. 2021, doi: https://doi.org/10.1016/j.eswa.2020.114338
[7] Md. Kamrul Hasan et al., “COVID-19 identification from volumetric chest CT scans
using a progressively resized 3D-CNN incorporating segmentation, augmentation, and class-
rebalancing” in Informatics in Medicine Unlocked, vol. 26, 2021, doi:
https://doi.org/10.1016/j.imu.2021.100709
[8] Loni. “Alzheimer's Disease Neuroimaging Initiative (ADNI)”. Internet: https://www.
http://adni.loni.usc.edu/data-samples/access-data/, Oct. 25, 2017 [Nov. 11, 2021].
[9] C. Ledig, R. A. Heckemann, A. Hammers, J. C. Lopez, V. F. J. Newcombe, A.
Makropoulos, J. Loetjoenen, D. Menon and D. Rueckert, "Robust whole-brain segmentation:
Application to traumatic brain injury", Medical Image Analysis, 21(1), pp. 40-58, 2015
[10] R. Heckemann, C. Ledig, K. R. Gray, P. Aljabar, D. Rueckert, J. V. Hajnal, and A.
Hammers, "Brain extraction using label propagation and group agreement: pincram", PLoS ONE,
10(7), pp. e0129211, 2015
77
ประวัตินิสิต
78