Professional Documents
Culture Documents
10
ปฏิบัติกำรที่ 1 Azure ML และ Python
Fraud Detection, Sentiment Analysis, Churn, Demand Estimation, Retail Forecasting และ Text
Classification เป็นต้น หน้ำต่ำงหน้ำ Experiments แสดงดังรูปที่ 1.7
11
ปฏิบัติกำรที่ 1 Azure ML และ Python
12
ปฏิบัติกำรที่ 1 Azure ML และ Python
เลือกมำใช้งำน
13
ปฏิบัติกำรที่ 1 Azure ML และ Python
14
ปฏิบัติกำรที่ 1 Azure ML และ Python
15
ปฏิบัติกำรที่ 1 Azure ML และ Python
1.5 การแสดงผลลัพธ์
หลังจำกรันทดสอบผลเสร็จเรียบร้อย สำมำรถเรียกดูผลลัพธ์ที่ได้โดยแต่ละ Module จะมีผลลัพธ์อยู่ 2
แบบ คือ แบบที่ 1 เป็นผลลัพธ์ที่ส่งต่อไปยัง Module อื่นๆ ถัดไป และแบบที่ 2 ผลลัพธ์ที่ได้จำกคำสั่งให้
แสดงผลออกทำงจอภำพ เช่น คำสั่ง ‘print()’ ของภำษำ python โดยกำรเรียกดูผลลัพธ์ของกำรทดลอง
สำมำรถทำได้โดยใช้คำสั่ง Visualize ตำมขั้นตอน ดังนี้
1) คลิกที่ปุ่มหมำยเลข (1) หรือ (2) ที่อยู่ใต้ Module เพื่อเรียกดูผลลัพธ์
2) คลิกเลือกคำสั่ง Visualize
16
ปฏิบัติกำรที่ 1 Azure ML และ Python
17
ปฏิบัติกำรที่ 1 Azure ML และ Python
18
ปฏิบัติการที่ 2
การนาเข้าและสารวจข้อมูลเบื้องต้น
2 การนาเข้าชุดข้อมูลและสารวจข้อมูลเบื้องต้น
การสารวจข้อมูล (Data Exploration) เป็นขั้นตอนหนึ่งที่ต้องทาสาหรับการทา data science เพื่อให้
ทราบว่าข้อมูลที่เรานามาใช้งานเป็นอย่างไร เช่น มีกี่แถว กี่คอลัมน์ อะไรบ้าง ข้อมูลที่ใช้ได้หรือใช้ได้มีอะไรบ้าง
เป็นต้น ทั้งนี้เราสามารถใช้ Module ต่าง ๆ ที่มีใน Azure ML Studio มาช่วยทาการสารวจข้อมูลของเราได้
19
ปฏิบัติการที่ 2 การนาเข้าและสารวจข้อมูล
20
ปฏิบัติการที่ 2 การนาเข้าและสารวจข้อมูล
2.2 การเรียกใช้ข้อมูล
หลังจากที่นาเข้าข้อมูลมาในระบบ Azure ML Studio เรียบร้อยแล้ว หากต้องนาข้อมูลไปใช้งานใน
Experiment สามารถทาได้ตามขั้นตอน ดังนี้
1) คลิกที่เมนู Save Datasets -> My Datasets หรือจะพิมพ์ชื่อไฟล์ข้อมูลที่ต้องการนามาใช้ในช่อง
search experiment items ก็ได้
2) ให้คลิกและลากไฟล์ข้อมูลที่ต้องการนามาใช้มายังพื้นที่การทา Experiment ดังรูปที่ 1.21
2.3 การสารวจข้อมูลเบื้องต้น
ก่อนนาข้อมูลไปวิเคราะห์หรือสร้างโมเดลใดๆ เราจาเป็นต้องทราบก่อนว่าข้อมูลที่เรานามาใช้เป็น
อย่างไร อย่างน้อย เช่น ข้อมูลมีกี่แถว กี่คอลัมน์ แต่ละคอลัมน์มีลักษณะข้อมูลเป็นประเภทใด เป็นต้น โดย
วิธีการสารวจในเบื้องต้นสามารถใช้ได้ทั้งเครื่องมือที่อยู่ใน Azure ML Studio หรือจะใช้วิธีการเขียนคาสั่งด้วย
ภาษาไพธอนก็ได้
ในปฏิบัติการที่ 1.2 จะเป็นการแสดงตัวอย่างวิธีการสารวจข้อมูลไฟล์ “Edu_figdb.csv” ซึ่งภายหลัง
จากนาข้อมูลเข้ามาในระบบเรียบร้อยแล้ว ให้สร้าง Experiment ชื่อว่า “DS02:Read data source from
CSV” จากนั้นใน Experiment ให้เรียกข้อมูลมาใช้งาน โดยให้ทาการสารวจเบื้องต้นดังนี้
2.3.1 การสารวจโดยใช้เครื่องมือ Azure ML Studio
เราสามารถตรวจสอบชุดข้อมูลที่เราใช้ทางานได้ โดยเรียกดูผ่านเมนู Visualize ดังรูปที่ 1.22 ซึง่
ผลลัพธ์จะได้ดังตัวอย่างรูปที่ 1.23
21
ปฏิบัติการที่ 2 การนาเข้าและสารวจข้อมูล
22
ปฏิบัติการที่ 2 การนาเข้าและสารวจข้อมูล
23
ปฏิบัติการที่ 2 การนาเข้าและสารวจข้อมูล
6 return df,
บรรทัดที่ 3 df คือ ตัวแปรที่เราใช้จัดเก็บ
pd คือ ชื่อย่อของไลบารี pandas ที่ถูกนาเข้ามาใช้ใน python script
dataframe1 คือ ข้อมูลอากิวเม้นต์ที่นามาสร้าง Data Frame
24
ปฏิบัติการที่ 2 การนาเข้าและสารวจข้อมูล
1 import pandas as pd
2 def azureml_main(dataframe1 = None, dataframe2 = None):
3 df = pd.DataFrame(dataframe1)
4 df.info()
5 print(“df.describe : \n”, df.describe())
6
7 # Return value must be of a sequence of pandas.DataFrame
8 return df,
25
ปฏิบัติการที่ 2 การนาเข้าและสารวจข้อมูล
26
ปฏิบัติการที่ 3
การใช้งานดาต้าเฟรม
3 การเลือกคอลัมน์จาก Data Frame
27
ปฏิบัติการที่ 3 การใช้งานดาต้าเฟรม
รูปที่ 1.27 แสดงขั้นตอนการเลือกคอลัมน์ Data Frame โดยใช้ Module Select Columns in Dataset
รูปแบบที่ 2 :
ชื่อ Data Frame . ชื่อคอลัมน์ของ Data Frame
ตัวอย่างการใช้งานคาสั่งเลือกคอลัมน์ เช่น
print(df[‘Value’].mean())
print(df[‘Value’].std())
บรรทัดแรก เป็นการเรียกดูค่าเฉลี่ยของข้อมูลคอลัมน์ Value
28
ปฏิบัติการที่ 3 การใช้งานดาต้าเฟรม
print(df[‘Value’, ‘Time’].count())
เป็นการใช้เมธอด count() นับจานวนข้อมูลในคอลัมน์ Value และ TIME
ผลลัพธ์ที่ได้ คือ จะได้ Data frame ที่มีจานวนข้อมูลทั้งหมด 384 แถว 3 คอลัมน์ ดังรูปที่ 1.27
การเลือกคอลัมน์โดยใช้คาสั่งภาษาไพธอน
3) จาก Experiment เดิมให้สร้างการเชื่อมต่อโมดูล Execute Python Script ดังรูปที่ 1.30
4 print(df.describe())
5 print(‘Describe of Value: \n')
6 print(df[‘Value’].describe())
- แสดงค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของข้อมูลคอลัมน์“Value”
7 print('Mean value: \n')
8 print(df[‘Value’].mean())
9
10 print('STDEV value: \n')
11 print(df[‘Value’].std())
31
ปฏิบัติการที่ 3 การใช้งานดาต้าเฟรม
32
ปฏิบัติการที่ 4
การเรียกดูข้อมูลจากดาต้าเฟรม
4 การเรียกดูข้อมูลแบบต่างๆ จากดาต้าเฟรม
33
ปฏิบัติการที่ 4 การเรียกดูข้อมูลจากดาต้าเฟรม
4.2 การเรียกดูข้อมูลแบบมีเงื่อนไข
การเรียกดูข้อมูลใน Data Frame เราสามารถใช้การเขียน Python script เรียกดูข้อมูลแบบระบุ
เงื่อนไขได้ โดยนาเอาตัวดาเนินการเปรียบเทียบมาใช้ในการค้นหาข้อมูลใน Data Frame ตัวอย่างเช่น ต้องการ
เรียกดูข้อมูลคอลัมน์ salary ที่มีค่ามากกว่า 120K ขึ้นไป คาสั่งสามารถเขียนได้ ดังนี้
34
ปฏิบัติการที่ 4 การเรียกดูข้อมูลจากดาต้าเฟรม
4.4 การจัดเรียงข้อมูล
ในการเรียกดูข้อมูลเราสามารถใช้เมธอด sort() ในการจัดเรียงข้อมูลได้ โดยตัวอย่างการใช้งาน เช่น
df_sub=df.loc[5:10,[‘TIME’,’Value’]]
df_sub_sort=df_sub.sort_values(by=’Value’, ascending=False)
35
ปฏิบัติการที่ 4 การเรียกดูข้อมูลจากดาต้าเฟรม
ผลลัพธ์ที่ได้ แสดงดังนี้
37
ปฏิบัติการที่ 4 การเรียกดูข้อมูลจากดาต้าเฟรม
ผลลัพธ์ที่ได้
38
ปฏิบัติการที่ 4 การเรียกดูข้อมูลจากดาต้าเฟรม
ผลลัพธ์ที่ได้
39
ปฏิบัติการที่ 4 การเรียกดูข้อมูลจากดาต้าเฟรม
ผลลัพธ์ที่ได้
40
ปฏิบัติการที่ 4 การเรียกดูข้อมูลจากดาต้าเฟรม
ผลลัพธ์ที่ได้
41
ปฏิบัติการที่ 4 การเรียกดูข้อมูลจากดาต้าเฟรม
-หน้าว่าง-
42