Professional Documents
Culture Documents
CH 1
CH 1
1.1 統計的工作
1.2 變數
1.3 統計資料之蒐集及分類
1.4 統計資料的整理
2021/7/19 1
1.1 統計的工作
例1.1 當你是一個國小某班之導師,想了解全班學生的智商,以利
數學教學參考,應如何了解?下面的步驟似乎是合理的處理
方法:
(1)利用一份具有公信力之智力測驗卷進行蒐集全班學生(母體)
之智商資料。
(2)將全班之資料輸入電腦(如:一般的試算表如Excel或統計軟
體如SAS,BMDP,SPSS,S-plus,Statistica等),進行資料
整理工作。
(3)製作全班學生智商之圖表(次數分配表、直方圖)。
(4)由圖表分析資料,並做成初步的判斷。
2021/7/19 2
例1.2 若你是一職業學校教務主任,想了解全校學生之就學及就業
傾向,以利課程安排,應如何了解?我們大概也會做下面的
個案:
(1)由各年級中抽出部份學生做「學業及就業性向調查」。
(2)將資料利用電腦軟體做整理,製成圖表。
(3)對於欲了解的問題做成假設。
(4)透過適當分析方法,提供證據來佐證步驟3之假設。
(5)根據步驟3、4之結論做成決策,並將此決策能推論到各個學
校給各學校參考。
2021/7/19 3
1.2 變數
一組具有相同性質和相同單位數字的集合
變數必須要能被量測、被觀察及被給定數值或歸
類。當然對不同之資料就有不同之變數出現,統
計學上較常使用之變數,可以概略分為:
離散型變數:名義變數、有序變數
連續型變數:等距變數、比例變數
2021/7/19 4
一. 離散型變數
名義變數(nominal variable)
» 凡變數本身用途只能作分類事物或表示類別用
的特性者。例如:球衣的背號,學生的學號,
性別,血型,宗教別,職業別,國籍,郵遞區
號,身份證字號,教學方式……等。
» 以上例子中變數可能有數字或非數字,但其數
字本身並無大小之分,如球衣的背號「00」,
「99」並沒「99」一定大於「00」。因該變數
只能做分類之用途,故又稱為「類別變數」
(classification variable)。
2021/7/19 5
有序變數(ordinal variable)
» 凡變數除了可以做為分類之外,並且可以用數值來
表示事物或類別間之大小、多寡、優劣、高低、次
序或等第。例如:各種比賽、考試之名次,畫圖或
作文給予甲、乙…等等,態度評定量表:「很不贊
成、不贊成、沒意見、贊成、很贊成」。
» 有序變數只用來描述事物與事物或類別與類別在某
一特質上的次序,但並不能用來顯示其間差異量的
大小;因此,有序變數只能以「>」或「<」等符
號來保留或比較兩事物或類別的次序關係,但不能
表示前者比後者大多少或小多少。
2021/7/19 6
二.連續型變數
等距變數(Interval variable)
有距離
沒有真實零點、數值間沒有比例關係存在
EX:智商、溫度
2021/7/19 7
比例變數(Ratio variable)
有距離、有真實的零點、數值間有比例關
係
EX:身高、體重
2021/7/19 8
1.3 統計資料之蒐集及分類
依資料本身的屬性分
質的資料(qualitative data)
» 無法以數值表示之統計資料,如性別、學歷、職
業別…等。
量的資料(quantitative data)
» 凡是可以用數字表達之統計資料,如年齡、薪
資…等。
2021/7/19 9
依資料數學的性質分
離散資料(discrete data)
» 統計資料間可分割,如性別、職業別、名次、人
數…等。
連續資料(continuous data)
» 凡是統計資料間無法分割,如時間、薪資…等。
2021/7/19 10
依獲得資料之方式分
原始資料(raw data)
» 依照研究之目的去調查,觀察或實驗所獲得之資
料。
次級資料(secondary data)
» 他人所蒐集後經整理之資料,如政府機關、學術
機構、個人…等所發佈的資料。
2021/7/19 11
依資料來源之地區分
內部資料(internal data)
» 由使用者之本身內部自行記錄蒐集之統計資料。
外部資料(external data)
» 由使用者組織以外機關團體或個體所蒐集的統計資
料。
2021/7/19 12
依資料獲得對象之範圍分
普查資料(census data)
» 對所有個體進行全面性調查而得到的資料。
抽樣資料(sampling data)
» 對所有個體中抽取部份有代表性之資料。
2021/7/19 13
依資料存在之時間分
靜態資料(static data)
» 在某一特定時間及空間靜止狀態的資料。
動態資料(dynamic data)
» 在某一特定期間內演變情形的資料。
2021/7/19 14
1.4 統計資料的整理
一. 整理之目的
» 1.在進行研究與資料分析之前,整理的目的是為了
系統化和簡化。
» 2.次數分配表及圖示法是敘述統計裏用來從原始資
料中描述各種重要特性的基本工作,此項工作有助
於了解分配的集中情形、分散情形、偏態和峰態。
» 3.圖示法可幫助讀者很快了解資料之分配情形和特
性,但也容易喪失部份資料,甚至無意被誤用或有
意被濫用。
2021/7/19 15
二. 離散型資料之整理方式
車 型 A B C D E
人 數 75 100 150 100 75
2021/7/19 16
(二)次數分配之圖示法
200 200
150 150
100 100
50
50
0
A B C D E 0
0 B C D E
直方圖 E A
次數多邊圖
D B
C
圓形比例圖
2021/7/19 17
三. 連續型資料之整理方式
» 步驟1:將所有資料依數量大小順序,由小至大排
序。
» 步驟2:求出全距(range)=資料中最大值-資料中最
小值。
» 步驟3:決定組數及組距(class interval)
2021/7/19 18
組距決定之原則:
» 1.次數分配能代表原始資料。
» 2.需能表現次數分配的主要趨勢。
» 3.需使次數表便於計算與運用。
» 4.若判斷原始資料為對稱(symmetric)或近似對稱分配、
可用參考公式:
全距
組距
1 3.322 log10 樣本個數
2021/7/19 19
組數:
» 經驗法則10~20組或利用下式
組數 1 3.322 log10 樣本個數
上組限 下組限 上組界 下組界
2 2
» 步驟5:劃記及計算各組組次數。
2021/7/19 20
三. 連續型資料之整理方式
例4.2某國小5年級全班50位學生成績:
1) 全距=88-22=66
2) 決定組距和組數:
組數 1 3.322 * log 10 50 7( 組)
66
組距 10
1 3.22 * log 10 50
2021/7/19 21
Histogram
14
12
10
Frequency
Mean = 54.88
Std. Dev. = 16.83611
0 N = 50
VAR00001
2021/7/19 22
組限 組界 組中點 組次數 累加次數 相對次數
合計 50
2021/7/19 23
90.00
80.00
70.00
60.00
50.00
40.00
30.00
20.00
VAR00001
2021/7/19 24
8% 6%
14% 1
12%
2
3
4
18% 16% 5
6
7
26%
2021/7/19 25
人數
15 2 2
12
2 48
9
3 1112
6
3 3 578
0 4 0234
0 24.5 44.5 64.5 84.5 分數
4 5579
肩形圖 5 00014
5 55566789
6 13344
6 6778
7 14
7 5589
0 10 20 30 40 50 60 70 80 90 100 110 8 144
Q1 Q2 Q3 8 8
莖葉圖
盒鬚圖
2021/7/19 26
THE END
2021/7/19 27