You are on page 1of 24

黃建彰

戴暘翃
•資料經由整理與分析來作為推論
•資料的整理往往會利用圖形或表格
•資料的分析則涉及數學上的公式與觀念
如:平均數、標準差,最後在資料的推論
上 ( 含估計與檢定 ) 會需要機率的理論
統計學分類:功能的角度
敘述統計 (Descriptive Statistics) :
將各種情況加以收集、整理,並用圖形與表格陳示
出來 ( 資料的收集、整理、分析 ) 。
推論統計 (Inferential Statistics) :
根據這些資料加以研究、檢定有無效用 ( 少數的資
料估計或檢定 ) 。
統計學分類:學術的角度
 理論統計 (Pure Statistics) :
又稱數理統計 (Mathematical Statistics) ,純粹用數學的方法來研
究與統計相關的公式、定理,是一種純理論的研究。
 應用統計 (Applied Statistics) :
涉及的範圍較廣,但原理與方法則是相同的。
如:生物統計學 (Biostatistics) 、教育統計學 (Educational
Statistics) 、商業統計學 (Business Statistics)
變數的分類
資料通常包含數種不同特性的數據,每一種特性稱為一種變數
(Variable) ,變數的不同其處理的統計方法也會跟著不同。
從實驗的因果關係來看:
• 原因─自變數 (Independent Variable)
• 結果─應變數 (Dependent Variable)
讀書的時間為因
測驗的分數為果
變數的分類
變數可否用數量來分類分類:
性質變數 (Attributive Variable) :無法用數量表達的變
數,如:性別、血型。
數量變數 (Numerical Variable) :可以用數量來表達,如
:人數、身高。又可分為:
a. 間斷變數 (Discrete Variable) :變數的單位不能切割,
如:人 數、病床數、心跳次數。
b. 連續變數 (Continuous Variable) :可無窮分割,如:身
高、體重、溫度。
測量尺度
• 我們常見的測量尺度包含類別、序位、等距、等比四種,他們所
表達的訊息程度有所不同,所以適用的運算方式也不一樣。
• 以下為常見的測量尺度:
A. 類別尺度 (Nominal Scale) :
 最基本的測量尺度,僅有性質不同不具大小順序關係,
只表達等於或不等於。
B. 序位尺度 (Ordinal Scale) :
 除了具有性質的不同,且具大小順序關係,如:考試成
績。
C. 等距尺度 (Interval Scale) :
 除了跟序位尺度相同外,另外還有差距一定相同,如:
溫度、智商、出生年次。
D. 等比尺度 (Ratio Scale) :
 根以上相同外,又增加了等比例的關係,如:身高、體
重、年齡。 ( 此為最高等級的測量尺度 )
評估測量工具品質有兩項指標:

A.信度 (Reliability) :
結果相當穩定具一致性。
B.效度 (Validity) :
選擇適當的工具,測得結果的有
效程度。
統計方法的順序
1. 確定目的
蒐集資料:
a.普查 (Census) :全面性的調查,統計
2. 蒐集資料
調查中很少在用到。
b.抽樣 (Sampling) :抽出部分個體做調
查,被抽出的部分稱樣本 (Sample) 。 3. 整理資料

整理資料:一開始收集的資料稱原始資 4. 分析資料
料 (Primary Data) ,整理過後的稱次
級資料 (Secondary Data) 。
5. 推論資料
母體與樣本
蒐集資料的全體對象稱為母體 (Population) 。
母體的特徵量數稱母數或參數 (Parameter) 。
樣本的特徵量數稱統計量或表徵數 (Statistic) 。

抽樣

推論

母體 樣本
• 抽樣本身就會有誤差存在,所以藉由增加樣本數
來減 少抽樣的誤差。

• 抽樣時所需考慮的第一件事為樣本大小,也就是
樣本的問題,抽出越大的樣本所得的預測結果越準
確,抽樣的誤差越小所付出的代價為耗費相當大的
人力、物力、時間、金錢,抽出過小的樣本則相反。
因此要選擇合適的樣本大小。
目的在於獲得具有代表性的樣本,方法有:

•隨機抽樣 (Random Sampling) :客觀性,用


於推論統計,又稱隨機樣本 (Random
Sample) 。

•非隨機性抽樣 (Nonrandom Sampling) :較


主觀,不適用於推論統計,又稱非隨機樣本
(Nonrandom Sample) 。
•又稱機率抽樣 (Probability Sampling) ,指母體中每一個
體都有可能被抽到,是隨機的非人為。可分為:
A.簡單隨機抽樣 (Probability Sampling) :將每一個體編
號,再用隨機性的方法,如:籤筒、彩卷、號碼球。
B.分層抽樣 (Stratified Sampling) :可提高抽樣精確度。
C.集群抽樣 (Cluster Sampling) :稱為部落抽樣。
D.系統抽樣 (Systematic Sampling) :稱等距抽樣,將母
體中每一個體編號再照一定的距離,等間隔的抽完所需的樣
本數。 ( 用於數量大 ) 首先知道間隔多遠抽一個樣本,就是
所謂的抽樣區間 (Sampling Interval) ,求法如下:
抽樣區間 = 母體個體總數
樣本數
抽出的機率為不可知,靠著方便或判斷來抽取樣本,可分為

便利抽樣 (Convenience Sampling) :又稱偶遇抽樣


(Accidental Sampling) ,只考慮方便,如:車站作的市
場調查。
判斷抽樣 (Judgement Sampling) :又稱立意抽樣
(Purposive Sampling) ,全憑抽樣者的知識或經驗,但
要小心有偏見的人,如:課堂所問的問題。
將資料按照一定的方式製成表格,稱統計表 (Statistical
Table) 。
統計表的結構可分五項,如下:
1.標題 (Title) :每個統計表所需的題目,放置表格上方文
字要簡明扼要,內容包含何事 (What) 、何時 (When) 、何
地 (Where) 三要素。
2.標目 (Item) :分橫向 (Row) 、縱向 (Column) 兩類。
3.表身 (Body) :變量的量度結果,以數字表達,有時也可
能會以文字呈現。
4.線條 (Lines) :用於美觀分類。
5.附註 (Footnote) :補充說明與資料來源,通常以 * 作為
代表。
編表時所注意的原則:
1. 標題應放在表格的上方。
2. 標目排列按照順序、筆畫或某些特徵來排列。
3. 特別注意項目可用粗線或其它字體表示。
4. 表格中數字排列需注意位數的對齊,若有單位須在標目
或附註中註明。
5. 表格不許留白,無數字應以「─」表示或文字「不詳」
表示。
6. 有相同的數字或文字出現時,不可用「同上」。
7. 每一欄位須加以補充說明,可特別編上記號如:「 * 」

8. 引用他人資料者,應在附註中加以說明。
9. 附註通常要在表個的下方。
•最常見的統計表是次數分配表 (Frequency
Distribution Table) ,如果表達以類別或序位尺度
量測的變數分佈,則將各組的次數統計出來後,分門
別類繪製成表格。
如果表達的事已等距或等比尺度量測的變數分佈,製表
時必須遵循一定的方法。
a. 求全距:首先要知道全距 (Range) 是多少,所謂的全距
指資料中 Max 和 min 的差,以〝全距 = 最大值 - 最小
值〞表示。
b. 定組數:組數訂太多,範圍過小的情況則看不出分佈狀
況,定太少又可以直接忽略,選擇合適的組數很重要,
一般以 1~15 最為恰當,樣本數越大,組數越多。
c. 定組距:組距 = 全距 / 組數,上式相除後不一定為整數
,為了運算方便組距會適當的調整,調整原則一般會取
比原本稍大一些且滿足 1 、 2 、 5 或十倍數。
d. 定組線:用來確定每一組的範圍,數值小的稱下限
(Lower Limit) ,大者稱上限 (Upper Limit) 。
e. 歸類與畫記:將所有資料歸類在各組中,每五個數字以
一個〝正〞表示,最後計算各組的次數,如此就完成一
個分配表。
統計圖 (Statistical Chart) 以圖形表示資料的分佈狀況,結
構可分為以下四項:
A.標題 (Title) :每個統計表所需的題目,放置表格上方文字
要簡明扼要,內容包含何事 (What) 、何時 (When) 、何地
(Where) 三要素。
B.圖身 (Body) :統計圖中最重要的一部分,又可包含以下三
項:
c)圖示線 (Curve) :資料分佈的線條,圖形的重心以粗線表示

d)圖框 (Frame) :圖形的邊線,有時可省。
e)座標 (Coordination) :由橫軸縱軸構成,起點未必從 0 開
始,但要加上破格號表示。
C.圖例 (Legend) :圖中至少存在兩條線時,為了說明線條的
意義,就需用到圖例。
D.附註 (Footnote) :補充說明與資料來源,通常以 * 作為代
表。
1. 要讓人看的簡單明瞭,必須避免過多的符號與線條。
2. 圖形要具有自我解釋的功能,純粹看圖就能明白。
3. 文字書寫要由上而下、左而又。
4. 座標起點不一定為 0 ,但必須加〝破格號〞表示,另外要記
得附上單位。
5. 圖示線為整個圖形的重心,應以最粗的線表示。
6. 標題應放置圖形的上方,但書籍或論文標題則放置圖形的下
方。
7. 附註通常在圖形的下方。
A. 長條圖 (Bar Chart) :
適合呈現在以類別或序位尺度量測的變數分佈,以等寬且分
開的平行長條代表資料,每一長條代表資料的次數。
AB
100 6%
80
60 O
A 19%
40 42%
20
0
A B AB O
B 33%

B. 圓形圖 (Pie Chart) :


適合呈現以類別尺度量測的分佈,特別是要表達資料中各個
類別所佔的比例時,圓形圖最方便。各類別所佔的面積比
等於該類別佔全部資料的百分比。
C. 直方圖 (Histogram) :
最常見的一種統計圖,適合用於等距或等比尺度量
測的變數分佈以等寬且相連的平行長條代表資料
,每一長條代表資料的次數。

25
20
人 15
數 10
5
0
150 155 160 165 170 175
身高 (cm)
D. 次數多邊圖 (Frquency Polygon) :
從直方圖演變而來,適合以等距或等比尺度量測的變數分佈,製圖
時將直方圖中各組的中點 ( 稱組中點 ) 依序連起來,次數多邊
圖兩端為封閉,所以我們會刻意的多取一組,設這兩組次數為
零,當各組組距越來越小時,此時圖型會近似一條曲線,稱為
次數分布曲線圖 (Frquency Distribution) 。

30

人 20

10

0
147.5 152.5 157.5 162.5 167.5 172.5 177.5

身高 (cm)
E. 累積次數多邊圖 (Cumulative Frquency Polygon) :
又稱肩型圖 (Ogive Chart) ,適合以等距或等比尺度量測的
變數分佈,我們可以了解 觀測圖 < 某一特殊數值的次
數分佈。座標為各組上限的以下累積次數,但要從起點次
數從零開始。
60
累 40

人 20

0
150 155 160 165 170 175
身高 (cm)

You might also like