You are on page 1of 31

第一章 統計導論

一、何謂統計學 ?
二、母體與樣本的關係
三、變數的測量尺度
四、資料的蒐集取得
一、何謂統計學 ?
 統計學是一門研究不確定現象的科學方法,
經由統計資料的蒐集、整理、陳示、分析及
解釋,並透過機率理論建立描述此不確定現
象的適當模型,然後從蒐集的樣本統計資料
推估母體的一些特性,並對這些特性做一些
必要的估計、假設檢定與預測,盡而利用統
計決策理論評估各種決策所冒的風險,以作
出最佳的決策。
二、母體與樣本的關係
 母體 : 調查者所欲研究的全部對象所成的

合,是由具有共同特性 ( 屬質或屬
量)
的個體所組成
Population 母體
Sample 樣本
 樣本 : 為從母體抽取的部分個體
三、測量尺度與資料型態
根據主題事物的性質及可能的衡量水準,
將資料按衡量尺度的不同分成四類:
 名目尺度 = 類別尺度 (nominal scale)
 順序尺度 (ordinal scale)
 區間尺度 (interval scale)
 比例尺度 (ratio scale)
名目尺度
 根據特徵的性質做分類,每類答案的
代表數字只作分類用,目的在求分類

 例如 : 【喜歡】與【不喜歡】
【是】與【否】
宗教信仰 ( 基督教、佛教、天主教… )
順序尺度
 有名目資料的性質,名且資料的順序或
階層等級有其意義時。

 例如 : 非常滿意、滿意、沒意見、
不滿意、非常不滿意
 只能看出高低次序無法確定各類別之間
的差距
區間尺度
 可以表達順序的關係
 尚能測量各順序位置的距離
 區間尺度資料的算術運算加、減均有意義
 無法使用乘、除的運算

( 區間尺度沒有原點 0)
比例尺度
 可以加減乘除的變數
第二章
統計的兩大架構
敘述統計
推論統計
敘述統計 (descriptive statistics)

 研討如何簡化與表示現成之一組統計資料
,指對於統計資料的搜集、整理、陳示、
分析及解釋部份,僅就統計資料本身作討
論。
推論統計 (statistical inference)

 研討如何利用母體中所抽取之樣本資料,
去估計、檢定或預測母體中未知特性之科
學方法。
資料收集 資料整理 資料分析 資料解釋 敘述統計

資料估計 資料檢定 資料預測 推論統計
第三章
基礎數值資料的運用
一、各種量數
一、各種量數
 位置量數 ( 集中趨勢量數 ):
反應該資料數值集中的位置
 離散量數 ( 差異量數 ):
用來測定群體中各個體的差異或分散程度
 偏態量數 : 對於分配圖左右兩邊的對稱程度
 峰態量數 : 對於分配圖高低及尾巴寬厚程度
位置量數 ( 集中趨勢量數 )
 算數平均數
 幾何平均數
 調和平均數
 中位數
 眾數
 四分位數
 百分位數
算數平均數
 資料的中心位置量數算法
 完整原始資料的樣本平均數為:

n

∑x
x1 + x2 + ... + xn i=1 i
x= = , n = 樣本數
 分組資料的樣本平均數為:n n
k

∑fx
其中 表第 i 組之組中點,而 表示該組的頻率
i i
x= i =1

n

xi fi
幾何平均數
 n 個數值連乘之 n 次方根
 其值之變化大約按照一定的比例時適用,
例如,求物價指數及人口增加率等
 公式:
n
G=n ∏x
i =1
i
調和平均數
 (n 個數值中各個數值倒數的算術平均數 )
的倒數
 意義最不易了解,應用範圍也很小
 僅在求平均速率和平均物價用到它
 公式:
N
H =
1

x i
調和平均數
 例子:求 46 48 52 的調和平均數
 解答:

3
H= ≈ 48.54
1 1 1
+ +
46 48 52
中位數
 資料由小到大依序排列時,位於中間
位置的資料值即中位數。
 若個數是偶數,則中位數是中間兩個數之
平均
EX : 16,7,41,21,18,33
中位數 =19.5
眾數
 出現最多的資料值。

EX : 7,3,2,3,4,5,3,9,1,2,3,6,2,3

眾數 =3
第 P 百分位數
 公式

 p 
i= × n
 100 
(i= 位標 )
(p= 百分位數 )
(n= 觀察值總
和)
四分位數
 Q1= 第 25 百分位數
 Q2= 第 50 百分位數 ( 中位數 )
 Q3= 第 75 百分位數
離散量數 ( 差異量數 )
 全距
 四分位數 & 四分位差
 平均差
 變異數
 標準差
全距
 資料中最大值與最小值的差距。

EX : 23,14,57,44,15,89,56,28,39

全距 =75
四分位距 & 四分位差
 Q3 與 Q1 之差
 四分位距 =Q3-Q1
 四分位差 =
Q3 − Q1
2
平均差 (average deviation
簡稱 AD)
 資料中每一個數值與其平均數差之絕對值
總合的算術平均數
 公式
n

∑x
i =1
i −x
AD =
n
變異數 (Variance)
 把平均差的絕對值改用離差的平方取代
 完整原始資料

∑ ∑
n 2 n 2 2
i =1
(x i − x) i =1
x i − nx
s2 = =
n −1 n −1

 分組資料
∑ ∑
k 2 k 2 2
i =1
f i (x i − x ) i =1
f i x i − nx
s2 = =
n −1 n −1
標準差 (standard deviation)
 變異數取正平方根
 完整原始資料 n


i =1
(x i − x)2
s = + s2 = +
n −1

 分組資料 k


i =1
f i (x i − x)2
s=
n −1
偏態量數 (skewness)
 對於分配圖左右兩邊的對稱程度
 公式: 3
∑ ( x i − µ )
b = S .K . =
σ
1 3

b 1
=0
眾數 中位數 平均數 平均數 中位數
眾數
b
左偏 1 < 0 右偏 b >0
1
動差 (moment)

E ( X − b) r :r.v.X 關於 x=b 上的 r 級動差

 <part1>b=0 mr = E ( X − 0) r = E ( X r )
r.v.X 的 r 級原動差

 <part2>b= µx µr = E ( X − µx ) r

r.v.X 的 r 級中心動差