You are on page 1of 8

光华学校二零一零年第二学期第一次校基评审试卷评估

A) 有效性(效度)
1)测验效度的定义:测验在何种程度上测出了它宣称要测的东西。

2)从不同的角度入手,有:

a) 内容效度

b)效标关联效度

3)试卷的效度评估:

a) 只适合进行内容效度的评估,因为:

 没有进行效标关联效度所需的效度的标准。

b) 试卷范围:

 理解(A, 1-5)

 多项选择题(形似字(B, 7-9)、叠音字(B, 15-18)、量词(B, 10-14)、标点符号(B,


22,23)、上声变调(B, 19-21)、词语填充(B, 1-6)、排列句子(B, 24,25)、同义词(B, 26-
30))

 把转述句改写成引述句(E, 1-3)

 连词/介词填充(F, 1-5)

 替代词语(C, 1,2)

 同音字构词(D, 1-3)

 汉语拼音(G, a,b)

c) 内容效度:十分高
B) 可靠性(信度)
1)测验信度的定义:测验分数的稳定性和一致性程度。

2)计算信度的方法,有:

a) 再测信度

b)复本信度

c) 分半信度系数

d) KR20 公式

e) 阿尔法系数

3)试卷的信度评估:

a) (i) 不适合使用再测信度进行评估,因为不方便进行两次的测验。

(ii) 不适合使用 KR20 公式进行评估,因为该公式只用在答案只有对或错的测验。

(iii) 适合使用分半信度系数及阿尔法系数进行评估,使用分半信度系数的方法,因
为较简单易行。

n∑ xy −(∑ x )(∑ y)
b) 公式:rhh= √ [n∑ x 2−(∑ x)2]√ [n ∑ y 2−(∑ y)2]

2rhh
r= 1+ r hh
rhh=半个测验的信度

r= 整个测验的信度

c)评估步骤:
学生 单数试题总得分,X 双数试题总得分,y xy x2 y2
1 45 45 2025.0 2025.0 2025.0 n= 10
2 37 45 1665.0 1369.0 2025.0 ∑xy= 53362.3
3 42.5 44.5 1891.3 1806.3 1980.3 ∑x = 1208.5
4 41.5 45 1867.5 1722.3 2025.0 ∑y = 1321
5 42 44 1848.0 1764.0 1936.0 (∑x)(∑y)= 1596429
6 43.5 45.5 1979.3 1892.3 2070.3 ∑x2 = 49041.3
7 42.5 43 1827.5 1806.3 1849.0 ∑y2= 58411.0
8 42 46 1932.0 1764.0 2116.0 (∑x)2= 1460472
9 48 47.5 2280.0 2304.0 2256.3 (∑y)2= 1745041
10 43 46.5 1999.5 1849.0 2162.3
11 35 42.5 1487.5 1225.0 1806.3
12 37 44 1628.0 1369.0 1936.0 rhh=0.5
13 40 43 1720.0 1600.0 1849.0 r=0.67
14 39 37 1443.0 1521.0 1369.0
15 37 40 1480.0 1369.0 1600.0
16 38.5 43.5 1674.8 1482.3 1892.3
17 36 42 1512.0 1296.0 1764.0
18 38.5 39.5 1520.8 1482.3 1560.3
19 38 42 1596.0 1444.0 1764.0
20 46 49 2254.0 2116.0 2401.0
21 44.5 47.5 2113.8 1980.3 2256.3
22 37.5 43 1612.5 1406.3 1849.0
23 37.5 42.5 1593.8 1406.3 1806.3
24 45 47 2115.0 2025.0 2209.0
25 44.5 45 2002.5 1980.3 2025.0
26 38.5 37.5 1443.8 1482.3 1406.3
27 36.5 46.5 1697.3 1332.3 2162.3
28 38 47 1786.0 1444.0 2209.0
29 38.5 43.5 1674.8 1482.3 1892.3
30 36 47 1692.0 1296.0 2209.0

分半信度系数,r=0.67
d) 试卷信度:信度偏低

: 需进行其他的测试(如更多项的测验)以更好地测量学生水平
C)鉴别力(区分度)
1)测验区分度的定义:测验题目对考生的区分能力。

2)计算区分度的方法:

a) 极端分组法

b)点双列相关系数

c) 双列相关系数

3)试卷的区分度评估:

a) 使用极端分组法进行测验题目的区分度评估,因为较简单易行。

b) 公式:

高分组答对人数−低分组答对人数
区分度指数,D=
一组的总人数

c) 评估步骤:
高分组 低分组 区分度
题目 A B C D E F G H 答对人数 I J K L M N O P 答对人数 指数,D
A1 / / / / / / / / 8 / X / / X X / X 4 0.50
A2 / / / / / / / / 8 / / / / / X / / 7 0.13
A3 / X / X / / / / 6 / X X / X / / / 5 0.13
A4 / / / X / X / X 5 X / X / / X X X 3 0.25
A5 / X / X / X / X 4 X X X X X X X X 0 0.50
B1 / / X / X X X / 4 X X / X / X X / 3 0.13
B2 / / / / / / / / 8 / / / / / / X X 6 0.25
B3 / / / / / / / / 8 / / / X / / X X 5 0.38
B4 / / / / / / / / 8 X X / X X / X / 3 0.63
B5 / / / / / / / / 8 / / / / / / / / 8 0.00
B6 / / / / / / / / 8 / / / / / / / / 8 0.00
B7 / / / / / / / / 8 / / / / / / / / 8 0.00
B8 / / / / / / / / 8 / / / / / / / / 8 0.00
B9 / / / / / / / / 8 / / / / / / / / 8 0.00
B10 / / / / / / X / 7 / / / X / / / X 6 0.13
B11 / / / / / / / / 8 / / / / / / / / 8 0.00
B12 X / / / X / / X 5 / X X / / X X / 4 0.13
B13 / / X / / / / / 7 / / / / / X / / 7 0.00
B14 / / / / / / / / 8 / / / / / / X X 6 0.25
B15 / / / / / / / / 8 / / X / / / / / 7 0.13
B16 / / / / / / / / 8 / / / / / / / X 7 0.13
B17 / / / / / / / / 8 X / / / X / / / 6 0.25
B18 / / / / / / / / 8 / X / X / / / / 6 0.25
B19 / / / / / / / / 8 X / X / X / / X 4 0.50
B20 / / / / / / / / 8 / / X / X / X X 4 0.50
B21 X / / / / / / / 7 / / / X / X X / 5 0.25
B22 / / / / / / / / 8 / X / X X X / / 4 0.50
B23 / / / / X / X X 5 / X X / / / / / 6 -0.13
B24 / / / / / / / / 8 X / X X X / / X 8 0.00
B25 / / / / / / / / 8 / / / / / / / / 3 0.63
B26 / / / / / / / / 8 / / / / / / / / 8 0.00
B27 / / / / / / / / 8 / / / / / / / / 8 0.00
B28 / / / / / / / / 8 / / / / / / / / 8 0.00
B29 / / / / / / / / 8 / / / / / / / / 8 0.00
B30 / / / / / / / / 8 / / / / / / / / 8 0.00
C1 / / X / / / / / 7 / / / / / / X / 7 0.00
C2 X / / / / / X / 6 X / / / / / / / 7 -0.13
D1a / / / / / X / / 7 / / X / / / / / 7 0.00
D1b / / / / / X / / 7 / / X X / / / / 6 0.13
D2a / / X X X / X X 3 / X X X X X X X 1 0.25
D2b / / / / / / / / 8 / / / X / / / / 7 0.13
D3a / / X / X / / / 6 / / / X / / / X 6 0.00
D3b / / / / / / / / 8 / / / / / X / / 7 0.13
E1 / / / / / X / X 6 X / / / X / X / 5 0.13
E2 / / / / / X / X 6 X / / / X / X / 5 0.13
E3 / / / / / / X / 7 X / / / / X / / 6 0.13
F1 / / / / / / / / 8 / / / / / / / / 8 0.00
F2 / / / / / / / / 8 / / / / / / / / 8 0.00
F3 / / / / / / / / 8 / / / / / / / / 8 0.00
F4 / / / / / / / / 8 / / / / / / / / 8 0.00
F5 / / / / / / / / 8 / / / / / / / / 8 0.00
Ga1 / / X / / X / X 5 / X X / X X / / 4 0.13
Ga2 / / / X X / / / 6 X / X / / / / / 6 0.00
Gb1 / / / / / / / / 8 / / / / / / / / 8 0.00
Gb2 / X / / X X X / 4 X / / X X X / / 4 0.00
区分度 注释 题数 %
大于 0.3 能较好地区分出学生的水平 8 14.5
介于 尚能区分学生水平,但需改进 7 12.8
0.2-0.29
低于 需淘汰或作较大的修改 40 72.7
0.19

d) 试卷区分度:非常低

 这一项测验依据实施时间和功能来看,是形成性测验(期中测验)

 测验目的是要了解学生在这一阶段达到语文教学目标的程度

 这一类测验并不要求对学生水平作出详细的区分,所以一般上区分度并不高

 有人提出用“教学敏感性”取代区分度

教学敏感性,D=Ppost-Ppre

Ppost =教学后的答对率

Ppre =教学前的答对率
D) 便利性(实用性)
1)测验实用性要求测验所需的时间、人力为客观条件所允许。

2)试卷便利性的评估:

a) 从准备试题的时间、人力与难度来看:

 一共有五位教师参与拟题

 每一位教师负责拟一部分的试题

 花费的时间、人力与难度互相分担

b) 从进行测验的时间、人力与难度来看:

 测验时间为一小时

 一位老师负责在一个班级监考

 测验内容适中,大部分学生有足够的时间完成测验

c) 从为测验评分的时间、人力与难度来看:

 每一名科任负责批改各自班级的试卷

 评分简便(客观题与半客观题),消耗的时间与精力较少

d) 试卷的便利性:非常高

You might also like