Professional Documents
Culture Documents
Ngaây nhêån baâi: 07/12/2016; ngaây sûãa chûäa: 19/12/2016; ngaây duyïåt àùng: 19/12/2016.
Abstract:
The article mentions an overview of the theoretical background (Item response theory, the algorithm estimates the i
capacity of candidates) to build an Item bank and points out the role of Item bank in the process of teaching and assessment. B
theory, the article proposes a process of building an item bank to assess competence of students.
Keywords: Item bank, learner’s competence assessment, item response theory, classical test theory, item calibration.
L
õch sûã phaát triïín chûúng trònh giaáo duåc thïë giúái Baãng 1. Töíng húåp sûå khaác nhau giûäa CTT vaâ IRT
traãi qua nhiïìu giai àoaån khaác nhau, trong àoá nöíi CTT IRT
bêåt laâ tiïëp cêån
nöåi dung, tiïëp cêån tiïën trònh vaâ tiïëp Phuå thuöåc Caác tham söë CH phuå thuöåc Caác tham söë CH àöåc lêåp
cêån kïët quaã àêìu ra. Trong tiïëp cêån àêìu ra, gêìn àêy coá mêîu vaâo mêîu thñ sinh vúái mêîu thñ sinh
xu hûúáng phaát triïín chûúng trònh tiïëp cêån nùng lûåc Ûúác tñnh khaã nùng cuãa thñÛúác tñnh khaã nùng cuãa thñ
(NL) - nhêën maånh viïåc phaát triïín nhûäng khaã nùng cuãa Phuå thuöåc CH sinh phuå thuöåc vaâo töíngsinhsöë phuå thuöåcaâo
v CH
ngûúâi hoåc tûâ nhûäng kiïën thûác, kô nùng caác mön hoåc. àiïím test test
Viïåc phaát triïín chûúng trònh tiïëp cêån NL luön bao Àöå tin cêåy (laâ Têët caã caác àiïím chêëm coá
Möîi giaá trõ NL coá àöå tin
haâm caã viïåc phaát triïín möåt phûúng thûác àaánh giaá sai söë ào cuâng àöå tin cêåy cêåy riïng biïåt
lûúâng)
NL, vúái nhûäng phûúng tiïån, cöng cuå àaánh giaá phuâ Têët caãCHàoáng goáp nhû
húåp. Baâi viïët nïu yá tûúãng vïì viïåc xêy dûång möåt trong nhau vaâo töíng àiïím(töíng
Àöåkhoá CH hoãi coá troång
nhûäng cöng cuå, phûúng tiïån àaánh giaá NL àoá laâ Ngên Àöå khoá CH söë àoáng goáp khaác nhau
àiïím laâ àaåi diïån cho
NLthñ
àïí ûúác tñnh NL thñ sinh
haâng cêu hoãi (CH), göìm 3 nöåi dung chñnh: Töíng sinh)
quan lñ thuyïët test cöí àiïín vaâ ûáng àaáp CH; Vai troâ cuãa Àöå phên biïåtÀöå phên biïåt khöng àûúåcÀöå phên biïåt àoáng goáp
ngên haâng CH khi thûåc hiïån chûúng trònh giaáo duåc; CH (phên biïåtxem xeát khi chêëm àiïím cho vaâo ûúác tñnh NL thñ sinh,
Àïì xuêët yá tûúãng xêy dûång ngên haâng CH àaánh giaá NL hoåc sinh gioãi ngoaåi trûâ úã mö hònh àoâi
thñ sinh
vaâ keám) hoãi phaãi cên bùçng
hoåc sinh.
Mûác àöå khoá CH vaâ NL thñ
1. Töíng quan lñ thuyïët test cöí àiïín vaâ lñ thuyïët sinh tham chiïëu caác thang Mûác àöå khoá CH vaâ NL thñ
ûáng àaáp CH Thang tham
khaác nhau (vñ duå àöå khoásinh
CHàûúåc tham chiïëu
chiïëu
Lñ thuyïët test cöí àiïín (Classical Test Theory - theo Bloom, NL theo thang trïn cuâng thang ào Logit
CTT) vaâ lñ thuyïët ûáng àaáp CH (Item Response Theory 0, 1,... 10 àiïím
- IRT) laâ hai khung phên tñch thöëng kï phöí biïën àïí
thiïët kïë vaâ phên tñch CH test. CTT àûúåc phaát triïín CH phuå thuöåc vaâo NL cuãa nhoám thñ sinh (nïëu nhoám
trûúác vúái nhûäng cöng thûác thöëng kï tûúng àöëi àún thñ sinh gioãi/ keám thò cêu hoãi àoá coá chó söë àöå khoá
giaãn, trong khi IRT phûác taåp hún. Baãng 1 toám tùæt sûåthêëp/ cao). Sai söë chuêín cuãa ào lûúâng (Standard
khaác nhau giûäa CTT vaâ IRT. Error of Measurement - SEM) trong CTT àûúåc tñnh
1.1. Ûúác tñnh caác tham söë CH vaâ NL thñ sinh : toaán thöng qua chó söë àöå tin cêåy cuãa baâi test, vò vêåy
Ûúác tñnh NL thñ sinh cuãa CTT laâ dûåa vaâo töíng àiïímSEM khöng thay àöíi giûäa caác thñ sinh. Coân vúái IRT,
baâi test vaâ chó söë àöå khoá CH laâ tó lïå thñ sinh traã lúâi mö hònh hoáa xaác suêët traã lúâi àuáng àöëi vúái CH nhõ
àuáng (àöå khoá möåt CH thêëp/cao khi tó lïå thñ sinh traã lúâi phên (phaãn ûáng cuãa hoåc sinh coá hai mûác 0: sai, 1:
àuáng cao/thêëp). Vaâ nhû vêåy, khöng chó NL cuãa thñ àuáng) vaâ CH àa phên (phaãn ûáng cuãa hoåc sinh nhiïìu
sinh, maâ àöå khoá CH coá thïí thay àöíi theo mêîu: NL thñ hún 2 mûác). Xaác suêët naây phuå thuöåc vaâo “àöå khoá
sinh phuå thuöåc vaâo töíng àiïím baâi test (àiïím baâi test
cao/thêëp thò thñ sinh coá NL cao/thêëp); Àöå khoá möåt* Viïån Khoa hoåc Giaáo duåc Viïåt Nam
àêy, vúái P j(): xaác xuêët traã lúâi àuáng cêu hoãi j cuãa thñ
sinh coá NL ; a j: àöå phên biïåt cuãa CH j; bj : àöå khoá
CH j; cj: àöå àoaán moâ cuãa CH j. Mö hònh 1PL àún
giaãn nhêët nhûng àoâi hoãi hai giaã thiïët maånh laâ têët caã
caác CH coá àöå phên biïåt cên bùçng vaâ khöng coá cú höåi
àoaán moâ. Mö hònh 2PL giaã thiïët khöng coá cú höåi
àoaán moâ nhûng cho pheáp coá àöå phên biïåt khaác nhau.
Coân vúái mö hònh 3PL, cho pheáp caã ba tham söë àïìu
coá thïí khaác nhau.
1
1PL: Pj ( ) ;
1 e ( b j )
Hònh 1. Haâm thöng tin cuãa baâi test
1 Mûác thöng tin chung cuãa baâi test cao hún nhiïìu
2PL: Pj ( ) ; vaâ
1 e a j ( b j )
so vúái mûác thöng tin cuãa tûâng CH (tûác laâ möåt baâi test
seä ào NL chñnh xaác hún so vúái möåt CH), vaâ baâi test daâi
1 cj thûúâng ào NL chñnh xaác hún baâi test ngùæn. Tuây theo
3PL: Pj ( ) c j .
1e a j ( b j ) tñnh chêët caác CH taåo maâ haâm thöng tin seä coá giaá trõ lúán
Vúái nhûäng CH àa phên (nhû cêu tûå luêån), viïåc (tûác laâ ào chñnh xaác) úã caác khoaãng NL xaác àõnh naâo
mö hònh hoáa dûä liïåu àaáp ûáng cuãa thñ sinh thöng qua àoá, vaâ coá giaá trõ beá (tûác laâ ào keám chñnh xaác) úã caác
möåt söë mö hònh nhû Graded response model, Partial khoaãng NL khaác. Hònh 1 mö taã haâm thöng tin cuãa baâi
credit model, Generalized partial credit model, Rating test göìm 5 CH: Caác CH 1, 2, 3, 4 vaâ 5 coá giaá trõ lúán lêìn
scale model,.... lûúåt úã caác khoaãng NL 0, -0,7, -3, 0,5 vaâ 1,4; Baâi test coá
Trong IRT, NL thñ sinh vaâ caác tham söë CH laâ bêët giaá trõ lúán úã caác khoaãng NL -1 vaâ 1, coá giaá trõ rêët nhoã úã
biïën trong mêîu. Àiïìu naây coá nghôa, nïëu möåt têåp húåpcaác khoaãng NL <-2 vaâ >2.
caác CH coá àöå khoá khaác nhau cuâng àûúåc möåt thñ sinh 1.3. Möåt söë thuêåt toaán duâng àïí ûúác tñnh tham
thûåc hiïån, chuáng àïìu àûa ra ûúác tñnh khaã nùng cuãa söë CH vaâ NL thñ sinh: Ûúác tñnh caác tham söë CH
thñ sinh tûúng tûå nhau; nïëu caác nhoám thñ sinh khaác hoùåc NL thñ sinh dûåa trïn caác thuêåt toaán thöëng kï.
- Khi caác tham söë CH àaä biïët (tûác laâ, àaä àûúåc àõnh
nhau cuâng tham gia traã lúâi möåt CH, ûúác tñnh giaá trõ caác
cúä), thuêåt toaán phöí biïën cho viïåc ûúác lûúång khaã nùng
tham söë cho CH àoá cuäng àïìu nhû nhau.
1.2. Haâm thöng tin cuãa CH vaâ baâi test : Möåt CH
cuãa thñ sinh laâ ûúác lûúång khaã nùng töëi àa (Maximum
Likelihood Estimation - MLE).
cung cêëp lûúång thöng tin khaác nhau vïì caác thñ sinh
- Khi caã hai tham söë CH vaâ NL thñ sinh cuâng àöìng
coá NL khaác nhau. Nïëu CH quaá dïî/ khoá, hêìu hïët thñ
thúâi àûúåc tñnh toaán, thuêåt toaán kïët nöëi ûúác lûúång khaã
sinh àïìu traã lúâi àuáng/ sai, thò CH àoá khöng cho chuáng
nùng töëi àa (Joint Maximum Likelihood Estimation -
ta thöng tin naâo vïì NL cuãa thñ sinh. Vò vêåy, tñnh thöng JMLE) coá thïí àûúåc sûã duång. JMLE hiïåu quaã àöëi vúái
tin cuãa caác CH caâng cao, baâi test caâng coá giaá trõmö hònh 1PL, nhûng gùåp khoá vúái nhûäng mö hònh
ûáng duång. phûác taåp vaâ söë lûúång lúán thñ sinh, coân MLE thûúâng
A.Birnbaum àûa ra biïíu thûác tñnh thöng tin cuãa àûúåc sûã duång àöëi vúái mö hònh 2PL vaâ 3PL.
'
[ Pi ( j )]2
2. Vai troâ cuãa ngên haâng CH khi thûåc hiïån
CH laâ I i ( j ) P ( )(1 P ( ) vúái I i ( j ) laâ thöng tin chûúng trònh giaáo duåc
i j j
2.1. Khaái niïåm ngên haâng CH : Àöi khi thuêåt ngûä
cung cêëp búãi CH thûá i úã NL j , Pi ' ( j ) , laâ àaåo haâm cuãa “ngên haâng cêu hoãi” (item bank, IB) duâng àïí chó möåt
Pi ( j ) . Tûâ àoá ta thêëy, thöng tin cuãa CH caâng cao khi: böå sûu têåp caác CH àaánh giaá bêët kò. Tuy nhiïn, “ngên
haâng” thûúâng chó möåt têåp húåp caác CH test àûúåc àõnh
b caâng gêìn bùçng , a caâng lúán vaâ c caâng gêìn bùçng 0. cúä cêín thêån vaâ têåp trung mö taã möåt biïën êín nhêët àõnh.