Acest articol a fost : 181] La data de: 25 2012, At: 12:20 Distribuitor: Routledge Informa Ltd Înregistrat în Anglia şi Ţara Galilor Numărul

inregistrat: 1072954 inregistrat birou: Mortimer House, 37-41 Mortimer Street, Londra W1T 3JH, Marea Britanie

Evaluare în Educaţie: Principii, Politică şi practici
Publicarea detalii, inclusiv instrucţiuni pentru autori şi Abonament informaţii: http://www.tandfonline.com/loi/caie20

Profesorii de evaluare în curs de dezvoltare pentru învăţare: impactul asupra elevilor realizare
Dylan Wiliam, Clare Lee, Christine Harrison & Paul negru Educaţional Serviciul de Testare, NJ, Statele Unite ale Americii Consiliul Judeţean Warwickshire, Marea c Britanie Kings College, din Londra, Marea Britanie Disponibil on-line: 27 Sep 2010
b o o b c c

Pentru a cita acest articol: Dylan Wiliam, Clare Lee, Christine Harrison & Paul negru (2004): Cadrele didactice de evaluare în curs de dezvoltare pentru învăţarea: impactul asupra rezultatelor elevilor, Evaluare în Educaţie: Principii, politică şi practică, 11:1, 49-65 Pentru a lega la acest articol: http://dx.doi.org/10.1080/0969594042000208994

VĂ RUGĂM Derulaţi în jos pentru ARTICOLUL Termeni şi condiţii de utilizare: http://www.tandfonline.com/page/terms-andCondiţii Acest articol poate fi utilizat pentru activităţi de cercetare, de predare, şi în scopuri personale de studiu. Orice Reproducerea substanţială sau sistematic, redistribuire, revinde, de împrumut, sub-licenţiere, aprovizionare sistematică, sau distribuirea sub orice formă, pentru oricine este interzis în mod expres. Editorul nu oferă nici o garanţie expresă sau implicită sau face orice reprezentare care conţinutul va fi completă sau corecte sau până la data de. Precizie de orice instructiuni, formule, iar dozele de droguri ar trebui să fie verificate în mod independent cu primar surse. Editorul nu va fi raspunzator pentru nici o pierdere, acţiuni, susţine, proceduri, cerere, sau costuri sau daune cauzate sau oricum s-ar decurg în mod direct sau indirect în legătură cu sau care decurg din utilizarea acestui material.

Evaluarea în Educaţie, Vol.. 11, No. 1, martie 2004

Profesorii de evaluare în curs de dezvoltare pentru dDyelaînWviăliaţma1re*,:CimlarepLaecet2u, elevilor lCahrsisutinperHaarriszoun3ltşai tPealvoerl
Black3
1

Educaţional Serviciul de Testare, NJ, Statele Unite ale Americii; 2Consiliul Judeţean Warwickshire, Marea Britanie; 3Kings College din Londra, Marea Britanie

Deşi este recunoscut faptul că, în general, utilizarea sporită a evaluării formative (sau de evaluare pentru învăţare) conduce la învăţarea de calitate superior, este de multe ori a afirmat că presiunea în şcoli până la îmbunătăţi rezultatele obţinute de studenţi în exterior-set încercările şi examinările exclude utilizarea acestuia. Această lucrare rapoarte privind realizarea de elevii de liceu care au lucrat în sălile de clasă în cazul în care profesorii făcut timp pentru a dezvolta strategii de evaluare formativă. Un total de 24 de cadre didactice (2 ştiinţă şi 2 profesorii de matematică, în fiecare din cele şase şcoli în două LEA) au fost susţinute într-o de şase luni în explorarea şi planificarea abordarea lor de a evaluării formative, şi apoi, început în septembrie 1999, cadrele didactice pune aceste planuri în acţiune cu clase selectate. În Pentru a calcula dimensiunile sens, o măsură a nivelului anterior şi cel puţin un grup de comparatie a fost stabilit pentru fiecare clasă (de obicei, fie o clasă echivalentă predate în anul precedent de către acelaşi profesor, sau o clasă paralelă predate de un alt profesor). Mărimea medie în favoarea intrării în vigoare a de intervenţie a fost 0.32.

Introducere Opinii de cercetare de către Natriello (1987) şi Crooks (1988) şi, mai recent, de către Negru şi Wiliam (1998a) au demonstrat că câştiguri substanţiale de învăţare sunt posibil, atunci când profesorii să introducă evaluarea formativă în practică clasă lor. De asemenea, este clar din aceste comentarii, şi de la alte studii (a se vedea Black & Atkin, 1996) faptul că realizarea acestui nu este deloc simplă. Deoarece negru şi Wiliam (1998b) subliniază, aceste modificări sunt greu să pună în aplicare chiar şi în condiţii ideale:

Astfel, de îmbunătăţire a evaluării formative nu poate fi o chestiune simplă. Nu există nici o rapidă " fix ", care poate fi adăugat la practica existentă, cu promisiunea de recompensa rapid. Dimpotrivă, în cazul în care recompensele substanţială a elementelor de probă care deţine în promisiunea urmează să fie garantate, această va veni doar în cazul în care fiecare cadru didactic îşi găseşte căile sale proprii de a încorpora lecţii şi idei care sunt prevăzute mai sus în ei sau modele proprii de lucru clasă. Acest lucru se poate întâmpla doar relativ lent, şi prin programe susţinute de prodezvoltarea personală, profesională şi sprijin. Acest lucru nu slăbi mesaj aici-, într-adevăr, ar trebui să fie un semn de autenticitate sale, pentru îmbunătăţiri de durată şi fundamentale în de predare şi învăţare se poate întâmpla numai în acest fel. (P. 15, sublinierea în original) * Autorul corespondent: Centrul de Cercetare de învăţare şi predare, ETS, Rosedale Road (ms 04-R), Princeton, NJ 08541, Statele Unite ale Americii. E-mail: dwiliam@ets.org

ISSN 0969594X (print) / ISSN 1465329X (online) / 04/01004917 ∧ 2004 Taylor & Francis Ltd DOI: 10.1080/096 9594042000 208994

50 D. Wiliam et al. Cu toate acestea, introducerea pe mize mari de stat mandatate de testare, cum ar fi acum există în Anglia şi cele mai multe state din SUA, face ca punerea în aplicare efectivă a evaluării formative şi mai dificilă. Acest lucru se datorează faptului că, deşi activitatea de Nuthall şi Alton-Lee (1995) a arătat că didactice pentru înţelegere, mai degrabă decât dinafară rechemare, rezultate mai bune în retenţie pe termen lung, încercările de a maximiza şi a studenţilor scorurile şcoală par a duce la o lipsă de atenţie la tipurile de ordin superior gândire implicate în evaluarea formativă (Paris et al., 1991). Într-adevăr, se pare ca dacă există o credinţă larg răspândită că predarea bine este incompatibilă cu creşterea de încercare scorurile. Au existat unele studii care au demonstrat că utilizarea de ordin superior goluri este compatibil cu succes, chiar şi atunci când realizarea este măsurată în termeni astfel de îngust ca scorurile la testele externe. Într-un studiu de trei ani de şcoli în jumătatea de vest a Statele Unite ale Americii, Newmann et al. (2001) a constatat că elevii ale căror cadre didactice utilizate autentice sarcini de clasă (definite ca de construcţie care necesită, mai degrabă decât de reproducere cunoştinţe, disciplinat anchetă, şi valoarea dincolo de şcoală), în afara efectuate studenţi nu li se acordă o astfel de activitate, şi că mărimea efectelor (masurata prin standardizate efect de dimensiune) a fost substanţială. În lectură, scris şi matematică, standardizat mărimile de efect au fost 0,43, 0,52 şi 0.64, respectiv, cu semnificative aptitude-tratament interacţiuni favorizează high-un nivel în materie de citit şi de low-au realizat în matematică. Într-un alt studiu de trei ani a doua secundare (11-16) şcoli în Anglia, Boaler (2002) faţă de cele două şcoli. O şcoală (Phoenix Park) a folosit o "reformă" abordare la predarea matematicii, subliniind gândirea de nivel superior, şi a studenţilor " responsabilitatea pentru propria învăţare, în timp ce altele (Amber Hill) a folosit o "traAbordarea vicii ", subliniind practică a elementelor de testare. Deşi compensată în ceea ce priveşte realizarea prealabilă, studenţii de la Phoenix Park depasit cele de la Amber Hill în naţionale de bacalaureat (Certificat General de secundar Educaţie, sau GCSE) de, în medie, o treime din un grad, echivalent cu o mărimea efectului standardizat de 0,21. Aceste studii sunt utile în subliniind faptul că atenţia la ordin superior goluri în de predare poate duce la realizarea mai mari, chiar şi atunci când astfel de realizarea este măsurată în principal în termeni de inferior-comandă goluri. Cu toate acestea, deoarece aceste studii nu au fost bazat pe experimente directe, există întotdeauna posibilitatea ca, în Newmann et al lui. (2001) de studiu, profesorii folosind mai multe activităţi autentice au fost profesori doar mai bine, şi că alegerea activităţilor de autentic a fost incidente la succesul lor. În mod similar, în Boaler lui (2002) de studiu, ar putea fi faptul că profesorii de predare de la Phoenix Park au fost doar profesorii mai bine, atras de şcoală de către etosul ei progresivă. În scopul de a atrage implicaţii politice clare în ceea ce priveşte utilitatea formative evaluare, prin urmare, am decis că era necesar să se efectueze o mai direct experiment, în care intricate de variabile, în timp ce nu sunt în întregime resa mutat, a fost redus, de către cadrele didactice care solicită să includă evaluarea formativă (sau de evaluare pentru învăţare cum este numit uneori) în practică clasă lor, şi compară performanţele studenţilor lor cu cele din alte clase, în acelaşi timp şcoală. Această lucrare a fost efectuată în formativă King's-Medway-Oxfordshire De evaluare a proiectului (KMOFAP), finanţat iniţial de Fundaţia Nuffield (ca Practica Sală de clasă în curs de dezvoltare în evaluarea formativă proiect) şi ulterior de către

Profesorii de evaluare în curs de dezvoltare pent5ru1 învăţarea Statele Unite ale Americii National Science Foundation, prin sprijinul lor noastre parteneriat cu Proiectul Sală de clasă de evaluare Stanford pentru îmbunătăţirea predării Şi de învăţare (de capital; FSN Grant REC-9909370).

Strategie pentru cercetare Principiul central al proiectului de cercetare a fost că, dacă promisiunea de a formative Evaluarea a fost să fie realizat, tradiţionale de cercetare-modele în care cadrele didactice sunt "A spus" ce să facă de către cercetători, nu ar fi oportună. Acest lucru nu se datorează faptului că profesorii nu cumva cu precizie pentru a pune în practică prescripţiile de recaută, ci pentru că principiile generale emergente din cercetare-underde Termine acţiune-a pus pur şi simplu, ei nu spun ce sa faci.

Profesorii nu va prelua idei atractive de sondare, deşi bazate pe cercetări extinse, în cazul în care acestea sunt prezentate ca principii generale, care lasă în întregime pentru a le sarcina de a traducându-le în practica de zi cu zi, viaţa lor clasă sunt prea ocupati si prea fragil pentru ca acest lucru să fie posibil pentru toţi, ci o câteva restante. Ceea ce au nevoie este un soi de exemple vii de punere în aplicare, de către profesori cu care se pot identifica şi de la care aceştia pot obţine atât convingerea şi încrederea că pot face mai bine, şi a se vedea exemple concrete de ceea ce face înseamnă mai bine în practică. (Black & Wiliam, 1998b, pp. 15-16)

Această dificultate de "punere în practică de cercetare" nu este vina profesorilor. Dar nici nu este un inconvenient în cercetare. Din cauza noastră de înţelegere a teoretice Principiile care stau la baza acţiunii clasă de succes este slabă, de cercetare nu pot spune profesorii ce să facă. Într-adevăr, având în vedere complexitatea de săli de clasă, se pare că visul pozitivistă a unei teorii eficiente a cadrelor didactice de acţiune, care ar însemna în "cel mai bun" curs de acţiune având în vedere anumite condiţii, este nu doar dificil şi de lungă departe de a fi, dar imposibilă în principiu (Wiliam, 2003). Din aceste motive am decis că am fost nevoiţi să lucreze într-un mod cu adevărat colaborativ cu un mic grup de profesori, ceea ce sugerează de ghidare care ar putea fi fructuoasă pentru explora, şi sprijinirea lor, precum şi am putut, dar evitând capcana eliberarea "sfaturi pentru profesori". La inceput, se pare că profesorii nu au crezut acest lucru. Păreau să creadă că cercetătorii au fost de operare cu un pervers Modelul de învăţare descoperire în care cercetătorii ştiau foarte bine ceea ce au a dorit ca profesorii să facă, dar nu le spun, pentru că ei au vrut ", a cadrelor didactice descoperi că pentru ei înşişi ". Cu toate acestea, după un timp, a devenit clar că nu exista nici o prescris model de acţiune eficiente clasă, şi fiecare profesor ar trebui să găsească propriul mod de punere în aplicare a acestor principii generale, în sălile de clasă lor.

Eşantionul Am început prin selectarea cele două autorităţi locale de educaţie (LEA) în cazul în care am ştiut acolo a fost sprijin de la autoritatea pentru a încerca să dezvolte evaluarea formativă, şi, la fel de important, în cazul în care există un ofiţer a fost persoana care ar putea acţiona ca o legătură între echipa de cercetare şi şcoli, şi să ofere un local de contact pentru ad-hoc sprijin pentru cadrele didactice. În acest sens, suntem foarte recunoscători pentru Sue Swaffield de la

52 D. Wiliam et al.
Tabelul 1. Cele şase şcoli implicate în proiect Şcoală Zonelor industriale dezafectate Century Island Cornbury Estate Riverside Doi episcopi Waterford Abreviere BF CI CE RS TB WF Descriere Băieţi Mixt Mixt Mixt Mixt Fete

Medway şi Dorothy Kavanagh din Oxfordshire, care, în numele lor, autorităţile legături, ajutat la crearea si cultivarea legăturilor noastre cu şcolile. Implicarea lor în atât planificarea şi furnizarea de formale în circulaţie sesiuni, precum şi sprijinul lor ", pe teren ", au fost de nepreţuit, şi este sigur că proiectul nu ar fi fost ca de succes, fără contribuţia lor. A identificat cele două autorităţi, am cerut fiecare autoritate pentru a selecta trei Şcolile care au simţit-ar fi participanţi adecvat în proiect. Am fost foarte clar că nu am fost în căutarea pentru "reprezentant" sau şcoli tipice. De la noastre experienţă în dezvoltarea curriculum-de exemplu, în evaluarea gradat (Brown, 1988)-am fost conştienţi de faptul că dezvoltarea este foarte diferită de punere în aplicare. Ceea ce am nevoie de şcoli au fost care au început deja să se gândească în curs de dezvoltare de evaluare pentru învăţare, astfel încât cu aceşti profesori ne-ar putea începe să producă "Exemple vii" a făcut aluzie la mai devreme de a utiliza în difuzare. Fiecare autoritate a identificat trei şcoli care au fost interesaţi să exploreze în continuare posibilitatea de implicare a lor, şi trei dintre noi (PB, CH şi DW) au vizitat fiecare şcoală cu ofiţerul de LEA pentru a discuta proiectul cu profesorul cap şi alte membrii echipei de conducere. Toate cele şase şcoli identificate de acord să fie implicate. O scurtă prezentare a şase şcoli sunt prezentate în tabelul 1 (numele tuturor şcolile şi profesorii sunt, desigur, pseudonime). În propunerea noastră iniţială a fundaţiei Nuffield, ne-am propus să lucreze numai cu matematică şi ştiinţe profesori, în parte datorită expertizei noastre mai mari în aceste discipline, dar şi pentru că am crezut că implicaţiile pentru evaluare pentru învăţare au fost mai clare în aceste domenii. Pentru a evita posibilele perico le de izolare, design-ului nostru solicitat de două matematică şi ştiinţă doi profesori de la fiecare şcoală să se implice. Alegerea cadrelor didactice a fost lăsat la şcoală, şi o varietate de metode au fost folosite. În unele şcoli, şefii desemnat un şef de departament, împreună cu un profesor în anul lor de prima sau a doua de predare. Într-o altă şcoală, în scopul de a asigura o angajamentul faţă de proiect, directorul şcolii a insistat că atât cap şi deputaţi din matematică şi ştiinţe departamente au fost implicate. În alte şcoli, profesori a părut să fie selectate, deoarece, în cuvintele de un singur cap, "ei ar putea face cu un pic de "introducere. În cazul în care, în timp ce şcolile noastre nu au f ost concepute pentru a să fie reprezentative, a existat o gamă considerabilă de expertiză şi experienţă printre cele 24 de cadre didactice selectate-cinci profesori au fost şefii de departament,

Profesorii de evaluare în curs de dezvoltare pent5ru3 învăţarea
Tabelul 2. Model de în-serviciu sesiuni desfăşurate Medalion Held Format Concentra

A B C

Februarie Mai Iunie Septembrie

1999 1999 1999 1999 1999

D

Noiembrie

E

Ianuarie

2000

F

Aprilie

2000

G

Iunie

2000

introducere elaborarea planurilor de acţiune revizuirea şi revizuirea de acţiune Planurile revizuirea şi revizuirea de acţiune jumătate de zi, pe baza LEA Planurile schimbul de experienţă, de rafinare planuri de acţiune, planificarea o zi întreagă, la Londra diseminare metode de cercetare, diseminare, Şedinţe opţionale, inclusiv o zi întreagă, la Londra Teoriile de învăţare integrarea obiectivelor de învăţare cu stabilirea obiectivelor şi planificare, scris jurnale personale o zi întreagă, la Londra planuri de acţiune şi şcoală Planurile de diseminare, analiza datelor "În timp ce aşteptaţi" o zi întreagă, la Londra

o zi întreagă, la Londra o zi întreagă, la Londra o zi întreagă, la Londra

cinci au fost directorii adjuncţi de departament, iar restul de 14 au ocupat o serie de poziţiile în cadrul şcolilor lor, mai ales la un nivel relativ junior.

De intervenţie Intervenţia a avut două componente principale: o serie de jumătate de zi şi o zi în circulaţie sesiuni, în care cadrele didactice ar fi introdus la punctul nostru de vedere a principiilor care stau la baza evaluării formative, şi au o sansa de a dezvolta propriile planuri; vizite la şcoli, în care cadrele didactice ar putea fi observate de predare de către personalul implicat în proiect, au posibilitatea de a discuta despre ideile lor, şi planul de modul în care acestea ar putea să fie puse în practică mai eficient. În propunerea noastră iniţială, am avut în vedere o serie de nouă jumătate de zi în circulaţie sesiuni, unele, cu implicarea tuturor cadrelor didactice, care va avea loc la Londra, şi alţii-conductoare TED în LEA, în scopul de a reduce timpul de cadrele didactice "călătorie. În cazul în care, de un singur astfel de LEA pe bază de sesiune a avut loc, deoarece cadrele didactice consideră că au câştigat o mare se ocupe de a lucra cu profesorii în o altă autoritate. Ca rezultat, deoarece majoritatea cadrele didactice să-şi petreacă două sau trei ore de călătorie pentru a ajunge la Londra, toate insert sesiuni, în afară de cea LEA pe bază de sesiune, a luat forma de sesiuni de o zi (De obicei 10 dimineaţa la 16). Deşi am plătit costurile de călătorie şi de înlocuire de predare, deoarece nu toate cadrele didactice au putut participa toate introduceri, economiile permis un total de şase-şi-o jumătate de zi "insert (mai degrabă decât a propus patru-şi-jumătate-). Modelul de introduceri este prezentată în tabelul 2 (Introduceri ulterioare au avut loc ca parte a

54 D. Wiliam et al.
Tabelul 3. Frecvenţele de activităţi în planurile de acţiune de 24 de cadre didactice Categorie Chestionarea Activitate Profesor interogatoriu Elevii scris întrebări De evaluare deja existent: teste de preElevii întrebări Comment-singurul marcaj De evaluare deja existent: re-sincronizare Grupuri de lucru: recenzie de încercare Curs de lucru: Criteriile de marcare Curs de lucru: exemple Start Lecţii de: luare scop clar Start Lecţii de: stabilirea de obiective Sfârşitul de Lecţii de: recenzie profesorului Sfârşitul de Lecţii de: recenzie elevilor " Grupuri de lucru: explicaţia Implicarea evaluare clasă De auto-evaluare: semafoare De auto-evaluare: obiective Grupuri de lucru: recenzie de încercare De auto-evaluare: alte Elev peer-evaluare Grupuri de lucru: revizuirea Inclusiv părinţii Postere Prezentări Frecvenţă 11 8 4 4 6 4 4 5 4 4 1 1 4 2 2 11 5 6 7 5 1 1 1 1 102

Feedback

Schimbul de criteriile cu elevii

De auto-evaluare

General

Total

FSN-finanţat de lucru cu privire la proiectul CAPITAL, dar aici se referă datele raportate la proiectul original, din 1999 până în august 2000. Caracteristica esenţială a sesiunilor insert a fost dezvoltarea de planuri de acţiune. Întrucât am fost constienti de la alte studii care punerea în aplicare efectivă a evalua formativment cere profesorilor să re-negocieze "contract de învăţare" (cf. Brousseau, 1984) că au evoluat cu elevii lor, am decis că formativă de punere în aplicare evaluare ar fi cel mai bine la începutul unui nou an şcolar. Pentru prima şase luni ale proiectului, prin urmare, am încurajat cadrele didactice să experimenteze cu unele dintre strategiile şi tehnicile sugerate de cercetare, cum ar fi bogat interogatoriu, comment-singurul marcaj, schimbul de criterii cu care învaţă, şi studenţilor peer-evaluare şi auto-evaluare. Fiecare profesor a fost apoi invitată să redacteze, şi mai târziu pentru a rafina, un plan de acţiune precizează care aspecte ale evaluării formative ei a dorit să dezvolte în practica lor şi de a identifica o clasă focale cu care aceste strategii ar putea fi introduse în septembrie 1999. Deşi nu a existat inerent structura în aceste planuri (vezi mai jos), cadrele didactice fiind liber pentru a explora tot ceea ce dorit, am găsit că ar putea fi organizate în cadrul mari categorii prezentate în tabelul 3. În total, cele 24 de cadre didactice au inclus un total de 102 activităţi în acţiunea lor Planurile-o medie de doar peste patru fiecare.

Profesorii de evaluare în curs de dezvoltare pent5ru5 învăţarea Cele mai multe dintre planurile profesorilor cuprinse trimitere la două sau trei domenii importante în de predare în cazul în care aceştia căutau să crească utilizarea lor de evaluarea formativă, în general, urmat de detalii de strategii care ar putea f i folosite pentru a face acest lucru. În aproape toate cazurile, planul a fost dat în detaliu, deşi mulţi profesori utilizat Expresii ale căror înţelesuri diferite de la profesor la profesor (chiar şi în cadrul aceleiaşi şcoală). Practic, fiecare plan conţinea câteva trimitere la concentrându-se asupra sau îmbunătăţirea profesorului tehnici proprii sub semnul întrebării, deşi numai 11 au dat detalii cu privire la modul în care acestea s-au de gând să facă acest lucru (de exemplu, utilizând mai multe întrebări deschise, care să permită studenţilor mai mult timp să se gândească de răspunsuri sau de a începe lecţia cu o intrebare focal). Alţii au fost mai puţin precise (de exemplu, utilizând interogarea mai susţinută a persoanelor fizice, sau îmbunătăţirea tehnicilor de interogatoriu, în general). Unii profesori menţionat de planificare de înregistrare şi întrebările lor. Multi dintre profesori sunt menţionate, de asemenea, studenţilor care implică mai mult în chestiuni de stabilire (pentru teme, sau unul pentru celălalt în clasa). Unii profesori a văzut, de asemenea, testele naţionale existente, curriculum-ul ca o sursa de întrebări bune. Utilizarea comment-singurul marcaj a fost menţionate în mod expres de aproape jumătate profesori, deşi doar 6 din cadre didactice a inclus ca un element specific, în lor planurilor de acţiune. Unii dintre profesori a vrut să reducă utilizarea mărcilor si calitati, dar problemele prevăzut cu acest lucru, având în vedere politicile de şcoală privind marcarea de lucrările elevilor. Patru profesori planificate pentru un test de modul care urmează să fie luate cu mult înainte de sfârşitul anului Modulul care oferă astfel de timp pentru remediere. Împărtăşesc obiectivele de lecţii sau teme a fost menţionat de către majoritatea cadrelor didactice, printr-o varietate de tehnici (folosind o întrebare pe care studenţii ar trebui să poată raspunsul la sfârşitul lecţiei, precizând în mod clar obiectivele la începutul lecţie i, obtinerea de elevi pentru a rotunji Lecţii cu un cont de ceea ce au învăţate). Aproximativ jumătate planurile incluse trimiterile pentru a ajuta studenţii în stau criteriile utilizate pentru marcarea munca de investigaţie sau de explorare, în general, utilizând exemplare de la studenţii din anii anteriori. Materialul exemplar a fost menţionat în alte contexte, cum ar fi având de lucru pe ecran şi cere elevilor să marca locul de muncă utilizând un set de criterii prevăzute de către profesor. Aproape toate cadrele didactice menţionate o formă de auto-evaluare în planurile lor, variind de la utilizarea roşu, galben sau "semafoare" verde pentru a indica al studentului percepţia măsura în care un subiect sau Lecţii au fost înţelese, şi la strategii care incurajeaza auto-evaluare prin obiective care a plasat responsabilitatea pe elevi (De exemplu, "Una dintre aceste douăzeci de răspunsuri este greşit: se pare şi fixaţi-l!"). Semafoare (sau smiley-se confruntă cu un echivalent, care nu au nevoie de creioane colorate sau creioane) s-au văzut! în aproximativ jumătate din planurile şi, în practic toate cazurile utilizarea lor a fost combinat cu strategii pentru a urmări cazurile în care elevii semnalate incomplet înţelesING. Mai multe cadre didactice menţionat convingerea lor că grupuri de lucru oferit de importarmare furnica pentru studenţi, precum şi furnizarea de profesor cu perspective în elevii lor "înţelegere a muncii. Am fost interesaţi dacă opţiunile de activităţi de către profesori diferiţi a arătat nici o structura (de exemplu, face anumite combinaţii de strategii să apară împreună?). Cu toate acestea, utilizarea analizei grupurilor şi scalarea multidimensională (Schiffman et al., 1981) nu au relevat tendinta de strategii special pentru a fi găsite împreună. În acest

56 D. Wiliam et al. sens, strategiile şi tehnicile par să fie relativ independente una de altul. Cealaltă componentă a intervenţiei, vizite la şcoli, cu condiţia ca o oportunitate pentru personalul din cadrul proiectului, pentru a discuta cu profesorii ceea ce făceau, şi modul în care acest referitoare la eforturile lor de a pune în aplicare planuri de acţiune în practică. interacţiuni nu au fost directivă, dar mai mult ca un depozit dintr-o oglindă a profesori. Deoarece personalul din cadrul proiectului au fost frecvent văzut ca "experţi" în nici matematică sau educaţiei în domeniul ştiinţelor, a existat o tendinţă, uneori, pentru profesori de a investi ches- tions din partea unui membru al echipei de proiect cu o semnificaţie deosebită, şi pentru această motiv, aceste discuţii au fost de multe ori mai eficiente atunci când profesorii au fost ştiinţa respectate de către specialişti în matematică, şi vice-versa. Ne-am propus pentru fiecare profesor să fie observată cel puţin o dată pe termen lung şi jumătate, deşi eliberarea cadrelor didactice pentru a discuta despre lecţiile lor nici înainte, nici după aceea a fost dataaliat o problemă (şi şcoli care au garantat presă al cadrelor didactice în acest scop la la începutul proiectului au fost, uneori, în imposibilitatea de a oferi pentru el). O descriere detaliată a schimbărilor calitative în practicile cadrelor didactice "este dincolo de domeniul de aplicare al acestei lucrări (a se vedea negru et al., 2003, pentru un cont pe deplin), dar aceasta este în valoare de remarcat aici că practicile cadrelor didactice au fost lent pentru a schimba, şi că de cele mai multe schimbări în practică, pe care am observat au avut loc spre sfârşitul anului, astfel încât dimensiunea reală a efectelor constatate sunt susceptibile de a fi subestimează de ceea ce ar putea fi atinse atunci când profesorii sunt accentuând evaluării formative ca parte integrantă a practica lor.

De cercetare proiectare Având în vedere natura intervenţiei, care a fost proiectat pentru a construi pe profesia de alism de cadre didactice (mai degrabă decât de instituire a unui model de "evaluare formativă bune" pe le), am simţit că pentru a utiliza un design tradiţionale de cercetare cu privire la cadrele didactice s -ar fi fost inconsistente. În plus, ar fi fost imposibil. Din moment ce fiecare profesor a fost liber să aleagă ce clasă ar putea să se concentreze pentru acest lucru, nu a existat nici posibilitatea de standardizare, fie de "input" sau "ieşire" variabile. Din acest motiv, colectarea de date empirice cantitative privind dimensiunea de efecte a fost bazat pe o abordarea pe care am numit "de design locale". Desen mai mult decât pe interpretivist paradigme pozitiviste, am căutat să facă uz de instrumente de evaluare, indiferent ar fi fost administrate de către şcoală în cursul normal al evenimentelor. În multe cazuri, acestea au fost rezultatele pe testele naţionale de 14 de ani sau clasele pe naţionale de bacalaureat (GCSE), dar în unele cazuri ne-am facut utilizarea de scorurile de la evaluări de şcoală (în special în domeniul ştiinţei, în cazul în care modulare abordări a însemnat că scorurile pe end-of-modul de teste au fost disponibile). Cu ajutorul testelor de pe plan extern mandatat şi examinările ca "intrare" şi "ieşire" variabilele are atât punctele slabe şi punctele forte. Pe partea de minus, astfel de teste ar putea lipsa termenului de valabilitate curriculare (McClung, 1978), în sensul că acestea pot să nu reflecte cu acurateţe ceea ce profesorii au fost de predare în sălile de clasă lor. Pe de altă parte, să cer cadrelor didactice să dezvolta evaluări suplimentare legate în mod specific la ceea ce ei au fost de predare ar fi fost un plus la procesele de lucru inacceptabil lor deja grele. Nici

Profesorii de evaluare în curs de dezvoltare pent5ru7 învăţarea ar fi oferirea de evaluări noastre proprii au fost o soluţie satisfăcătoare, deoarece această ar ridica probleme de îndată, dacă ei au capturat ceea ce profesorii au fost încercarea de a atinge. În plus, toţi profesorii au fost fericiţi cu "ieşire" variabilele am avut sugerat ca măsuri satisfăcătoare a ceea ce ei au fost încercăm să realizăm, în lor săli de clasă, ceea ce sugerează un grad considerabil de "aliniere" între învăţătura lor şi evaluările de utilizat (deşi este de remarcat aici faptul că profesorii au fost critică a acestor evaluări, pentru că au simţit că evaluările nu a evaluat aspecte importante ale subiectului). În timp ce utilizarea de teste externe, prin urmare, ridică multe aspecte, nu credem că orice altă abordare ar fi fost potrivită. Pentru fiecare clasă de contact am avut, prin urmare, o variabilă focal (care este, variabilă dependentă sau "ieşire") şi, în toate, dar în câteva cazuri, am avut, de asemenea, variabile de referinţă (care este, variabile independente sau "intrări"). Pentru a putea interpreta rezultatele am au discutat despre circumstanţele locale în şcoală cu fiecare profesor şi înfiinţat cele mai bune grupul de comparaţie care să fie compatibilă cu nu perturba activitatea şcolii. În unele cazuri, aceasta a fost o clasa paralela predate de către acelaşi profesor în anii anteriori (şi într-un caz în acelaşi an). În alte cazuri, am folosit o clasa paralela predate de către un profesor diferite şi, în caz contrar, o clasă de non-paralele predate de către acelaşi sau diferite profesor. Am realizat, de asemenea, utilizarea normelor naţionale în cazul în care acestea au fost disponibile. În aproape toate cazurile, am fost capabili sa condiţie variabila focale pe una sau mai multe de referinţă variabile, deşi în unele cazuri variabile de referinţă au fost măsuri de interes general capacitatea (de exemplu, Fundaţia Naţională pentru Cercetare-Cognitiv Educaţional NFER lui Abilitati de încercare), în timp ce în altele acestea au fost măsuri de realizare în acest subiect (De exemplu, de sfârşit de an-8 încercări). Pentru a putea compara rezultatele, diferenţele de prime între experimentale şi grupuri de comparaţie au fost standardizate prin împărţirea standard cumulate Abaterea de scorurile experimentale şi compararea. Această măsură, numit fie "Mărimea efectului standardizat", sau, uneori, "mărimea efectului" doar, şi a notat doferă o modalitate de a compararea rezultatelor experimentale obţinute cu măsuri diferite (deşi a se vedea discutarea problemelor de dimensiuni efect interpretarea de mai jos).

Rezultate Din cele 24 de profesori iniţial selectate, 22 au rămas o parte a proiectului până la ei concluzie în iulie 2000. Peter de la Şcoala Zonele industriale dezafectate în mod oficial s-au retras din proiect şi Lisa stânga Riverside în şcoli, să fie înlocuite cu Patrick. Cu toate acestea, mai multe Profesorii au plecat şcolile lor la sfârşitul proiectului, şi date fiabile au fost disponibile pentru doar 19 cadre didactice, dintre care patru au decis să aibă două clase focal fiecare, rezultând date pe 23 de clase. Pentru două dintre clase (Nancy si James) s-au două grupuri de comparaţie posibil. În cazul lui James, efectele sunt comparabile (D 0,29 şi d0,38). Cu toate acestea, în cazul de Nancy, comparativ cu un alt profesor (de fapt, Patrick, care nu a făcut parte iniţial din studiu) randamentele un impact negativ 0.31), în timp ce o comparaţie cu un set similar predate în yeareffect anterioare (d de Nancy produce un efect pozitiv foarte mare (d 1.15). Din motive de exhaustivitate, Rezultate obţinute atât pentru Nancy şi James au fost incluse, oferind un total de dimensiuni intrării în vigoare 25, care sunt prezentate în tabelul 4, şi rezumate în stem-şi-frunze formă în figura 1.

58 D. Wiliam et al.

p

0.02990.00810.104.33640040.00010.01130.00180.19840.23050.800.438520.2628 0.10380 .0001 50.39970.00190.00010.06690.000 1 .1438

9d

0.380.360.351.505.261.200.380.460.270.240.070.260.311.1 50.230.290.380.1 60.66

Raweffect

2.7619.12

10.02 0.2550.3752.95

6.6312.255.2238.44 0.3420.4170.1830.1690.0250.127 1232 0.130.38 Tabelul 4. Rezultatele experim e SD nta le pentru 25 de profesori implicaţi în KMOFAP n 10.6115.93 17.5433.8414.9602.48.8890.9110.6660.6950.03790. 4916 0 38.727.8 0.500.58 2621169169565620283430 -

43.38

0.8791.013 15.33 34323256

95949525

Comparaţie grup DDDD

PDPPDPPP P* SNN

PSPI

ReferenceCva7ria bles C7, S8 C7 SB7 Focal variabil

KS2KS2SE7SE7 C7C7 SE7SE7 C7C7 KS2KS2

--SE8

SE8 SE7KS3SE7SES7 E8KS3SE8SE8KS3 S3 KS3KS3KS3KS3KS3KS3 GCSEGCSE KS3

n

2527258

212326272729242932323430

32323230

Set

1135

13 - 21411111

2211 -

An

7977

898899998899

8811119

Profesor IwanIwanLilyRosePeter BelindaAngela

S i a

nCarl DerekPhilipGreg Eva NancyNancyNancyPatrick Subiectiv MMMSSMMSSSSMMMMMMMSSSSS LisaJerryTomJamesJamesRobert Şcoală BFBFBFBFBFCECECECECICICICIRSRSRSRSRSRSRSTBTBTB

Profesorii de evaluare în curs de dezvoltare pent5ru9 învăţarea
0.10930.28490.13480.02 760.2469

0.400.150.200.250.34

0.3800.2220.3090.47860 .158

0.9411.481.541.950.462

3187878224

PDDDL

KS3KS3KS3KS3 Cheie Variabile FocalKS3 Key Stage 3 testsSBn Scoala deproduse de testare la începutul anului nSEn Scoala-produs de testare la sfârşitul anului nReferinţă variabileCn scorurile CAT in an nSEn Scoala de produse teste la sfârşitul anului nComparaţiiAm învăţat paralele stabilite de către acelaşi profesor în anii acelaşi set similari predate de către acelaşi profesor în paralel yearP anterioare stabilite predate de către profesor diferite în acelaşi set similari yearL predate de către profesor în diferite anterioare yearD non-paralele stabilite predate de către profesor în diferite norme tânji acelaşi Naţional * Non-reprezentant comparaţie

GCSEGCSEGCSEGCS E KS3 3224233223 24412 111111119

SteveSteveKerryKerryGwenAlice SusanKieron

MMMMMMSS

TBTBTBTBWFWFWFWF

60 D. Wiliam et al.

Figura 1. În general dimensiuni standardizate intrării în vigoare NB: în această diagramă stem-and-frunze, valorile negative sunt afişate în urma convenţie care "Model de date reziduale", astfel încât o valoare de -0.26 este afişată cu o "tulpină", de -0,3 şi o "frunză" din 4 (Reprezentând 0,04).

Cum se poate observa, majoritatea de dimensiuni intrării în vigoare sunt în jurul valorii de 0.2 - 0.3, cu o mediană valoarea de 0,27. Având în vedere faptul că fiecare dintre aceste rezultate este separată, "mini -Exper- "iment, de îngrijire trebuie să fie luate în trage concluzii generale despre net efect al adoptării evaluării formative (vezi "Discuţie" de mai jos). Medie mărimea efectului este 0.34, dar este clar influenţată de unele valori extreme, şi întrucât dimensiuni efect nu sunt în mod normal distribuite, procedura de jack-cutit recomandată de către Mosteller şi Tukey (1977) a fost folosit pentru a oferi o estimare a efectului medie adevărat 0.32 ca şi un interval de încredere de 95% din mărimea efectului adevarat ca (0,16, 0,48). În scopul de a examina relaţia dintre practica unui profesor şi a efectului dimensiuni, am clasificat profesori într-una din cele patru grupe, în funcţie de utilizarea lor de strategii de evaluare formativă în sălile de clasă lor, după cum se arată în figura 2. Aceste caracterizări au apărut de la observaţiile noastre a fiecarui profesor practică, şi s-au bazat pe utilizarea lor de strategii-cheie în timpul perioadei principale ale proiect. Clasificarea Independent de cele 24 de cadre didactice de către doi dintre noi (CH şi CL) produse clasificare identice pentru toate, dar doi profesori, iar acestea au fost rezolvate după discuţii. Aceste clasificări au fost produse înainte ca rezultatele erau cunoscute. Mărimi intrării în vigoare în funcţie de tipul profesor sunt prezentate în tabelul 5. Deşi nu există o evidentă tendinţă în ceea ce priveşte dimensiunea medie a intrării în vigoare, ca zbor se mută de la mai puţin de profesori de specialitate mai mult,

Profesorii de evaluare în curs de dezvoltare pent6ru1 învăţarea

Figura 2: dimensiuni standardizate în vigoare în funcţie de tipul comparaţie

gama de dimensiuni intercuartilic intrării în vigoare reduce, indicând un sprijin suplimentar pentru atribuirea de efecte la calitatea evaluării formative. O analiză a efectelor de diferite forme de grupul de comparatie, în formă de side-by-side-stem-frunze şi diagrame (Figura 2) arată că nici o diferenţă semnificativă în vigoare pentru dimensiunile formă diferită de comparaţii se poate observa. Nu a fost nici o diferenta in dimensiunea efectului medie pentru grupele de vârste dife rite,

Tabelul 5. Efectul dimensiuni clasificate prin utilizarea cadrelor didactice "a formative de evaluare a strategiilor de Grup Experţi Pionieri în mişcare Pionieri static Triallers Conta 7 10 2 6 Median 0.25 0.31 1.38 0.15 H-răspândirea * 0.07 0.25 0.35 0.64

* "Balama-răspândit" sau "H-răspândit", este analog cu interGama quartile-urile aferente, şi tinde să-l ca numărul de puncte de date creşte, dar este mult mai uşor de interpretat pentru eşantioane mici. A se vedea Tukey (1977) pentru mai multe detalii.

62 D. Wiliam et al. Deşi este important să subliniem faptul că în anul 11 focal grupurile-în cazul în care "de ieşire" Măsura a fost nota cu privire la examenul GCSE-toate mărimile au avut efect pozitiv. Nu a fost nici o variaţie sistematică în mărime în vigoare odată cu capacitatea de clasa focale deşi o analiză de subiect arată că toate mărimile efect negativ au fost găsite pentru grupurile de matematică (dimensiunile mediană efect pentru matematică şi ştiinţă grupuri au fost, totuşi, aproape identice).

Discuţie Prin însăşi natura sa, dovezi cantitative furnizate aici este dificil de interpretat. Comparaţii nu sunt la fel de robust. În unele cazuri, avem comparaţii cu acelaşi profesor de predare-o clasă paralelă în anii anteriori, care, în ceea ce priveşte Întrebarea principală (care este, a avut un efect de intervenţie?) este, probabil, cea mai bună formă de comparaţie. În alte cazuri, avem comparaţii cu un profesor de predare diferită un set paralel, aşa că ar putea fi faptul că, în unele cazuri, un efect pozitiv indică faptul că numai profesorul care participă la proiect este un profesor mai bun decât profesorul de predare comparaţie clasa. În alte cazuri, clasa de comparaţie este o altă clasă (şi ianuarie uneori o clasa paralela) predate de către acelaşi profesor, şi în timp ce există exemple de dimensiuni efect pozitiv aici (în cazul lui Robert, de exemplu), este, de asemenea, rezonabil să presupunem că mărimea de observat astfel de efecte vor fi atenuate prin ceea ce am numit "difuzare necontrolate". Într-adevăr, în timp ce doi dintre profesorii nostri au vedere Implicarea în proiect ca un angajament pe termen scurt (după care ar a reveni la "normal" de predare), pentru marea majoritate a profesorilor noştri, implicarea în proiectul nu tocmai a extins la toate clasele, dar a modificat fundamental lor punctele de vedere ale ei înşişi ca profesionişti. În unele cazuri, comparaţiile disponibile numai au fost clasele de cadre didactice de predare diverse non-paralele clase, şi având în vedere prevalenţa de grupare capacităţii în matematică şi ştiinţă, şi efectul său asupra atinge dezvoltare (a se vedea Wiliam & Bartolomeu, 2004), disentangling efectul noastre intervenţie tions de factorii contextuali este destul de imposibil. În special, de natura problematică a grupurilor de comparaţie face interpretaation dintre cele patru efecte negative greu. Cazul de Nancy a fost discutată de mai sus. Pentru Lily, o învăţătură fără experienţă profesor de sex feminin într-o şcoală toatebăieţi, comparaţiile posibile au fost doar cu mai multă experienţă, profesori de sex masculin, şi, prin urmare, un efect negativ nu este surprinzător (şi, deşi acest lucru poate părea ca memoriu de construcţii, Este convingerea noastră, de la observaţiile de predare ei, Lily, care sa ameliorat în mod substanţial în predarea ei în timpul proiectului). Am putea încerca, de asemenea, să "explice" efecte negative pentru cele două profesorii de matematică la Şcoala Insula Century prin citarea participarea lor la sesiunile de limitat în circulaţie. Excluderi ar fi de război ranted dacă am fost încercarea de a stabili eficienţa evaluării formative, întrucât angajamentului lor cu evaluarea formativă a fost, de fapt, foarte limitate. Cu toate acestea, întrucât obiectivul nostru în această lucrare nu este dacă evaluarea formativă este eficace în creşterea realizare (pentru că nu există cercetări semnificative în existenţă să demonstreze că este), dar cu privire la modul de a sprijini cadrele didactice în curs de dezvoltare practica lor, credem că este necesar să se includă aceste rezultate. Deşi o serie de măsuri au fost utilizate ca intrări şi ieşiri, faptul că foarte

Profesorii de evaluare în curs de dezvoltare pent6ru3 învăţarea acestea au fost fie testelor naţionale şi examenele, sau evaluările puse în aplicare de către şcoală, ne oferă un grad de încredere că aceste măsuri au în unele termenului de valabilitate punct de vedere al ceea ce profesorii au fost încercarea de a atinge. Există, de asemenea, o problemă inerentă în definiţia standard de mărimea efectului standardizate în literatura de specialitate (de sticlă et al., 1981, de exemplu). În timp ce dimensiunile standardizate intrării în vigoare sunt mai mult de prime comparabile scorurile, şi să permită evaluări diferite pentru a fi plasate pe o măsurătoare comună, există problemele totuşi semnificative de interpretare. Împărţirea diferenţa dintre Compară şi loturi experimentale prin deviaţia standard regrupate în mod clar mărci sensul că într-o îmbunătăţire din 5 note de la (să zicem) 60 - 65 reprezintă un imens ameliorare în cazul în care abaterea standard este de 5 mărci, ci doar o îmbunătăţire modestă în cazul în care abaterea standard este de 20 de mărci. Cu toate acestea, aceeaşi logică impune ca o imbunatatire medie de o jumătate de grad pe cap de student, la GCSE trebuie să fie privită ca o efect mai mare în cazul în care se realizează într-un set top în cazul în care abaterea standard este o clasă (D 0,5), decât în cazul în care se realizează într-o clasă cu abilităţi mixte, în cazul în care deviaţia standard este de două grade GCSE (d 0.25). Există, de asemenea, întrebarea de ce lecţii pot fi trase din aceste şase şcoli pentru politică şi practică în altă parte. La urma urmei, şcolile în acest studiu nu au fost tipice, în că ei au s-au identificat la fel de interesat în explorarea de dezvoltare a evaluarea formativă, iar ei s-au dat un grad mult mai mare de sprijin decât este disponibile pentru majoritatea profesorilor. Ca răspuns, putem cădea de acord doar, şi se repetă de obicei cercetători "litanie, că" mai mult de cercetare trebuie să fie făcut ". Cu toate acestea, în apărarea ideea că cercetări suplimentare în acest domeniu este în valoare de întreprindere, ne-ar face două puncte. Primul este faptul că, în timp ce şcolile au fost un eşantion selectiv, profesorii au fost mult mai mai putin, reprezentând o gamă de expertiză şi experienţă, şi aproape toate cadrele didactice par să se fi ameliorat. În plus, aceste cadre didactice au generat o serie de "Exemple vii de punere în aplicare", care au servit pentru a face mai uşor să se introducă aceste idei altor profesori (Black et al., 2002). Experienţa de participante profesorilor este deja construit pe la şcolile lor şi autorităţile locale de învăţământ (Şi, mai general, a se vedea Black & Wiliam, 2003), dar, desigur, rămâne de văzut în ce măsură acest lucru poate fi scalate până la o LEA sau o ţară. Al doilea se referă la costurile serviciilor de asistenţă. Estimăm că costul de furnizarea de sprijin (ca spre deosebire de cercetarea efectelor sale) a fost în jur de £ 2000 ($ 3000) la un cadru didactic sau aproximativ 8% din costurile salariale pentru un profesor pentru o ani. Deşi acest lucru este mult mai mult decât cele mai multe şcoli au la dispoziţie pe profesor pentru dezvoltarea profesională, aceasta este o proporţie relativ mică din costul anual al fiecare profesor (în special în cazul în care, după cum pare să fie cazul, acesta este un one -off, mai degrabă decât o cost cu o schimbare recurente). În concluzie, în pofida avertizează menţionat mai sus, credem că rezultatele prezentate aici oferă dovezi ferme că îmbunătăţirea evaluării formative se producă beneficii concrete în ceea ce priveşte evaluările extern mandatat (cum ar fi cheie etapa 3 încercările şi examinările GCSE în Anglia). Plasarea unui estimare cantitativă privind mărimea efectului este dificilă, dar se pare că îmbunătăţirile echivalente la aproximativ o jumatate de grad GCSE pe cap de student pe subiect sunt realizabile. În timp ce aceste îmbunătăţiri s-ar putea sunet mic, dacă replicat într-o întreaga şcoală,

64 D. Wiliam et al. s-ar ridica de performanţă a unei şcoli de la 25-a percentilă de realizare la nivel naţional în jumătatea superioară. Cel puţin, aceste date sugerează că profesorii nu nu, ca uneori este raportat, trebuie să aleagă între bine şi obţinerea de predare rezultate bune.

Note despre contribuabili Dylan Wiliam a preluat postul de director al Cercetării de învăţare şi predare Centrul de la ETS în septembrie 2003. Înainte de faptul că el a fost profesor de învăţământ Evaluare la Kings College din Londra, care a aderat după ce a predat-mathemat ICS şi ştiinţă în şcoli secundare în Londra. La Regelui, el a lucrat pe diferite proiecte de cercetare legate de evaluare, inclusiv de evaluare clasificate în Math - ematics, Consorţiul pentru Evaluare şi Testare în şcoli, precum şi didactice cu privire la PGCE, masterat, Ed.D. şi doctorat programe. Paul Neagră este profesor emerit la Kings College din Londra. Pe parcursul carierei sale el a a fost implicat într-o serie de proiecte de curriculum Nuffield şi în cercetare mai multe proiecte, în principal în domeniul educaţiei şi ştiinţei de evaluare. În 1987-8 el a prezidat activitate de grup (TGAT), care a informat miniştrii cu privire la evaluarea naţională şi noi Politica de testare. Deoarece de pensionare, el sa concentrat pe studiul de formative de evaluare. Chris Harrison predat ştiinţa în câteva şcoli din zona de la Londra, înainte de a alăturat Kings College în 1993. Ea îşi petrece acum o parte din timpul său de lucru cu profesori stagiari. Munca ei în evaluarea formativă la King a dus la mai multe de cercetare şi proiecte de dezvoltare profesională în Marea Britanie şi în străinătate, atât la primar şi secundar nivel. Ea a lucrat de asemenea ca de evaluare pentru învăţare consultant pe proiecte naţionale, în Anglia, Scoţia şi Jersey. Clare Lee a fost colegi de cercetare cu privire la proiectul KMOFAP la regele lui, şi a avut predat anterior matematică secundar de peste douăzeci de ani în mai multe şcoli. Ea a lucrat de asemenea cu cadrele didactice pe proiecte de cercetare pe bază de acţiune la Oxford Universitatea. În prezent, ea este consilier pentru evaluarea cadrelor didactice pentru Warwickshire de lucru privind evaluarea pentru mai multe proiecte de învăţare la nivel primar şi secundar în cadrul LEA.

Notă
Aceasta este o versiune revizuită a unui document prezentat la conferinţa anuală a 27-a britanice Educational Research Association, Universitatea din Leeds, septembrie 2001. La revizuirea de hârtie, am au luat în considerare comentariile de doi referenţi anonimi, ale căror ajutorul de care avem recunoştinţă recunosc, deşi suntem în întregime responsabili pentru eventualele erori rămase.

Referinte
Negru, P., Harrison, C., Lee, C., Marshall, B. & Wiliam, D. (2002) De lucru în interiorul casetei negre (Londra, Kings College din Londra Departamentul de Educatie si Studii Profesionale). Negru, P., Harrison, C., Lee, C., Marshall, B. & Wiliam, D. (2003) Evaluare pentru învăţare: punerea aceasta în practică (Buckingham, Open University Press).

Profesorii de evaluare în curs de dezvoltare pent6ru5 învăţarea
Negru, P. & Wiliam, D. (2003) În laudă de cercetare de învăţământ: evaluarea formativă, Britanic Educational Research Journal, 29 (5), 623-637. Negru, P. J. & Atkin, J. M. (EDS) (1996) Schimbarea subiect: inovaţii în domeniul ştiinţei, matematică şi Tehnologia de învăţământ (Londra, Routledge). Negru, PJ & Wiliam, D. (1998a), Evaluare şi învăţare în clasă, Evaluare în Educaţie: principii, politici şi practică, 5 (1), 7-73. Negru, P. J. & Wiliam, D. (1998b) In interiorul cutiei negre: ridicarea standardelor de evaluare, prin sala de clasă (Londra, Kings College din Londra Şcoala de Educaţie). Boaler, J. (2002) Experimentarea matematică şcoală: abordările tradiţionale şi reforma de predare şi de impactul lor asupra învăţării elevilor (Mahwah, NJ, Lawrence Erlbaum Associates). Brousseau, G. (1984) rolul esenţial al contractului didactice în analiza şi construcţii de situaţii în predare şi învăţare matematică, în:. HG, Steiner (Ed.) Teoria matematică educaţie: ICME 5 zonă subiect şi miniconference (Bielefeld, Germania, Institut fur ¨ Didaktik der Mathematik der Universitat Bielefeld), 110-119. · Brown, M. L. (Ed.) (1988) Evaluarea clasate în matematică dezvoltare ambalaj: Manualul profesorului (Basingstoke, Macmillan). Escroci, TJ (1988) Impactul practicilor de evaluare clasă pe elevi, Revizuirea Educaţionale de cercetare, 58 (4), 438-481. Sticlă, G. V., McGaw, B. & Smith, M. (1981) Meta-analiza în cercetarea socială (Beverly Hills, CA, Sage). McClung, MS (1978) Sunt programe de testare a competenţei corecte? Juridice? Phi Delta Kappan, 59 (6), 397-400. Mosteller, F. W. & Tukey, J. W. (1977) Analiza datelor şi de regresie: un al doilea curs în statisticile (Reading, MA, Addison-Wesley). Natriello, G. (1987) Impactul proceselor de evaluare asupra elevilor, Psiholog de învăţământ, 22 (2), 155-175. Newmann, FM, Bryk, AS & Nagaoka, JK (2001) Muncă intelectuală autentică şi standardizate teste: conflict sau coexistenţă? (Chicago, IL, Consorţiul la Chicago Scoala de cercetare). Nuthall, G. & Alton-Lee, A. (1995) Evaluarea de învăţare sală de clasă: modul în care elevii utilizarea lor cunoştinţele şi experienţa pentru a răspunde la întrebări realizarea clasă de testare în domeniul ştiinţei şi studii sociale, American Educational Research Journal, 32 (1), 185-223. Paris, SG, Lawton, T., Turner, J. & Roth, J. (1991) O perspectivă de dezvoltare pe standardizate realizarea de testare, Cercetător de învăţământ, 20 (5), 12-20. Schiffman, SS, Reynolds, ML & Young, FW (1981) Introducere în scalarea multidimensională: teorie, metode, şi aplicaţii (New York, Academic Press). Tukey, J. W. (1977) Exploratoriu analiza datelor (Reading, MA, Addison-Wesley). Wiliam, D. (2003) impactul cercetării educaţionale privind educaţia matematică, în: A. Bishop, MA Clements, C. Keitel, J. Kilpatrick & FKS Leung (EDS) În al doilea rând internaţionale manual de matematica de învăţământ (Dordrecht, Ţările de Jos, Kluwer Academic Publishers). Wiliam, D. & Bartolomeu, H. (2004) Nu e la ce şcoală, dar care a stabilit faptul că sunteţi în materie: influenţa capacitatea de a-gruparea practici cu privire la progresul elevilor în domeniul matematicii, Britanic Educational Research Journal, 30 (2), 279-293.

Sign up to vote on this title
UsefulNot useful