You are on page 1of 142

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC GIÁO DỤC


---------***---------

TẬP BÀI GIẢNG

MÔN HỌC

ĐO LƯỜNG VÀ ĐÁNH GIÁ TRONG GIÁO DỤC

Hà Nội, 2008
LỜI NÓI ĐẦU
Đo lường đánh giá kết quả học tập là một trong những kĩ năng sư phạm
quan trọng mà bất kì người giáo viên nào cũng cần phải được rèn luyện. Kĩ năng
này là sự tổng hợp của năng lực chuyên môn, tức là kiến thức chuyên sâu về
môn học và năng lực sử dụng các phương pháp dạy học môn học. Sau khi học
xong chuyên đề, người học có thể:
1. Mô tả những khái niệm cơ bản của khoa học đo lường và đánh giá, xác
định vị trí, vai trò, chức năng của kiểm tra đánh giá trong quá trình dạy
học.
2. Xác định được mục tiêu giảng dạy môn học, bài học, làm cơ sở cho qui
trình dạy - học và kiểm tra đánh giá kết quả học tập.
3. Phân biệt và sử dụng được các phương pháp, hình thức kiểm tra đánh giá
trong quá trình dạy - học (Quan sát, viết, vấn đáp), nhận diện những điểm
khác biệt và tương đồng giữa trắc nghiệm khách quan và trắc nghiệm tự
luận, những ưu khuyết điểm của từng loại.
4. Xây dựng được một qui trình với các công đoạn, các hoạt động của quá
trình tổ chức một bài kiểm tra hay thi.
5. Xác định được tính tin cậy và giá trị của các phương pháp đo lường đánh
giá trong giáo dục.
6. Soạn thảo được các câu trắc nghiệm theo 4 loại - Đúng/sai, nhiều lựa
chọn, ghép đôi, điền khuyết, các câu tự luận có cấu trúc; phân tích các câu
hỏi theo độ khó, độ phân biệt, tính độ tin cậy, độ giá trị của một bài trắc
nghiệm.
7. Và cuối cùng là lập được kế hoạch kiểm tra đánh giá cho cả môn học từ
khi bắt đầu tới khi kết thúc môn học.
Để thực hiện được các mục tiêu nêu trên, nội dung của chuyên đề được tổ chức
như sau:
Chương 1 - Một số vấn đề chung - Giới thiệu một số khái niệm, thuật
ngữ thường dùng trong đo lường đánh giá.

1
Chương 2 - Xây dựng mục tiêu dạy học - Giới thiệu vị trí, vai trò của
mục tiêu trong quá trình dạy học, các cấp độ của mục tiêu và bước đầu giúp
người học rèn luyện kĩ năng tự xác định mục tiêu của môn học, bài học làm cơ
sở cho việc lựa chọn hình thức tổ chức dạy - học, phương pháp dạy - học và các
hình thức kiểm tra đánh giá.
Chương 3 – Phương pháp và kỹ thuật trong đánh giá - Giới thiệu các
phương pháp kiểm tra đánh giá được dùng trong giáo dục, như quan sát, viết,
vấn đáp. Chương 3 đi sâu giới thiệu phương pháp kiểm tra đánh giá dưới hình
thức viết bằng các câu hỏi trắc nghiệm khách quan. Sự khác biệt và tương đồng
giữa câu hỏi trắc nghiệm khách quan và trắc nghiệm tự luận, ưu nhược điểm của
mỗi loại. Chương này cũng giúp người học rèn luyện kĩ năng xây dựng câu hỏi
trắc nghiệm khách quan, cách thức kết hợp trắc nghiệm tự luận và trắc nghiệm
khách quan, quy trình tổ chức một kì kiểm tra bằng hình thức TNKQ.
Chương 4 – Một số ký thuật xử lý câu hỏi thi - Chương này bước đầu
giúp người học rèn luyện kĩ năng phân tích các câu hỏi trắc nghiệm khách quan,
tính toán độ khó, độ phận biệt của các câu hỏi trắc nghiệm khách quan, độ giá
trị, độ tin cậy của một bài thi bằng các câu hỏi trắc nghiệm khách quan và qui
trình xử lý dữ liệu.
Chương 5 – Đánh giá thực kết quả học tập của người học – Chương
này giới thiệu với người học một kí thuật đánh giá tiên tiến hiện nay trên thế
giới – kĩ thuật đánh giá thực. Nội dung của chương đề cập tới bản chất của đánh
giá thực, phân biệt nó với đánh giá truyền thống; Cách thức kết hợp đánh giá
truyền thống và đánh giá thực, các bước xây dựng một bài đánh giá thực.
Khoa học đo lường và đánh giá trong giáo dục dù đã có lịch sử phát triển
gần 1 thế kỉ trong các nước phát triển, nhưng ở nước ta nó còn quá mới mẻ, các
công trình nghiên cứu về lĩnh vực này mới được một số ít tác giả như Dương
Thiệu Tống, Đặng Bá Lãm, Phan Trọng Ngọ, Trần Tuyết Anh, Lâm Quang
Thiệp, Lê Đức Ngọc v.v... đề cập tới, do vậy người học ít có cơ hội tiếp cận các
tài liệu tham khảo.
Và đây cũng là lí do tại sao trong tập bài giảng này còn nhiều hạn chế và
bất cập. Những người biên soạn rất biết ơn khi nhận được những lời góp ý của
các bạn sinh viên và đồng nghiệp.

2
CHƯƠNG 1

MỘT SỐ VẤN ĐỀ CHUNG


1.1. Một số thuật ngữ thường dùng trong đo lường đánh giá
Bất kỳ một quá trình giáo dục nào tác động lên một con người cũng nhằm
tạo ra những biến đổi nhất định trong đối tương đó. Muốn biết những biến đổi
đó xảy ra ở mức độ nào phải đánh giá hành vi của đối tượng trong một tình
huống nhất định. Sự đánh giá cho phép chúng ta xác định, một là mục tiêu giáo
dục được đặt ra có phù hợp hay không và có đạt được mục tiêu hay không, hai là
việc giảng dạy có thành công hay không, người học có tiến bộ hay không.
Có thể định nghĩa đánh giá như sau:
“Đánh giá là quá trình thu thập và xử lí thông tin một cách có hệ thống
nhằm xác định mục tiêu đã và đang đạt được ở mức độ nào”.
Hoặc “Đánh giá là quá trình thu thập và xử lí thông tin một cách có hệ
thống để đưa ra các quyết định”.
Trong khoa học đánh giá có thể dùng một số thuật ngữ: lượng giá
(measurement), đánh giá (assessment), định giá trị (evaluation), trắc nghiệm
(test).
1.1.1. Lượng giá (Measurement)
Lượng giá là xác định số lượng hay đưa một giá trị bằng số hoặc thứ bậc
theo một hệ thống qui tắc nào đó cho một hoạt động giáo dục nhất định. Lượng
giá là quá trình thu thập thông tin một cách định lượng về các đại lượng đặc
trưng như nhận thức, tư duy, kỹ năng và các phẩm chất nhân cách khác trong
quá trình giáo dục làm cơ sở cho những quyết định quản lí.
1.1.2. Đánh giá (Assessment)
Đánh giá là căn cứ vào các thông tin định tính và định lượng để đưa ra
những kết luận về năng lực và phẩm chất của sản phẩm giáo dục và sử dụng
những thông tin đó đưa ra quyết định về người học cũng như điều chỉnh cách
dạy - học trong tương lai. Đánh giá có thể thực hiện đầu quá trình giảng dạy để
giúp tìm hiểu và chẩn đoán (diagnostic) về đối tượng giảng dạy, phát hiện, dự
báo những nguyên nhân của hiện trạng và xây dựng kế hoạch khắc phục, có thể

3
triển khai trong tiến trình (formative) giảng dạy để tạo những thông tin phản hồi
giúp điều chỉnh quá trình dạy và học, cũng có thể thực hiện lúc kết thúc
(summative) để tổng kết. Trong giảng dạy ở nhà trường, các đánh giá trong tiến
trình thường gắn chặt với người dạy, tuy nhiên các đánh giá kết thúc thường
bám sát vào mục tiêu dạy học đã được đề ra và có thể tách khỏi người dạy.
1.1.3. Định giá trị (Evaluation) hoặc định giá
Để hiểu khái niệm định giá trị, trước hết cần xác định giá trị là gì?
Quan điểm về giá trị đóng vai trò quan trọng trong quá trình đánh giá.
Quan điểm về giá trị của mọi người không giống nhau, cách đánh giá về sự vật
cũng khác biệt. Giá trị luôn là nhân tố khách quan, ngược lại đánh giá mang tính
chủ quan. Trong lịch sử triết học đã từng xuất hiện các quan điểm khác nhau về
giá trị.
Trường phái chủ nghĩa giá trị khách quan cho rằng khách quan là thuộc
tính vốn có của giá trị. Trường phái chủ nghĩa giá trị chủ quan ngược lại cho
rằng con người dùng các giá trị để biểu đạt các đặc điểm tốt, xấu của sự vật, do
đó nó mang tính chủ quan.
Quan điểm của chủ nghĩa duy vật biện chứng cho rằng giá trị là một đặc
tính hữu dụng đặc thù cho biết quan hệ giữa khách thể và chủ thể. Giá trị kết
hợp cả khách quan và chủ quan. Khi tính hữu dụng của sự vật khách quan kết
hợp với nguyện vọng nhu cầu chủ quan thì cho ra đời một giá trị, mức độ kết
hợp càng chặt chẽ thì giá trị càng lớn.
Vậy, định giá trị là qui trình thu thập và xử lí các thông tin về đặc trưng
hữu dụng khách quan của sự vật, hiện tượng và xác định thái độ chủ quan của
con người đối với sự vật đó, đồng thời xem xét mức độ kết hợp giữa hai đại
lượng đó. Xác định mức độ kết hợp giữa hai đại lượng này cho phép ta có được
khái niệm về giá trị hay định được giá trị của đối tượng.
1.1.4. Trắc nghiệm (test)
Trắc nghiệm là một công cụ hay một hệ thống các công cụ dùng đo lường
một mẫu hành vi (behavior) để trả lời cho câu hỏi: kết quả học tập của một cá
nhân so với những cá nhân khác, hay so với nhiệm vụ học tập cụ thể được qui
định từ trước là như thế nào?

4
Trắc nghiệm chuẩn mực (Norm – Referenced Test) là trắc nghiệm được
soạn nhằm đo lường kết quả học tập của một cá nhân so với một nhóm cá nhân
được xem là chuẩn (hay nói cách khác, để xác định vị trí của một cá nhân so với
nhóm cá nhân được xem là chuẩn).
Trắc nghiệm tiêu chí (Criterion – Refferenced Test) là trắc nghiệm được
soạn nhằm đo lường mức đạt mục tiêu học tập trong một lĩnh vực đã được xác
định từ trước.
Trắc nghiệm theo mục tiêu (Objective – Referenced Test) là trắc nghiệm
được soạn nhằm đo lường mức độ đạt mục tiêu học tập chuyên biệt (gần với trắc
nghiệm tiêu chí).
Trắc nghiệm theo lĩnh vực (Domain – Referenced Test) cũng là một loại
trắc nghiệm tiêu chí, nhưng các mục tiêu được tổ chức thành những lĩnh vực,
mỗi lĩnh vực có những điểm chung của nhiều mục tiêu.
1.2. Chức năng của đo lường đánh giá trong giáo dục
1.2.1. Chức năng định hướng
Đánh giá giáo dục được tiến hành trên cơ sở của mục tiêu giáo dục. Nó
tiến hành phán đoán độ sai lệch giữa hiện trạng thực tế và mục tiêu đề ra trước
đó, làm cho khoảng cách này ngày một ngắn hơn.
Chính vì vậy đánh giá giáo dục có khả năng chỉ ra phương hướng về mục
tiêu, tôn chỉ giúp các trường lập kế hoạch dạy và học. Đánh giá giáo dục chỉ ra
phương hướng phấn đấu cho giáo viên và học sinh, cho các cơ sở giáo dục và
đào tạo nói chung.
Chức năng định hướng của đánh giá tồn tại khách quan, không bị ý chí cá
nhân của con người chi phối . Ngoài ra đánh giá giáo dục còn có khả năng tác
động và bảo đảm tính thông suốt cho quá trình thực hiện các mục tiêu, chính
sách giáo dục.
1.2.2. Chức năng đốc thúc, kích thích, tạo động lực
Thông qua đánh giá, giáo dục có thể kích thích tinh thần học hỏi và vươn
lên không ngừng của những đối tượng được đánh giá, từ đó tạo ra một môi
trường cạnh tranh chính thức hoặc phi chính thức.

5
Trong quá trình quản lí dạy và học, căn cứ vào đặc đIểm công việc và qui
luật hoạt động của ngành giáo dục chúng ta có thể sử dụng đánh giá để đôn đốc,
tăng cường tinh thần cạnh tranh giữa các đối tượng được đánh giá. Từ đó có thể
giúp cho những đối tượng này thực hiện được những mục tiêu đề ra trong tương
lai.
1.2.3. Chức năng sàng lọc, lựa chọn
Trong thực tế chúng ta phải thường xuyên tiến hành lựa chọn, sàng lọc,
phân loại đối tượng.
Kết quả của quá trình đánh giá sẽ giúp phân loại, sàng lọc đối tượng và từ
đó sẽ có những chiến lược phù hợp với từng loại đối tượng, giúp đối tượng tiến
bộ không ngừng.
1.2.4. Chức năng cải tiến, dự báo
Nhờ có đánh giá mới phát hiện được những vấn đề tồn tại trong công tác
dạy và học, từ đó tiến hành sử dụng các biện pháp thích hợp để bù đắp những
chỗ thiếu hụt hoặc loại bỏ những sai sót không đáng có. Đó chính là chức năng
cải tiến và dự báo của đánh giá. Ví dụ, nhờ có phân tích và nghiên cứu từng
khâu, từng bước trong quản lí giáo dục và kiểm tra đánh giá tính chính xác, độ
thích hợp của các hoạt đọng giáo dục, chúng ta mới có thể phán đoán hoặc dự
báo các vấn đề hoặc các khâu còn yếu kém trong công tác dạy và học. Đây sẽ là
căn cứ đáng tin cậy để tiến tới việc xác lập mục tiêu cải tiến giáo dục.
Để tiến tới mục tiêu cuối cùng là nâng cao chất lượng dạy và học, không
thể thiếu đánh giá: đó chính là một trong những ý nghĩa thực tế quan trọng nhất
của công tác đánh giá.
1.3. Những yêu cầu đối với việc đánh giá
Để đánh giá thực hiện được các chức năng quan trọng của nó, việc đánh
giá phải đáp ứng các yêu cầu sau:
1.3.1. Tính qui chuẩn
Đánh giá, dù theo bất kỳ hình thức nào cũng đều nhằm mục tiêu phát triển
hoạt động dạy và học, đồng thời phải đảm bảo lợi ích cho người được đánh giá.
Vì vậy đánh giá cần tuân theo những chuẩn mực nhất định. Những chuẩn này

6
được ghi rõ trong văn bản pháp qui và được công bố công khai đối với người
được đánh giá. Những qui định này phải đầy đủ, chi tiết, rõ ràng từ mục tiêu,
hình thức đánh giá, cấu trúc đề, v.v.
1.3.2. Tính khách quan
Tính khách quan là yêu cầu đương nhiên của mọi hình thức đánh giá.
Đánh giá khách quan mới có thể kích thích, tạo động lực người được đánh giá và
cho những kết quả đáng tin cậy làm cơ sở cho các quyết định quản lí khác.
1.3.3. Tính xác nhận và phát triển
Đánh giá phải chỉ ra những kết quả đáng tin cậy khẳng định hiện trạng
của đối tượng so với mục tiêu, tìm ra nguyên nhân của các sai lệch và có biện
pháp khắc phục.
Ngoài ra đánh giá trong giáo dục phải mang tính phát triển, nghĩa là
không chỉ giúp người được đánh giá nhận ra hiện trạng cái mình đạt mà còn có
niềm tin, động lực để phấn đấu khắc phục những điểm chưa phù hợp để đạt tới
trình độ cao hơn.
1.3.4. Tính toàn diện
Tính toàn diện là một yêu cầu của giáo dục, nhằm phát triển một cách
toàn diện các đối tượng giáo dục, do vậy kiểm tra đánh giá cũng phải quán triệt
nguyên tắc này. Tính toàn diện được hiểu là nội dung của việc kiểm tra đánh giá
phải đáp ứng toàn bộ mục đích của đánh giá, các tiêu chuẩn, tiêu chí đánh giá
trong các lĩnh vực nhận thức, tình cảm cũng như tâm lí vận động (sẽ nói ở phần
sau). Tính toàn diện trong kiểm tra đánh giá nhằm phản ánh tính toàn diện của
giáo dục, đồng thời định hướng để mọi hoạt động giáo dục phải được tiến hành
một cách toàn diện.
1.4. Một số nội dung đo lường đánh giá thành quả giáo dục
1.4.1. Mặt nhận thức
1.4.1.1. Kết quả học tập (school achievement)
Kết quả học tập là mức độ kiến thức, kỹ năng hay nhận thức của người
học trong một lĩnh vực nào đó (môn học). Chỉ có bài kiểm tra (trắc nghiệm) kết
quả học tập là có thể đo lường một cách trực tiếp những gì người ta thiết kế để

7
đo. Bài tập đo trí thông minh, năng lực trí tuệ hay nhân cách là những bài tập
gián tiếp đo các đặc điểm khác nhau của nhân cách.
1.4.1.2. Trí thông minh (Intelligence)
Trí thông minh là thuật ngữ khá phổ biến gần một thế kỷ nay. Theo tiếng
Latin, Intelligence là sự khác biệt về cá nhân trong năng lực trí óc. Con người có
năng lực trí tuệ chung và năng lực trí tuệ chuyên biệt. Nhà tâm lí học người
Pháp Alfred Binet đã định nghĩa rằng “trí thông minh là năng lực phán xét tốt,
năng lực lập luận tốt và năng lực hiểu tốt” ông còn nói rằng trí thông minh của
con người được biểu hiện thông qua việc con người thực hiện một loạt các
nhiệm vụ và nó có thể đo được thông qua việc phản ứng trả lời một số mẫu
nhiệm vụ
Các bài tập đo trí thông minh cố gắng đo sự khác biệt cá nhân dưới ảnh
hưởng cuả kinh nghiệm riêng trong cùng một nền văn hoá. Giả định rằng mọi
người có cùng một nền văn hoá và có những kinh nghiệm như nhau, người nào
có trí thông minh tốt hơn sẽ học được nhiều kinh nghiệm hơn so với người có trí
thông minh tồi hơn. Kết quả là, người có số điểm cao hơn trong các bài test trí
thông minh sẽ là do người đó có năng lực trí tuệ tốt hơn chứ không chỉ đơn giản
là do có nhiều kinh nghiệm hơn.
1.4.1.3. Năng khiếu (Aptitude)
Nói về năng lực của cá nhân có liên quan đến lợi thế cho quá trình đào tạo
tương lai, còn thành quả học tập liên quan đến mức độ năng lực đã đạt được.
Chính vì vậy test năng khiếu trước hết là đo tiềm năng hoặc xác định mức độ thể
hiện năng lực trong tương lai. Có test hoạt động nhạy cảm (sensory test), vận
động (motor), tâm vận động (psychomotor), nghệ thuật, âm nhạc, kỹ thuật, tài
năng khoa học….
1.4.2. Mặt thái độ
1.4.2.1. Đặc điểm phát triển nhân cách
Nhân cách là một thể thống nhất gồm: năng lực tinh thần, hứng thú, thái
độ, khí chất, suy nghĩ, cảm xúc và hành vi v.v. Chính vì vậy phương pháp đánh
giá nhân cách gồm tất cả các phương pháp đo các biến về nhận thức và những
biến ảnh hưởng khác như cảm xúc, tính cách, định hướng giá trị, khí chất, hứng

8
thú v.v. Thông qua các phép đo này cho phép xác định đặc điểm của nhân cách.
1.4.2.2. Hứng thú
Những thông tin về hứng thú của con người hoặc những hoạt động hay sự
vật hiện tượng mà con người thích có thể thu thập bằng rất nhiều cách khác
nhau: thổ lộ về hứng thú, thể hiện hứng thú, kiểm tra hứng thú, khám phá hứng
thú. Với 4 phương pháp xác định hứng thú này người ta có thể đo 8 nhóm hứng
thú cơ bản (theo Super và Crites): khoa học, lợi ích xã hội, văn học, vật chất, hệ
thống, giao tiếp, thể hiện thẩm mỹ và phân tích giá trị thẩm mỹ.
1.4.2.3. Thái độ
Thái độ được xem là khả năng phản ứng (tích cực hoặc tiêu cực) với một
số sự vật, tình huống, hoàn cảnh, quan niệm hoặc những người khác. Thái độ
gần giống với hứng thú nhưng hứng thú chỉ giới hạn trong một phạm vi hẹp của
cảm xúc và sự thích thú tới một nhóm hoạt động nhất định.
Thái độ cũng gần giống với quan điểm nhưng nó khác quan điểm về tính
khái quát và phương pháp đo lường. Quan điểm là sự phản ứng đặc biệt đối với
một sự vật hiện tượng cụ thể, trong khi đó thái độ mang tính khái quát và là sự
phản ứng tới một nhóm các sự kiện hoặc một nhóm người. Hơn nữa con người
nhiều khi nhận thức rõ quan điểm của mình nhưng không hoàn toàn ý thức được
về thái độ của mình.
Quan điểm có thể đo bằng điều tra qua bảng hỏi và các điều tra xã hội
học. Thái độ được đo bằng phương pháp không thể thiếu đó là quan sát hành vi
(làm gì, nói gì, viết gì…) trong rất nhiều tình huống khác nhau có liên quan.
Ngoài ra thái độ cũng có thể đo bằng phỏng vấn (trực tiếp hoặc gián tiếp) để làm
rõ thái độ của người được nghiên cứu.

9
1.5. Vị trí, vai trò của kiểm tra - đánh giá trong quá trình đào tạo
1.5.1. Vị trí của kiểm tra - đánh giá
Xét trên quan điểm hệ thống, Qui trình đào tạo (QTĐT) được xem như
một hệ thống bao gồm các yếu tố: mục tiêu (MT), nội dung (ND), hình thức tổ
chức dạy – học (HTTCDH), phương pháp dạy (PPD) của thày, phương pháp học
(PPH) của trò và cuối cùng là kiểm tra đánh giá (KTĐG) kết quả của người học.

Yêu cầu của xã hội

ĐỊNH HƯỚNG

Mục tiêu
Khoá đào tạo

Nội dung đào tạo – Các


môn học

(Mục tiêu môn học, bài học)

Hình thức tổ chức dạy – học

Phương pháp Phương pháp


Dạy Học
(KT - ĐG thường xuyên)

Kiểm tra – đánh giá


(Tổng kết)

10
Các yếu tố này tác động qua lại lẫn nhau theo một sơ đồ cấu trúc nhất
định. Đó là từ phân tích nhu cầu của xã hội, trên cơ sở triết lí của nền giáo dục
và các cơ sở khác (hệ) mục tiêu của một cấp học, bậc học, ngành học được xác
định. Đây là cái mốc cơ bản để thiết kế chương trình, lựa chọn và sắp xếp nội
dung đào tạo. Hệ mục tiêu còn định hướng cho việc tìm ra các hình thức tổ chức
dạy – học phù hợp trong đó người dạy và người học tìm được các phương pháp
dạy – học tương ứng để đạt mục tiêu.
Trong sơ đồ trên kiểm tra - đánh giá là khâu cuối cùng và cũng là khâu
quan trọng nhất bởi lẽ nó không chỉ cho ta biết quá trình đào tạo có đạt mục tiêu
hay không, mà còn cung cấp các thông tin hữu ích để điều chỉnh toàn bộ các
hoạt động xảy ra trước đó.
1.5.2. Vai trò đánh giá trong giáo dục
1.5.2.1. Đánh giá giáo dục là một bộ phận quan trọng của quản lí giáo dục tầm
vĩ mô
Có thể nói rằng bất kì khâu nào của quản lí giáo dục cũng cần tới đánh
giá. Không có đánh giá thì hệ thống quản lí giáo dục sẽ trở thành một hệ thống
một chiều, không có cơ chế phản ánh trở lại, tức là chỉ có chiều đi mà không có
chiều về. Đây là một cơ chế quản lí không khoa học, không hoàn thiện.
Chỉ khi có đánh giá, quản lí giáo dục mới nhận được phản hồi, mới kịp
thời phát hiện ra các vấn đề và giải quyết chúng. Giáo dục là một hệ thống quản
lí hai chiều theo kiểu khứ hồi. Như vậy có thể nói đánh giá là một nhân tố đảm
bảo cho quản lí giáo dục có tính khoa học và hoàn thiện.
- Đánh giá giáo dục là một biện pháp quan trọng nhằm đi sâu cải cách
giáo dục.
Muốn cải cách giáo dục trước tiên phải tiến hành cải cách chế độ đánh giá
bằng cách xây dựng một phương án đánh giá khả thi. Trong quá trình cải cách
cũng cần phải đầu tư cho đánh giá. Kết thúc mõi công đoạn cải cách cần phải
tổng kết lại những công việc đã làm được.
Chỉ có như vậy mới tránh được tính thiếu nhất quán trong đánh giá, bảo
đảm cải cách giáo dục đi đúng quĩ đạo phát triển.
- Đánh giá giáo dục là một phương pháp quan trọng để nâng cao toàn

11
diện chất lượng giáo dục, có tác dụng tích cực tới các dự án trong nhà trường,
giúp cho học sinh phát triển toàn diện về mọi mặt.
Sau khi nhận được các tin tức phản hồi, kịp thời tổng kết thành tích và sửa
chữa sai sót, chất lượng giáo dục sẽ được nâng cao hơn rất nhiều.
- Đánh giá giáo dục là một nội dung quan trọng trong công tác nghiên
cứu khoa học giáo dục.
Ngày nay công tác nghiên cứu khoa học trong giáo dục được phân thành
ba lĩnh vực: nghiên cứu cơ sở lí luận giáo dục, nghiên cứu lí luận phát triển giáo
dục và nghiên cứu về đánh giá giáo dục.
1.5.2.2. Kiểm tra - đánh giá kết quả học tập là một trong những hoạt động quan
trọng nhất của quá trình dạy học.
Bản chất của kiểm tra - đánh giá là thu thập các thông tin định tính và
định lượng, xử lý các thông tin đó và xác định xem mục tiêu của chương trình
đào tạo, của môn học có đạt được hay không và nếu đạt được thì ở mức độ nào.
Kiểm tra - đánh giá là định hướng tới đích cuối cùng để người dạy hướng
dẫn người học cùng vươn tới và cũng là để người học tuỳ theo năng lực của bản
thân tìm cách riêng cho mình hướng tới. Với nghĩa này, kiểm tra – đánh giá sẽ
định hướng cách dạy của thầy và cách học của trò sao cho hiệu quả nhất, nghĩa
là cùng hướng tới việc đạt mục tiêu.
Ngoài ra, các thông tin khai thác được từ kết quả kiểm tra - đánh giá sẽ rất
hữu ích cho việc điều chỉnh phương pháp dạy của thầy và phương pháp học của
trò, đồng thời giúp các nhà quản lí có những thay đổi cần thiết trong việc tổ chức
quá trình đào tạo (như điều chỉnh chương trình đào tạo, nội dung đào tạo, hình
thức tổ chức dạy – học).
Nếu xem chất lượng của quá trình dạy – học là sự “trùng khớp với mục
tiêu” thì kiểm tra - đánh giá là cách tốt nhất để đánh giá chất lượng của qui trình
đào tạo.
1.6. Đặc trưng của đánh giá trong lớp học
1.6.1. Đánh giá trong lớp học nhằm mục đích cao nhất là vì sự tiến bộ của
người học trong suốt quá trình học tập.

12
Đánh giá cung cấp cho người học những thông tin hướng dẫn, điều chỉnh
phương pháp học, phát triển các thao tác tư duy, năng lực nhận thức. Nhờ đó
học sinh sẽ tự tin, tự chịu trách nhiệm về việc học tập của họ và đó cũng là
những phẩm chất cần có để học tập suốt đời.
1.6.2. Đánh giá trong lớp học định hướng cho hoạt động của giảng viên
Kế hoạch dạy học có đan xen các đợt KT - ĐG liên tục trong suốt quá
trình, định hướng cho giảng viên giúp người học vượt qua từng chặng đường
một cách vững chắc. Chính những thông tin thu được sau mỗi đợt đánh giá kết
quả học tập của tập thể lớp học cụ thể, giáo viên sẽ có cơ sở để quyết định dạy
cái gì, dạy như thế nào, đánh giá cái gì và như thế nào, xử lí các thông tin thu
được ra sao.
1.6.3. Đánh giá trong lớp học mang lại lợi ích cho cả thầy và trò
Sự đánh giá trong lớp học cần có sự tham gia tích cực và tự nguyện của
người học. Bằng việc hợp tác trong đánh giá người học củng cố kiến thức thu
được trong cả quá trình đồng thời rèn luyện năng lực tự đánh giá bản thân. Qua
đó động lực học tập của họ được nâng cao do nhận thấy rằng giảng viên đầu tư
công sức và sự thành công trong học tập của học sinh.
Giảng viên trong quá trình đó cũng điều chỉnh cách dạy của mình thông
qua việc trả lời các câu hỏi “Tôi đang giúp học sinh rèn luyện những kiến thức
và kỹ năng gì?”, “Làm thế nào để biết sinh viên có được những kiến thức và kỹ
năng đó ở mức nào?”, “Làm thế nào để giúp họ học tốt hơn?”.v.v.
Khi giảng viên làm việc gần gũi với sinh viên để trả lời các câu hỏi này,
họ cũng nâng cao được kỹ năng sư phạm và ngày càng thành công trong sự
nghiệp.
1.6.4. Đánh giá trong lớp học là đánh giá theo tiến trình, liên tục.
Đánh giá trong lớp học với mục đích cao nhất là vì sự tiến bộ không
ngừng của sinh viên chứ không phải là cung cấp các bằng chứng để đánh giá và
xếp loại sinh viên. Nếu đánh giá tổng kết cần những bài thi có độ tin cậy và độ
giá trị cao, cần bao quát đủ phạm vi kiến thức của môn học để có thể cho những
kết quả công bằng khách quan, theo đúng chuẩn đã qui định, thì đánh giá theo
tiến trình không dùng để xếp loại và có thể không cần nêu tên từng sinh viên.

13
Mục đích của đánh giá theo tiến trình chỉ là cung cấp cho giảng viên những
thông tin về việc sinh viên đang học cái gì, như thế nào và qua đó giúp họ thành
công hơn trong những kỳ đánh giá sau và nhất là trong kỳ đánh giá tổng kết toàn
khoá.
1.6.5. Đánh giá trong lớp học tuỳ thuộc vào từng lớp học cụ thể
Đánh giá trong lớp học chỉ có thể đạt được mục đích khi nó đáp ứng được
những yêu cầu và đặc điểm cụ thể của từng lớp học. Mỗi lớp học có đối tượng
riêng, có những đặc điểm không giống bất kỳ lớp học nào khác, do vậy mỗi lớp
học đòi hỏi có kỹ thuật đánh giá tương ứng mà không thể áp dụng một cách máy
móc, một mô hình có sẵn nào. Những giảng viên thành công là những người
nhận ra những đặc thù của lớp học, có phương pháp dạy phù hợp với đối tượng
đó và có những thủ pháp đánh giá tương ứng với hoàn cảnh cụ thể đó.
1.6.6. Đánh giá trong lớp học gắn với mọi hoạt động của người giáo viên
trong và ngoài giờ học, là bộ phận cấu thành của phương pháp dạy học và là
cơ sở hình thành tài năng sư phạm
Đánh giá là một bộ phận không thể tách rời và diễn ra liên tục trong suốt
quá trình dạy - học môn học trong và ngoài giờ học, và là bộ phận cấu thành của
phương pháp dạy - học.
Trong quá trình phấn đấu đạt mục tiêu môn học, người dạy và người học
sử dụng các phương pháp phù hợp, liên tục sử dụng các hình thức đánh giá để
kiểm tra việc đạt mục tiêu, liên tục cải tiến, điều chỉnh để đạt mục tiêu cuối cùng
của khoá học.
Quá trình dạy - học, đánh giá liên tục như vậy giúp người học tiến bộ
không ngừng, người dạy ngày càng tích luỹ kiến thức, kinh nghiệm. Sự gắn kết
giữa người dạy và người học, giữa kết quả học tập với nỗ lực giảng dạy cũng vì
thế ngày càng tăng cường, người học và người dạy cùng chịu trách nhiệm về
việc dạy học môn học.
Dành một chút thời gian làm một đánh giá đơn giản trước khi dạy một bài
cụ thể nào đó, giáo viên có thể hiểu rõ hơn trình độ của sinh viên ở mức nào và
nên bắt đầu bài giảng từ đâu.
Một đánh giá nhanh giữa giờ có thể cho biết sinh viên có hứng thú với bài

14
giảng không. Đánh giá sau buổi học cho phép giáo viên củng cố bài giảng và
phát hiện những lỗ hổng kiến thức của sinh viên trước khi chúng trở thành một
trở ngại nghiêm trọng cho việc học sau này. Những đánh giá như vậy còn giúp
sinh viên hình thành kỹ năng tự đánh giá, một kỹ năng hữu ích đối với họ ngay
cả khi họ đi vào cuộc sống lao động sau này.
1.7. Vai trò của đánh giá trong lớp học
Việc đánh giá lớp học thường xuyên là rất quan trọng đối với không chỉ
có giáo viên, các nhà quản lý, mà còn đối với cả học sinh.
* Đối với giáo viên
Việc đánh giá lớp học sẽ giúp giáo viên biết được hiệu quả và chất lượng
giảng dạy. Thông qua đánh giá lớp học, người giáo viên thu thập các thông tin
một cách nhanh nhất và trực tiếp. Người giáo viên không chỉ có giảng dạy
không thôi mà còn phải biết kết hợp với đánh giá trong suốt cả quá trình giảng
dạy. Bởi khi người giáo viên thực hiện được việc đánh giá cũng có nghĩa là giáo
viên sẽ đứng ở vị trí của người học, sẽ tìm hiểu những động có học tập của học
sinh, năng lực, khả năng tiếp thu của học sinh, thực tế giảng dạy ra sao: nhanh
hay chậm, có quá khó hay phức tạp hay không; v.v. để từ đó có những điều
chỉnh, sửa đổi sao cho phù hợp.
Những thông tin mà giáo viên thu thập được thông qua việc đánh giá rất
hữu ích, nó giúp cho người giáo viên có thể ra được những quyết định kịp thời
và đúng đắn trước, trong khi, hoặc sau khi giảng. Cụ thể là: Cần phải ra những
quyết định trước khi giảng bài để đặt ra những mục đích học tập, lựa chọn
những hoạt động giảng dạy thích hợp và chuẩn bị tài liệu học tập. Trong khi lên
lớp, phải có những quyết định cách thức và nhịp độ giới thiệu thông tin bài
giảng hấp dẫn, thu hút sự chú ý, kiểm soát hành vi của học sinh, điều chỉnh kế
hoạch bài giảng. Sau bài giảng, giáo viên đánh giá việc học tập của học sinh, các
hoạt động giảng dạy và ngay chính bản thân mình để cải tiến nâng cao chất
lượng giảng dạy.
* Đối với các nhà quản lý
Thông qua đánh giá, các nhà quản lý sẽ ra những quyết định phù hợp để
điều chỉnh chương trình đào tạo và tổ chức giảng dạy và học tập cũng như ra các

15
quyết định về đánh giá kết quả học tập của học sinh.
* Đối với học sinh
Thông qua việc đánh giá thường xuyên của người giáo viên, giúp cho học
sinh biết được chất lượng học tập. Việc đánh giá học sinh không những cho học
sinh biết họ nắm được, làm được những gì, mà còn có tác dụng thúc đẩy việc
học tập của họ.
Như chúng ta đã biết, học tập là một quá trình liên tục trong đó, học sinh
chủ động tiếp thu, giải thích, liên hệ thông tin với những điều họ biết và kinh
qua. Đánh giá có hiệu quả có tác dụng thúc đẩy quá trình.
Mặt khác, một trong những khía cạnh quan trọng trong giảng dạy là
những kỳ vọng giao tiếp với học sinh. Do vậy, giáo viên liên tục đánh giá trong
giảng dạy nhằm cho học biết những gì mong đợi ở họ. Những kỳ vọng đó được
truyền tải tới học sinh thông qua thực chất các câu hỏi giáo viên đặt ra, thông
qua việc giáo viên chấp nhận những câu trả lời của học sinh như thế nào, hay thể
loại thông tin phản hồi của giáo viên khi họ đang làm bài tập, cũng như thông
qua rất nhiều cách thức ứng đáp tinh tế khác của giáo viên với học sinh. Tính
chất các bài kiểm tra giáo viên đưa ra và việc họ đánh giá bài làm của học sinh
sẽ truyền đạt những tiêu chuẩn mà học sinh cần đạt được.
Những đánh giá tin cậy dựa trên hoạt động học tập của học sinh mang tính
dài hạn và tạo những cơ hội học tập cho học sinh; tạo ra môi trường lôi cuốn học
sinh tích cực học tập liên kết thông tin mới với kiến thức hiện hữu; đồng thời
giúp cho học sinh nhận thức rõ hơn động cơ, mục đích của việc học và tự điều
chỉnh mình.

16
CHƯƠNG 2

XÂY DỰNG MỤC TIÊU DẠY HỌC

Mục tiêu là những cái đích mà người dạy, người học, người quản lí hướng
tới, là những kết quả mà chúng ta cố gắng đạt được. Những mục tiêu không chỉ
đơn thuần là điểm tận cùng, mục tiêu còn là những điểm mốc tham chiếu (trung
gian) mà chúng ta dùng để đánh giá sự tiến triển và để xác định xem chúng ta có
đi đúng hướng hay không. Không có mục tiêu rõ ràng, tường minh, chúng ta
không thể đánh giá mức độ thành công của hoạt động dạy học, và cũng không
thể nhận biết mình có đi chệch hướng hay không, chệch đến mức nào và làm thế
nào để quay trở lại đúng hướng. Vì vậy việc đánh giá bao giờ cũng bắt đầu từ
việc đề ra các mục tiêu hay xác lập hệ mục tiêu.
Đánh giá trong lớp học cũng không nằm ngoài cách thức trên. Để có thể
đánh giá chính xác hiệu quả của quá trình dạy học và cải thiện quá trình đó,
giáo viên phải xác định một cách chính xác, rõ ràng, cụ thể những gì người học
cần và phải đạt được sau mỗi giai đoạn và ở cuối khoá học.
2.1. Một số vấn đề chung về xây dựng mục tiêu
2.1.1. Cơ sở xây dựng mục tiêu
Một nền giáo dục nói chung, hay một chương trình đào tạo nói riêng bao
giờ cũng có triết lí của nó – mà ta gọi là cơ sở triết học của giáo dục (hay của
một chương trình đào tạo). Cơ sở triết học của giáo dục định hướng (aim) cho sự
phát triển của giáo dục: giáo dục ai, giáo dục cái gì, giáo dục như thế nào, và
giáo dục để làm gì. Sự định hướng đó giúp ta hoạch định mục đích (goal) của
giáo dục. Từ mục đích của giáo dục mang tính định hướng, các nhà khoa học và
quản lí giáo dục phải xác lập mục tiêu (objectives) của giáo dục, mục tiêu của
từng bậc học, cấp học, của mỗi chương trình đào tạo và cuối cùng là mục tiêu
của từng môn học (hệ mục tiêu).
Trong hệ thống giáo dục nước ta trong giai đoạn hiện tại mối quan hệ đó
có thể được minh hoạ bằng sơ đồ sau:

17
Triết lí của giáo dục. “-Ai cũng có cơm no áo mặc
Cơ sở triết học của Ai cũng được học hành”
GD. “- Một dân tộc dốt là một dân
tộc yếu.”
“Muốn xây dựng CNXH phải có
con người XHCN”

- Giáo dục là quốc sách hàng đầu.


- Xây dựng nền giáo dục có tính
nhân dân, dân tộc, khoa học, hiện
đại, theo định hướng xã hội chủ
Định hướng của giáo nghĩa.
dục (aim) - Phát triển giáo dục phải gắn với
nhu cầu phát triển kinh tế – xã hội,
tiến bộ khoa học, - công nghệ, củng
cố quốc phòng, an ninh.
- Giáo dục là sự nghiệp của Đảng,
Nhà nước và của toàn dân.

- Nghị quyết TW 2, Nghị quyết


Mục đích của giáo TW 4 khoá 8
dục (goal) - Nghị quyết 40 và 41 Quốc
hội 10.
- Luật Giáo dục (cấp bộ,
ngành).

Mục tiêu của giáo


dục (hệ mục tiêu) Cấp trường, khoa, bộ môn
(Objectives).

18
2.1.2. Phân biệt định hướng (aim), mục đích (goal), mục tiêu (objectives or
targets) giáo dục.
2.1.2.1. Định hướng
Định hướng, mục đích, mục tiêu của giáo dục là các thuật ngữ được hiểu
theo nhiều cách. Chúng tôi dùng thuật ngữ định hướng (aim) để chỉ các nhận
định rộng lớn của giáo dục. Định hướng là những nhận định chứa đựng giá trị,
diễn đạt một triết lí giáo dục và các khái niệm về vai trò xã hội của nhà trường
và các nhu cầu của trẻ em và thanh niên. Tóm lại, định hướng là những hướng
dẫn khái quát để biến các nhu cầu của xã hội thành chính sách giáo dục. Mục
đích được viết ở cấp độ nhà nước, là những nhận định có tính mô tả và được viết
không cụ thể.
Thí dụ, định hướng (aim) của hệ thống GDQD Việt Nam được xác định
như sau:

1) Giáo dục là quốc sách hàng đầu. Phát triển giáo dục là nền tảng, là cơ
sở tạo ra nguồn nhân lực chất lượng cao, là một trong những động lực quan
trọng thúc đẩy sự nghiệp công nghiệp hoá, hiện đại hoá, là yếu tố cơ bản để phát
triển xã hội, tăng trưởng kinh tế nhanh và vững bền.
2) Xây dựng nền giáo dục có tính nhân dân, dân tộc, khoa học, hiện
đại, theo định hướng xã hội chủ nghĩa, lấy chủ nghĩa Mác – Lênin và tư tưởng
Hồ Chí Minh làm nền tảng. Thực hiện công bằng xã hội trong giáo dục, tạo cơ
hội bình đẳng để ai cũng được học hành. Nhà nước và xã hội có cơ chế, chính
sách giúp đỡ người nghèo học tập, khuyến khích những người học giỏi phát
triển tài năng.
Giáo dục con người Việt Nam phát triển toàn diện, có đạo đức, tri thức,
sức khoẻ và thẩm mĩ, phát triển được năng lực cá nhân, đào tạo những người lao
động có kĩ năng nghề nghiệp, năng động, sáng tạo, trung thành với lí tưởng độc
lập dân tộc và chủ nghĩa xã hội, có ý trí vươn lên lập thân, lập nghiệp, có ý thức
công dân, góp phần vào làm cho dân giàu nước mạnh, xã hội công bằng, dân
chủ, văn minh, phục vụ sự nghiệp xây dựng và bảo vệ Tổ quốc.
3) Phát triển giáo dục phải gắn với nhu cầu phát triển kinh tế – xã
hội, tiến bộ khoa học - công nghệ, củng cố quốc phòng, an ninh, đảm bảo sự

19
hợp lí về cơ cấu trình độ, cơ cấu ngành nghề, cơ cấu vùng miền; mở rộng qui mô
trên cơ sở đảm bảo chất lượng và hiệu quả; kết hợp giữa đào tạo và sử dụng.
Thực hiện nguyên lí học đi đôi với hành, giáo dục kết hợp với lao động sản xuất,
lí luận gắn liền với thực tiễn, giáo dục nhà trường kết hợp với giáo dục gia đình
và giáo dục xã hội.
4) Giáo dục là sự nghiệp của Đảng, Nhà nước và của toàn dân. Xây
dựng xã hội học tập, tạo điều kiện cho mọi người, ở mọi lứa tuổi, mọi trình độ
được học thường xuyên, học suốt đời. Nhà nước giữ vai trò chủ đạo trong phát
triển sự nghiệp giáo dục. Đẩy mạnh xã hội hoá, khuyến khích, huy động và tạo
điều kiện để toàn xã hội tham gia phát triển giáo dục.

Đây là những định hướng chiến lược, tổng quát, chỉ rõ yêu cầu của xã hội
Việt Nam trong giai đoạn mới đối với giáo dục và đào tạo.
Các nhà giáo dục phải nghiên cứu thực hiện những định hướng này thành
cái mà nhà trường phải đạt tới, tức là mục đích của giáo dục.
2.1.2.2. Mục đích
Các nhà giáo dục cần phải biến định hướng thành những nhận định miêu
tả những cái mà nhà trường kì vọng là phải đạt được. Những biến đổi hay
chuyển dịch này được gọi là mục đích (Goal). Mục đích giúp chúng ta có thể tổ
chức các hoạt động dạy học mà cơ sở đào tạo cho là cần thiết trên cơ sở của một
hệ thống rộng lớn. Về hiệu quả, mục đích là những nhận định cắt ngang qua các
môn học và các cấp - lớp và thể hiện toàn bộ chương trình đào tạo của cơ sở.
Mục đích cụ thể hơn định hướng, nhưng chúng vẫn chưa chỉ ra hành vi và do đó
không thể đo hay quan sát được. Mục đích tạo nên sự hướng dẫn cho các nhà
giáo dục, nhưng chúng không cụ thể hoá các cấp độ thành tựu hay cấp độ năng
lực.
Theo một số nhà giáo dục, mục đích “không có thời gian” ở chỗ là người
ta không chỉ ra thời điểm nào các mục đích được hoàn thành, và đồng thời
chúng “không vĩnh cửu” ở chỗ là chúng “có thể được điểu chỉnh ở bất cứ chỗ
nào cần thiết”. Mục đích không mô tả cụ thể nội dung hay các hoạt động tương
ứng. Mục đích nên được xác định đủ rộng “để bất kì cơ sở giáo dục nào cũng

20
chấp nhận được”, nhưng phải đủ cụ thể để có thể đạt tới những kết quả mong
muốn.
Như vậy, mục đích cụ thể hơn định hướng, nó bao quát một bậc học, cấp
học, nhưng nó mới là những hướng dẫn ban đầu cho nhà giáo dục, mà chưa cụ
thể hoá thành các cấp độ thành tựu hay cấp độ năng lực. Mục đích được xác lập
ở cấp ngành – thí dụ trong Luật giáo dục ghi rõ (mục tiêu trong các Điều sau
theo cách hiểu của chúng ta là mục đích).

Điều 23: Mục tiêu của giáo dục phổ thông.


Mục tiêu của giáo dục phổ thông là giúp học sinh phát triển toàn diện về
đạo đức, trí tuệ, thể chất, thẩm mĩ và các kĩ năng cơ bản nhằm hình thành tư
cách của con người Việt Nam xã hội chủ nghĩa, xây dựng tư cách và trách nhiệm
công dân, chuẩn bị cho học sinh tiếp tục học lên hoặc đi vào cuộc sống lao động
tham gia xây dựng và bảo vệ Tổ quốc.
Giáo dục tiểu học nhằm giúp học sinh hình thành những cơ sở ban đầu
cho sự phát triển đúng đắn và lâu dài về đạo đức, trí tuệ, thể chất, thẩm mĩ và
các kĩ năng cơ bản để học sinh tiếp tục học trung học cơ sở.
Giáo dục trung học cơ sở nhằm giúp học sinh củng cố và phát triển những
kết quả của giáo dục tiểu học; có trình độ học vấn phổ thông cơ sở và những
hiểu biết ban đầu về kĩ thuật và hướng nghiệp để tiếp tục học trung học phổ
thông, trung học chuyên nghiệp, học nghề hoặc đi vào cuộc sống lao động.
Giáo dục trung học phổ thông nhằm giúp học sinh củng cố và phát triển
những kết quả của giáo dục trung học cơ sở, hoàn thiện học vấn phổ thông và
những hiểu biết thông thường về kũ thuật và hướng nghiệp để tiếp tục học đại
học, cao đẳng, trung học chuyên nghiệp, học nghề hoặc đi vào cuộc sống lao
động.

21
Điều 35: Mục tiêu của giáo dục đại học và sau đại học.
Mục tiêu của giáo dục học đại học và sau đại học là đào tạo người học có
phẩm chất chính trị, đạo đức, có ý thức phục vụ nhân dân, có kiến thức và năng
lực thực hành nghề nghiệp tương xứng với trình độ đào tạo, có sức khoẻ, đáp
ứng yêu cầu xây dựng và bảo vệ Tổ quốc.
Đào tạo trình độ cao đẳng giúp sinh viên có kiến thức chuyên môn và kĩ
năng thực hành cơ bản về một ngành nghề, có khả năng giải quyết những vấn đề
thông thường thuộc chuyên ngành được đào tạo.
Đào tạo trình độ đại học giúp sinh viên nắm vững kiến thức chuyên môn
và kĩ năng thực hành cơ bản về một ngành nghề, có khả năng phát hiện, giải
quyết những vấn đề thông thường thuộc chuyên ngành được đào tạo.
Đào tạo trình độ thạc sĩ giúp học viên nắm vững lí thuyết, có trình độ cao
về thực hành, có khả năng phát hiện, giải quyết những vấn đề thuộc chuyên
ngành được đào tạo.
Đào tạo trình độ tiến sĩ giúp nghiên cứu sinh có trình độ cao về lí thuyết,
và thực hành, có năng lực nghiên cứu độc lập, sáng tạo, giải quyết những vấn đề
khoa học – công nghệ và hướng dẫn hoạt động chuyên môn.

Ở đây mục đích đã cụ thể hơn cho mỗi bậc học, cấp học. Nhưng nó vẫn
chưa chỉ ra một năng lực, một hành vi có thể quan sát được, đo lường được mà
mới phác thảo hình hài ban đầu của sản phẩm của một qui trình đào tạo ở một
bậc đào tạo nhất định.
Từ mục đích của mỗi cấp học, bậc học, các nhà trường phải triển khai
thành các mục tiêu cụ thể của chương trình giáo dục (curriculum), của từng môn
học, và từng bài học.
2.1.2.3. Mục tiêu
Mục tiêu hiểu theo nghĩa cơ bản nhất của từ này là cái ta cần chiếm lĩnh
và ta phải đánh giá được cái đã chiếm lĩnh ấy. Với nghĩa này những “định
hướng”, “mục đích” của giáo dục mới chỉ là “Bản qui hoạch chung” hoặc cùng
lắm là “bản qui hoạch chi tiết” của ngôi nhà giáo dục. Nó mới cho ta một ý niệm

22
ban đầu về hình hài ngôi nhà. Nhất thiết phải có bản thiết kế, một bản vẽ kĩ thuật
(tức là mục tiêu) làm cơ sở cho việc xác định một cách chính xác và tường minh
những loại nguyên vật liệu nào cần (nội dung) bao nhiêu là đủ (không thừa,
không thiếu), phải có các biện pháp thi công nào (phương pháp dạy - học), và
điều tối quan trọng là khi xây dựng xong ta có thể đối chiếu ngôi nhà đó với bản
thiết kế để đánh giá chất lượng ngôi nhà (kiểm tra - đánh giá).
Tất nhiên các mục tiêu cần phải nhất quán với các mục đích tổng thể của
nhà trường và các mục tiêu giáo dục chung của xã hội. Mỗi giáo viên, khi lập kế
hoạch dạy học, có thể xây dựng các mục tiêu theo những cách khác nhau. Thí
dụ:
- Mục đích: Phát triển các kĩ năng đọc.
- Mục tiêu cụ thể: Xác định các ý chính của tác giả.
- Mục đích: Thưởng thức nghệ thuật.
- Mục tiêu cụ thể: Nhận ra bức tranh của các nghệ sĩ chính.
- Mục đích: Hiểu các khái niệm khoa học.
- Mục tiêu cụ thể: Xác định Hydro và Oxi biến thành nước như thế nào.
Mối quan hệ giữa định hướng, mục đích và mục tiêu được thể hiện ở sự
thống nhất với nhau của chúng. Định hướng rộng lớn nhất, mục tiêu cụ thể nhất.
Mục tiêu được phân chia tiếp ra thành chương trình học, môn học và các mục
tiêu cụ thể của bài học.
Mục tiêu chương trình bắt nguồn từ mục đích của cơ sở đào tạo và được
viết ở cấp độ trường. ở cấp độ này, mục tiêu vẫn còn mang tính khái quát, nó chỉ
ra công việc mà tất cả học sinh hoàn thành chứ không phải từng cá nhân học
sinh.
Mục tiêu môn học xuất phát từ mục tiêu của chương trình và được xây
dựng ở cấp bộ môn. Những mục tiêu này phạm trù hoá các khái niệm, các vấn
đề hay hành vi, nhưng không chi tiết hoá nội dung hay các phương pháp giảng
dạy. Mục tiêu môn học được xác định dưới hình thức các chủ đề, khái niệm hay
hành vi khái quát.
Mục tiêu lớp học (cấp độ lớp học) thường do giáo viên xây dựng. Dựa vào

23
mục tiêu môn học, mục tiêu cấp độ này được chia theo đơn vị bài học. Vì mỗi
bài có thể kéo dài trong nhiều tiết, nên mục tiêu của mỗi bài học có thể được
chia theo buổi lên lớp. Các mục tiêu ở cấp độ bài học xác định mặt kiến thức, kỹ
năng và thái độ. Chúng cũng có thể xác định kết quả đầu ra, các điều kiện cần
nắm vững.
Các đặc điểm của các mục tiêu dạy học ở cấp độ lớp học:
- Việc xác định các mục tiêu phải mô tả được cả kiểu hành vi được kỳ
vọng và nội dung hay ngữ cảnh mà các hành vi đó được thể hiện.
- Các mục tiêu phức hợp cần phải được xác định theo kiểu phân tích và đủ
cụ thể để không còn nghi ngờ đối với kiểu hành vi được kỳ vọng hay cái mà
hành vi được áp dụng.
- Các mục tiêu phải xây dựng có tính phân hoá giữa các học sinh, đạt
được những hành vi khác nhau.
- Mục tiêu có tính phát triển, thể hiện các con đường đi tới chứ không
phải là các điểm cuối cùng.
- Mục tiêu phải thực tế và chỉ bao gồm những gì được hiện thực hoá thành
kinh nghiệm trong lớp học.
- Phạm vi của các mục tiêu phải đủ rộng để chứa đựng tất cả các kết quả
đầu ra mà cơ sở đào tạo chịu trách nhiệm.
2.1.3. Vai trò của việc xác định mục tiêu
Theo Hilda Taba, một nhà giáo dục học nổi tiếng có nhiều ảnh hưởng đến
bản chất của dạy học trong những năm giữa thế kỉ 20, “chức năng chủ yếu của…
các mục tiêu cụ thể là để hướng việc ra các quyết định phải chứa đựng cái gì,
nhấn mạnh cái gì, lựa chọn nội dung nào, và các kinh nghiệm học tập nào phải
nhấn mạnh". Bởi vì các khả năng của nội dung, học tập, và giảng dạy là vô tận,
cho nên giáo viên gặp phải những khó khăn trong việc lựa chọn nội dung nào là
quan trọng nhất? Theo Taba, các mục tiêu cụ thể cung cấp tiêu chí cho những
quyết định này. Bất chấp bản chất của nó là gì thì việc xác định mục tiêu cụ thể
theo những kết quả đầu ra mong muốn cũng “tạo phạm vi và các giới hạn cho
những gì được dạy và được học”.

24
Không có mục tiêu xác định, không có bất kỳ cơ sở nào để lựa chọn nội
dung giảng dạy, phương pháp giảng dạy và càng không thể đánh giá được hiệu
quả, giá trị của một bài giảng, một khoá giảng hay cả một chương trình.

Không một người thợ nào lại đi chọn đồ nghề trước khi biết công việc
phải làm, cũng như không có người thợ xây nào lại đi chọn nguyên vật liệu và
định trước tiến độ của một công trình khi chưa có bản thiết kế trong tay.
Chúng ta nghe nhiều sự phê phán, bình luận về chất lượng của các loại
sách giáo khoa, và đồ dùng dạy học, về phương pháp dạy - học mà không bao
giờ thấy có sự phân tích các mục tiêu mà các phương tiện ấy cho phép đạt tới.
Một thầy giáo sẽ hoàn toàn làm việc trong sự mơ hồ chừng nào không biết được
thực sự ông ta muốn học trò của mình làm được gì sau khi học xong một bài học
hay một môn học.

Điều quan trọng tiếp theo là các mục tiêu được xác định đó phải là cái
mốc để đánh giá được sự tiến bộ của học sinh đến mức nào theo chiều hướng đã
định. Các kỳ thi, kiểm tra chính là những mốc đặt ra trên con đường tới đích để
cả thầy và trò biết mình đã đi đến đâu và làm thế nào để cùng đạt mục tiêu khoá
học, tức là tới đích. Nhưng những bài thi, kiểm tra đó sẽ là vô ích chừng nào
mục tiêu không được xác định tường minh trong đầu cả thầy và trò. Để có ích,
các bài thi, kiểm tra phải có khả năng đo được mức độ hoàn thành so với mục
tiêu. Chừng nào người thầy giáo còn chưa có một hình ảnh rõ ràng về ý đồ giảng
dạy của họ thì không thể chọn ra được các hình thức, phương pháp kiểm tra có
khả năng đo được năng lực của học sinh trong việc thực hiện hành động mà
người thầy mong muốn.
Việc xác minh chính xác, tường minh mục tiêu môn học, giúp học sinh có
cách tự đánh giá sự tiến bộ của bản thân trong quá trình học tập và tự tổ chức
quá trình học tập của bản thân theo một định hướng rõ ràng. Có mục tiêu rõ ràng
trước mặt, học sinh biết lựa chọn các hoạt động dẫn tới thành công mà không
cần mất công tìm kiếm sở thích hay “gu” của thầy, một việc làm thường dẫn tới
các trò tinh ranh của vài học sinh “láu cá” mong đạt điểm cao mà không cần
phải cố gắng nhiều.

25
Một mục tiêu được xác định rõ ràng đồng thời cho phép suy nghĩ sâu sắc
và chín chắn trong việc lựa chọn và sắp xếp nội dung bài giảng và nhất là tìm
các phương pháp, thủ pháp truyền đạt nội dung đó tới người học để cùng đạt
mục tiêu.
Có thể sẽ nảy sinh một câu hỏi: Tại sao phải mất công xác định mục tiêu
của bài dạy? Nếu ta có một câu hỏi thi tốt thì cần gì phải xác định mục tiêu. Có
thể không khó trả lời câu hỏi này. Một là để có một câu hỏi thi tốt, trước hết cần
xác định chính xác mục tiêu của bài dạy. Mục tiêu của bài dạy chính là cơ sở để
viết một câu hỏi thi tốt. Hoặc có thể trả lời câu hỏi đó bằng một câu hỏi khác:
Nếu trong tay ta có một cái thước (câu hỏi thi) để đo một toà nhà thì có cần đến
bản thiết kế (mục tiêu) nữa hay không? Câu trả lời rất rõ: Bản thiết kế cho phép
rà soát toà nhà sau khi đã làm xong xem có phù hợp với ý đồ ban đầu không,
mặt khác nó cho phép xây dựng những toà nhà khác có cùng kích thước.
Đối với các mục tiêu bài dạy cũng như vậy, nó chỉ rõ con đường phải đi
đến đích, còn câu hỏi thi chỉ cho ta biết đã đến đích được chưa.
Xác định mục tiêu cho một môn học, giờ học là rất quan trọng, song
không phải cái gì quan trọng cũng có thể đo lường, đánh giá được. Trong những
trường hợp như vậy, giáo viên có thể chỉ ra một hành vi nào đó mà học sinh làm
được ở mức độ nào đó thì được xem là có thể chấp nhận được. Có trường hợp
cách xác định chuẩn như vậy có vai trò quyết định, nhưng có những lúc nó rất ít
quan trọng hoặc không cần. Nhưng đặt ra chuẩn cho một mục tiêu nào đó là
cách giáo viên xác định một khía cạnh quan trọng để thầy và trò cùng phấn đấu
vươn tới.
2.2. Xác định mục tiêu môn học – bài dạy
2.2.1. Phân loại mục tiêu giáo dục và các mức độ mục tiêu trong lĩnh vực
nhận thức theo B. Bloom.
2.2.1.1. Mục tiêu giáo dục
Tại hội nghị của Hội Tâm lý học Mỹ năm 1948, B. S. Bloom đã chủ trì
xây dựng một hệ thống phân loại các mục tiêu của quá trình giáo dục. Ba lĩnh
vực của các hoạt động giáo dục đã được xác định, đó là lĩnh vực về nhận thức
(cognitive domain), lĩnh vực về tâm vận động (psychomator domain) và lĩnh vực

26
về cảm xúc, thái độ (affective domain).
Lĩnh vực nhận thức thể hiện ở khả năng suy nghĩ, lập luận, bao gồm việc
thu thập các sự kiện, giải thích, lập luận theo kiểu diễn dịch và quy nạp và sự
đánh giá có phê phán.
Lĩnh vực tâm vận động liên quan đến những kỹ năng đòi hỏi sự khéo léo
về chân tay, sự phối hợp các cơ bắp từ đơn giản đến phức tạp.
Lĩnh vực cảm xúc liên quan đến những đáp ứng về mặt tình cảm, bao hàm
cả những mối quan hệ như yêu ghét, thái độ nhiệt tình thờ ơ, cũng như sự cam
kết với một nguyên tắc và sự tiếp thu các lý tưởng.
Các lĩnh vực nêu trên không hoàn toàn tách biệt hoặc loại trừ lẫn nhau.
Phần lớn việc phát triển tâm lý đều bao hàm cả 3 lĩnh vực nói trên.
Bloom và những người cộng tác với ông cũng xây dựng nên các cấp độ
của các mục tiêu giáo dục, thường được gọi là cách phân loại Bloom (Bloom),
trong đó lĩnh vực nhận thức được chia thành các mức độ hành vi từ đơn giản
nhất đến phức tạp nhất.
2.2.1.2. Lĩnh vực nhận thức
Lĩnh vực được đánh giá phổ biến nhất trong giáo dục là lĩnh vực nhận
thức. Lĩnh vực này bao gồm 6 mức độ theo thứ tự từ đơn giản đến phức tạp.
- Nhớ (Knowledge): được định nghĩa là sự nhớ lại các dữ liệu đã học
được trước đây. Điều đó có nghĩa là một người có thể nhắc lại một loạt dữ liệu,
từ các sự kiện đơn giản đến các lý thuyết phức tạp, tái hiện trong trí nhớ những
thông tin cần thiết. Đây là cấp độ thấp nhất của kết quả học tập trong lĩnh vực
nhận thức.
- Hiểu (Comprehention): được định nghĩa là khả năng nắm được ý nghĩa
của tài liệu. Điều đó có thể thể hiện bằng việc chuyển tài liệu từ dạng này sang
dạng khác (từ các từ sang số liệu), bằng cách giải thích tài liệu (giải thích hoặc
tóm tắt) và bằng cách ước lượng xu hướng tương lai (dự báo các hệ quả ảnh
hưởng). Kết quả học tập ở cấp độ này cao hơn so với nhớ, và là mức thấp nhất
của việc thấu hiểu sự vật.
- Áp dụng (Application): được định nghĩa là khả năng sử dụng các tài liệu

27
đã học vào một hoàn cành cụ thể mới. Điều đó có thể bao gồm việc áp dụng các
quy tắc, phương pháp, khái niệm, nguyên lý, định luật và lý thuyết. Kết quả học
tập trong lĩnh vực này đòi hỏi cấp độ thấu hiểu cao hơn so với cấp độ hiểu trên
đây.
- Phân tích (Analysis): được định nghĩa là khả năng phân chia một tài
liệu ra thành các phần sao cho có thể hiểu được các cấu trúc tổ chức của nó.
Điều đó có thể bao gồm việc chỉ ra đúng các bộ phận, phân tích mối quan hệ
giữa các bộ phận và nhận biết được các nguyên lý tổ chức được bao hàm. Kết
quả học tập ở đây thể hiện một mức độ trí tuệ cao hơn so với mức hiểu và áp
dụng vì nó đòi hỏi một sự thấu hiểu cả nội dung và hình thái cấu trúc của tài
liệu.
- Tổng hợp (Synthesis): được định nghĩa là khả năng sắp xếp các bộ phận
lại với nhau để hình thành một tổng thể mới. Điều đó có thể bao gồm việc tạo ra
một cuộc giao tiếp đơn nhất (chủ đề hoặc bài phát biểu), một kế hoạch hành
động (dự án nghiên cứu), hoặc một mạng lưới các quan hệ trừu tượng (sơ đồ để
phân lớp thông tin). Kết quả học tập trong lĩnh vực này nhấn mạnh các hành vi
sáng tạo, đặc biệt tập trung chủ yếu vào việc hình thành các mô hình hoăc cấu
trúc mới.
- Đánh giá (Evaluation) (hoặc định giá): là khả năng xác định giá trị của
tài liệu (tuyên bố, tiểu thuyết, thơ, báo cáo nghiên cứu). Việc đánh giá dựa trên
các tiêu chí nhất định. Đó có thể là các tiêu chí bên trong (các tổ chức) hoặc các
tiêu chí bên ngoài (phù hợp với mục đích), và người đánh giá phải tự xác định
hoặc được cung cấp các tiêu chí. Kết quả học tập trong lĩnh vực này là cao nhất
trong các cấp bậc nhận thức vì nó chứa các yếu tố của mọi cấp bậc khác.
Các công cụ đánh giá có hiệu quả phải giúp xác định được kết quả học tập
mọi cấp độ nói trên để đưa ra một nhận định chính xác về năng lực của người
được đánh giá về một lĩnh vực chuyên môn.
Thực ra, các mức trong mục tiêu nhận thức do B.Bloom đề xuất không có
ranh giới rõ ràng và khó phân biệt rạch ròi trong việc xác định mục tiêu của quá
trình nhận thức cụ thể và càng khó hơn trong việc đánh giá. Để tiện sử dụng
trong việc xác định mục tiêu và đánh giá việc đạt mục tiêu, các nhà giáo dục qui
6 mức trên thành 3 bậc:

28
Bậc 1: Tái nhận, tái hiện - tương đương với nhớ;
Bậc 2: Tái tạo - tương đương với hiểu, áp dụng;
Bậc 3: Lập luận sáng tạo - tương đương với phân tích, tổng hợp, đánh giá.
2.2.1.3.Lĩnh vực tình cảm
Lĩnh vực tình cảm ít được đánh giá nhất trong số 3 lĩnh vực. Tuy nhiên
lĩnh vực này cũng là một khía cạnh quan trọng trong giáo dục, vì nó ảnh hưởng
đến tình cảm và cảm xúc của người học. Lĩnh vực này bao gồm các mức độ sau:
- Tiếp nhận những hiện tượng và tác nhân kích thích cụ thể.
Ví dụ: Mô tả làm cách nào con người có thể nâng cao chất lượng cuộc
sống nhờ lòng khát khao được làm việc có ích cho bản thân và xã hội.
- Hồi đáp, đáp ứng.
Ví dụ: Đáp ứng nhu cầu của người khác bằng cách chia xẻ tình cảm,
nguồn lực.
- Đánh giá, định giá trị của một sự kiện hay hiện tượng.
Ví dụ: Thể hiện sự kiên định trong suy nghĩ, hành động, không hoang
mang, dao động.
- Thiết lập (tổ chức) những giá trị trong mối liên quan với nhau.
Ví dụ: Xác định được mối quan hệ giữa các giá trị, kiên định trong cuộc
sống.
- Khái quát hoá - tổng hợp các giá trị thành hệ thống giá trị của bản thân.
Ví dụ: Tổng hợp các giá trị văn hoá tinh thần tiếp thu được trong học tập,
cộng tác thành nguyên tắc sống của bản thân.
2.2.1.4. Lĩnh vực tâm lí vận động
Lĩnh vực tâm lí vận động đề cập đến việc rèn luyện các kĩ năng hoạt động
thể chất, liên quan đến sự vận động của chân tay. Lĩnh vực tâm lí vận động được
chia thành các cấp độ sau:
- Vận động phản xạ
Ví dụ: Sự vận động của cơ bắp do có các tác nhân kích thích từ bên ngoài.

29
- Vận động cơ bản
Ví dụ: Các vận động như đi, đứng, ngồi v.v.
- Vận động chuyển giao
Ví dụ: Chuyển giao những thông tin thu được từ mắt sang ngón tay để
chơi một nhạc cụ nào đó.
- Vận động kĩ năng
Ví dụ: Các vận động đòi hỏi sự khéo tay, cẩn thận, có tính toán, như vẽ
tranh, trang trí sân khấu.
- Vận động kĩ xảo, phối hợp thành thạo nhiều kĩ năng.
Ví dụ: Nhảy theo nhạc, sáng tạo trong hội hoạ, âm nhạc v.v.
Như vậy, 3 lĩnh vực: nhận thức, tình cảm và tâm lí vận động là đối tượng
để giáo viên xác định mục tiêu cho hoạt động dạy - học. Điều này hướng giáo
viên quan tâm đến cả 3 lĩnh vực, thay vì chỉ đi sâu vào 1 lĩnh vực nhận thức.
Người học phải được tạo cơ hội để phát triển năng lực trí tuệ, tình cảm và thể
chất để trở thành những con người hoàn thiện.
Về lĩnh vực kĩ năng, kĩ xảo thông qua các thao tác thực hành vận dụng
các kiến thức đã học vào thực tế cuộc sống, cũng có thể được đánh giá theo các
mức sau:
1 - Bắt chước, mô phỏng
Quan sát và làm lại 1 thao tác nào đó.
2 – Thao tác
Nghe chỉ dẫn và thực hiện lại thao tác đó.
3 - Chuẩn hoá
Lặp đi, lặp lại 1 thao tác một cách chính xác mà không cần có hướng dẫn.
4 - Phối hợp
Kết hợp nhiều thao tác theo trình tự 1 cách thuần thục, ổn định.
5 - Tự động hoá
Hoàn thành một hay nhiều thao tác một cách tự nhiên, không đòi hỏi sự

30
gắng sức về thể chất cũng như trí tuệ.
2.2.2. Cách xây dựng mục tiêu
2.2.2.1. Xây dựng mục tiêu là một quá trình
Một giáo viên trước khi lên lớp phải xác định và giải quyết một số vấn đề
nếu họ muốn thành công:
- Hãy làm cho vấn đề mình dạy (thường là theo chương trình) trở thành
nhu cầu đối với học sinh

• Xác định được điều học sinh chưa có và những kinh nghiệm
đã có về vấn đề định dạy.

• Sau đó cần xác định mục tiêu dự kiến cần đạt vào cuối bài
dạy, và tìm ra các phương pháp để đánh giá sự tiến bộ của học sinh theo
những mục tiêu đã đề ra ngay từ đầu.
Nói cách khác người ta bắt đầu bằng xác định cái học sinh cần chiếm lĩnh
rồi mới tìm các con đường giúp học sinh chiếm lĩnh nó và sau đó kiểm tra xem
người học đã chiếm lĩnh mục tiêu chưa.
Quá trình này gồm 3 giai đoạn:
Phân tích tình hình: giai đoạn phân tích cần trả lời các câu hỏi sau:
- Học sinh đã có được những kinh nghiệm gì về chủ đề hay nội dung
giảng dạy (thường dựa vào chương trình đào tạo của các trình độ trước và của
khoá học) để từ đó xác định vấn đề cần giải quyết.
- Vấn đề đó có thể được giải quyết như thế nào?
- Và nếu có thì mục tiêu cần đạt cụ thể của việc giảng dạy là gì?
Nếu không sơ bộ phân tích tình hình thì giáo viên có thể hoàn chỉnh một
bài giảng tuyệt diệu chỉ về hình thức, vì nội dung của nó có thể hoàn toàn vô bổ
vì học sinh hoặc thấy không cần thiết, hoặc đã được nghe nói dưới một hình
thức khác rồi. Việc phân tích hiệu quả hay phân tích mục tiêu cho phép tránh
một sự lãng phí như vậy.
Xây dựng mục tiêu:
- Phác hoạ những mục tiêu chính của bài giảng đó theo các cấp độ.

31
- Những mục tiêu “con” có thể điều chỉnh cho phù hợp với đối tượng cụ
thể trên cơ sở những mục tiêu “xương sống” đã dựng sẵn.
Thực hiện và đánh giá việc đạt mục tiêu:
- Giảng dạy bám theo mục tiêu và lựa chọn phương pháp sao cho phù hợp
để dạt mục tiêu đề ra.
- Nhất thiết phải kiểm tra và đánh giá mục tiêu đã chiếm lĩnh bằng
phương pháp đánh giá phù hợp
2.2.2.2. Phân biệt mục tiêu bài dạy với mô tả bài dạy.
Mục tiêu bài dạy là sự mô tả (hoặc một tổ hợp) các hoạt động, hành vi
(hay thành tích) mà học sinh phải chiếm lĩnh được nếu muốn được công nhận là
có năng lực.
Như vậy, mục tiêu bài dạy là sự mô tả kết quả, sản phẩm mà bài dạy
muốn đạt được, chứ không phải là quá trình dạy học hay các phương pháp, biện
pháp sử dụng để dạy học.
Xem sơ đồ sau:

Vào (1) Bài giảng (2) Ra (3)

1. Điều kiện 2. Mô tả bài dạy 3. Mục tiêu


tiên quyết

1.(Người học có khả năng 2.(Nội dung 3. “Hành động” (người học phải
hiểu nội dung bài giảng) bài dạy) thực hiện được sau bài dạy)

Hãy phân biệt nội dung và mục tiêu của bài dạy sau:

Môn sinh học:


Môi trường và các nhân tố sinh thái.
Liệt kê được 3 kiểu quan hệ sinh thái cùng loài (quần tụ, cách li, lãnh thổ)
và 7 kiểu quan hệ khác loài (cộng sinh, hợp tác, hội sinh, cạnh tranh, động

32
vật ăn thịt, con mồi, ức sinh - vật chủ, ức chế - cảm nhiễm).
Kể và phân tích nguyên nhân tồn tại của sinh vật trong môi trường khắc
nghiệt.
Kể và phân tích sự đa dạng của sinh vật trên trái đất (động vật, thực vật).

Môn vật lí:


- Đo bước sóng ánh sáng. Bước sóng và màu sắc ánh sáng.
- Học sinh phát biểu được khoảng vân (khoảng cách liên tiếp), ánh
sáng đơn sắc (một bước sóng).
- Học sinh trình bày được cách đo bước sóng của ánh sáng bằng
phương pháp giao thoa.
- Học sinh vẽ hình và sử dụng các tính chất hình học và gần đúng
trong lượng giác để chứng minh lại được các công thức giao thoa.

Môn lịch sử
Khởi nghĩa nông dân Đàng Ngoài và phong trào Tây Sơn. Khởi nghĩa
nông dân Đàng Ngoài.
- Học sinh chỉ trên bản đồ địa điểm của cuộc khởi nghĩa Tây Sơn và kể ra
được những diễn biến chính của nó.
- Học sinh kể 5 nguyên nhân chính dẫn đến chiến thắng Ngọc Hồi - Đống
Đa. và phân tích những nguyên nhân đó

Môn ngữ văn


- Liên kết văn bản, các hình thức liên kết văn bản.
- Xác định được hình thức liên kết của các câu trong văn bản cho
sẵn và gọi tên các hình thức liên kết đó. Cho một ví dụ tương tự

33
“ Anh cứ hát. Hết sức hát. Gò ngực mà hát. Há miệng ra mà hát.
Hát như con cóc kêu thương”.
(Nguyễn Công Hoan)

Như vậy mục tiêu bài giảng nói rõ cái mà học sinh phải có khả năng làm
được sau khi học xong một bài học, còn việc mô tả bài giảng chỉ kể ra nội dung
của việc giảng dạy mà thôi.
Sự phân biệt này rất quan trọng vì việc mô tả nội dung bài giảng không
chỉ ra được cái đích cần đến, bằng cách nào để đến được đích đó và càng không
chỉ ra được ta đã đến đích hay chưa.
2.2.2.3. Độ tin cậy và giá trị của mục tiêu bài dạy
Mục tiêu (bài giảng) như đã phân tích ở trên là sự mô tả một hành động
(hay nói rộng hơn là hành vi) mà ta mong muốn học sinh có được, khi học sinh
có thể chứng tỏ là đã thực hiện được hành vi mong muốn đó, tức là người thầy
đã thành công.
Một mục tiêu được xem là tin cậy và có giá trị khi nó truyền đạt chính xác
ý định của thầy giáo để người khác cũng như học sinh hiểu đúng như chính bản
thân thầy giáo hiểu.
Ví dụ, bạn đã xác định mục tiêu của một bài dạy và truyền đạt nó cho một
đồng nghiệp và người này dạy cho học sinh hành động theo đúng cách mà bạn
cho là phù hợp với cái mà bạn có trong ý đồ thiết kế mục tiêu. Khi đó bạn đã xác
định được một mục tiêu tin cậy và có giá trị.
Để làm được việc này cần trả lời 3 câu hỏi:
1) Học sinh phải làm được gì?
2) Làm được trong điều kiện nào? bằng cách nào?
3) Làm được với mức độ ra sao?
Như vậy một mục tiêu được xem là tin cậy và có giá trị khi nó xác định
cái mà học sinh có thể và phải làm được (khả năng hoàn thành), đồng thời mục
tiêu phải xác định được những điều kiện có thể xảy ra để hoàn thành hành vi đó,

34
và nếu cần mục tiêu mô tả cả chuẩn hay mức độ chấp nhận được khi thực hiện
hành vi đó.
Hành vi của học sinh có thể là lời nói hay hành động. Ta có thể yêu cầu
học sinh trả lời miệng hay viết, hoặc giải quyết một vấn đề... Nhưng dù cho có
dùng cách nào thì ta cũng chỉ có thể suy diễn điều học sinh đang có trong đầu
thông qua quan sát khả năng hoàn thành của họ.
Điều cơ bản của một mục tiêu có giá trị là nó chấp nhận một thể loại khả
năng hoàn thành. Thể loại được chấp nhận này là một bằng chứng thuyết phục
về việc học sinh đã đạt mục tiêu.

Ví dụ: Học sinh chỉ ra được trên bản đồ vị trí của cuộc khởi nghĩa Tây
Sơn và kể ra những diễn biến chính của nó - là bằng chứng của việc học sinh
đã hiểu về cuộc khởi nghĩa Tây Sơn.

Qua phần trình bày ở trên ta cũng thấy một mục tiêu giảng dạy được xác
định sao cho có độ tin cậy và giá trị chỉ bao hàm một phần nhỏ ý đồ giảng dạy
của bạn. Và để bao quát toàn bộ chương trình môn học bạn phải xác định nhiều
mục tiêu, mỗi mục tiêu đôi khi phải diễn giải dài. Việc xác định này càng cụ thể,
càng tường minh bao nhiêu thì bạn càng có cơ sở để tin vào chất lượng bài giảng
của bạn bấy nhiêu.
2.2.2.4. Mô tả hành vi trong mục tiêu
Cách xác định một mục tiêu khi hành vi có thể và cần được hoàn thành là
một hành vi nội tại, không quan sát được.
Hãy so sánh các động từ sau đây:
- Chạy - Hiểu
- Viết và - Nắm vững
- Giải (bài toán) - Quán triệt
-.... - Có hứng thú
Thật dễ dàng để quan sát học sinh chạy hay viết, hoặc kiểm tra xem học
sinh có giải được bài toán không. Còn làm thế nào để chứng minh sự hứng thú
hay sự hiểu biết - Đó là những trạng thái mà muốn lượng giá cần có những biểu
hiện cụ thể của các trạng thái ấy.

35
Để phân biệt người ta gọi các hành vi có thể quan sát được là khả năng
hoàn thành ngoài và loại không quan sát được là khả năng hoàn thành trong. Để
tránh mọi hiểu lầm, khi miêu tả một mục tiêu đòi hỏi khả năng hoàn thành trong
bạn hãy thêm vào đó một chỉ số về hình thức hoàn thành hành vi đó.
Thí dụ: bạn muốn biết học sinh có khả năng xác định các kết từ trong một
văn bản nào đó, hãy xác định mục tiêu: “Biết xác định các kết từ bằng cách gạch
dưới hoặc khoanh tròn những kết từ trong một văn bản cho trước”.
Như vậy khả năng hoàn thành trong đã trở nên cụ thể và có thể kiểm tra
được. Như vậy bạn đã biết biểu hiện của khả năng hoàn thành là “gạch dưới”
hay “khoanh tròn”; còn mục tiêu cơ bản là xác định các kết từ.
Tuy nhiên trong nhiều trường hợp để mục tiêu của thày có khả năng
truyền đạt tường minh ý đồ sư phạm, mục tiêu phải mô tả rõ hành vi cuối cùng
bằng cách xác định những điều kiện học sinh phải tuân theo khi muốn chứng
minh đã đạt mục tiêu.
Thí dụ:
- Cho một bài toán thuộc loại sau ...
- Cho một bộ công cụ ....
- Cho một thước và compa ....
- Không cần bất cứ dụng cụ nào...
- Không dùng tài liệu tham khảo .....
Vậy đáng lẽ viết đơn giản là: “học sinh có khả năng giải các bài toán đại
số”, có thể xác định mục tiêu tường minh hơn: “cho một phương trình đại số
tuyến tính có một ẩn số, học sinh cần phải tìm được nghiệm của phương trình
mà không dùng tài liệu hoặc máy tính.”
Khi cung cấp các điều kiện (trong trường hợp cần thiết) để mục tiêu được
tường minh giáo viên cần trả lời các câu hỏi sau:
1) Học sinh có quyền có các thông tin gì?
2) Cái gì phải từ chối đối với học sinh?
3) Bạn muốn hành vi của học sinh diễn ra trong điều kiện nào?

36
Trả lời được các câu hỏi này trong quá trình xác đinh mục tiêu, giáo viên
sẽ có được mục tiêu bài giảng có độ tin cậy và giá trị cao. Trong một số trường
hợp khi muốn làm sáng tỏ hơn các điều kiện trong đó học sinh phải hoàn thành
một hành vi, thày giáo có thể thêm vào đó một ví dụ minh hoạ.
Ví dụ: Mục tiêu của một giờ luyện nghe hiểu tiếng Anh là học sinh nghe
hiểu một câu hỏi tiếng Anh và phải chứng minh việc hiểu câu hỏi đó bằng cách
trả lời bằng một câu tiếng Anh thích hợp kèm theo có một băng ghi âm 10 câu
hỏi bằng tiếng Anh về giao dịch ngân hàng thông thường. Sau mỗi câu hỏi học
sinh có 10 giây để trả lời, ghi câu trả lời vào băng.
Như vậy mục tiêu của bài giảng là học sinh có khả năng trả lời các câu hỏi
bằng tiếng Anh theo chủ đề giao dịch ngân hàng trong điều kiện lớp học, tốc độ
đối thoại bình thường, thời gian trả lời 1 câu hỏi là 10 giây. Tất nhiên có thể xác
định mục tiêu dài như vậy. Nhưng cũng có thể chỉ cần ghi thêm vào mục tiêu là
có băng kèm theo.
Một ví dụ khác: mục tiêu của bài giảng “biết giải phương trình tuyến tính
1 ẩn số”. Bạn có thể hoàn thành mục tiêu này khi thêm vào đó một ví dụ: biết
giải phương trình tuyến tính một ẩn số:
Tìm x trong ví dụ sau:
a) 2x + 4 = 12
b) 9x - 3 = 6
Đương nhiên, việc đưa vào mục tiêu các điều kiện, ví dụ chỉ được thực
hiện khi cần thiết và với mức độ vừa phải để mục tiêu đạt được độ tin cậy và giá
trị như đã xác định ở phần trên.
Tóm lại
- Một mục tiêu sư phạm mô tả hành động cụ thể mà bạn mong đợi ở học
sinh chứ không phải là quá trình giảng dạy hoặc là sự trình bày hay tóm tắt một
bài giảng.
- Một mục tiêu bao giờ cũng nói lên một khả năng hoàn thành bằng cách
chỉ ra cái mà học sinh có thể và phải thực hiện được khi họ đạt mục tiêu. Mục
tiêu đó phải được những người khác hiểu như chính người xác định mục tiêu đó

37
hiểu
- Muốn xây dựng một mục tiêu :
+ Viết một câu diễn đạt ý đồ chính hay khả năng hoàn thành mà thầy giáo
mong đợi ở học sinh.
+ Nếu hoạt động thuộc lĩnh lực trừu tượng thêm vào đó một chỉ tố hành vi
cho phép đánh giá mục tiêu có đạt hay không.
+ Mô tả những điều kiện cơ bản trong đó khả năng hoàn thành phải thực
hiện.
Như vậy học sinh không phải tìm hiểu ý đồ của thầy giáo qua các từ đa
nghĩa kiểu “hiểu”, “biết”, “quán triệt”. Ở đây, thầy giáo đã xác định cho học
sinh và cho chính bản thân một loạt hoạt động mà thầy chấp nhận như bằng
chứng thành công của học sinh. Qua đó thầy cũng xác định được các tài liệu và
phương pháp phù hợp cho việc giảng dạy và có được cơ sở để đánh giá hiệu quả
hoạt động của trò cũng như của thầy.
Gợi ý về một số động từ chỉ mục tiêu cần đạt về kiến thức
Các động từ có thể dùng để phân loại mục tiêu theo thang bậc nhận thức.

Thang bậc nhận thức Các động từ có thể dùng

1. Nhớ, nhận thức Xác định, phân biệt, nhớ lại, nhận ra, viết ra, kể
(Knowledge) lại..

2.Hiểu (Comprehension) Dịch ra, chuyển hoá, sắp xếp lại, giải thích, dự
đoán, bổ sung….

3. Vận dụng Ứng dụng, liên hệ, phân loại, phát triển, cấu
(Application) trúc lại, lựa chọn…

4.Phân tích (Analysis) Phân biệt, đối chiếu, so sánh, phân tích.

5. Tổng hợp (Sythesis) Phạm trù hoá, lập kế hoạch, thiết kế, tổ chức…

6.Đánh giá (evaluation) Chứng minh, đánh giá, quyết định, thẩm
định….

38
Những từ kiểu “hiểu”, “biết”, “quán triệt” v.v. không xác định được giáo
viên muốn học sinh của mình làm được gì. Cách làm tốt hơn là xác định xem khi
học sinh đã “hiểu”, “biết”... giáo viên mong muốn họ cuối cùng sẽ thực hiện
được hành động gì một cách tường minh nhất.
2.2.2.5. Thông số đo mục tiêu.
Trong nhiều trường hợp sau khi mô tả hành vi mà học sinh có thể và phải
hoàn thành, giáo viên có thể nhấn mạnh ý đồ sư phạm của mình bằng cách mô tả
thêm tiêu chuẩn hay chất lượng của hành vi mà giáo viên chờ đợi ở học sinh.
Nếu người giáo viên có thể chỉ rõ ít nhất những khả năng hoàn thành chấp nhận
được đối với một mục tiêu, thì giáo viên đó sẽ tìm được những phương cách
thực hiện chương trình dạy học của mình để đạt tới các chuẩn đó.
Tốc độ
Thông thường khái niệm thời gian giới hạn được dùng khi xác định mục
tiêu mà học sinh phải hoàn thành trong một thời gian nhất định. Trong trường
hợp tốc độ là một đặc điểm quan trọng của khả năng hoàn thành một hành vi nào
đó được xem là mục tiêu của bài giảng, thì khi xác định mục tiêu cần có yếu tố
này.
Thí dụ:
Sau khoá huấn luyện vận động viên phải có khả năng chạy 100m trên mặt
đường pit không quá 11 giây.
Sau bài giảng học sinh kể ra được 5 lớp ý nghĩa của văn bản văn học
trong vòng 5 phút.
Độ chính xác
Trong nhiều trường hợp, khi mục tiêu là khả năng hoàn thành cần một độ
chính xác chấp nhận được, thì yếu tố này cũng được xem là một thành phần
quan trọng của mục tiêu:
Thí dụ: Sau bài học, với thước và compa học sinh có thể vẽ được đường
phân giác của một góc bất kỳ lớn hơn 5o và với độ chính xác là ≤ 1o.
Ở đây vẽ đường phân giác là khả năng hoàn thành, nhưng để đạt mục tiêu,

39
học sinh cần phải vẽ được với độ chính xác nhỏ hơn 1o.
Độ sáng tạo
Hình thành khả năng sáng tạo cho học sinh cũng là một mục tiêu quan
trọng của mỗi bài học. Để xác định sự sáng tạo được hình thành hay không, giáo
viên thường kiểm tra khả năng ứng dụng kiến thức vào thực tiễn, khả năng lý
giải các vấn đề mới của thực tiễn.
Kết luận chung
- Một mục tiêu sư phạm xác định tin cậy và có giá trị là sự mô tả cái mà
học sinh có thể và phải làm được khi họ muốn chứng minh là đã đạt mục tiêu và
đó cũng là cách mà giáo viên có thể kiểm tra xem học sinh đã đạt mục tiêu chưa.
- Muốn mô tả hành vi cuối cùng (tức là cái mà học sinh có thể và phải làm
được) giáo viên cần:
+ Phân định và chỉ rõ tên hành vi.
+ Xác định những điều kiện quan trọng trong đó hành vi phải hoàn thành,
hoặc chỉ ra cách thực hiện hành vi đó.
+ Xác định tiêu chuẩn mong muốn hoặc chấp nhận được của khả năng
hoàn thành hành vi.
- Hãy xác định mỗi mục tiêu bằng một đoạn văn và cùng học sinh thảo
luận sao cho thầy và trò cùng hiểu như nhau về mục tiêu đó.
- Nếu giáo viên cung cấp cho mỗi học sinh một bản mục tiêu của bài học,
của chương trình ngay vào giờ đầu tiên của môn học thì sẽ còn rất ít việc phải
làm.
Cụ thể hoá (hay hành vi hoá) các mục tiêu tổng quát của một chương trình
đào tạo của một bậc học (bậc đại học chẳng hạn) là một việc làm khó. Nhưng
đây là việc cần và có thể làm được. Hệ mục tiêu cho phép cụ thể hoá mục tiêu
tổng quát thành các mục tiêu cụ thể hơn và cuối cùng là một hệ các hành vi có
thể quan sát được và nhờ đó có thể đo lường, đánh giá được mục tiêu đã đạt
được hay chưa.

40
CHƯƠNG 3

PHƯƠNG PHÁP VÀ KỸ THUẬT TRONG ĐÁNH GIÁ

3.1. Phương pháp đo lường và đánh giá


Đánh giá học tập của học sinh theo truyền thống thường bằng các bài
kiểm tra. Bài kiểm tra tốt được thiết kế và sử dụng để tìm hiểu xem đã đạt được
mục tiêu dạy học hay chưa. Bài test là một dụng cụ có giá trị, hữu ích, không chỉ
đánh giá sự tiến bộ của học sinh mà còn là một phương tiện kiểm tra việc dạy
học diễn ra như thế nào. Các cách làm khác như quan sát của người giáo viên,
nghiên cứu tài liệu hồ sơ học sinh, sự trình bày của học sinh được sử dụng
thường xuyên như một phương tiện đánh giá thành tích của học sinh (Airasian,
1994). Việc tập hợp những kĩ thuật (cách tiến hành) này để có thể đánh giá thực
tế/thành tích của học sinh.
Trong phần này, chúng ta giải quyết vấn đề chính của việc dạy học có
hiệu quả là các phương pháp Đánh giá kết quả học tập của học sinh. Giản đồ
3.1 minh họa 3 mặt quan trọng của dạy học có hiệu quả là: Xác định mục tiêu
học tập, lựa chọn phương pháp dạy học và đánh giá kết quả học tập.
Giản đồ 3.1 minh họa bằng đồ thị vị trí quan trọng của việc đánh giá học
tập học sinh trong quá trình dạy – học. Giáo viên cần phải hình thành mục tiêu,
lựa chọn phương pháp và tài liệu để đạt được những mục tiêu đó, sử dụng kết
quả đánh giá xác định quá trình tiến triển của học tập. Nếu học sinh học tốt thì
cần phải đưa thêm những tài liệu mới, khó hơn cho học sinh, còn nếu còn hạn
chế thì người giáo viên nên ôn hay nhắc lại tài liệu cho các em.
Các bài kiểm tra thường nhấn mạnh vào thành tích của học sinh nhưng
liệu các bài kiểm tra có bao quát được những gì mà học sinh đã học hay không?
Liệu học sinh đã đạt được mục tiêu đề ra để chuyển sang một giai đoạn tiếp theo
hay không. Mục tiêu giữ một vai trò rất quan trọng và rõ ràng, các mục tiêu cần
phải được định nghĩa rõ ràng và phát biểu thành lời cho phép thực hiện được
việc đo đạc và cụ thể hóa những thay đổi về hành vi.
Tuy nhiên, kiểm tra còn giữ chức năng hướng dẫn. Tuỳ thuộc vào bản
chất điểm số của các bài kiểm tra, kết quả bài kiểm tra sẽ minh họa sinh động

41
những điểm nào còn hạn chế và cần được khắc phục, và cần những tài liệu nào
để đáp ứng được nhu cầu phát triển liên tục. Phân tích cẩn thận chi tiết điểm số
các bài kiểm tra sẽ xác định được những khó khăn học tập cả cho cá nhân và lớp
học. Nếu một cá nhân hay lớp học nào không đạt được mục tiêu, giáo viên cần
phải nghiên cứu nguyên nhân. Ở đây có 3 khả năng: học sinh (ví dụ như ốm vào
lúc làm bài kiểm tra, có những buồn phiền cá nhân), độ khó của tài liệu hay
phương pháp dạy học của giáo viên. Nếu lớp học như một tập thể thống nhất
cùng có kết quả kiểm tra không tốt như nhau,trong khi đó tài liệu lại thành công
đối với lớp khác thì giáo viên cần phải xem xét một số khả năng đối với kết quả
của lớp học như: Thiếu những thông tin cơ bản, trình bày quá nhanh, hay hạn
chế hoạt động của học sinh trong khi tài liệu đó yêu cầu liên quan đến cá nhân
nhiều hơn. Ngoài ra: các giáo viên có tay nghề sẽ sử dụng kết quả của bài kiểm
tra như một hình thức tự đánh giá (self- evaluation) - đó là kết quả của kiểm tra
thông tin về việc dạy học.
Giản đồ 3.1: Kết hợp hoạt động dạy học và đánh giá (assessment)

Tiến đến Lặp lại


* Tài liệu Đánh Mức độ mức tiếp đánh giá
giá. đạt được theo
* Các mục tiêu (Asses mục tiêu Khẳng
sment) định kết
được tuyên bố Tìm cách
quả,
khắc phục học nếu cần
* Các phương sinh châm
pháp thiết
hiểu/ôn lại bài

Kiểm tra và các hoạt động đánh giá khác còn cung cấp thông tin về các
điều kiện học tập. Chúng ta biết gì về động cơ của lớp học? Liệu học sinh có
nhận ra họ đang đối mặt với một vấn đề hay không? Liệu giáo viên có cung cấp
cơ hội để học sinh thực hành những hành vi mong đợi hay không? Học sinh có
đủ thời gian hay không? Liệu học sinh có được sự thỏa mãn qua học tập hay
không? Hướng dẫn bao nhiêu là cần thiết? Học sinh có được những thông tin
ngược hay không?
Mặc dù giáo viên sử dụng rất nhiều kĩ thuật để đánh giá học sinh, nhưng
có lẽ hình thức thông dụng nhất là bài kiểm tra giấy do chính giáo viên xây

42
dựng. Các bài kiểm tra này thường bao gồm các bài luận hay các câu hỏi nhiều
lựa chọn. Bài test nhiều lựa chọn và bài test giấy thường là những bài test được
sử dụng thông dụng nhất. Các loại như: Đúng – Sai; bài luận; và bài kiểm tra
việc làm (performance test) cũng được giáo viên sử dụng tương đối phổ biến.
Các câu hỏi nhiều lựa chọn rất khó chuẩn bị nhưng có thể tính điểm rõ ràng và
đạt đến mục tiêu. Mặt khác, các bài kiểm tra luận (Essay tests) tương đối dễ
chuẩn bị nhưng việc tính điểm lại rất khó.
Có thể phân chia các phương pháp trắc nghiệm ra làm ba loại lớn: loại
quan sát, loại vấn đáp và loại viết

Các phương pháp trắc nghiệm

Quan sát Viết Vấn Đáp

Trắc nghiệm khách quan Trắc nghiệm tự luận


(Obfective tests) (Essay tests)

Tự luận tự do Tự luận theo cấu trúc

Ghép đôi Điền khuyết Trả lời ngắn Đúng sai Nhiều lựa chọn

3.1.1. Phương pháp quan sát


Đối với hầu hết giáo viên, không có hoạt động đánh giá nào bao quát rộng
như việc quan sát hành vi, thao tác thường ngày của học sinh. Giáo viên liên tục
nhìn vào học sinh và lắng nghe những gì đang diễn ra trong lớp. Các quan sát
này được tiến hành để xác định các yếu tố như:
- Bản chất sự tham gia của học sinh vào thảo luận lớp.
- Các kỹ năng giao tiếp giữa các cá nhân trong nhóm.

43
- Độ chuẩn xác các câu trả lời của học sinh.
- Bản chất của các câu trả lời của học sinh
- Cách phản ứng của học sinh đối với một bài tập.
- Cách phản ứng của học sinh đối với điểm kiểm tra.
- Nhịp độ bài học.
- Mức độ hứng thú của học sinh.
- Mức độ hiểu biết thể hiện qua các câu trả lời của học sinh.
Quan sát thường ngày không có qui trình cụ thể nhưng cũng không thể
tuỳ tiện. Quan sát bao gồm:
a. Đánh giá hành vi
Giáo viên chủ yếu dựa vào cử chỉ, biểu hiện nét mặt và ánh mắt để quan
sát chính xác và lý giải hành vi của học sinh. Các hành động như vậy được gọi
là không lời vì thông điệp được chuyển tải bởi một “cái gì đó” của học sinh chứ
không phải nội dung mà học sinh nói ra. Các hành vi không lời giúp giáo viên
đánh giá cả ý nghĩa và biểu cảm. Ví dụ: Chúng ta dựa vào biểu hiện nét mặt và
cơ thể để xác định các ý nghĩa của thông điệp. Các biểu hiện ngắt quãng của
thông điệp nói cũng theo cách mà dấu cảm thán, dấu hỏi, in đậm và in nghiêng
nhấn mạnh ý nghĩa của ngôn ngữ viết. Sự ngắt quãng này xảy ra theo các cách
sau:
- Khẳng định hoặc nhắc lại.
- Từ chối hoặc bối rối.
- Củng cố hoặc nhấn mạnh.
- Điều khiển và điều chỉnh.
Giáo viên sẽ thấy rằng biểu cảm và cảm xúc thường được chuyển tải rõ
ràng và chính xác hơn qua các dấu hiệu bằng lời và không lời. Các dấu hiệu
không lời không những là nguồn thông tin phong phú về tác động ở lớp học mà
còn ổn định và nhất quán nhất. Do hầu hết các hành vi không lời khó kiểm soát
được, nên các thông điệp cũng tương đối dễ bị bóp méo và đánh lừa người khác.
Điều này có thể nhận ra được khi giáo viên chủ ý quan sát hành vi không lời,

44
xác định tâm trạng, tinh thần, thái độ, sự tin tưởng, phản ứng, nhiệt tình, tức
giận, lo sợ và các tâm tính khác. Điều này đặc biệt có ích khi thông điệp cử chỉ
mâu thuẫn với lời nói. Đó là cách học sinh nói, qua hành vi cử chỉ, là quan
trọng, hơn là những gì được nói.
Để thấy rõ biểu cảm và cảm xúc của học sinh, giáo viên dựa vào các
thông điệp sau:
+ Biểu hiện nét mặt: Một nguồn thông tin quan trọng nhất chính là mặt, vì
đây là nơi xuất hiện chính của các biểu cảm và ít khi có ý nghĩa trái ngược.
Khuôn mặt thể hiện rất nhiều thông điệp một phần vì tập trung các cơ phức tạp
và linh hoạt. Để biết biểu hiện trên nét mặt nên tập trung quan sát vào 3 khu vực
chính là lông mày và trán; mắt, mi mắt và mũi; phần dưới của mặt. Phần trên
của mặt thường biểu hiện các cảm xúc như quan tâm và tức giận. Phần thấp hơn,
đặc biệt là miệng sẽ biểu hiện hạnh phúc và thích thú. Cười, cau mày, mím môi,
cằm nâng lên, miệng mím chặt và các biểu hiện khác cũng khá rõ khi diễn đạt.
Để phục vụ các mục đích giảng dạy, giáo viên cần hết sức cẩn thận khi
xem xét các biểu hiện nét mặt bối rối và thích thú. Giáo viên sử dụng nhiều
những biểu cảm này để xác định độ thông hiểu và động cơ của học sinh.
Một biểu hiện có nhiều thông tin nhất của khuôn mặt là mắt và trạng thái
giao tiếp của mắt. Ánh mắt cho biết sự sẵn sàng giao tiếp và giao tiếp liên tục
biểu hiện sự tự tin. Mắt nhìn đi chỗ khác thường có ý là học sinh không muốn
trả lời, thiếu tự tin, hay thờ ơ.
+ Ngôn ngữ cử chỉ: Giống như biểu hiện nét mặt và giọng nói, cử chỉ,
động tác và điệu bộ cũng truyền đi các thông điệp. Ý nghĩa của các biểu hiện cử
chỉ được hiểu rõ nhất khi xem xét đến 5 loại hành vi không lời, mỗi loại được
căn cứ vào một chức năng hay mục đích khác nhau: biểu tượng, minh hoạ, tác
động, trưng bày, điều chỉnh và thích ứng.
- Một cử chỉ biểu tượng là một cử chỉ có ý nghĩa của một hay hai từ nói.
Các biểu tượng được sử dụng để giao tiếp liên tục một thông điệp đặc biệt. Hầu
hết các biểu tượng là thay cho lời nói.
- Cử chỉ minh hoạ được sử dụng để làm rõ ý nghĩa và nhận thức, nhấn
mạnh những gì đang được nói. Loại cử chỉ này bổ trợ cho các thông điệp biểu

45
cảm.
- Cử chỉ tác động cho biết cảm xúc qua vị trí và điệu bộ của cơ thể và các
cử chỉ nhất định.
- Điều chỉnh được sử dụng để chỉ sự bắt đầu, độ dài và kết thúc của các
thông điệp bằng lời. Học sinh sử dụng các cử chỉ này thông báo cho giáo viên
biết liệu họ có muốn trả lời, kết thúc bằng nhận xét hay suy nghĩ, hay muốn tiếp
tục nói hay không.
- Thích ứng là một nguồn thông tin phong phú về thái độ, mức độ tự tin
và lo lắng.
b. Đánh giá các dấu hiệu liên quan đến giọng nói
Các hành vi liên quan đến giọng nói bao gồm âm điệu, độ lớn, ngừng,
lặng yên, độ cao, chuyển điệu, cách từ, nhấn mạnh và các yếu tố khác của giọng
nói thêm vào nội dung được nói. Khả năng cung cấp thông tin của các dấu hiệu
lời nói về mức độ nắm hiểu, tin tưởng, và trạng thái cảm xúc của học sinh chỉ
biểu hiện qua nét mặt.
Giáo viên cần phải cẩn thận để tránh kết luận là thiếu kiến thức, tự tin, lo
lắng hay mạnh mẽ chỉ căn cứ duy nhất vào các dấu hiệu lời nói. Giống như hành
vi không lời, giọng nói là một trong số nhiều bằng chứng mà giáo viên cần phải
xem xét để đưa ra đánh giá chuẩn xác. Giáo viên phải quan sát được các dấu
hiệu lời nói, cử chỉ, lý giải đúng và tiến hành điều chỉnh khi cần thiết.
Quan sát thường ngày của giáo viên tuy giúp giáo viên có được các thông
tin trực tiếp, nhưng nó vẫn mang nặng tính chất định tính và chủ quan từ phía
giáo viên. Trong khi quan sát, người giáo viên thường mắc một số sai sót sau:
- Khoan dung hay độ lượng: giáo viên là người quan sát thường là như
vậy.
- Ấn tượng ban đầu: ấn tượng ban đầu của giáo viên có tác động sai lệch
cho các quan sát tiếp theo.
- Ấn tượng mới: Phân tích của giáo viên bị ảnh hưởng sai bởi quan sát
mới nhất.
- Các lỗi khái quát lôgic: giáo viên cho rằng một số cử chỉ khái quát

46
chung các mặt khác.
- Không thừa nhận mình: giáo viên không để ý tới ảnh hưởng của mình
đối với học sinh.
- Lấy mẫu không đúng: giáo viên lý giải sai các hành vi, không phản ánh
đúng học sinh, hay không xảy ra thường xuyên để đủ tin cậy.
- Quan sát có thành kiến: thành kiến có sẵn của giáo viên hay sự rập
khuôn làm sai ý nghĩa của những gì quan sát được.
- Không đánh giá học sinh đúng bối cảnh: giáo viên không có sự giải
thích của học sinh để làm sáng tỏ ấn tượng của mình.
- Phản ứng của học sinh khi bị quan sát: một số học sinh thường bối rối
hay không thoải mái khi giáo viên quan sát mình.
- Không quan sát được hành động khác do diễn biến quá nhanh: giáo viên
có thể bỏ qua các hành vi quan trọng do diễn biến nhanh ở lớp.
- Không cùng lúc quan sát được các hành động liên quan: giáo viên có
thể không tiếp nhận được một thông điệp khác được chuyển tả đi cùng lúc.
- Sự giả tạo của học sinh: giáo viên có thể không nhận ra học sinh đang
giả tạo.
3.1.2. Phương pháp vấn đáp
Vấn đáp được sử dụng thường xuyên trong giảng dạy để theo dõi mức độ
hiểu bài của học sinh. Các câu hỏi vấn đáp được sử dụng để kiểm tra hoặc xác
định mức độ hiểu bài dưới dạng phỏng vấn hoặc hội kiến.
Giáo viên cần phải liên tục theo dõi sự hiểu bài của học sinh trong lúc
dạy. Cùng với việc quan sát các hành vi, giáo viên nên căn cứ vào khả năng trả
lời câu hỏi của học sinh trong lúc dạy để biết liệu học sinh có thực sự hiểu bài
hay có thể hiện các kỹ năng không. Do vậy, câu hỏi giáo viên nêu ra trong lớp
học và sự phối hợp giáo viên – học sinh tiếp đó là những thành tố quan trọng của
giảng dạy có hiệu quả. Vì vậy, đặt câu hỏi miệng là một phương pháp hữu hiệu
để đánh giá sự tiến bộ của học sinh trong giảng dạy.
Đặt câu hỏi đặc trưng diễn ra dưỡi 3 hình thức: giáo viên đặt câu hỏi để
ôn lại nội dung, thảo luận và phát vấn. Ôn lại bài do giáo viên hướng dẫn được

47
thực hiện nhanh để học sinh nắm vững kiễn thức trọng tâm bài học. Thảo luận
giúp học sinh phát vấn, thảo luận, trao đổi ý tưởng, nhận xét làm rõ các vấn đề,
phát triển tư duy và giải quyết một vấn đề. Phát vấn, phổ biến nhất, diễn ra giữa
hai hình thức trên. Trong khi giới thiệu ngữ liệu, giáo viên đặt câu hỏi để cuốn
hút học sinh vào bài. Các câu hỏi được xen vào trong khi giảng nhằm giúp học
sinh hiểu nội dung bài.
Giáo viên đặt câu hỏi nhằm mục đích chính:
+ Lôi cuốn học sinh tham gia vào bài học: câu hỏi có thể thu hút sự chý ý
của học sinh một cách dễ dàng và hiệu quả, lôi cuốn họ tham gia vào bài học.
Câu hỏi sẽ thách thức các quan niệm, khích lệ học sinh, làm cho họ suy nghĩ về
chủ đề thảo luận bằng cách tạo ra sự không hoà hợp, mất cân đối hoặc mất thăng
bằng.
+ Khuyến khích khả năng tư duy và khả năng lĩnh hội của học sinh: câu
hỏi có thể nâng cao khả năng lập luận và lĩnh hội của học sinh bằng cách giúp
họ tư duy thấu đáo và diễn đạt bằng lời những ý tưởng của mình. Tư duy một
cách tích cực xuyên suốt các câu trả lời sẽ nâng cao khả năng lĩnh hội vấn đề của
học sinh. Lắng nghe các câu trả lời của các học sinh khác cũng giúp nâng cao
chất lượng học tập bởi những câu trả lời này thể hiện một phương pháp diễn đạt
các ý tưởng có nghĩa hơn so với phương pháp giải thích các vấn đề của giáo
viên. Điều này sẽ thành công nếu các câu hỏi hiệu quả và gợi ra các thông tin có
ích cho giáo viên.
+ Ôn lại nội dung quan trọng: câu hỏi báo hiệu cho học sinh biết về nội
dung quan trọng phải học tập, tạo cơ hội cho học sinh đánh giá mức độ nắm hiểu
của họ trong lĩnh vực này. Loại câu hỏi đặt ra này cũng chỉ ra phương pháp học
sinh cần chuẩn bị để thể hiện khả năng hiểu bài của họ.
+ Điều khiển học sinh: câu hỏi dùng để kiểm soát hành vi của học sinh và
quản lý lớp học. Câu hỏi ngẫu nhiên được đặt ra cho những học sinh khác nhau
và yêu cầu trả lời ngắn gọn, đúng, sẽ duy trì được sự chú ý của học sinh. Giáo
viên thường đặt một câu hỏi riêng cho một học sinh không chú ý vào bài để
ngăn chặn hành vi không thích hợp. Ngược lại, cũng có thể dùng câu hỏi để
củng cố hành vi tốt. Câu hỏi còn được dùng để nhắc nhở học sinh về những qui
định và phương thức của lớp học. Thông qua việc sử dụng các câu hỏi hay giúp

48
lôi cuốn học sinh vào học tập, phòng ngừa được khả năng của những hành vi
không đúng đắn của học sinh.
+ Đánh giá sự tiến bộ của học sinh: mục đích phát vấn cuối cùng là để thu
thập thông tin về sự hiểu bài và tiến bộ của học sinh. Để đạt được mục đích này,
câu hỏi phải hiệu quả, gợi ra được những thông tin hữu ích cho giáo viên.
Mục đích phát vấn của giáo viên trong quá trình dạy là nhằm cung cấp
cho học sinh các thông tin chính xác về những gì học sinh biết và có thể làm
được. Khi xác định được mục đích này, các gợi ý và kế hoạch dưới đây sẽ trợ
giúp giáo viên:
(1) Nêu câu hỏi rõ ràng và súc tích để học sinh nắm được chủ đích của
câu hỏi: Học sinh sẽ hiểu câu hỏi nếu họ biết cách trả lời. Học sinh sẽ thấy câu
hỏi mập mờ nếu có quá nhiều khả năng trả lời hay nếu câu hỏi quá chung chung.
(2) Gắn câu hỏi với mục tiêu học tập: Các câu hỏi giáo viên đưa ra phải
phản ánh được mục tiêu học tập, mức độ nhấn mạnh các chủ đề khác nhau sẽ
được đánh giá chính thức hơn trong bài kiểm tra một đơn vị học tập và cấp độ
khó của các mục tiêu học tập.
Gắn câu hỏi với các mục tiêu học tập đòi hỏi các câu hỏi đặt ra phải gợi
được các câu trả lời đúng với mục tiêu học tập. Để đạt được mục tiêu này, phần
lớn các câu hỏi miệng sẽ phải tương xứng với mục tiêu kiến thức hay lập luận.
Mục tiêu kiến thức tập trung vào khả năng ghi nhớ và hiểu bài.
Câu hỏi đánh giá mục tiêu kiến thức đòi hỏi học sinh phải nhớ lại được
các sự kiện như thời gian, địa điểm, khái niệm. Các câu hỏi quy tụ chỉ có một
câu trả lời đúng duy nhất. Các loại câu hỏi kiến thức khác yêu cầu cao hơn sơ
với việc chỉ đơn giản hồi nhớ lại các sự kiện để đánh giá khả năng hiểu và lĩnh
hội của học sinh. Học sinh phải thể hiện họ đã nắm được ý nghĩa của một vấn đề
nào đó bằng cách trả lời các câu hỏi đòi hỏi cao hơn mức độ thuộc lòng.
Cần có thêm thời gian cho các loại câu hỏi yêu cầu lập luận. Các câu hỏi
này có nhiều cách trả lời. Giáo viên yêu cầu học sinh sử dụng kiến thức của
mình để phân tích, tổng hợp, giải quyết vấn đề, sáng tạo và nhận xét. Các câu
hỏi lập luận có các từ hay nghĩa như phân biệt, đối chiếu, tổng hợp, nhận xét,
giải quyết, so sánh, phân tích, liên hệ và đoan.

49
Nói chung, giáo viên nên cân bằng các câu hỏi kiến thức với câu hỏi lập
luận để thu hút sự chú ý và nâng cao khả năng của học sinh.
(3) Thu hút cả lớp: Giáo viên nên hỏi tất cả học sinh, chứ không chỉ tập
trung vào một số học sinh trả lời các câu hỏi. Dễ xảy ra trường hợp chỉ gọi liên
tục vẫn cùng một số học sinh. Do vậy, tốt nhất phải biết được những học sinh
nào đã và chưa trả lời được. Nếu giáo viên đang tiến hành đánh giá sự tiến bộ
của cả lớp, thì cần phải thu thập thông tin từ các học sinh khác nhau, mặc dù đôi
khi học sinh khá cũng gặp khó khăn, lúng túng, như vậy sẽ là tình hình chung
cho tất cả những học sinh còn lại. Nếu học sinh kém hơn trả lời đúng thì khi đó
cả lớp đã sắn sàng để học tiếp.
Sự tham gia của cả lớp sẽ được tăng cường nếu có các câu trả lời hỗ trợ.
Một phương pháp khuyến khích học sinh trả lời là đặt câu hỏi cho tất cả học sinh
biết, cho thời gian suy nghĩ và gọi một số học sinh trả lời.
(4) Cho đủ thời gian chuẩn bị trả lời: Sẽ đánh giá được chính xác hơn
những gì học sinh biết nếu cho học sinh đủ thời gian để nghĩ và trả lời. Học sinh
cần thời gian để sắp xếp câu trả lời. Các câu hỏi lập luận cần nhiều thời gian
chuẩn bị hơn các câu hỏi kiến thức.
(5) Ứng đáp thích hợp với câu trả lời của học sinh: Những ứng đáp của
giáo viên đối với các câu trả lời của học sinh rất quan trọng để tập hợp được
thông tin có giá trị về sự tiến bộ của học sinh, bởi phong cách và phương pháp
của giáo viên – không khí và hình thức tương tác được thiết lập - sẽ tác động đến
việc học sinh có muốn trả lời không, hoặc trả lời như thế nào. Giáo viên cần ghi
nhận một cách chân thực với hàm ý khích lệ đối với những câu trả lời của học
sinh.
(6) Tránh các câu hỏi có trả lời có hoặc không: có nhiều lý do để tránh các
câu hỏi có/không hay các câu hỏi khác mà đòi hỏi phải lựa chọn trả lời. Thứ
nhất, đối với câu hỏi loại này, học sinh có thể đoán các câu trả lời chỉ trong vòng
nửa thời gian cho phép. Thứ hai, loại câu hỏi này không cho biết nhiều về sự
hiểu biết của học sinh về nội dung đó. Thực chất các câu hỏi như vậy không có
độ chẩn đoán cao, giáo viên nên hạn chế sử dụng những câu hỏi như vậy.
(7) Thăm dò các câu trả lời đầu tiên khi cần thiết: Câu hỏi thăm dò là để

50
biết rõ hơn tại sao học sinh trả lời như vậy, lập luận và lôgic của câu trả lời.
(8) Tránh các câu hỏi giằng co, phỏng đoán và dồn ép: Hỏi loại câu hỏi
này sẽ khó có thể xác định được kiến thức và khả năng lập luận của học sinh.
Các câu hỏi giằng co là để hỏi thêm học sinh mà không cho biết hướng
cần tập trung đến.
Các câu hỏi phỏng đoán gợi cho học sinh cách ước chừng. Loại câu hỏi
này có hiệu quả thu hút sự chú tâm của học sinh và khiến học sinh suy nghĩ về
một vấn đề hay lĩnh vực, nhưng không phù hợp để đánh giá sự tiến bộ.
Câu hỏi dồn thường được sử dụng để tăng tốc độ bài học hơn là để thu
thập thông tin về kiến thức của học sinh. Vì vậy nên tránh dùng các câu hỏi loại
này.
(9) Tránh hỏi học sinh những gì họ biết: Thường không hiệu quả nếu hỏi
trực tiếp xem liệu họ biết hay hiểu vấn đề gì.
(10) Đặt câu hỏi theo tiến trình hợp lý: Đặt câu hỏi theo tiến trình đã vạch
sẵn sẽ nâng cao chất lượng thêm thông tin để đánh giá sự hiểu bài của học sinh.
Các tiến trình hợp lý thường bắt đầu bằng các câu hỏi kiến thức để xác định liệu
học sinh biết rõ về nội dung để có thể hỏi tiếp câu hỏi lập luận.
3.1.3. Phương pháp trắc nghiệm viết
Hiện nay, phương pháp kiểm tra – đánh giá bằng hình thức viết được sử
dụng rộng rãi trong tất cả các cấp học, bậc học. Có hai loại trắc nghiệm dưới
dạng viết là trắc nghiệm tự luận (TNTL) (hay luận đề) và trắc nghiệm khách
quan (TNKQ).
* Một số khác biệt và tương đồng giữa TNTL và TNKQ
Sự khác biệt

Trắc nghiệm tự luận Trắc nghiệm khách quan

1 Thí sinh phải tự soạn câu trả lời và Chọn câu trả lời đúng nhất trong 1
diễn tả bằng ngôn ngữ của mình số câu đã cho sẵn

2 Ít câu hỏi, nhưng có tính tổng quát Nhiều câu hỏi chuyên biệt, chỉ cần
và phải trả lời dài trả lời ngắn gọn

51
3 Phải suy nghĩ, viết Phải đọc và suy nghĩ

4 Chất lượng của bài TNTL do kĩ Chất lượng của bài TNKQ do kĩ
năng của người chấm bài xác định năng của người biên soạn quyết
định

5 Dễ soạn, khó chấm và khó cho Khó soạn, dễ chấm, cho điểm
điểm chính xác chính xác

6 Thí sinh tự do bộc lộ cá tính, Người soạn tự do bộc lộ kiến thức,


người chấm cũng tự do cho điểm thí sinh chỉ có quyền chứng tỏ
theo xu hướng của mình mức độ hiểu biết qua số các câu
trả lời đúng

7 Khó xác định mức độ hoàn thành Dễ thẩm định mức độ hoàn thành
toàn diện nhiệm vụ học tập các nhiệm vụ học tập

8 Cho phép hoặc đôi khi khuyến Cho phép “đoán mò”
khích sự “lừa phỉnh”

9 Cho phép người chấm ấn định sự Sự phân bố điểm do bài thi ấn


phân bố điểm (sửa đáp án) định

Nguồn Dương Thiệu Tống - Trắc nghiệm và đo lường thành quả học tập, tr.16.

Những điểm tương đồng


1- Cả hai loại TNTL và TNKQ đều có thể đo lường hầu hết kết quả học
tập quan trọng bằng hình thức viết.
2 - Cả hai loại trắc nghiệm đều có chức năng khuyến khích học sinh học
tập để đạt mục tiêu: hiểu biết các nguyên lí, tổ chức, phối hợp các ý tưởng, ứng
dụng kiến thức trong việc giải quyết các vấn dề.
3 - Cả hai loại đều đòi hỏi sự vận dụng ít nhiều sự phán đoán chủ quan.
4 – Giá trị của cả hai loại tuỳ thuộc vào tính khách quan và độ tin cậy của
chúng.
Một vài điều lợi và bất lợi của TNKQ:

52
1 – TNKQ có khuyến khích sự đoán mò không?
Trong kĩ thuật soạn các bài thi bằng trắc nghiệm khách quan có độ tin
cậy cao với các câu hỏi nhiều lựa chọn gần như loại trừ hoàn toàn khả năng
nhận điểm do cao do đoán mò. Thí dụ một bài thi gồm 100 câu, mỗi câu có 5
phương án chọn thì điểm tối đa do đoàn mò là 1/5 tức là 20% tương đương 2/10
điểm.
2 – TNKQ không khảo sát các kĩ năng tư duy bậc cao?
Một bài trắc nghiệm được soạn thảo công phu, đáp ứng các mục tiêu
giảng dạy và đánh giá đều có thể đánh giá được các kĩ năng tư duy bậc cao như
phân tích, tổng hợp v.v
3- TNKQ không khảo sát được kĩ năng sáng tạo?
Đây là một nhược điểm của các bài TNKQ. Do vậy, gần đây, người ta xen
vào bài trắc nghiệm khách quan các câu hỏi loại điền khuyết hay trả lời ngắn.
Các câu trả lời này được đánh giá theo mức độ đạt được các tiêu chuẩn sáng
tạo.
Khi nào nên sử dụng TNKQ và TNTL

Trắc nghiệm tự luận Trắc nghiệm khách quan

Số thí sinh không đông, đề thi sử dụng Khi thí sinh đông, đề thi có thể sử
1 lần dụng lại

Khuyến khích kỹ năng viết Muốn có điểm số chính xác, tin cậy,
khách quan

Để thăm dò thái độ, tư tưởng của học Xem trọng yếu tố công bằng, vô tư,
sinh hơn là khảo sát kết quả học tập chính xác trong thi cử.

Tin tưởng khả năng chấm vô tư, chính Khi có ngân hàng câu hỏi tốt, chấm
xác nhanh

Không có nhiều thời gian soạn đề thi Ngăn ngừa nạn học tủ, học vẹt và gian
nhưng lại có thời gian để chấm bài lận trong thi cử.

* Trắc nghiệm tự luận

53
TNTL có 2 loại - Tự luận tự do và tự luận theo cấu trúc.
TNTL tự do có thể là một bài viết trong một vài giờ dưới dạng một bài
luận, hoặc một bài tập lớn dưới dạng tiểu luận được hoàn thành sau một vài tuần
chuẩn bị.
Tuy nhiên loại TNTL tự do thường gây khó khăn cho thí sinh trong quá
trình tìm hiểu ý đồ của giáo viên và cũng rất khó khăn cho giáo viên khi chấm
bài. Do vậy, trong trường hợp khi các bài TNKQ không phù hợp người ta dùng
các câu hỏi tự luận có cấu trúc. Để làm việc này, cần phân tích các câu tự luận
thành các câu hỏi nhỏ với trình tự nhiệm vụ cần thực hiện một cách rõ ràng, cụ
thể tường minh cả với thí sinh và người chấm.
TNTL cấu trúc là những câu hỏi nhỏ được sắp xếp theo trình tự khó dần
với số điểm tương ứng. Trong một số trường hợp, người ta qui định số lượng từ
hạn chế cho mỗi câu hỏi nhỏ. Cách ra đề như vậy vẫn phát huy được những ưu
điểm của TNTL, như khuyến khích sự sáng tạo, khả năng viết, đồng thời hạn
chế được những nhược điểm vốn có của nó, như khó thống nhất khi đánh giá.
* Trắc nghiệm khách quan – Hình thức các câu hỏi trắc nghiệm khách
quan thông dụng
1. Câu đúng – sai:
Câu đúng – sai được trình bày dưới dạng một câu phát biểu và thí sinh
phải trả lời bằng cách lựa chọn Đúng (Đ) hay Sai (S).
Một số ưu nhược điểm của loại câu đúng – sai

Nhược điểm Ưu điểm

- Xác suất đoán mò 50% - Viết được nhiều câu cho một
- Khuyến khích học vẹt chủ đề trong thời gian ngắn.

- Đôi khi không phù hợp với thực tế


- Khó thẩm định
- Khó viết trong một số lĩnh vực nhạy cảm

Chỉ nên sử dụng câu Đ-S với các điều kiện sau

54
- Các trường hợp Đ-S phải chắc chắn, không tuỳ thuộc vào quan niệm
riêng của từng người.
- Lựa chọn những câu phát biểu mà 1 thí sinh có khả năng trung bình
không thể nhận ra ngay là đúng hay sai mà không có đôi chút suy nghĩ.
- Mỗi câu chỉ miêu tả một ý duy nhất.
- Không chép nguyên văn từ SGK.
- Tránh dùng các từ “tất cả”, “không bao giờ”, “đôi khi” v.v.
2 - Loại câu TNKQ nhiều lựa chọn
Câu hỏi NLC có hai phần: phần gốc và phần lựa chọn. Phần gốc là một
câu hay một câu bỏ lửng (chưa hoàn tất). Phần lựa chọn gồm một số (4 hoặc 5)
câu trả lời hay câu bổ túc cho thí sinh lựa chọn phương án đúng.
Yêu cầu:
- Các phương án sai phải có vẻ hợp lý.
- Nên dùng 4 – 5 phương án chọn
- Chỉ có 1 phương án đúng nhất
- Đảm bảo cho câu gốc nối liền với phương án chọn đúng ngữ pháp.
- Tránh dùng câu phủ định, đặc biệt phủ định 2 lần
- Tránh tạo phương án đúng quá khác biệt với các phương án sai
- Sắp xếp các phương án theo thứ tự ngẫu nhiên
- Tránh lạm dụng kiểu “tất cả đều đúng” v.v.
Ví dụ:
1. Nếu (N+68)2= 654481, thì (N+58)(N+78)=?
a. 654381 d. 654581
b. 654471 e. 654524
c. 654481
(Giải đáp cho câu trên đây đặt cơ sở trên sự hiểu biết cấu trúc toán học, không
cần phải thực hiện tính toán, nhưng học sinh kém hơn có thể giải đáp bằng cách

55
giải phương trình).
2. 1/8 phần trăm của x =
a. 0.000125x d. 0.125x
b. 0.00125x e. 1.25x
c. 0.0125x
(Câu này thuộc loại khảo sát khả năng thông hiểu, bằng cách biến cải các phần
tử từ một dạng này sang một dạng khác, chứ không đòi hỏi phải thực hiện tính
toán).
Ví dụ:
1. Trong sự phân giải định lượng một chất hữu cơ có chứa C, H, O, N nguyên tố
được định phân sau cùng là
a. Carbon d. Nitrogen
b. Hidrogen e. Nguyên tố nào cũng được
c. Oxigen
2. Công thức M=29d chỉ dùng để tính
a. Chất lượng của một chất khí khi biết tỷ trọng của nó.
b. Tỷ trọng của một chất rắn khi biết chất lượng phân tử M.
c. Chất lượng phân tử M của một chất bất kỳ khi biết tỷ trọng của nó.
d. Chất lượng phân tử của một chất khí, lỏng hay rắn khi biết tỷ trọng hơi
của nó.
e. Tỷ trọng của một chất lỏng khi biết chất lượng phân tử của nó.
Ví dụ:
1. Có thể đưa ra nhận xét nào về cán cân thương mại Việt Nam từ 1920 - 1937.
a. Quá dư thừa
b. Chỉ dư thừa từ 1932 trở về sau
c. Luôn luôn thiếu hụt
d. Khá quân bình.

56
Trong câu trắc nghiệm NLC này phần dẫn cho ta những thông tin để suy luận:
- Khi viên bi đi lên, tốc độ của nó giảm do đó gia tốc phải có hướng
ngược với vận tốc viên bi. Vì vận tốc lúc đó hướng lên nên gia tốc phải hướng
xuống.
- Khi viên bi đi xuống, tốc độc của nó tăng, do đó gia tốc của nó phải có
hướng trùng với hướng vận tốc, tức là hướng xuống.
- Ở điểm cao nhất của quĩ đạo viên bi có tốc độ tức thời bằng không
nhưng vận tốc của nó đổi từ hướng lên sang hướng xuống, nghĩa là gia tốc
hướng xuống.
Như vậy, trong cả ba trường hợp viên bi đều bị tác dụng bởi một lực
hướng xuống, đó là lực hấp dẫn của Trái đất. Theo định luật II Newton, gia tốc
phải có hướng của lực tác dụng, nghĩa là hướng xuống trong cả ba trường hợp.
Vì thế, câu trả lời đúng nhất trong thí dụ này là câu E.
Rõ ràng, với câu trắc nghiệm trong thí dụ vừa nêu, nếu thí sinh không
nắm được kiến thức vật lý về chuyển động có gia tốc và lực hấp dẫn thì không
thể biết phương án cần chọn là phương án nào. Ngay cả đối với thí sinh biết
nhưng không hiểu sâu vấn đề thì họ vẫn có thể chỉ chọn phương án C, và như
vậy câu trả lời của thí sinh vẫn là sai. Chính các phương án A, B, C trong thí dụ
này có tác dụng gây nhiễu đối với thí sinh, thậm chí làm cho thí sinh lạc hướng
hoàn toàn nếu kiến thức không đủ vững.
Trong khi soạn thảo câu trắc nghiệm, người ta thường cố gắng làm cho
các phương án nhiễu đều có vẻ “có lý” và “hấp dẫn” như phương án đúng.
Chẳng hạn, chúng ta hãy xem câu trắc nghiệm rất đơn giản về toán sau đây (cho
học sinh mới bắt đầu học Đại số):

Cho a=15 và b=2; tích của a và b bằng...


A)17 B) 13 C) 7.5 D) 30 E) 225
Thí sinh nắm vững khái niệm đã học sẽ hiểu ngay rằng tích của a và b là
kết quả của phép nhân a với b, tức là 15 x 2 và chọn phương án trả lời D. Trong
khi đó, đối với phương án A, B, C, E đều có vẻ “có lý”, có thể lôi cuốn thí sinh
vào một trong các phương án trả lời sai:

57
a+b = 15 + 2 = 17 -> chọn A
a-b = 15 - 2 = 13 -> chọn B
a:b = 15 : 2 = 7.5 -> chọn C
ab = 15 2 = 225 -> chọn E

Về nguyên tắc, đối với người có kinh nghiệm viết trắc nghiệm, một nội
dung bất kỳ nào cần kiểm tra đều có thể được thể hiện vào một câu trắc nghiệm
theo một kiểu nào đó. Vì thế đối với tất cả các môn học người ta đều có thể viết
câu hỏi trắc nghiệm. Tuy nhiên, do đặc thù của từng môn học mà việc viết trắc
nghiệm cho môn này có thể khó hơn cho môn kia.
Cần lưu ý rằng không phải bất cứ ai có kiến thức chuyên môn cũng viết
được câu trắc nghiệm có chất lượng cao cho chuyên môn đó. Muốn viết câu hỏi
trắc nghiệm tốt phải suy nghĩ sâu sắc về chuyên môn và tích lũy kinh nghiệm
sau một thời gian thử nghiệm lâu dài. Thế mà một số người không có khả năng
viết được câu trắc nghiệm tốt hoặc không hiểu hết ý tứ của các câu trắc nghiệm
thường vội kết luận rằng trắc nghiệm chỉ đánh giá được khả năng nhớ tầm
thường!
3-Loại câu ghép đôi
Loại câu ghép đôi cũng là một dạng của câu nhiều lựa chọn.
Thí dụ câu trắc nghiệm về lịch sử:
Hãy nối những sự kiện chính của phong trào Tây Sơn ở cột A với năm
tương ứng ở cột B.
Cột A Cột B
1. Khởi nghĩa ở Bình Định 1. Năm 1770
2. Kháng chiến chống quân Xiêm 2. Năm 1771
3. Đánh đổ chính quyền Lê- Trịnh 3. Năm 1786- 1788
4. Kháng chiến chống quân Thanh 4. Năm 1785
5. Năm 1789
6. Năm 1802

Đối với loại câu hỏi ghép đôi, người ta thường cho số yếu tố ở cột bên trái
không bằng số yếu tố ở cột bên phải, vì rằng khi số yếu tố ở 2 phía bằng nhau thì

58
hai yếu tố cuối cùng sẽ mặc nhiên được ghép với nhau và không phải lựa chọn.
4- Loại câu điền khuyết
Loại câu điền khuyết có 2 dạng: câu trả lời rất ngắn hoặc một câu với 1
hay nhiều chỗ trống để thí sinh điền vào 1 từ hay một nhóm từ ngắn.

Lấy thí dụ với câu trắc nghiệm về lịch sử:


Ngày 2 tháng 9 năm 1945 Chủ tịch Hồ Chí Minh đã đọc ………… khai
sinh ra nước Việt Nam Dân chủ Cộng hoà.
Đáp án: Tuyên ngôn độc lập

(Sinh viên đọc thêm: Một số nguyên tắc soạn thảo những câu TNKQ Nhiều lựa
chọn – Dương Thiệu Tống, Chương 6, tr 79-96.)
3.2. Kết hợp TNKQ và TNTL (TNTL có cấu trúc và TNTL tự do) trong
kiểm tra đánh giá kết quả học tập của học sinh.
Như đã nói ở trên, mỗi hình thức kiểm tra đánh giá (TNKQ – TNTL) đều
có những ưu nhược điểm riêng.
TNTL có ưu điểm là kiểm tra được kiến thức tổng hợp, kĩ năng tư duy, kĩ
năng viết của học sinh, dễ ra đề. Song TNTL cũng có những nhược điểm như
không bao quát hết nội dung cần kiểm tra, dễ dẫn tới các hiện tượng tiêu cực,
như học tủ, học vẹt, quay cóp trong thi cử. Hơn nữa, những bài TNTL thường
khó đánh giá và cho điểm chính xác. Ngược lại, TNKQ do bao gồm nhiều câu
hỏi nên bài thi bao quát hầu hết nội dung cần kiểm tra, lại dễ chấm và cho điểm
chính xác nên hạn chế các hiện tượng tiêu cực trong học tập, cũng như thi cử.
Tuy nhiên, các câu hỏi TNKQ lại không cho phép kiểm tra kĩ năng viết của học
sinh, không thẩm định được quá trình tư duy của học sinh khi quyết định chọn 1
câu trả lời đúng. Hơn nữa, việc học sinh chọn được câu trả lời đúng hoàn toàn
chưa có nghĩa là họ sẽ vận dụng được những kiến thức đó vào cuộc sống sau
này.
Vấn đề đặt ra là nên kết hợp 2 hình thức kiểm tra đánh giá này vào các kì
kiểm tra đánh giá khác nhau, dùng ưu điểm của hình thức này để khắc phục
nhược điểm của hình thức kia để đạt mục đích của kì thi - kiểm tra một cách tốt

59
nhất.
Cách kết hợp 2 hình thức kiểm tra đánh giá này tuỳ thuộc vào kiểu kiểm
tra đánh giá đang diễn ra trong nhà trường và vào mục đích của các kì kiểm tra
đánh giá đó. Ở trường phổ thông hiện nay, các giáo viên đang tiến hành các hình
thức kiểm tra đánh giá sau:
1 - Kiểm tra đánh giá thường xuyên
Các hình thức kiểm tra đánh giá thường xuyên diễn ra trong quá trình
giảng bài, trong phạm vi tiết học. Giáo viên thường dùng các câu hỏi /
đáp, các bài kiểm tra nhanh dưới dạng viết, các trò chơi v.v. Mục đích của
kiểm tra đánh giá thường xuyên là tìm hiểu mức độ hiểu một nội dung nào
đó trước khi chuyển sang nội dung khác, hoặc để thay đổi không khí lớp,
hoặc để giáo viên điều chỉnh cách dạy cho giờ sau v.v.
2 - Kiểm tra đánh giá định kì
2.1. Kiểm tra miệng / vấn đáp
Kiểm tra miệng được tiến hành thường xuyên vào đầu mỗi tiết học. Mục
đích của kiểm tra miệng là giúp giáo viên nắm được tình hình học tập,
chuẩn bị bài cũ của học sinh, khởi động giờ học mới. Đây cũng là thời
điểm để giáo viên có dịp liên hệ kiến thức đã học ở bài trước với bài sẽ
dạy vào hôm đó. Kiểm tra miệng thường được tiến hành dưới dạng vấn
đáp, đôi khi cũng có thể để học sinh trình bày câu trả lời trên bảng.
2.2. Kiểm tra 15’ (hệ số 1)
Bài kiểm tra 15’ được tiến hành dưới dạng viết. Mục đích của bài kiểm tra
15’ là để đánh giá mức độ đạt mục tiêu học tập của học sinh sau một đơn
vị nội dung nhất định (thường là sau 2, 3 bài).
2.3. Kiểm tra 45’ (hệ số 2)
Bài kiểm tra 45’ thường được tiến hành dưới dạng viết, sau khi học xong
một chương hay một nội dung tương đối hoàn chỉnh. Loại bài kiểm tra
này thường bao quát nội dung kiểm tra tương đối rộng, ứng với các mục
tiêu nhận thức cao hơn như khả năng vận dụng, phân tích, tổng hợp.
2.4. Bài kiểm tra học kì (hệ số 3)

60
Bài kiểm tra học kì là loại kiểm tra đánh giá tổng kết nhằm đánh giá một
cách toàn diện mức độ nắm vững kiến thức, kĩ năng, kể các các kĩ năng tư
duy bậc cao như phân tích, tổng hợp, phê phán của học sinh sau một học
kì hay cả năm học.
Căn cứ vào các hình thức kiểm tra – đánh giá đang được tiến hành trong
nhà trường, căn cứ mục đích của từng hình thức kiểm tra – đánh giá, mức độ
quan trọng của từng hình thức (qua các hệ số), xem xét ưu nhược điểm của từng
kĩ thuật kiểm tra đánh giá ta có thể tìm ra cách phối hợp phù hợp để đạt mục
đích đánh giá một cách tốt nhất.
Tuy nhiên, cách kết hợp như thế nào cho hiệu quả lại tuỳ thuộc rất nhiều
vào năng lực của từng giáo viên. Trong quá trình kiểm tra – đánh giá, mối quan
tâm hàng đầu của người giáo viên là phải đạt mục đích của kì kiểm tra, đánh giá
được việc đạt mục tiêu học tập ở từng giai đoạn để rồi từ đó giúp học sinh tiến
bộ không ngừng sau mỗi kì kiểm tra.
Thí dụ, bài kiểm tra 15’ có mục đích là đánh giá mức độ nắm vững nội
dung kiến thức sau 2, 3 bài học. Các mục tiêu học tập (kể cả bậc thấp) cũng cần
được kiểm tra hết nhằm đồng thời giúp học sinh củng cố kiến thức đã học, qua
đó phát hiện những khó khăn học sinh có thể gặp ở các bài sau.
Các mục tiêu nhận thức bậc 1 và một số mục tiêu nhận thức bậc vận dụng
lớp học có thể được kiểm tra thông qua các loại câu hỏi TNKQ (Đây là loại trắc
nghiệm tiêu chí do giáo viên tự soạn, khác với các câu hỏi TNKQ tiêu cuẩn do
các chuyên gia biên soạn - sẽ nói ở phần sau). Tỉ lệ câu TNKQ trong bài kiểm
tra loại này có thể chiếm 70-80%. Còn các mục tiêu bậc 2 (vận dụng trong thực
tế) có thể kiểm tra bằng các loại câu TNTL cấu trúc (hạn chế số từ) hoặc TNTN
tự do.
Câu TNTL cấu trúc hay còn gọi là câu trả lời kiến tạo có ưu điểm là chỉ
cần trả lời ngắn gọn, nên có thể ra nhiều câu hỏi, bao quát nhiều nội dung. Đối
với câu hỏi loại này, học sinh phải tự kiến tạo câu trả lời, qua đó phần nào bộc
lộ năng lực tư duy, khả năng viết. Và nếu giáo viên biết đặt các câu hỏi để học
sinh vận dụng kiến thức của mình để giải thích hay giải quyết một vấn đề có
trong cuộc sống thực, thì hiệu quả của bài kiểm tra sẽ được nâng lên rất nhiều.
(Vấn đề hình thức đánh giá thực sẽ được bàn đến ở chương 5).

61
Một bài kiểm tra 45’ với mục đích là đánh giá tổng kết, nội dung kiểm tra
và các mục tiêu nhận thức tương ứng cũng nhiều hơn, trong đó, một số nội dung
và mục tiêu đã được đánh giá qua các kì kiểm tra – đánh giá trước đó, nên tỉ lệ
các câu TNKQ và TNTL cũng khác. Thông thường, trong các bài kiểm tra loại
này, các mục tiêu nhận thức ứng với nội dung học tập được kiểm tra theo tỉ lệ
sau

30-40% Mục tiêu bậc 1

40-50% Mục tiêu bậc 2

10-20% Mục tiêu bậc 3

Căn cứ tỉ lệ này có thể xác định tỉ lệ các câu TNKQ và TNTL (trong đó,
có TNTL có cấu trúc) trong một bài kiểm tra 45’.
3.3. Qui trình tổ chức một kì kiểm tra đánh giá
Tổ chức đánh giá kết quả học tập là một hoạt động đòi hỏi người giáo
viên không chỉ có trình độ chuyên môn cao, nắm vững và sử dụng thành thạo
các phương pháp dạy - học hiệu quả, mà còn phải được trang bị những kĩ thuật
KTĐG, tuân thủ những nguyên tắc và qui trình KTĐG đã được các chuyên gia
về KTĐG đề xuất.
Nguyên tắc tổ chức hoạt động đánh giá
- Xác định rõ mục đích, mục tiêu đánh giá.
- Qui trình và công cụ đánh giá do mục đích, mục tiêu đánh giá qui định.
- Có nhiều công cụ, biện pháp đánh giá được sử dụng đồng thời mới có
thể có được kết quả đánh giá có giá trị.
- Nắm vững ưu nhược điểm của từng công cụ đánh giá để sử dụng đúng.
- Đánh giá chỉ là phương tiện đi đến mục đích chứ không phải là mục
đích.
- Kết quả của đánh giá phải phục vụ các mục đích sau:
+ Cải tiến, hoàn thiện nội dung dạy - học, phương pháp dạy - học.
+ Quyết định liên quan đến cá nhân người học.

62
+ Quyết định liên quan đến giáo viên, chương trình đào tạo, quản lí hệ
thống đào tạo.
Quy trình KTĐG bao gồm các bước sau
1- Xác định mục đích đánh giá
Đây là yếu tố đầu tiên đầu tiên mà người giáo viên phải xác định trước khi
tiến hành một hoạt động đánh giá nào đó. Đánh giá được tiến hành ở nhiều thời
điểm khác nhau trong quá trình dạy học. Ở mỗi thời điểm, đánh giá có mục đích
riêng, thí dụ:
- Đánh giá “khởi sự” (Placement Evaluation) nhằm khảo sát kiến thức đã
có của người học trước khi bắt đầu giảng dạy một môn học. Câu hỏi đặt ra là
người học đã có những kiến thức, kĩ năng cần thiết để tiếp thu nội dung giảng
dạy mới chưa? Họ có thể gặp những khó khăn gì trong quá trình học tập sắp tới.
- Đánh giá theo tiến trình (đánh giá hình thành – Formative Evaluation)
được dùng để theo dõi sự tiến bộ của người học, nhằm đánh giá mức độ đạt các
mục tiêu trung gian, cung cấp các thông tin phản hồi để giúp người dạy - người
học điều chỉnh hoạt động của mình để đạt mục tiêu cuối cùng.
- Đánh giá chẩn đoán (Diagnostic Evaluation) nhằm phán đoán, dự báo
những khó khăn mà người học có thể gặp phải, phát hiện nguyên nhân của các
lỗi thường gặp và lặp đi lặp lại để tìm cách khắc phục.
- Đánh giá tổng kết (Summative Evaluation) thường được tiến hành vào
cuối kì giảng dạy 1 khoá học, một môn học, một đơn vị học tập nhằm xác định
mức độ đạt được mục tiêu học tập và thường được dùng để có các quyết định
quản lý phù hợp, như lên lớp, thi lại. Kết quả của đánh giá tổng kết cũng cung
cấp các thông tin cần thiết để cải tiến chương trình đào tạo cũng như hiệu quả
của việc dạy - học.
Như vậy, đánh giá có nhiều mục đích và người giáo viên phải xác định rõ
mục đích của mình mới soạn thảo được các đề kiểm tra đánh giá có giá trị, vì
chính mục đích chi phối chuẩn đánh giá, nội dung, hình thức của bài thi.
2 - Lựa chọn các hình thức, phương pháp đánh giá
Trên cơ sở mục đích đánh giá được xác định, người dạy quyết định

63
phương pháp, hình thức đánh giá phù hợp – Có thể dùng phương pháp quan sát,
vấn đáp hay thi viết, trong thi viết có thể dùng loại trắc nghiệm tự luận hay trắc
nghiệm khách quan hoặc kết hợp cả 2 loại.
3 – Phân tích nội dung, xác định tiêu chuẩn, tiêu chí đánh giá cho
từng nội dung cần đánh giá
Nếu chọn hình thức thi viết, thì đây là khâu quan trọng nhất. Trong quá
trình phân tích nội dung cần đánh giá, người soạn phải xem xét toàn bộ nội dung
này và phân biệt:
- Những nội dung chỉ cần tái hiện hay tái nhận.
- Những nội dung cần giải thích, minh hoạ
- Những ý tưởng phức tạp cần được phân tích, giải thích, áp dụng trong
những hoàn cảnh khác Khi đã xác định được mục đích kiểm tra và hình thức
đánh giá thì quá trình phân tích toàn bộ nội dung chương trình cần đánh giá giúp
nhà quản lí bao quát toàn bộ nội dung, phân định mức độ hoàn thiện các nội
dung đó (mục tiêu ở các bậc) của người học. Đây là cở sở quan trọng để thiết lập
dàn bài thi.
4 - Thiết lập dàn bài thi
Phương pháp thường dùng để thiết lập dàn bài thi là lập bản quy định hai
chiều (table of specification) với một chiều (hàng dọc) biểu thị toàn bộ nội dung,
còn một chiều kia biểu thị cho các bậc mục tiêu (quá trình tư duy) mà bài thi
muốn khảo sát.
Mỗi phạm trù trong hai phạm trù tổng quát ấy (ND và MT) có thể được
phân ra thành các phạm trù nhỏ khác (từ 4-12) tuỳ theo tính chất phức tạp của
các mục tiêu. Ở mỗi ô có thể ghi số hay tỉ lệ phần trăm câu hỏi dự tính cho mục
tiêu và nội dung, ứng với hàng dọc và hàng ngang của ô ấy.
Dưới đây là một vài ví dụ
Dàn bài Kiểm tra – Thi
Môn

Nội dung ND1 ND2 ND3 Tổng Tỉ lệ

64
Mục Tiêu

Nhớ (B1) 40%

Từ ngữ 1 0 1 4

Kí hiệu 0 1 0

Quy ước 0 1 0

Sự kiện 3 1 2 6

Hiểu, vận dụng (B2) 40%

Giải thích 2 1 2 5

Tính toán 1 2 2 5

Phân tích, tổng hợp, 20%


đánh giá (B3)

Phê phán 2 1 0 5

Bình luận 0 1 1

Tổng 9 8 8 25 100%

Với dàn bài này, ở nội dung 1 ta có 9 mục tiêu được kiểm tra, trong đó 4
mục tiêu bậc 1 (nhớ), 3 mục tiêu bậc 2 (hiểu, vận dụng) và 2 mục tiêu bậc 3
(phân tích, tổng hợp, đánh giá).
Tương tự như vậy có thể xác định được số và bậc mục tiêu ở các ND2 và
ND3. Đây là cơ sở để viết các câu hỏi ứng với nội dung và bậc mục tiêu dùng
cho bài kiểm tra, đồng thời là cơ sở để xác định biểu điểm dành cho mỗi câu, ở
mỗi nội dung và mục tiêu tương ứng.
Với một bài kiểm tra viết dưới dạng TNKQ ở lớp học nhằm khảo sát một
phần của môn học có thể lập bản quy định hai chiều đơn giản hơn:
Ví dụ:
Bài kiểm tra 15’

65
Nội dung Mục 1 Mục 2 Mục 3 Tổng
Mục Tiêu

Nhớ (B1) 1 1 2 4

Hiểu, vận dụng (B2) 2 1 1 4

Phân tích, tổng hợp, 0 1 1 2


đánh giá (B3)

Tổng 3 3 4 10

5 - Lựa chọn hoặc viết các câu hỏi


Dàn bài thi đã cho ta biết số lượng và bậc mục tiêu ứng với từng nội dung
cần kiểm tra. Bước tiếp theo là lựa chọn (nếu đã có ngân hàng câu hỏi) hoặc viết
các câu hỏi (Xem phần phân biệt câu TNTL & TNKQ ở trên).
Đối với các mục tiêu bậc 1 và một phần mục tiêu bậc 2 có thể viết các câu
TNKQ nhiều lựa chọn hoặc ghép đôi. Số lượng câu hỏi tuỳ thuộc và thời gian
được dành để kiểm tra. Trung bình để chọn được câu trả lời đúng cho một câu
hỏi nhiều lựa chọn thì học sinh cần một phút. Đây cũng là căn cứ tương đối để
người viết quyết định số lượng câu hỏi cho các mục tiêu ở bậc tương ứng.
Đối với một số mục tiêu bậc 2 và bậc 3 có thể dùng các câu TNTL có cấu
trúc đề kiểm tra (xem phần TNTL ở trên)
6 - Phân tích câu hỏi
Việc phân tích các câu hỏi đã lựa chọn hoặc tự viết nhằm xác định xem
các câu hỏi có thể dùng làm công cụ để kiểm tra việc đạt các mục tiêu trong các
nội dung cần kiểm tra hay không. Việc phân tích các câu hỏi cũng nhằm đánh
giá độ khó, độ phân biệt của các câu hỏi đó để thay đổi hoặc điều chỉnh nếu cần.
Sau khi xem xét từng câu hỏi, cần phân tích để đánh giá toàn bộ đề thi
vừa được biên soạn.
Các tiêu chí để đánh giá một đề kiểm tra
1- Phạm vi nội dung cần bao quát
2- Sự cân đối của các loại câu hỏi về độ khó (bậc mục tiêu)

66
+ Khả năng tái hiện
+ Hiểu biết, vận dụng
+ Phân tích, tổng hợp, đánh giá
+ Sự sáng tạo
+ Các kĩ năng khác
3- Cơ hội bình đẳng để trả lời cho toàn bộ người học
4- Những sai sót có thể có trong bài thi
7- Tổ chức thi, chấm điểm
Sau khi đã phân tích từng câu hỏi và toàn bộ bài thi, công việc tiếp theo là
tổ chức một đợt thi. Đối với các kì kiểm tra – thi dưới hình thức TNKQ, việc in
đề, hướng dẫn học sinh làm bài đòi hỏi nhiều công sức của giáo viên hơn vì đây
là hình thức kiểm tra đánh giá mới ở nước ta.
Việc xây dựng phương thức chấm điểm, các tiêu chuẩn, tiêu chí cho điểm
chính xác, nhất là đối với các câu TNTL là rất cần thiết. Hạn chế dùng các câu
TNTL tự do và thay vào đó các TNTL có cấu trúc sẽ giúp khắc phục khó khăn
này. Phương thức chấm điểm phải khắc phục một số khó khăn thường gặp như:
- Thay đổi chuẩn đánh giá
- Phân biệt đối xử do chữ viết của thí sinh v.v
Một phương thức chấm điểm khách quan đối với các câu TNTL là một
giáo viên chấm từng câu hỏi cho tất cả thí sinh chứ không chấm tất cả các câu
hỏi của một thí sinh.
Một điều cần lưu ý khi chấm các bài kiểm tra, nhất là các bài kiểm tra
theo tiến trình là cần có lời nhận xét của giáo viên. Những nhận xét chính xác,
cách động viên của giáo viên sẽ giúp người học sửa lỗi và tiến bộ sau mỗi kì
kiểm tra.
8- Ghi chép, phân tích, lưu trữ kết quả thi trước khi công bố kết quả
Với kết quả đã chấm, trong các kì kiểm tra đánh giá, do giáo viên tự tổ
chức cho lớp của mình, việc ghi chép, phân tích qua thống kê đơn giản và lưu
trữ các kết quả cho phép giáo viên theo dõi sự tiến bộ của người học, các dạng

67
lỗi mà họ thường gặp để giúp họ điều chỉnh cách học, khắc phục những nhược
điểm, đồng thời động viên họ học tập ngày càng tốt hơn. Những thông tin này
cũng giúp giáo viên có những điều chỉnh trong nội dung bài giảng, phương pháp
giảng dạy. Đối với các kì thi TNKQ tiêu chuẩn hoá, việc phân tích kết quả các
bài thi cho phép xác định độ khó, độ phân biệt của các câu trắc nghiệm, độ khó
trung bình của một bài trắc nghiệm, độ giá trị, độ tin cậy của bài thi.
3. 4. Trắc nghiệm tiêu chí (criterion - Referenced test) và trắc nghiệm
chuẩn mực (Norm - Referenced test) trong việc đo lường đánh giá kết quả
học tập.
Đo lường đánh giá kết quả học tập xét cho cùng là lượng giá mức độ đạt
được các mục tiêu học tập hay tiêu chí (criterion). Điều này đòi hỏi phải xác
định mức độ kết quả học tập đối chiếu với các mục tiêu học tập. Các điểm số thu
được từ một bài đo lường kết quả học tập vì thế cung cấp 2 loại thông tin:
- Mức độ học sinh đạt mục tiêu môn học, bài học (thí dụ: giải được bài
toán, mô tả chính xác thí nghiệm…) không cần biết học sinh đó giỏi hơn hay
kém hơn những người khác.
- Vị trí của mỗi học sinh so với các học sinh khác (thí dụ: học sinh A giải
bài toán nhanh hơn học sinh B, học sinh B học giỏi hơn học sinh C… )
Sự khác biệt của 2 loại thông tin là ở loại chuẩn được sử dụng để tham
chiếu. Trắc nghiệm chuẩn mực có tiêu chuẩn tham chiếu là chuẩn tương đối (tức
là so với một nhóm được dùng làm chuẩn về một nội dung giảng dạy nào đó có
tính bao quát, đại diện cho một cấp học, bài học trong phạm vi một nước hoặc
một lãnh thổ), còn trắc nghiệm tiêu chí có tiêu chuẩn tham chiếu là chuẩn tuyệt
đối tức là mục tiêu học tập của một môn học nào đó trong một nhà trường, thậm
chí của một giáo viên. Trong việc đánh giá kết quả học tập của người học ta có
thể dùng cả 2 loại, tuỳ thuộc vào mục đích của việc đánh giá.
Một trắc nghiệm chuẩn mực cho biết vị trí của một học sinh trong bảng
phân bố điểm số so sánh với vị trí của các học sinh khác trong nhóm được chọn
làm chuẩn mực.
Còn trắc nghiệm tiêu chí cho biết mức độ đạt mục tiêu giảng dạy trong
một môn học, hay một nội dung dạy học chuyên biệt nào đó.

68
Với những đặc trưng như vậy, trắc nghiệm chuẩn mực được xây dựng để
so sánh giữa các cá nhân với nhau nhằm tuyển chọn một số trong nhóm, thí dụ:
trắc nghiệm chuẩn mực rất có tác dụng trong trường hợp một công ty muốn
tuyển dụng một vài người trong số đông ứng viên, hay tuyển sinh đại học cũng
là một lĩnh vực để trắc nghiệm chuẩn mực phát huy tác dụng.
Còn trắc nghiệm tiêu chí là loại trắc nghiệm thích hợp khi người ta chỉ
cần biết một cá nhân có hay không có khả năng (kĩ năng) nào đó đã được xác
định mà không cần giới hạn về số người có được khả năng (kĩ năng) này là bao
nhiêu. Các kì thi tốt nghiệp THPT, thi lấy bằng lái xe ô tô là một ví dụ điển hình
cho loại trắc nghiệm tiêu chí này.
Do trắc nghiệm tiêu chí có những đặc trưng như trình bày ở trên nên việc
xác định trước các nhiệm vụ (mục tiêu) mà người học phải đạt được một cách rõ
ràng, tường minh là vô cùng quan trọng. Còn độ khó, độ phân biệt của câu hỏi
không phải là tiêu chí quan trọng nữa.
Trắc nghiệm tiêu chí được sử dụng trong các trường hợp sau:
- Giáo viên theo dõi sự tiến bộ của học sinh, chẩn đoán những khó khăn
học sinh có thể gặp phải.
- Đánh giá kết quả, hiệu quả giảng dạy của nhà trường.
- Xác nhận khả năng nghề nghiệp, cấp bằng tốt nghiệp.
Một số điểm cần lưu ý khi sử dụng trắc nghiệm tiêu chí:
1. Trắc nghiệm tiêu chí được sử dụng trong trường hợp khảo sát
việc đạt mục tiêu môn học, bài học, tức là trong phạm vi hẹp của quá
trình đào tạo để xác định việc đạt hay không đạt mục tiêu học tập nào đó,
hay để sắp xếp người học theo các lớp tuỳ theo trình độ của họ.
Soạn thảo các câu hỏi cho trắc nghiệm tiêu chí đòi hỏi phải phân
tích nội dung cần khảo sát tương đối hẹp, người ta có thể liệt kê ra hết
hoặc gần hết những nội dung cần kiểm tra và soạn số câu hỏi tương ứng
với các nội dung đó.
Nếu lĩnh vực cần kiểm tra rộng hơn, cần phải lập dàn bài theo
bảng qui định 2 chiều, trong đó ở cột nội dung cần xác định chi tiết hơn

69
nhiệm vụ mà người học cần thực hiện làm căn cứ cho việc viết các câu
hỏi.
Để soạn thảo các bài TNTC, các tác giả đề xuất qui định cho bài
TN và qui định cho câu trắc nghiệm. Qui định cho bài trắc nghiệm là đưa
ra qui tắc cần phải theo để tạo ra sự bao quát của bài TN, tức là mô tả
cách cấu tạo bài TN, chẳng hạn, tỉ lệ các câu phải nhớ so với các câu
phải giải thích, vận dụng, số lượng câu TN cần có, thời gian làm bài…
Còn qui định về câu TN làm mô tả các loại câu hỏi cần sử dụng, thí
dụ câu TNTL có cấu trúc, TNKQ
Mức độ chi tiết của các qui định trên tuỳ thuộc vào tầm quan trọng
của kì thi (thi tốt nghiệp, bài kiểm tra 15 phút…)
Thông thường các qui định về câu TN bao gồm:
1. Mô tả tổng quát
2. Một câu trắc nghiệm mẫu
3. Các qui định về câu dẫn
4. Các qui định về phần trả lời (cách chấm điểm
5. Phần bổ sung (nếu cần)
2. Trong việc sử dụng TNTC thì việc phân tích độ khó, độ phân biệt
của câu TN đôi khi không cần thiết, vì TNTC chỉ nhằm mô tả thành tích
của học sinh trên cơ sở đối chiếu với mục tiêu đang học. Như vậy, độ
khó, độ phân biệt của câu TNTC cũng cần phải tính đến, nhưng phải sử
dụng theo cách khác, tuỳ thuộc vào mục tiêu học tập đã qui định từ trước.
3. Có thể phân tích câu trắc nghiệm tiêu chí để đánh giá hiệu quả
của việ giảng dạy. Để làm việc này, giáo viên phải tổ chức làm một bài
trắc nghiệm 2 lần, trước và sau khi giảng dạy và so sánh các kết quả với
nhau

Câu TN 1 2 3 4 5

70
Tiền TN
(B)

Hậu TN (A) B A B A B A B A B A

Trần Hai - + + + - - + - - +

Lê Ba - + + + - - + - + +

Đỗ Bốn - + + + - - + - - +

Lê Năm - + + + - - + - - +

Hà Sáu - + + + - - + - + +

Vũ Bảy - + + + - - + - - -

(Dấu +: trả lời đúng câu trắc nghiệm; dấu -: trả lời sai câu trắc nghiệm).
Bảng trên đây cho thấy:
Câu 1: Tất cả 6 học sinh đều trả lời sai trước khi được giảng dạy và tất
cả đều trả lời đúng sau khi được giảng dạy. Như vậy, đó là câu trắc nghiệm lý
tưởng.
Câu 2: Tất cả học sinh đều trả lời đúng cả trước lẫn sau. Đây là câu quá
dễ.
Câu 3: Tất cả đều trả lời sai cả trước lẫn sau. Câu này quá khó hoặc việc
giảng dạy không hiệu quả.
Câu 4: Câu này quá kém, hay quá dễ nhưng thầy đã dạy sai.
Câu 5: Đây là câu tốt và hợp lý. Một số học sinh trả lời sai lúc chưa học,
nhưng sau khi được giảng dạy thì đa số học sinh làm đúng.
Công thức dùng để ước lượng tính nhạy cảm với việc giảng dạy S như
sau:
S = (RA-RB)/T
Trong đó RA = số học sinh làm đúng sau khi giảng dạy

71
RB= số học sinh làm đúng trước khi giảng dạy
T= tổng số học sinh làm câu trắc nghiệm hai lần.
Áp dụng công thức trên với 5 câu trắc nghiệm trong bảng trên, ta có các
chỉ số nhạy cảm (S) như sau:
Câu 1: S=(6-0)/6=1.00
Câu 2: S = (6-6)/6=0.00
Câu 3: S=(0-0)/6=0.00
Câu 4: S= (0-6)/6=-1.00
Câu 5: S = (5-2)/6=0.5
Như vậy, câu trắc nghiệm lý tưởng cho một trắc nghiệm thành thạo có chỉ
số nhạy cảm là 1.00. Các câu trắc nghiệm tốt có trị số S nằm giữa 0.00 và 1.00.
Trị số dương này càng cao bao nhiêu thì chứng tỏ câu trắc nghiệm càng nhạy
cảm bấy nhiêu với hiệu quả giảng dạy. Các câu có trị số S là 0 hay âm không
phản ánh các hiệu quả mong muốn. Điều ta cần phải nhớ là không nên lầm lẫn
chỉ số nhạy cảm (S) với chỉ số phân biệt (D) vì cả hai đều dùng các trị số từ 0.00
đến 1.00. Trị số phân biệt D chỉ mức độ phân biệt của câu trắc nghiệm giữa học
sinh giỏi và kém, còn chỉ số nhạy cảm S chỉ mức độ phản ánh hiệu quả dự kiến
của việc giảng dạy.
Phân tích các phương án nhiễu
Phần trên đây đề cập đến việc tính toán tính nhạy cảm của câu trắc
nghiệm căn cứ trên đáp ứng của học sinh với câu lựa chọn được dự tính là
đúng. Với các phương án nhiễu, ta cũng cần phải phân tích các đáp ứng của học
sinh với các phương án đó. Do đó, ta cần phải xem xét tần số lựa chọn của mỗi
phương án nhiễu. Loại phân tích này có thể được thực hiện tốt nhất vào lúc tiền
- trắc - nghiệm. Lúc ấy, một tỉ lệ học sinh tương đối lớn có thể làm sai câu trắc
nghiệm. Nếu có một số câu trắc nghiệm không được ai lựa chọn, hay lựa chọn
rất ít, thì phương án nhiễu ấy cần được sửa lại.
3. 5. Trắc nghiệm khách quan tiêu chuẩn hoá
Những khác biệt chính giữa TNKQ tiêu chuẩn hoá và trắc nghiệm lớp học

72
Trắc nghiệm khách quan tiêu chuẩn hoá Trắc nghiệm lớp học

Có căn cứ là nội dung và mục tiêu chung Có căn cứ là nội dung và mục
của nhiều trường trong một vùng, 1 nước. tiêu của lớp học

Kiến thức, kĩ năng rộng, ít câu hỏi cho mỗi Đề cập 1 chủ đề, 1 kĩ năng
chủ đề chuyên biệt

Có sự hợp tác giữa chuyên gia và giáo viên Do giáo viên tự viết

Câu trắc nghiệm được thử nghiệm và xử lý Chưa thử nghiệm, xử lý

Độ tin cậy cao Độ tin cậy vừa phải, thấp

Là chuẩn mực cho nhiều nhóm, 1 vùng, 1 Giới hạn trong lớp, trường
nước

Nên sử dụng TNKQ tiêu chuẩn hoá khi


1- So sánh một nhóm hay một cá nhân về mức độ thành quả đạt
được giữa nhiều môn, nhiều kĩ năng khác nhau.
2- So sánh thành quả giữa nhiều trường.
3- Nghiên cứu sự tiến bộ của học sinh sau một thời gian.
4- Muốn so sánh thành quả của học sinh trong hiện tại và dự báo
thành công của họ trong tương lai.
Nên sử dụng trắc nghiệm lớp học khi
1- Đo mức độ đạt mục tiêu học tập.
2- Đánh giá mức độ đạt mục tiêu bằng điểm số.
Cả 2 loại trắc nghiệm có thể dùng để
1- Chẩn đoán khó khăn của học sinh.
2- Xếp lớp theo năng lực
3- Tư vấn nghề nghiệp

73
4- Lựa chọn học sinh cho các chương trình đặc biệt.

74
CHƯƠNG 4
MỘT SỐ KỸ THUẬT XỬ LÝ CÂU HỎI THI

Sau khi thử nghiệm một bài trắc nghiệm mới soạn, để tìm hiểu về độ khó
và độ tin cậy của toàn bài trắc nghiệm, độ khó và độ phân biệt của câu trắc
nghiệm v.v nhằm đi đến kết luận một bài trắc nghiệm là tốt hay chưa tốt, chúng
ta cần tiến hành bước phân tích và xử lý các dữ kiện thu được.
Để làm được điều đó, chúng ta cần nắm vững một số phương pháp thống kê đơn
giản.
4.1. Một số kiến thức cơ bản về thống kê
4.1.1. Phân bố tần số (Frequency Distribution)
Một phân bố tần số là một bảng liệt kê các giá trị mà mỗi biến nhận được
trong một mẫu. Thông thường, bảng phân bố được sắp xếp theo số lượng, liệt kê
số lần xuất hiện của mỗi giá trị. Ví dụ, có 100 người đưa ra ý kiến đánh giá cho
một khẳng định, theo thang điểm từ 1 – 5, trong đó 1 là rất đồng ý, 5 là rất
không đồng ý, phân bố tần số của các câu trả lời của họ có thể là:

Điểm Mức độ đồng ý Tần số

1 Rất đồng ý 20

2 Đồng ý 30

3 Không đồng ý ở một vài điểm 20

4 Hầu như không đồng ý 15

5 Rất không đồng ý 15

Trong trường hợp, một biến không nhận các giá trị rời rạc mà các giá trị
nhận được liên tục trong một khoảng hoặc giá trị nhận được là rất lớn, việc xây
dựng bảng như trên là khá cồng kềnh, nếu không muốn nói là khó thực hiện.
Trong những trường hợp như vậy, người ta nghĩ đến việc sử dụng một bảng

75
phân bố khác dựa trên miền giá trị (bảng phân bố tần số theo nhóm). Ví dụ, khi
đo chiều cao của học sinh trong một lớp, bảng tần suất có thể như sau:

Khoảng chiều cao Tần số Tần số tích luỹ

1.4 – 1.5 mét 25 25

1.5 – 1.6 mét 35 60

1.6 – 1.7 mét 20 80

1.7 – 1.8 mét 20 100

* Trong khi thống kê số liệu liên quan đến điểm trắc nghiệm, cần lưu ý một
số quy tắc trong việc thiết lập các nhóm điểm số cho một phân bố tần số
theo nhóm:
(1) Nên có từ 10-20 nhóm điểm số, tuỳ theo số nhóm tối ưu có thể tóm tắt các
dữ kiện một cách có hiệu quả nhất mà không làm sai lệch hình dạng của phân
bố. Quá ít nhóm sẽ làm cho các dữ kiện bị nén lại nên che dấu những biến đổi có
ý nghĩa trọng hình dạng của phân bố. Quá nhiều nhóm lại khiến cho các dữ kiện
bị giãn ra, tạo nên những khoảng trống không cần thiết.
(2) Bề rộng của mỗi nhóm điểm tuỳ thuộc vào hàng số các điểm số và số nhóm
điểm cần sử dụng. Ví dụ, nếu hàng số điểm là (44-17=27) và ta muốn sử dụng
vào khoảng 10 nhóm điểm số. Vậy bề rộng của nhóm đẳng loại là 27/10=2.7,
hay lấy tròn số là 3.
(3) Khi bề rộng của nhóm điểm nhỏ hơn 10 đơn vị điểm, ta nên chọn các số lẻ
như 1, 3, 5, 7, 9 làm bề rộng của nhóm điểm số, như vậy sẽ thuận tiện hơn vì
trung điểm (midpoint) của nhóm điểm là một số nguyên. Nếu kích thước của
nhóm điểm là 10 hay lớn hơn ta nên sử dụng các bội số của 5.
4.1.2. Các đại lượng đo lường mức độ tập trung hay phân tán của dữ liệu
Sắp xếp và xử lý dữ liệu dựa vào các bảng phân bố tần số sẽ đơn giản hơn
nhiều việc xử lý trên dữ liệu thô. Việc kiểm nghiệm các giả thuyết thống kê
được dựa trên những đánh giá về những điểm khác biệt và tương đồng giữa các
phân bố tần số. Việc đánh giá này có liên quan đến một số đại lượng định tâm

76
như số yếu vị, trung vị, trung bình và các đại lượng đo mức độ phân tán của dữ
liệu như phương sai và độ lệch chuẩn.
4.1.2.1. Các đại lượng đo mức độ tập trung của dữ liệu
4.1.2.1.1 Số trung bình (Mean)
Khi cho một tập dữ liệu, số trung bình là tổng của các giá trị quan sát
được chia cho số các quan sát. Đây là dạng công cụ thường được dùng cho dạng
đo khoảng cách và tỷ lệ. Số trung bình có đặc điểm là chịu sự tác động của các
giá trị ở mỗi quan sát, do đó đây là thang đo nhạy cảm nhất đối với sự thay đổi
của các giá trị quan sát. Số trung bình được tính bằng công thức sau:
1 n
n i =1 xi
x= ⋅∑

Ví dụ, số trung bình của 6 số: 34, 27, 45, 55, 22, 34 là:
34 + 27 + 45 + 55 + 22 + 34 217
= ≈ 36.167
6 6
Với một phân bố tần số thì số trung bình được tính bằng công thức:

x=
∑ fx
n
trong đó “f = tần số”, “ ∑ f .x = tổng cộng tất cả các tích số của điểm số với tần
số f tương ứng”, “n = số đơn vị trong mẫu”. Số trung bình hay bị nhầm lẫn với
số trung vị (median) và số yếu vị (mode).
4.1.2.1.2. Số trung vị (Median)
Là số nằm giữa (nếu lượng quan sát là số lẻ) hoặc là giá trị trung bình của
hai quan sát nằm giữa (nếu số lượng quan sát là số chẵn) của một dãy quan sát
được sắp xếp theo thứ tự từ nhỏ đến lớn. Đây là một dạng công cụ thống kê
thường được dùng để đo lường mức độ tập trung của dữ liệu thang đo thứ tự, nó
có đặc điểm là không bị ảnh hưởng bởi các giá trị đầu mút của dãy phân phối, do
đó rất thích hợp để phân tích đối với dữ liệu có sự chênh lệch lớn về giá trị ở đầu
mút của dãy phân phối.
Số trung vị của một dãy hữu hạn các số có thể được tìm bằng cách sắp
xếp dãy các số từ bé đến lớn và xác định vị trí trung tâm. Ví dụ: nếu a < b < c,
thì số trung vị của dãy số {a, b, c} là b, và nếu a < b < c < d, thì số trung vị của
dãy số {a, b, c, d} là trung bình của b và c, tức là bằng (b + c)/2.

77
4.1.2.1.3. Số yếu vị (Mode)
Là số xuất hiện nhiều lần nhất trong dãy dữ liệu. Ví dụ số yếu vị của dãy
(1, 2, 2, 3, 3, 3, 4) là 3; Dãy (1, 2, 2, 3, 3, 5) có 2 yếu vị là 2 và 3. Số yếu vị
thường được dùng đối với dạng dữ liệu thang biểu danh. Giống như trung vị,
mode không bị ảnh hưởng bởi giá trị đầu mút của dãy phân phối.
4.1.2.2. Các đại lượng đo lường mức độ phân tán của dữ liệu
Khảo sát hai nhóm các số sau:
Nhóm 1: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11
Nhóm 2: 4, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 8
Nhận thấy, kích thước mẫu của hai nhóm này bằng nhau, các giá trị đo lường
mức độ tập trung của dữ liệu đều bằng nhau. Tuy nhiên, hai dữ liệu này lại hoàn
toàn khác nhau. Nhóm 1 có các dữ liệu biến đổi nhiều hơn nhóm 2, điều này có
nghĩa các giá trị trong nhóm 1 phân tán hơn, các giá trị quan sát nằm xa giá trị
trung bình của mẫu hơn là nhóm
4.1.2.2.1. Phương sai (Variance)
Dùng để đo lường mức độ phân tán của một tập các giá trị quan sát xung
quanh giá trị trung bình của tập quan sát đó. Phương sai được tính bằng trung
bình các bình phương sai lệch giữa các giá trị quan sát đối với giá trị trung bình
của các quan sát đó. Người ta dùng phương sai để đo lường tính đại diện của giá
trị trung bình tương ứng, các tham số trung bình có phương sai tương ứng càng
lớn thì giá trị thông tin hay tính đại diện của giá trị trung bình đó càng nhỏ.
Phương sai của mẫu được tính bằng công thức:
n

∑ (x i − x) 2
S2 = i =1

n −1
4.1.2.2.2. Độ lệch chuẩn
Trong xác suất và thống kê, độ lệch chuẩn là đại lượng đo lường mức độ
phân tán của một tập hợp các giá trị. Độ lệch chuẩn thường được kí hiệu bằng
chữ cái σ (chữ sigma thường). Nó được xác định bằng căn bậc hai của bình
phương trung bình độ lệch của các giá trị quan sát so với giá trị trung bình của
nó, hoặc được tính bằng căn bậc hai của phương sai. Chẳng hạn, nếu một biến

78
ngẫu nhiên X nhận N giá trị (là các số thực) với xác suất bằng nhau, khi đó độ
lệch chuẩn σ có thể được tính như sau:
1. Với mỗi xi , tính độ lệch của nó so với giá trị trung bình ( xi − x).
2. Tính bình phương của các độ lệch đó.
3. Tìm giá trị trung bình của bình phương các độ lệch. Đại lượng đó gọi là
phương sai σ2.
4. Lấy căn bậc hai của phương sai
Độ lệch chuẩn có thể được tính theo công thức sau:
1 N
σ= ∑ ( xi − x ) 2
N i =1

Trong đó x là giá trị trung bình của biến X.


Ví dụ
Giả sử chúng ta muốn tính độ lệch chuẩn của các số 3, 7, 7, và 19.
Bước 1: Tìm số trung bình (mean) của 3, 7, 7, và 19,
(3 + 7 + 7 + 19) / 4 = 9.
Bước 2: Tìm độ lệch của mỗi số với số trung bình,
3 − 9 = − 6; 7 − 9 = − 2; 7 − 9 = − 2; 19 − 9 = 10.
Bước 3: Bình phương mỗi độ lệch, sẽ khuếch đại độ lệch và biến các giá trị âm
thành dương,
( − 6)2 = 36; ( − 2)2 = 4; ( − 2)2 = 4; 102 = 100.
Bước 4: Tìm trung bình của các bình phương độ lệch,
(36 + 4 + 4 + 100) / 4 = 36.
Bước 5: Lấy căn bậc hai số học của thương trên 36 = 6 .
Vậy, độ lệch chuẩn của dãy đã cho là 6
Trong thực tế, người ta thường giả sử rằng dữ liệu được cho từ một dân số
có phân bố chuẩn. Điều này đã được chứng minh là lý tưởng nhờ định lý giới
hạn trung tâm trong xác suất, phát biểu rằng, tổng của nhiều biến ngẫu nhiên độc
lập, phân bố tương tự nhau sẽ tiến tới giới hạn là một phân bố chuẩn. Nếu giả
thiết được kiểm nghiệm là đúng thì có khoảng 68% giá trị nằm trong khoảng
lệch chuẩn là 1 so với giá trị trung bình, khoảng 95% giá trị nằm trong khoảng

79
lệch chuẩn là 2 so với giá trị trung bình và khoảng 99.7% nằm trong khoảng lệch
chuẩn là 3 so với giá trị trung bình. Điều này được biết đến như quy tắc 68-95-
99.7.
Khoảng tin cậy được cho như sau

σ 68.26894921371%
1.645σ 90.000%
1.96σ 95.000%
2σ 95.44997361036%
2.576σ 99.000%
3σ 99.73002039367%
4σ 99.99366575163% Biểu đồ phân bố lệch chuẩn
5σ 99.99994266969%
6σ 99.99999980268%
7σ 99.99999999974%
* Ước lượng độ lệch chuẩn của dân số từ độ lệch chuẩn của mẫu
Trong thực tế, tìm ra độ lệch chuẩn của cả một dân số là không thực tế
trong các trường hợp xác định, chẳng hạn trong trắc nghiệm tiêu chuẩn hoá, khi
mà mỗi phần tử của một dân số được chọn là một mẫu. Trong hầu hết các trường
hợp, độ lệch chuẩn được ước lượng bởi việc lẫy ngẫu nhiên một mẫu từ dân số.
Đại lượng thường sử dụng nhiều nhất là độ lệch chuẩn của mẫu, được xác định
bởi
1 n
s= ∑ ( xi − x ) 2
N − 1 i =1

Trong đó, {x1 , x2 ,, x N } là mẫu và x là số trung bình của mẫu. Mẫu số (N-1) là
số bậc tự do của vectơ (x1 − x, x2 − x,, x N − x).
* Khoảng biến thiên (Range): Là khoảng cách giữa giá trị quan sát nhỏ nhất đến
giá trị quan sát lớn nhất.
* Sai số trung bình mẫu (Standard Error of Mean): Được dùng để đo lường sự
khác biệt về giá trị trung bình của mẫu nghiên cứu này so với mẫu nghiên cứu
khác trong điều kiện có cùng phân phối. Nó có thể được dùng để so sánh giá trị
trung bình quan sát với một giá trị ban đầu nào đó. Ta có thể kết luận hai giá trị

80
này là khác nhau nếu tỷ số về sự khác biệt đối với sai số trung bình nằm ngoài
khoảng (-2, +2). Công thức tính sai số trung bình mẫu:
S
Sx =
n
* Cách tính trung bình độ lệch tiêu chuẩn với các dữ kiện không phân
nhóm
Xét ví dụ sau: Ta xếp các điểm thô (raw score) từ cao đến thấp
Ví dụ:
X d d2
16 5.5 30.25
14 3.5 12.25
12 1.5 2.25
11 0.5 0.25
10 -0.5 0.25
10 -0.5 0.25
9 -1.5 2.25
9 -1.5 2.25
8 -2.5 6.25
6 -4.5 20.25
2
∑ x = 105 ∑ d = 0.0 ∑d = 76.50

Tính điểm trung bình bằng cách cộng tất cả các điểm thô rồi chia cho n, số đơn
vị (hay trường hợp trong mẫu).

x=
∑ x = 105 = 10.5
n 10
Tính độ lệch chuẩn:
- Trừ x cho mỗi điểm thô, ta có d = x − x .
- Bình phương mỗi d, ta có d 2 .
- Tổng cộng các d 2 , ta có ∑d 2
= 76.5

d2 76.5
- Tính độ lệch chuẩn theo công thức: = = 2.91
n −1 9
Ngoài công thức trên, ta còn có một công thức tính độ lệch tiêu chuẩn với mẫu
gồm n người như sau

81
2
n∑ x 2 − (∑ x )
n(n − 1)

4.1.3. Hệ số tương quan


Dùng để đo lường mối tương quan giữa hai biến thứ tự hoặc khoảng cách.
Việc đo lường mối tương quan giữa hai biến thứ tự này chủ yếu dựa vào hai hệ
số tương quan Spearman và hệ số tương quan Pearson. Trong đó:
o Hệ số tương quan Spearman (rho) được dùng để đo lường mối quan
hệ giữa hai biến thứ tự (các biến này hầu hết đều được sắp xếp từ
thấp nhất đến cao nhất).
o Khi các biến trong bảng là các biến định lượng ta sử dụng hệ số
tương quan Pearson để đo lường mối quan hệ tuyến tính giữa các
biến này.
Các giá trị của hệ số tương quan biến thiên từ –1 đến 1, dấu cộng hoặc trừ
chỉ ra hướng tương quan giữa các biến (thuận hay nghịch), giá trị tuyệt đối của
chỉ số này cho biết cường độ tương quan giữa hai biến, giá trị này càng lớn mối
tương quan càng mạnh.
Hệ số tương quan có thể là một số dương, âm hoặc bằng 0. Nếu các trị số
thấp của biến X có liên hệ với các trị số thấp của biến Y và các trị số cao của
biến X có liên hệ với các trị số cao của biến Y thì hệ số tương quan nhận giá trị
dương và ngược lại, nhận giá trị âm. Khi không có sự liên hệ hệ thống nào giữa
biến X và biến Y thì đó là tương quan 0. Khi có sự tương quan thuận hoàn toàn
thì nó là tương quan 1. Mối tương quan giữa hai biến X và Y được đo lường bởi
hệ số tương quan r, được tính bởi công thức
N ∑ xy − ∑ x∑ y
r=
[N ∑ x 2
− (∑ x ) 2 ] [N ∑ y 2
− (∑ y ) 2 ]
4.2. Các loại điểm số trắc nghiệm
4.2.1. So sánh với tiêu chuẩn tuyệt đối
Các điểm trắc nghiệm thuộc loại này được so sánh với thành quả đạt được
của mỗi người với điểm số tối đa có thể đạt được với bài trắc nghiệm. Điểm số
của những người làm bài trắc nghiệm không ảnh hưởng đến nhau.

82
a. Điểm phần trăm đúng: So sánh điểm số của người làm trắc nghiệm với điểm
số tối đa có thể đạt được, nói cách khác, loại điểm số này có thể xem như là
điểm số trên một bài trắc nghiệm với 100 câu hỏi. Điểm số này được tính bằng
tỷ lệ phần trăm:
X=100Đ/T
Trong đó: X: Điểm tính theo tỉ lệ phần trăm
Đ: Số câu trắc nghiệm làm đúng
T: Tổng số câu trắc nghiệm
Khi sử dụng loại điểm này, người ta thường đặt ra trước tiêu chuẩn mà học sinh
phải đạt được mới được xem là đạt hay chưa đạt yêu cầu. Ví dụ, trả lời được
50% số câu thì mới được xem là đạt yêu cầu, dưới con số ấy xem như chưa đạt.
Việc xác định trước tiêu chuẩn như vậy có tính cách tuỳ tiện. Nó không khách
quan và không đo lường được khả năng của học sinh vì người ta có thể viết các
câu trắc nghiệm dễ hơn hoặc khó hơn tuỳ theo ý muốn để thay đổi kết quả đo
lường. Người ta thường chỉ dùng loại điểm phần trăm đúng với loại trắc nghiệm
tiêu chí (là loại trắc nghiệm mà kết quả đo lường xác định được không dùng để
so sánh với thành tích của các cá nhân khác mà đo lường khả năng của người
học thực hiện được một tập hợp kỹ năng hay kiến thức ở một mức độ nào đó).
b. Điểm chữ: Là loại điểm căn cứ trên tỉ lệ phần trăm số câu làm đúng, nhưng
được biểu thị bằng các chứ cái A, B, C, D v.v.
4.2.2. So sánh với nhóm làm chuẩn mực
a. Thứ hạng bách phân và điểm bách phân:
Thứ hạng bách phân là một con số nằm giữa 0 và 100, cho biết có bao nhiêu
phần trăm trường hợp trong một nhóm chuẩn mực rơi vào chính số ấy hay ở
dưới nó.
Điểm bách phân: Là một điểm trên thang điểm số mà ở đó có một số phần trăm
trường hợp nào đó rơi vào chính điểm số ấy hay ở dưới nó.
b. Điểm tiêu chuẩn:
Điểm số loại này được tính trên cơ sở độ lệch tiêu chuẩn của phân bố điểm số,
có thể hiểu là khoảng cách điểm ấy tính từ trung bình. Có nhiều loại điểm tiêu

83
chuẩn:
* Điểm Z: là điểm tiêu chuẩn cơ sở, từ đó có thể thiết lập các loại điểm tiêu
chuẩn khác. Điểm Z cho ta biết hiệu số giữa số trị số điểm thô nào đó và điểm
trung bình của nhóm làm bài trắc nghiệm.
X−X
Z=
s

Trong đó: X: là một điểm thô nào đó; X : điểm thô trung bình của nhóm làm trắc
nghiệm; s: độ lệch tiêu chuẩn của nhóm ấy.
* Điểm tiêu chuẩn V: Về căn bản, giống như điểm Z, nhưng nó được qui về
phân bố chuẩn với trung bình là 10 và độ lệch tiêu chuẩn là 4.
Điểm chuẩn V = 4Z + 10
Tuy nhiên, với thang điểm từ 0 đến 10, điểm V được tính theo công thức trên
không áp dụng được, cần phải thay đổi bằng cách chọn điểm trung bình là 5 và
độ lệch chuẩn là 2.
Điểm chuẩn V (mới) = 2Z + 5
Nếu muốn đổi điểm thô ra bất cứ loại điểm tiêu chuẩnnào, ta có thể sử dụng
công thức:
σv ⎛ σ ⎞
Xv = X 0 − ⎜ v M 0 − M v ⎟
σ ⎝ σ ⎠

Trong đó:
Xv: là một điểm số trên thang điểm tiêu chuẩn
X0: là một điểm thô
Mv: trung bình của thang điểm tiêu chuẩn
M0: trung bình của phân bố điểm thô
σ v : độ lệch tiêu chuẩn của thang điểm tiêu chuẩn

σ 0 : độ lệch tiêu chuẩn của phân bố điểm thô.

4.3. Một số yêu cầu đối với các công cụ kiểm tra đánh giá
Những yêu cầu cơ bản đối với bài thi dạng TNKQ là độ phân biệt, độ khó

84
của câu hỏi, độ tin cậy, độ giá trị của bài thi.
Bài thi có các câu hỏi với độ khó và độ phân biệt tốt sẽ đảm bảo toàn bài
thi có độ giá trị và độ tin cậy cao, nghĩa là giúp giáo viên đánh giá đúng thành
tích học tập của học sinh.
4.3.2.1. Độ phân biệt của câu trắc nghiệm
Một câu hỏi có độ phân biệt tốt cho phép phân biệt được học sinh giỏi với
học sinh kém, đồng thời, đóng góp làm gia tăng độ tin cậy và độ giá trị của bài
thi.
Có nhiều phương pháp xác định độ phân biệt của câu trắc nghiệm khách
quan. Dưới đây là một số phương pháp đơn giản và thông dụng nhất.
Việc phân tích độ phân biệt được thực hiện theo 4 bước
1 - Xếp các bảng trả lời đã chấm theo thứ tự từ điểm số cao đến thấp
2 – Phân chia các bảng trả lời theo 2 nhóm
- Nhóm cao xấp xỉ 27% của toàn nhóm có điểm cao nhất.
- Nhóm thất xấp xỉ 27% của toàn nhóm có điểm thấp nhất.
3 – Ghi số lần trả lời của học sinh trong cả 2 nhóm cho mỗi phương án
chọn của mỗi câu trắc nghiệm khách quan theo mẫu.
Thí dụ: Câu trắc nghiệm số i

Các phương án chọn A B* C D E Tổng

Nhóm cao (27%) 1 10 3 0 4 18

Nhóm thấp (27%) 0 4 6 1 7 18

4 - Cộng số lần trả lời đúng (phương án B) của nhóm cao và thấp, chia
tổng số này cho số bài (số người) của 2 nhóm cộng lại - kết quả là chỉ số khó
của câu i

10+4
Di = = 0.39 tức 39%
36

85
5 - Lấy số làm đúng trong nhóm cao trừ số làm đúng trong nhóm thấp, rồi
chia hiệu số này với hiệu số tối đa của nó (27%N) kết quả là chỉ số phân biệt của
câu trắc nghiệm i.
Trong thí dụ này,

10-4
Di = = 0.33
18

Như vậy, chỉ số phân biệt D được tính bởi công thức

C-T
Di = = 0.33
n

Trong đó, C là số người trong nhóm cao làm đúng câu TN


T là số người trong nhóm thấp làm đúng câu TN
n là hiệu số tối đa (n = 27N)
Một phương pháp khác để tính chỉ số D là tỉ lệ % số người làm đúng câu
TN trong nhóm cao trừ đi tỉ lệ % số người làm đúng các câu TN trong nhóm
thấp, hiệu số là chỉ số phân biệt của câu.
Thí dụ một bài TN có 40 câu do 100 thí sinh làm, 27 sinh viên có điểm
cao nhất được đưa vào nhóm cao, 27 sinh viên có điểm thấp nhất được đưa vào
nhóm thấp, kết quả phân tích 4 câu (1, 2, 3, 4) trong số 40 câu được trình bày
cho dưới

Câu % Nhóm cao % Nhóm thấp Chỉ số D

1 71 42 29%

2 60 24 36%

3 47 42 5%

4 38 61 - 23%

86
Các bạn thử phân tích các số liệu này.
Chỉ số D từ 40% trở lên là rất tốt
từ 30-39% là khá tốt
từ 20-29% là tạm được, có thể cần phải hoàn chỉnh
dưới 19% là kém, cần loại hay sửa chữa lại cho tốt hơn.
Chỉ số phân biệt tỉ lệ thuận với độ tin cậy.
4.3.2.2.Độ khó của câu trắc nghiệm
Độ khó của của câu trắc nghiệm được tính bằng công thức
Số thí sinh trả lời đúng câu i
Trị số P của câu i =
Tổng số thí sinh
Độ khó vừa phải của câu trắc nghiệm là ≈ 50% (hay 50%), trong dải 25% - 75%.
4.3.2.3. Độ khó của bài trắc nghiệm
Độ khó của bài trắc nghiệm được xác định bằng cách đối chiếu điểm
trung bình của bài trắc nghiệm (sau khi chấm) với điểm trung bình lí tưởng của
bài đó.
Điểm trung bình lý tưởng là điểm giữa của điểm tối đa có được và điểm
may rủi tối đa của bài đó.
Thí dụ, một bài trắc nghiệm có 50 câu, mỗi câu có 5 lựa chọn thì điểm
may rủi tối đa là 10 điểm, điểm tối đa có được là 50 điểm, và điểm trung bình lý
tưởng sẽ là (10+50)/2 = 30.
Nếu điểm trung bình của bài trắc nghiệm sau khi chấm trên hay dưới 30
quá xa thì có nghĩa là bài trắc nghiệm quá dễ hoặc quá khó.
4.3.2.4. Phân tích các phương án nhiễu
Về nguyên tắc, các câu nhiễu phải được các học sinh nhóm kém chọn
nhiều hơn các học sinh nhóm giỏi. Do vậy, ngoài việc tìm ra những câu quá khó
hoặc quá dễ, có độ phân biệt kém, cũng cần phân tích các câu nhiễu để loại bỏ
những câu không ai lựa chọn (tức là không có tác dụng gây nhiễu)

87
Thí dụ:
Với câu trắc nghiệm có kết quả sau khi đã thống kê như sau:

Các phương án chọn A B C D* E Tổng

Nhóm cao 7 2 0 8 1 18

Nhóm thấp 2 6 3 5 2 18

Độ khó của câu trắc nghiệm là 0.36, độ phân biệt là 0.16. Như vậy, câu
này thuộc loại câu khó và độ phân biệt thấp. Ta cần phải xét kỹ toàn bộ câu trắc
nghiệm.
Về phương án lựa chọn đúng D, số học sinh trong nhóm cao trả lời đúng
nhiều hơn ở nhóm thấp, như thế có tương quan thuận như mong đợi, nhưng sự
khác biệt (8-5) quá nhỏ.
Về các phương án nhiễu B, C, E, có mối tương quan nghịch như mong
đợi. Đáng chú ý nhất là phương án nhiễu A, ở đó, số học sinh trong nhóm cao
làm sai nhiều hơn ở nhóm thấp, trái với điều ta mong đợi. Sự khác biệt ở phương
án nhiễu này (7-2) lại còn lớn hơn ở phương án lựa chọn đúng D.
Như vậy ta cần xem lại phương án lựa chọn A và D. Hẳn phương án D có
nhiều điểm đúng, vì thế nhiều học sinh trong nhóm cao đã lựa chọn nó. Các dữ
kiện ở phương án D này cho phép ta tin rằng phương án lựa chọn này không
phải là sai. Nhưng các dữ kiện ở phương án nhiễu A cũng có thể khiến tra nghi
ngờ rằng phương án này cũng có phần nào đúng, nếu giải thích về một phương
diện nào đó. Sau khi xem xét và so sánh hai phương án lựa chọn A và D này và
nếu thấy quả đúng như vậy thì ta có thể cho cả 2 phương án lựa chọn này đều
đúng cho nhóm học sinh ấy và phải sửa lại làm sao chỉ có một lựa chọn rõ ràng
là đúng mà thôi.
4.3.2.5. Độ tin cậy và độ giá trị của bài thi
Bài thi được xem là có độ tin cậy cao khi nó cho những kết quả ổn định,
nghĩa là khi làm bài trắc nghiệm đó hơn 1 lần, mỗi học sinh vẫn giữ được thứ
hạng tương đối của mình trong nhóm.
Độ tin cậy của bài trắc nghiệm rất phụ thuộc vào cách chọn mẫu (số lượng

88
câu hỏi), độ khó, độ phân biệt của các câu hỏi.
Một bài thi có độ tin cậy mới có thể có độ giá trị, tức là chỉ khi bài thi cho
một kết quả ổn định, nó mới giúp đo đúng cái cần đo, và lúc đó ta mới đạt được
mục đích của kì thi hay kiểm tra. Độ tin cậy và độ giá trị khác nhau ở chỗ là độ
tin cậy liên quan đến sự ổn định của điểm số, còn độ giá trị liên quan đến mục
đích của sự đo lường.
Tuy nhiên, một bài trắc nghiệm tin cậy chưa chắc đã có độ giá trị (có
điểm số ổn định, nhưng không đo được cái cần đo), nhưng ngược lại, một bài
trắc nghiệm có độ giá trị thì chắc chắn có độ tin cậy. Độ giá trị liên quan đến
mức độ mà bài trắc nghiệm đó phục vụ được cho mục đích của sự đo lường với
nhóm người ta muốn khảo sát. Ví dụ, mục đích của kì thi tuyển sinh là chọn
những người có trình độ giáo dục phổ thông nhưng có năng lực tự học, tự
nghiên cứu ở bậc đại học, mà sau kì thi ta chỉ chọn được những người quen học
thuộc lòng, không có năng lực tư duy phê phán, không có kĩ năng tự học, thì các
bài thi tuyển sinh đó chỉ có độ tin cậy nhưng không có độ giá trị, không giúp ta
đạt mục đích của kì thi tuyển sinh đại học.
Thông thường, có một số loại giá trị như sau
a. Giá trị đồng thời: Giá trị đồng thời nói lên mối liên hệ giữa điểm số của
bài trắc nghiệm với một tiêu chí khác đồng thời, đã có sẵn và được nhiều người
chấp nhận, về khả năng của bài trắc nghiệm ấy muốn đo lường.
b. Giá trị tiên đoán: Giá trị tiên đoán nói liên mối liên hệ giữa điểm số bài
trắc nghiệm với một tiêu chí khác căn cứ vào khả năng (hay thành quả học tập) ở
thời điểm tương lai.
c. Giá trị nội dung: Giá trị nội dung là mức độ "bao trùm“ được nội dung
môn học, bài học. Một bài luận đề nhằm đo lường kiến thức môn học có thể kém
giá trị nội dung vì nó bị giới hạn bởi số câu hỏi ít ỏi. Một bài trắc nghiệm có thể
bao trùm nhiều nội dung môn học, vì có nhiều câu hỏi nhưng nó vẫn có thể kém
giá trị vì chỉ chú trọng vào một phần nội dung nào đó mà bỏ qua các phần quan
trọng khác, hay bài trắc nghiệm ấy xem các phần quan trọng và không quan
trọng giống nhau.
d. Giá trị khái niệm tạo lập: Giá trị khái niệm tạo lập là giá trị liên quan

89
đến các loại học tập được qui định trong các mục tiêu dạy và học. Một bài trắc
nghiệm gồm những câu hỏi chỉ liên quan đến khả năng nhớ thuộc lòng các sự
kiện thì không có giá trị đo lường kiến thức, thông hiểu phân tích, tổng hợp, ứng
dụng, tức là những mục tiêu dạy và học tổng quát.
Trong trường hợp soạn thảo các bài thi trắc nghiệm lớp học, khi không có
thời gian để thi thử và phân tích các câu hỏi cũng như toàn bài thi, người giáo
viên có thể sử dụng sự phán đoán để xác định độ giá trị của bài thi.
Để xác định độ giá trị của bài thi, người giáo viên phải tự đặt 2 câu hỏi
1. Bài trắc nghiệm có phục vụ cho mục đích của nó hay không?
2. Bài thi đo lường chính xác đến mức nào?
Trong quá trình cố gắng trả lời hai câu hỏi này, người giáo viên có thể
phát hiện những khiếm khuyết của các câu hỏi thi hay của cả bài thi.
Có thể phải thêm số câu hỏi để tăng độ tin cậy của bài thi, có thể phải tăng
độ khó của một số câu hỏi v.v.
* Cách tính độ tin cậy của bài trắc nghiệm
1. Cách tính độ tin cậy theo phương pháp phân đôi bài trắc nghiệm
Thực chất là tạo 2 bài trắc nghiệm tương đương, mỗi bài là một nửa bài
trắc nghiệm. Để hai nửa bài thật sự tương đương, người ta sắp xếp từng cặp câu
chẵn và lẻ tương đương nhau để có 2 nửa bài trắc nghiệm một gồm các câu
chẵn và một gồm các câu lẻ. Độ tin cậy của nửa bài trắc nghiệm bằng hệ số
tương quan giữa hai bộ điểm của hai nửa bài trắc nghiệm, còn độ tin cậy của
toàn bài trắc nghiệm có thể thu được khi hiệu chỉnh việc tăng độ dài gấp đôi.
Sự phụ thuộc của độ tin cậy của bài trắc nghiệm vào độ dài của nó được
tính theo công thức tổng quát Spearman-Brown:

nrs
rn =
(n − 1)r + 1
Trong đó rs là độ tin cậy của bài trắc nghiệm ngắn xuất phát, rn là độ tin
cậy của bài trắc nghiệm có độ dài gấp n lần. Rõ ràng để hiệu chỉnh cho trường
hợp bài trắc nghiệm có độ dài gấp đôi, ta phải dùng công thức:

90
2rs
r =
rs + 1
2. Cách tính độ tin cậy theo công thức Kuder – Richardson
Việc tính độ tin cậy theo phương pháp Kuder – Richardson dựa trên ý
tưởng xem mỗi câu trong bài trắc nghiệm là một bài trắc nghiệm tương đương,
tức là chúng có cùng điểm trung bình và cùng phương sai.
Dựa trên giả thiết có thể thu được công thức Kuder – Richardson.20 như
sau để tính độ tin cậy của một bài trắc nghiệm:

k ∑ pq
r = (1 − 2
)
k −1 σ
Trong đó:
k: số câu của bài trắc nghiệm
p: tỉ lệ trường hợp trả lời đúng cho một câu
q: tỉ lệ trường hợp trả lời sai cho một câu

σ 2 : phương sai của tổng điểm mọi thí sinh đối với toàn bài trắc nghiệm
Công thức K-R.20 hơi khó áp dụng, vì đòi hỏi phải biết độ khó p của mỗi
câu trắc nghiệm.
Trong trường hợp độ khó của các câu trắc nghiệm không khác nhau
nhiều, người ta có thể biến đổi công thức K-R.20 thành một công thức dễ tính
toán hơn:

⎡ M ⎤
M (1 − ) ⎥
k ⎢ k
r = ⎢1 - ⎥
k − 1 ⎢ σ2 ⎥
⎣ ⎦
Trong đó M là giá trị trung bình của điểm số bài trắc nghiệm. Đó là công
thức Kuder – Richardson.21
* Đánh giá độ giá trị tiên đoán của bài trắc nghiệm

91
- Độ giá trị tiên đoán (predictive validity): Một bài trắc nghiệm dùng để
xét tuyển thường cần có độ giá trị tiên đoán, tức là bộ điểm số của nó tương
quan tốt với một bài trắc nghiệm đánh giá hoặc các tiêu chí để đánh giá theo
mục tiêu. Chẳng hạn, bộ điểm số của bài trắc nghiệm tuyển sinh đại học đối với
một nhóm thí sinh nào phải tương quan tốt với kết quả học tập cuối giai đoạn 1
đại học, chẳng hạn theo tiêu chí điểm trung bình của giai đoạn 1 đại học.
Để nâng cao giá trị tiên đoán người ta thường không chỉ dùng một bài
trắc nghiệm tiên đoán, mà dùng nhiều bài trắc nghiệm khác nhau hoặc các yếu
tố khác nhau kết hợp với nhau để tiên đoán. Nói cách khác người ta thường xác
định mối tương quan nhiều chiều, biểu hiện qua phương trình hồi quy đa biến.
Chẳng hạn, một phương trình hồi qui đa biến tiên đoán điểm trung bình
xếp hạng ở trường đại học có thể có dạng như sau:
Y= 0.5 X1 + 0.01 X2 + 0.5
Trong đó Y là điểm trung bình xếp hạng ở đại học, X1 là điểm truyển sinh
đại học, X2 là điểm trung bình ở trường trung học phổ thông.
- Độ giá trị nội dung (content validity): Độ giá trị về nội dung phản ánh
đầy đủ các mục tiêu xác định cho môn học, bao trùm đầy đủ nội dung của môn
học. Để xây dựng được một bài trắc nghiệm có độ giá trị về nội dung, cần phải
thiết kế bài trắc nghiệm dựa vào toàn bộ nội dung, vào các loại trí năng mà mức
kỹ năng mà môn học đòi hỏi. Để xác định độ giá trị về nội dung không thể chỉ
dựa vào các tính toán thống kê như độ giá trị tiên đoán hoặc độ giá trị đồng
thời, mà phải phân tích tỷ mỷ và công phu bài trắc nghiệm đối chiếu với mục
tiêu và nội dung môn học.
4.4. Qui trình xử lý số liệu
Trong một qui trình nghiên cứu định lượng, việc xử lý dữ liệu bắt đầu từ khi ta
nhận được kết quả điều tra. Qui trình xử lý số liệu bao gồm các bước sau:
- Bước 1: Kiểm tra, hiệu đính dữ liệu
- Bước 2: Mã hóa dữ liệu
- Bước 3: Nhập dữ liệu đã được mã hóa vào máy tính
- Bước 4: Xác định các lỗi trong cơ sở dữ liệu và làm sạch dữ liệu

92
- Bước 5: Tạo bảng cho dữ liệu và tiến hành các phân tích thống kê
Hai giai đoạn đầu tiên là những bước chuẩn bị cho việc phân tích bằng máy tính
sau này. Giai đoạn 3 là nhập các dữ liệu đã được mã hóa vào máy tính. Quá trình
nhập liệu này có thể dẫn đến những sai sót do đó một bước kế tiếp phải được
thực hiện trước khi tiến hành phân tích dữ liệu là phải làm sạch dữ liệu đã được
nhập vào trong máy.
4.1. Kiểm tra và hiệu đính dữ liệu
Đối với điều tra bằng bảng hỏi, đây là bước kiểm tra chất lượng thông tin
trong bảng hỏi nhằm bảo đảm không thiếu hoặc chứa đựng những thông tin sai
sót theo yêu cầu thiết kế ban đầu, bước này cần thiết được thực hiện trước khi
tiến hành mã hóa và nhập dữ liệu vào máy tính. Thông thường trong bước này
nhà nghiên cứu sẽ tiến hành kiểm tra những đặc tính sau của bảng câu hỏi:
Tính logic của các câu trả lời: Đôi khi trong bảng câu hỏi, do yêu cầu nghiên
cứu sẽ có những điều kiện để người trả lời hoặc có thể trả lời tất cả các câu hỏi
hoặc có thể bỏ qua một vài câu hỏi nào đó. Kiểm tra tính logic của bảng câu hỏi
cho phép nhà nghiên cứu loại bỏ những câu trả lời thừa, cũng như kịp thời bổ
xung những phần thiếu trong bảng câu hỏi. Tính logic của câu trả lời còn phụ
thuộc vào sự kết dính và liên hệ lẫn nhau giữa các câu hỏi trong một bảng câu
hỏi (đôi khi một câu trả lời là có ý nghĩa nếu đứng riêng một mình nó những lại
vô nghĩa nếu kết hợp so sánh với các câu trả lời trước hoặc sau nó).
Tính đầy đủ của một câu trả lời và của một bảng câu hỏi: Một bảng câu hỏi
chỉ có giá trị nếu như tất cả những câu hỏi theo yêu cầu đều được trả lời đầy đủ.
Mỗi câu hỏi trong bảng câu hỏi đều có một ý nghĩa, một giá trị nghiên cứu nhất
định, do đó thiếu một câu trả lời nào đó cho một câu hỏi cụ thể nào đó sẽ làm
mất đi giá trị của bảng câu hỏi đó.
Tính hợp lý và xác thực của các câu trả lời: Một câu trả lời đầy đủ chưa hẳn là
câu trả lời có giá trị, do đó tính chân thực và hợp lý của câu trả lời cũng quyết
định đến giá trị của câu trả lời và của bảng câu hỏi, đặc biệt là các câu hỏi chấm
điểm, câu hỏi mở và các câu hỏi mang tính logic.
Quá trình kiểm tra, rà soát lại bản câu hỏi là nhằm mục đích kiểm tra, phát hiện,
sửa chửa và thông báo kịp thời cho người thu thập dữ liệu tránh những sai sót
tiếp theo.

93
4.2. Mã hoá dữ liệu
Là quá trình chuyển dịch câu trả lời thực của người trả lời vào từng nhóm,
từng mẫu đại diện với các giá trị đại diện tương ứng nhằm làm cho quá trình tóm
tắt, phân tích và nhập liệu được dễ dàng và hiệu quả hơn. Có hai dạng mã hóa:
Tiền mã hóa: Là việc mã hóa cho các câu hỏi đóng. Do đặc điểm của các loại
câu hỏi này là nhà nghiên cứu đã có sẵn các câu trả lời từ trước, người trả lời chỉ
việc lựa chọn câu trả lời nào phù hợp nhất với ý kiến của mình, do đó việc mã
hóa cho các câu hỏi này thường được tiến hành từ trước, ở giai đoạn thiết kế
bảng câu hỏi.
Mã hoá: Trong bảng câu hỏi ngoài những câu hỏi đóng nêu ở trên, còn những
câu hỏi mở, là những câu hỏi mà người trả lời tự do đưa ra câu trả lời theo suy
nghĩ và diễn giãi của chính họ. Các bảng câu hỏi nhận về thường có những câu
trả lời rất khác nhau và rất đa dạng. Do đó công việc mã hóa những câu trả lời
này thì cần thiết cho quá trình kiểm tra, nhập liệu, tóm tắt và phân tích sau này.
Mục đích của mã hóa là tạo nhãn cho các câu trả lời, thường là bằng các con số.
Mã hóa còn giúp giảm thiểu số lượng các câu trả lời bằng cách nhóm các câu trả
lời vào những nhóm có cùng ý nghĩa. Tiến trình mã hóa có thể được tiến hành
như sau:
- Đầu tiên, xác định loại câu trả lời cho những câu hỏi tương ứng. Những câu
trả lời này có thể thu thập từ một mẫu các bảng câu hỏi đã hoàn tất, thường là
25% trên tổng số bảng câu hỏi.
- Bước tiếp theo là xây dựng một danh sách liệt kê các câu trả lời, các câu trả
lời được liệt kê và tiến hành nhóm các câu trả lời theo những nhóm đặc trưng
(có cùng ý nghĩa).
- Cuối cùng, những nhóm câu trả lời này được gán cho một nhãn hiệu, một giá
trị, thường là một con số cụ thể.
4.3. Định biến và nhập dữ liệu
§ Phân loại biến theo kiểu dữ liệu:
Có hai loại biến chính là biến định tính và biến định lượng, đối với biến
định tính ta không thể sử dụng các phép toán (cộng, trừ, nhân, chia) để tính toán
các giá trị trên biến đó, ngược lại biến định lượng cho phép ta thao tác các phép

94
toán trên các giá trị mà nó đại diện. Việc xác định dạng biến theo cách này cho
phép ta lựa chọn được tham số thống kê tương thích để phân tích.
Để xác định được biến là định lượng hay định tính đói hỏi phải xác định các giá
trị trong biến thuộc dạng thang đo nào trong bốn dạng thang đó sau:
Thang đo định danh (Nominal Scale): Trong dạng thang đo này các con số
được sử dụng đơn thuần như một giá trị xác định sự khác biệt cho các câu trả
lời, các giá trị quan sát có ý nghĩa khác biệt nhau. Đối với loại thang định danh
các giá trị số được sử dụng như là con số nhận dạng và không có giá trị về một
thứ tự cao thấp và và độ lớn giữa các con số.
Thang đo thứ tự (Ordinal Scale): Trong dạng thang đo này dữ liệu được xắp
xếp các giá trị quan sát theo một thứ tự cao thấp nhất định, nhưng không diễn tả
được độ lớn giữa vị trí cao thấp giữa các con số. Tóm lại thang đó thứ tự bao
gồm cả thông tin về biểu danh đồng thời cung cấp luôn mối quan hệ theo thứ tự
giữa các giá trị nhưng không đo được khoảng cách giữa các giá trị đó.
Thang đó khoảng cách (Internal Scale): Giống như đặc tính của thang đo thứ
tự, tuy nhiên đối với thang đó khoảng cách cho phép ta đo được khoảng cách
giữa các giá trị. Tuy nhiên do thang đo khoảng cách không xác định được điểm
0 chung (giống như thang đo nhiệt độ) do đó ta chỉ có thể nói giá trị này lớn hơn
giá trị kia bao nhiêu đơn vị nhưng không thể kết luận giá trị này lớn hơn giá trị
kia bao nhiêu lần.
Thang đo tỷ lệ (ratio): Đây là thang đo có đủ các đặc tính thứ tự và khoảng
cách. Ngoài ra việc xác định ra tỷ số chênh lệch giữa các giá trị là có thể thực
hiện do ở thang đo này điểm 0 được xác định một cách có ý nghĩa.
Từ bốn dạng thang đo trên ta phân ra hai loại biến. Biến định tính là biến
chứa các giá trị quan sát ở dạng thang đo biểu danh và thứ tự. Còn biến định
lượng là biến chứa các giá trị có dạng thang đo khoảng cách và tỷ lệ.
Mục đích của việc định biến là gán nhãn và các thông số cho các biến và
gán ý nghĩa cho các giá trị trong biến. Sau khi được mã hóa các dữ liệu sẽ được
đại diện bằng những con số và các con số này có ý nghĩa khác nhau tùy theo câu
trả lời thu thập được. Để các con số này có thể nhập vào máy tính và có thể quản
lý cũng như có ý nghĩa, ta phải tiến hành định biến cho dữ liệu. Qui trình định
biến này bao gồm các bước sau:

95
- Gán tên cho biến (Name)
- Định ra kiểu biến (Type)
- Xác định độ rộng của biến (Width) và số lượng con số sau dấu phẩy hiển thị
(Decimals).
- Gán nhãn cho biến (Variable Label)
- Định tên cho các giá trị trong biến (Value lables)
- Định nghĩa các giá trị khuyết (Missing Values)
4.4. Xác định các lỗi trong cơ sở dữ liệu và làm sạch dữ liệu
Sau khi tiến hành định biến, chúng ta tiến hành nhập dữ liệu vào máy. Khi
tiến hành nhập dữ liệu, những sai sót mà chúng ta mắc phải là không thể tránh.
Tất cả những bước tiếp theo của việc khảo sát, đánh giá phụ thuộc vào chất
lượng của dữ liệu mà ta thu thập được. Số lượng công việc mà ta phải làm để xử
lý các sai số, hay còn gọi là “làm sạch dữ liệu” là rất lớn. Hiện nay, có nhiều
phần mềm chuyên dụng trong nhập dữ liệu, một trong số đó, có thể giúp giảm
thiểu thời gian và công việc phải làm là phân mềm Windows Data Entry
Manager (WinDEM). Phần mềm này có tính năng mạnh và tiện dụng để nhập dữ
liệu, kiểm tra độ giá trị của dữ liệu, tiện dụng cho mọi người có thể dễ dàng
nhập dữ liệu một cách nhanh chóng. Phần mềm này cũng cho phép nhiều người
khác nhau có thể cùng thao tác trên một tập dữ liệu vào cùng một thời điểm.
Ngoài ra, WinDEM còn có tính năng hoà nhập dữ liệu, quản lý file và xuất báo
cáo, giúp người sử dụng có thể nhập các dữ liệu được thu thập bởi nhiều người,
xuất dữ liệu thu thập được thành dữ liệu thô, hoặc sang các phần mềm thống kê
chuyên dụng khác như SAS hay SPSS.
4.5. Tạo bảng cho dữ liệu và tiến hành các phân tích thống kê
Trong phần này, chúng ta sẽ tìm hiểu một cách khái quát về lý thuyết ứng
đáp câu hỏi (Item Response Theory - IRT).
Lý thuyết ứng đáp câu hỏi (IRT) được phát triển trong mấy năm gần đây để tìm
cách giải quyết một số vấn đề và giả định liên quan đến lý thuyết trắc nghiệm cổ
điển (Classical Test Theory – CTT) và cung cấp thông tin để đưa ra các quyết
định mà trước đó không giải quyết được với mô hình CTT. IRT không yêu cầu
các giả thuyết về mẫu hoặc phân bố chuẩn nên lý tưởng để sử dụng trong đánh
giá năng lực với nhiều loại câu hỏi khác nhau. Lý thuyết này cũng không cần

96
yêu cầu việc xem xét sai số đo là như nhau đối với những người cùng làm một
bài test.
Lý thuyết ứng đáp câu hỏi (Item Response Theory – IRT) mô hình hoá
mối liên hệ giữa khả năng của một người và ứng đáp của người ấy với một câu
hỏi trắc nghiệm hay câu hỏi. Vì các khả năng là những gì không thể quan sát
được trực tiếp nên lý thuyết ứng đáp câu hỏi là một trong các mô hình thường
được gọi là mô hình đặc điểm tiềm tàng.
Trái với lý thuyết trắc nghiệm cổ điển, lý thuyết IRT đưa ra một số giả định về
hành vi của người khi trả lời các câu hỏi.
(1) Ta có thể mô tả hay nêu ra đặc điểm của một câu hỏi mà không phụ thuộc
vào mẫu (hay nhóm) người trả lời câu hỏi ấy.
(2) Ta có thể mô tả, hay nêu ra đặc điểm, của một người mà không phải phụ
thuộc vào mẫu (hay nhóm) các câu hỏi được đặt ra cho người ấy.
Tuy nhiên, IRT cũng có một số điểm bất lợi. Hầu như người ta không thể
kiểm chứng được hoàn toàn tính chính xác của các giả định mà lý thuyết ấy đưa
ra, căn cứ trên các dữ liện thu thập được. Hơn nữa, các ứng dụng của lý thuyết
đáp ứng IRT rất tốn kém về chi phí và công sức, so với các ứng dụng tương tự
của các lý thuyết cổ điển.
IRT cho phép người dùng tự tạo ra một thang đo khoảng cách về điểm số
đối với cả độ khó của câu hỏi và năng lực của người trả lời câu hỏi. Những điểm
số này được biểu diễn theo từng nhóm gọi là các logit và được xác định đặc
trưng trên thước thẳng như một thước đo logistic. Giống như thước đo của Anh,
đo theo đơn vị độ dài là inche, thước đo logistic đo khả năng của con người trên
một mặt của thước và mặt còn lại dùng để đo độ khó của câu hỏi. Giống như 2
inch có độ dài gấp đôi 1 inch; 2 logit có độ lớn gấp 2 lần 1 logit. Một câu hỏi có
điểm logit là 10 có độ khó gấp 2 lần 1 câu hỏi có điểm logit là 5. Một người có
điểm logit là 50 có khả năng lớn hơn gấp 5 lần một người có điểm logit là 10.
Đây là điểm khác biệt với những điểm số khác, giống như trong các phân loại
theo nhóm, chúng ta không thể nói rằng một người ở nhóm thứ 50 có năng lực
gấp 2 lần một người ở nhóm thứ 25. Bởi vì điểm logit có thể cộng, trừ, nhân,
chia và các nghiên cứu thống kê có thể tiếp tục được thực hiện sau đó, nên có rất

97
có ý nghĩa đối với các nghiên cứu trong giáo dục, cho thấy điểm yếu, điểm mạnh
và so sánh giữa các nhóm mẫu nghiên cứu.
Trong các mô hình về lý thuyết ứng đáp câu hỏi, mô hình đơn giản và
hiệu quả nhất đối với ứng dụng này là mô hình Rasch (hoặc mô hình một tham
số). Sử dụng mô hình Rasch cho ta minh chứng về cả độ giá trị và độ tin cậy của
bài trắc nghiệm hoặc thang đo. Mô hình Rasch sử dụng các công thức toán học
để tính toán xác suất mà một người có thể làm đúng một câu hỏi và một câu hỏi
có thể được trả lời đúng bởi một người nào đó. Khi xác suất tính được là rất
khác biệt với những điều xảy ra trong thực tế, các kết quả chỉ ra rằng dữ liệu
không khớp với những kì vọng của mô hình toán. Nguyên nhân là do cách sử
dụng các số đo độ tương thích.
Có 2 loại số đo độ tương thích (độ hoà hợp) – tương thích trong và tương thích
ngoài. Độ tương thích ngoài dễ ảnh hưởng tới các điểm tối đa hơn. Độ tương
thích trong tốt sẽ cung cấp thông tin rõ ràng hơn là độ tương thích ngoài tốt.
Trong phân tích dữ liệu theo mô hình Rasch, người sử dụng đặc biệt quan tâm
khi trung bình bình phương (Mean-Square – MNSQ) độ tương thích vượt quá
1.5. Số liệu này càng cao, thông tin thu được càng không đáng tin cậy.
Thông qua việc sử dụng các độ tương thích, mô hình Rasch giúp người sử dụng
nhận biết các câu hỏi bất kỳ không phù hợp với mô hình (do đó làm giảm cả độ
tin cậy và độ giá trị của bài test), và bất cứ ứng viên nào có điểm số không ở
mức độ phù hợp với mô hình. Trong trường hợp này, người sử dụng có thể nhận
biết người thi nào đã lo lắng khi làm bài thi hoặc đã không được đánh giá một
cách công bằng. Người dùng cũng có thể nhận biết các câu hỏi có độ khó lớn
hơn các câu hỏi khác, do đó cho phép người sử dụng có thể điều chỉnh việc dạy
học để cải thiện năng lực của người học.
Mức độ tương thích (hoà hợp) của dữ liệu với mô hình
Mặc dù mô hình Rasch có rất nhiều đặc tính đo lường tốt, nhưng vẫn không có
gì để đảm bảo rằng dữ liệu thu được về việc trả lời câu hỏi sẽ tuôn theo các biểu
thức toán học của mô hình Rasch. Nếu dữ liệu thu thập được không “phù hợp”
với mô hình Rasch, ứng dụng của mô hình Rasch sẽ không tận dụng được các
tính chất đo lường của dữ liệu. Tức là, trừ khi dữ liệu thực sự phù hợp với mô
hình Rasch, nếu không sẽ không mấy hiệu quả khi sử dụng mô hình này.

98
Đặc trưng cốt lõi của mô hình Rasch đó là xác suất thành công của một câu hỏi
có thể hoàn toàn được xác định bởi 2 giá trị: một là độ khó của câu hỏi δ và
năng lực của người trả lời θ . Công thức sau đây cho biết mô hình Rasch với xác
suất thành công của một người khi trả lời một câu hỏi là:
exp(θ − δ )
p = P( X = 1) =
1 + exp(θ − δ ) (1)
Nếu ngoài độ khó của câu hỏi và năng lực của người trả lời, còn có các nhân tố
khác ảnh hưởng tới xác suất thành công của một người trả lời một câu hỏi, khi
đó các giả thuyết của mô hình Rasch đã bị phá vỡ.
§ Đoán mò. Điều này hoàn toàn có thể xảy ra, đặc biệt là đối với các câu hỏi
nhiều lựa chọn khó. Nói chung, chúng ta thường nhận thấy rằng các câu
hỏi mở thường có độ phân biệt lớn hơn các câu hỏi nhiều lựa chọn.
§ Các câu hỏi phụ thuộc. Giả thuyết “độc lập địa phương” của mô hình
Rasch sẽ bị vi phạm khi xác suất để thành công trên một câu hỏi phụ
thuộc vào các phương án trả lời của các câu hỏi khác. Ví dụ, một câu hỏi
yêu cầu phải có thông tin từ các câu trả lời của các câu hỏi trước đó, hoặc,
một câu hỏi cung cấp các đầu mối để trả lời các câu hỏi khác.
§ Sự chênh lệch chức năng của câu hỏi. Điều này xảy ra khi các nhóm
người khác nhau trả lời một câu hỏi theo những cách khác nhau. Ví dụ,
nam giới có thể trả lời các câu hỏi về lĩnh vực bóng đá tốt hơn nữ giới vì
họ yêu thích thể thao hơn.
§ Các đặc điểm khác. Một câu hỏi có thể bao gồm trong nó một số “đặc
điểm”. Ví dụ, một câu hỏi toán có thể kiểm tra cả việc hiểu khái niệm và
khả năng tính toán chính xác. Hai “đặc điểm” này có thể khác nhau đối
với các cá nhân khác nhau. Tức là, một người có thể có đặc điểm này cao
hơn nhưng lại thấp hơn ở đặc điểm còn lại.
Độ tương thích (hoà hợp)
Tác động của những nhân tố bên ngoài khiến cho các giả thuyết của mô hình
Rasch bị phá vỡ có thể được kiểm nghiệm thông qua “độ tương thích”. Tuy
nhiên, vì có nhiều nhân tố có thể ảnh hưởng tới các giả thuyết của mô hình
Rasch, nên các độ tương thích khác nhau đã được thiết kế để phát hiện những
tác nhân can thiệp khác nhau này. Đây là một điểm quan trọng cần phải ghi nhớ,

99
vì chúng ta thường xuyên phải đưa ra các nhận xét đánh giá dựa trên một độ
tương thích đơn lẻ về việc liệu dữ liệu có phù hợp với mô hình Rasch hay
không. Cũng nên chú ý rằng, mỗi độ tương thích chỉ có thể thích hợp với một sự
can thiệp nhất định và không thích hợp với các can thiệp khác của mô hình.
Cơ sở thặng dư đo độ tương thích
Trong phần này, chúng ta sẽ tập trung vào một loại số đo độ tương thích: cơ sở
thặng dư đo độ tương thích. Độ tương thích này được xuất ra trong một số gói
phần mềm IRT như Winsteps (Linacre&Wright, 2000), RUMM (2001), Quest
(Adams&Khoo, 1996) và ConQuest (Wu, Adams & Wilson, 1998).
Wright (1977) đã đề xuất một số độ tương thích với câu hỏi và tương thích với
người trả lời dựa trên thặng dư chuẩn hoá cho mô hình Rasch. Cho xni là điểm
số quan sát được của người thứ n lên câu hỏi i, và Pni là xác suất có được câu trả
lời đúng của người thứ n trả lời câu hỏi i. Khi đó thặng dư chuẩn hoá được định
nghĩa như sau:
( xni − E ( xni ))
z ni =
(Var( xni ))1 / 2 (2)

Trong trường hợp mô hình Rasch rẽ nhánh, E ( xni ) = Pni và Var( xni ) = P ni (1 − Pni ) .
Những số thặng dư này đã cung cấp một công cụ chẩn đoán tổng quát trong
đánh giá tính phù hợp của mô hình. Chúng thường được biểu diễn dưới dạng các
biểu đồ, hướng chú ý tới mô tả câu hỏi / người trả lời hơn là sử dụng các bài test
thống kê cho sự tương thích với mô hình.

Nâng z ni lên lũy thừa bậc 2 và lấy tổng theo n , thông tin biểu hiện qua con số
nhận được từ đó có thể được sử dụng như là chỉ số phù hợp với câu hỏi thứ i.
Nâng z ni và lấy tổng theo i , thông tin biểu hiện qua con số nhận được từ đó có
thể được sử dụng như là chỉ số phù hợp với người thứ n (Theo Wright và
Masters, 1982). Với tương thích câu hỏi, Wright và Masters đã đề xuất một con
số có trọng (weighted) và không có trọng (unweighted) (còn gọi là tương thích
trong và tương thích ngoài, hoặc tổng tương thích có trọng và tổng tương thích
không trọng). Trung bình bình phương của độ tương thích không trọng (tương
thích ngoài) được định nghĩa như sau:

100
2
∑z
n
ni
1 ( xni − E ( xni )) 2
=
N
= ∑ Var( x )
N n
Trung bình bình phương không trọng ni (3)
Trong đó, N là tổng số người trả lời câu hỏi.
Trung bình bình phương tương thích có trọng (tương thích trong) được định
nghĩa như sau:
2 2
∑ z Var( x ) ∑ ( x − E ( x ))
n
ni ni
n
ni ni
=
∑Var( x ) ∑Var( x )
ni ni
Trung bình bình phương có trọng = n n (4)
Khi các giả thuyết xác định đã được đưa ra, có thể thấy được rằng cả trung bình
bình phương có trọng và không trọng đều cùng đạt tới 1.
Chú ý:
Thuật ngữ “trung bình bình phương có trọng” được dùng để chỉ ra rằng bình
phương của một thặng dư tiêu chuẩn hoá được gán trọng số bởi sự thay đổi
2
trong các câu trả lời (xem công thức (4)). Mỗi z ni được nhân bởi Var( xni ) trên tử
số của (4). Mẫu số là tổng của các trọng. Ngược lại, với trung bình bình phương
2
không trọng (công thức (3)), mỗi z ni có thể được coi như có trọng là 1 (trọng
bằng nhau), và mẫu số, N, là tổng của các trọng.

Có một sự lý giải có ý nghĩa cho trọng, Var( xni ) , được dùng trong trung bình
bình phương có trọng. Về bản chất, khi độ khó của một câu hỏi gần với năng lực
của người trả lời, Var( xni ) là tương đối lớn. Khi một câu hỏi nào đó “ngoài ý
muốn” (quá dễ hoặc quá khó), Var( xni ) là tương đối nhỏ. Vậy ta sử dụng một
trọng lớn hơn khi một câu hỏi cung cấp nhiều thông tin hơn về một câu hỏi hoặc
người học (một câu hỏi như ý muốn), và sử dụng trọng nhỏ hơn khi một câu hỏi
nào đó không cung cấp nhiều thông tin về câu hỏi và người trả lời (một câu
ngoài ý muốn).
Ví dụ minh hoạ về độ tương thích trong Conquest
------------------------------------------------------------------------------------------
VARIABLES UNWEIGHTED FIT WEIGHTED FIT
--------------- ----------------------- -----------------------
item ESTIMATE ERROR MNSQ T MNSQ T

101
------------------------------------------------------------------------------------------
1 0.639 0.072 1.08 1.3 1.07 1.9
2 -0.323 0.072 0.83 -2.9 0.87 -3.6
3 -1.806 0.081 1.01 0.1 0.99 -0.2
4 -0.492 0.072 1.00 -0.0 0.98 -0.4
5 0.529 0.072 1.09 1.4 1.04 1.1
6 0.679 0.072 1.02 0.4 1.03 0.7
7 -0.442 0.072 0.92 -1.2 0.95 -1.3
8 1.890 0.080 0.92 -1.2 1.01 0.2
9 1.185 0.075 1.11 1.7 1.03 0.6
10 -1.493 0.078 0.91 -1.4 1.00 0.0

Hình 1. Ví dụ kết quả từ phần mềm IRT cho thấy các chỉ số tương thích thặng dư

Hình 1 là một ví dụ từ ConQuest, cho thấy giá trị của trung bình bình phương
tương thích và số liệu thống kê t cho mỗi câu hỏi. Có thể nhận thấy trong ví dụ
này, giá trị trung bình bình phương tập trung xung quanh 1 và các giá trị t tập
trung quanh 0.
Các giải thích cho trung bình bình phương độ tương thích
Khi khẳng định rằng giá trị trung bình bình phương độ tương thích có một sự kỳ
vọng ở đó, chúng ta cần đưa ra một nhận định về khoảng cách giữa giá trị trung
bình bình phương với một giá trị khác trước khi đưa ra kết luận rằng câu hỏi đó
được xem như là câu hỏi không phù hợp. Hơn nữa, khi một câu hỏi là không
phù hợp, chúng ta cần hiểu theo ý nghĩa “trên mức phù hợp” (giá trị trung bình
bình phương nhỏ hơn 1) và “dưới mức phù hợp” (giá trị trung bình bình phương
nhỏ hơn 1).
Tham số độ dốc cân bằng
Số liệu trung bình bình phương xác định trong công thức (3) kiểm tra xem liệu
một câu hỏi có cùng “độ dốc” như các câu hỏi khác trong bài trắc nghiệm hay
không, vì mô hình Rasch đưa ra các giả thuyết rằng các câu hỏi đều có cùng “độ
dốc”, hoặc có cùng giá trị tham số “độ phân biệt”. Có thể thấy rằng, khi quan sát
đường cong đặc tính câu hỏi (Item Characteristic curve – ICC) thấy “dốc hơn”

102
đường đặc tính được kỳ vọng, giá trị trung bình bình phương tương thích là nhỏ
hơn 1. Khi đường đặc tính câu hỏi quan sát được “nằm ngang hơn” đường đặc
tính kỳ vọng, giá trị trung bình bình phương tương thích là lớn hơn 1. Hình 2 và
hình 3 dưới đây minh hoạ cho 2 ví dụ khi mà đường đặc tính quan sát được là
nằm ngang và dốc hơn đường đặc tính kỳ vọng.

Hình 2. Đường đặc tính quan sát được là “nằm ngang hơn” đường đặc tính kỳ
vọng

103
Hình 3. Đường đặc tính quan sát được là “dốc hơn” đường đặc tính kỳ vọng

Ngược lại với những suy nghĩ thông thường, độ tương thích dựa trên thặng dư
không cho ta sự biểu thị về khoảng cách giữa đường đặc tính quan sát được và
đường đặc tính lý thuyết. Tức là, chỉ cho biết “độ dốc” của đường đặc tính quan
sát được có giống như độ dốc của đường đặc tính lý thuyết hay không, trung
bình bình phương tương thích không cho biết dữ liệu là tương thích hay không
nếu khoảng cách giữa đường đặc tính quan sát được và đường đặc tính lý thuyết
là xa nhau.
Hình 4 cho thấy một câu hỏi có đường đặc tính quan sát được rất gần với đường
đặc tính lý thuyết cho tất cả các nhóm năng lực. Trung bình bình phương tương
thích là 0.95. Ngược lại, hình 5 cho thấy một câu hỏi mà đường đặc tính quan
sát được có số điểm mốc nằm tương đối xa so với đường lý thuyết, nhưng trung
bình bình phương tương thích vẫn là 0.95. Hai ví dụ này cho thấy số trung bình
bình phương tương thích không đề cập đến số các “nhóm” quan sát được trên
đường đặc tính quan sát được khi so sánh với đường đặc tính lý thuyết. Hơn
nữa, số trung bình bình phương tương thích cho phép kiểm tra “độ dốc” của
đường đặc tính quan sát được xem có giống với đường đặc tính lý thuyết hay
không.

104
Hình 4. Đường đặc tính quan sát được gần với đường đặc tính lý thuyết

Hình 5. Đường đặc tính quan sát được “nằm xa” đường đặc tính lý thuyết

Các tính chất phân bố của trung bình bình phương độ tương thích
Trong phần bàn về bản chất của số trung bình bình phương độ tương thích (công
thức (3) và công thức (4)), đã khẳng định rằng 2 loại số liệu này đều cho ta cùng
một lời giải. Tức là khi dữ liệu là tương thích (hoà hợp) với mô hình, ta mong

105
muốn rằng số trung bình bình phương độ hoà hợp là gần với 1. Nhưng “gần 1
đến bao nhiêu” được xem là một cách đánh giá. Để đánh giá “gần 1 bao nhiêu
thì đủ”, chúng ta cần biết tổng lượng thay đổi của trung bình bình phương.
Thông thường, phương sai tiệm cận của trung bình bình phương độ hoà hợp
được cho bởi công thức 2/N, trong đó N là cỡ mẫu. Điều này có nghĩa là, nếu
một bài test được thực hiện bởi một nhóm học sinh với số lượng nhỏ, chúng ta
chờ đợi giá trị trung bình bình phương độ tương thích cho mỗi câu hỏi sẽ dao
động trong một khoảng khá rộng xung quanh 1, thậm chí là khi các câu hỏi là
tương thích với mô hình Rasch. Ví dụ, nếu cỡ mẫu là 200, chúng ta kì vọng giá
2
= 0.1
trị trung bình bình phương sẽ nằm giữa 0.8 và 1.2 (với sai số = 200 ).
Cũng với cùng bài test đó nhưng nếu chúng ta thực hiện trên một nhóm học sinh
với số lượng lớn hơn, giá trị trung bình bình phương độ tương thích sẽ gần với 1
hơn. Ví dụ, nếu cỡ mẫu là 2000, chúng ta sẽ kỳ vọng rằng giá trị trung bình bình
2
= 0.03
phương sẽ nằm giữa 0.94 và 1.06 ( 2000 ). Vì phương sai của số trung
bình bình phương phụ thuộc vào cỡ mẫu, chúng ta cần phải cẩn thận trong việc
áp dụng các giới hạn xác định xung quanh 1 để có thể đưa ra một đánh giá về độ
tương thích của câu hỏi.

Số tương thích t
Số tương thích t, khi tính toán cũng cần tới cỡ mẫu. Số tương thích t có thể được
xem như là một độ lệch tiêu chuẩn với trung bình của 0 và một độ lệch chuẩn 1.
Đây là một phép biến đổi của giá trị trung bình bình phương độ tương thích, có
tính đến giá trị trung bình và phương sai của số trung bình bình phương độ
tương thích.
Chú ý
Để biến đổi giá trị trung bình bình phương độ tương thích thành số tiêu chuẩn
hoá để ta có thể tìm thấy dễ dàng mức độ quan trọng của nó, phép biến đổi
Wilson – Hilferty thường được sử dụng
1/ 3
( Fit unwtt − 1 + 2 /(9 N ))
t unwtt =
(2 /(9 N ))1 / 2

106
Trong đó Fit là giá trị trung bình bình phương.
Một phép biến đổi khác được đưa ra bởi Wright và Masters (1982), trong đó sử
dụng phép biến đổi khai căn bậc 3 của giá trị trung bình bình phương và
phương sai của nó
3 Var( Fitunwtt )
[ 1/ 3
t unwtt = Fitunwtt ]
−1. +
3
Var( Fitunwtt )

Vì số tương thích t có thể được xem như là 1 độ lệch tiêu chuẩn, một giá trị t
nằm ngoài miền -2.0 đến 2.0 (hoặc chính xác hơn là -1.96 đến 1.96) có thể được
xem như một dấu hiệu của sự không tương thích, với khoảng tin cậy là 95%.
Vấn đề mà chúng ta gặp phải đó là, trong đời thực, không có câu hỏi nào tương
thích hoàn toàn với mô hình Rasch! Khi các câu hỏi không tương thích với mô
hình Rasch, bất cứ một sự không tương thích nào dù là nhỏ cũng có thể tìm thấy
khi mà cỡ mẫu là không đủ lớn. Điều này có nghĩa là giá trị tương thích t sẽ luôn
luôn cho ta thấy mức độ quan trọng của nó khi cỡ mẫu đủ lớn. Theo một nghĩa
nào đó, giá trị t cho chúng ta biết “sự thật” về sự khác biệt thực sự giữa các câu
hỏi, và các câu hỏi không có cùng một cấu trúc.
Ví dụ sau đây cho ta biết sự ảnh hưởng của cỡ mẫu đến giá trị t.
Dữ liệu về ứng đáp câu hỏi trong một cuộc khảo sát so sánh tầm cỡ quốc tế được
tính toán tỉ lệ bằng phần mềm ConQuest, đầu tiên là thực hiện trên 300 học sinh
ngẫu nhiên, và sau đó chọn 2500, và 15000. Tức là các câu hỏi được tính toán
trên cả 3 mẫu là như nhau nhưng cỡ mẫu tăng dần.
------------------------------------------------------------------------------------------
VARIABLES UNWEIGHTED FIT WEIGHTED FIT
--------------- ----------------------- -----------------------
item ESTIMATE MNSQ T MNSQ T
------------------------------------------------------------------------------------------
1 -1.336 0.94 -0.4 1.07 0.6
2 -0.571 1.12 0.8 1.08 0.8
3 0.758 0.80 -1.5 0.90 -0.9
4 1.606 0.94 -0.4 1.02 0.2
5 1.578 0.99 -0.1 1.03 0.3
6 -1.354 0.88 -0.9 0.92 -0.6
7 0.738 0.76 -1.8 0.91 -0.6

107
8 -0.942 0.87 -0.9 0.98 -0.2
9 -0.590 0.99 0.0 0.95 -0.4
10 -1.332 1.05 0.4 1.00 0.0
Hình 6. Độ tương thích t với cỡ mẫu 300 học sinh
------------------------------------------------------------------------------------------
VARIABLES UNWEIGHTED FIT WEIGHTED FIT
--------------- ----------------------- -----------------------
item ESTIMATE MNSQ T MNSQ T
------------------------------------------------------------------------------------------
1 -1.510 1.09 1.6 0.99 -0.1
2 0.446 0.99 -0.2 1.00 0.1
3 0.865 0.77 -4.9 0.84 -4.5
4 1.489 0.83 -3.5 0.93 -1.1
5 -0.576 1.01 0.2 1.02 0.5
6 1.262 1.11 2.1 1.01 0.2
7 -1.401 0.77 -5.1 0.88 -2.6
8 0.575 1.00 0.0 1.03 0.8
9 -1.043 1.04 0.9 0.98 -0.3
10 -0.725 0.99 -0.2 0.99 -0.3
Hình 7. Độ tương thích t với cỡ mẫu 2500 học sinh

------------------------------------------------------------------------------------------
VARIABLES UNWEIGHTED FIT WEIGHTED FIT
--------------- ----------------------- -----------------------
item ESTIMATE MNSQ T MNSQ T
------------------------------------------------------------------------------------------
1 -1.471 1.15 7.0 1.06 2.7
2 0.436 0.96 -2.0 0.99 -0.5
3 0.807 0.80 -10.2 0.87 -8.7
4 1.490 0.92 -3.8 0.96 -1.4
5 -0.641 1.00 0.0 1.02 1.1
6 1.260 1.04 2.0 1.03 2.0
7 -1.466 0.77 -11.8 0.90 -5.1
8 0.661 0.97 -1.3 1.00 0.0
9 -0.911 0.91 -4.2 0.92 -4.8
10 -0.902 0.99 -0.4 0.99 -0.8
Hình 8. Độ tương thích t với cỡ mẫu 15000 học sinh

Từ hình 6 đến hình 8, ta có thể thấy rằng khi cỡ mẫu tăng lên, độ tương thích t
dần lớn hơn, cũng từ nhiều câu hỏi cho thấy sự không tương thích.
Những kết quả này đặt chúng ta vào một tình huống tiến thoái lưỡng nan. Nếu
chúng ta sử dụng giá trị trung bình bình phương độ tương thích để đặt ra các tiêu

108
chuẩn cho việc chấp nhận hay loại bỏ một câu hỏi nào đó dựa trên cơ sở về độ
tương thích (hay hoà hợp), có thể chúng ta sẽ tìm ra được tất cả các câu hỏi với
độ tương thích tốt khi cỡ mẫu là đủ lớn. Mặt khác, nếu chúng ta đặt ra các giới
hạn để tương thích với giá trị t như một tiêu chuẩn để tìm ra sự không tương
thích, chúng ta có thể loại bỏ hầu hết tất cả các câu hỏi đó khi cỡ mẫu đủ lớn.
Có nhiều tài liệu đưa ra những đề xuất về miền giá trị chấp nhận được của
các giá trị trung bình bình phương và số t đối với cơ sở thặng dư đo độ tương
thích. Có thể sẽ không có câu trả lời đúng hoặc sai. Điều quan trọng là, các số
liệu đo độ tương thích sẽ có vai trò như một chỉ số để tìm ra các câu hỏi cần phải
xem xét lại hơn là để thiết lập các quy tắc rời rạc để chấp nhận hay loại bỏ một
câu hỏi nào đó. Trên cơ sở đó, các số đo độ tương thích, vừa có thể kiểm tra các
câu hỏi, vừa có thể tìm ra nguyên nhân của sự không tương thích; Chỉnh sửa
hoặc loại bỏ các câu hỏi nếu nguyên nhân của sự không tương thích được xác
định. Các số đo độ tương thích không nên được sử dụng một cách tuỳ tiện trong
việc loại bỏ đi các câu hỏi, đặc biệt là những câu ở mức “trên phù hợp”, vì bạn
có thể loại bỏ đi những câu hỏi tốt nhất trong bài test của bạn vì phần còn lại của
bài test là những câu hỏi có thể không “tốt” như những câu mà bạn đã loại.
Hơn nữa, cơ sở thặng dư đo độ tương thích chỉ ra rằng, các câu hỏi tương
thích với mô hình Rasch chưa chắc đã là điều kiện đủ để ta đưa ra kết luận rằng
mình đã có trong tay một bài test tốt nhất. Độ tin cậy của bài test và độ phân biệt
của câu hỏi nên được xem xét trong khi đưa ra các quyết định đánh giá cuối
cùng.

109
K 0.5

Đường cong đặc tính câu hỏi

0.0

δ Thành tích cao

Hình 9. Đường cong đặc tính câu hỏi kỳ vọng và các điểm trên đường cong đặc tính
câu hỏi quan sát được
Hình 9 cho thấy, về mặt lý thuyết, hoặc kỳ vọng, đường cong đặc tính câu hỏi
cho một câu hỏi, với các điểm A, B, C, D ký hiệu 4 miền trong đó đường cong
đặc tính câu hỏi quan sát được có thể đi xuống. Điểm A kí hiệu miền trên đường
cong lý thuyết đặc tính câu hỏi, và nằm về phía bên phải đường thẳng đứng khi
θ = δ , khả năng ở đó là 50% cơ hội trả lời đúng một câu hỏi. Điểm B kí hiệu
miền nằm dưới đường cong đặc tính lý thuyết và nằm về phía bên phải đường
thẳng θ = δ . Điểm C ký hiệu miền nằm trên đường cong đặc tính lý thuyết
nhưng nằm phía bên tay trái đường thẳng θ = δ . Điểm D ký hiệu cho miền nằm
dưới đường cong đặc tính lý thuyết và cũng nằm bên trái đường thẳng θ = δ . Về
mặt toán học, có thể thấy ý nghĩa của các điểm quan sát được trong miền A và D
( x ni − E ( x ni )) 2
z ni2 =
đối với trung bình bình phương tương thích ngoài (Var ( x ni ))1 / 2 có kỳ vọng
2
nhỏ hơn 1, trong khi kỳ vọng của z ni của các điểm trong miền C và B là lớn hơn
1. Rõ ràng rằng, giá trị trung bình bình phương độ tương thích cho ta biết thông
tin về một bài test liệu có “độ dốc” của đường cong đặc tính quan sát được gần
với đường cong lý thuyết không. Việc cho trước một đường cong lý thuyết có
thể được coi như một mức “trung bình” cho các câu hỏi, các giá trị trung bình

110
bình phương độ tương thích kiểm tra xem đường cong đặc tính câu hỏi quan sát
được liệu có độ dốc gần với độ dốc của các câu hỏi khác không.
Phân tích một bài test nhiều lựa chọn có điểm số lưỡng phân bằng phần
mềm ConQuest
Các câu hỏi nhiều lựa chọn có lẽ là công cụ được sử dụng phổ biến nhất
trong các bài test. Điều này đặc biệt đúng trong trường hợp kiểm tra về khả năng
nhận thức hoặc thành tích của một nhóm học sinh. Việc phân tích các tính chất
cơ bản của các câu hỏi lưỡng phân (hay còn gọi là phân đôi) và các bài test chứa
một tập hợp các câu hỏi lưỡng phân là một ứng dụng đơn giản nhất của
ConQuest. Mẫu phân tích sau đây sẽ chỉ ra bằng cách nào ConQuest có thể được
sử dụng để hoà hợp mô hình lôgic đơn giản của Rasch với các dữ liệu thu thập
được trong một bài test nhiều lựa chọn. ConQuest cũng có thể cho biết các số
liệu thống kê về các câu hỏi kiểm tra theo truyền thống
Các file được sử dụng trong mẫu phân tích này là:
ex1.cqc file lệnh
ex1.dat file dữ liệu
ex1.lab Các nhãn biến của các câu hỏi trong các bài test nhiều
lựa chọn.
ex1.shw Kết quả của phân tích theo mô hình Rasch
ex1.itn Các kết quả phân tích của câu hỏi theo truyền thống
Dữ liệu được sử dụng trong tài liệu này từ một bài test 12 câu hỏi nhiều lựa
chọn, thực hiện bởi 1000 học sinh. Dữ liệu được nhập vào trong file ex1.dat, sử
dụng 1 dòng cho 1 học sinh. Mỗi học sinh có duy nhất 1 mã nhận dạng được
nhập vào từ cột 1 đến 5, và phương án trả lời của học sinh cho các câu hỏi đã
được mã và nhập từ cột 12 đến cột 23. Phương án trả lời cho mỗi câu hỏi được
gán cho 1 vị trí trên 1 cột; và các mã a, b, c và d được dùng để chỉ ra sự thay đổi
trong lựa chọn của học sinh cho mỗi câu hỏi. Nếu một học sinh không trả lời
một câu hỏi, chữ M sẽ được nhập vào file dữ liệu. Hình 4-1 sau đây được trích
ra từ file dữ liệu:

111
1 2
12345678901234567890123 (số các cột)
40016 acdabaeadacd
655 acdcccecbaca
31140 eccdbcebbacb
. .
. .
50321 dabcMcebdaca
30782 acddbcebbacc
. .
. .
Hình 4-1 Trích dẫn từ file dữ liệu ex1.dat

Trong mẫu phân tích này, mô hình logic đơn giản của Rasch ([1960]
1980) sẽ được tương thích với dữ liệu, và các số liệu thống kê phân tích câu hỏi
theo cách truyền thống cũng được tổng hợp. Nội dung của một file lệnh có thể
được sử dụng để phân tích những dữ liệu này được trình bày trong hình 4-2.
1. Datafile ex1.dat;
2. Format id 1-5 responses 12-23;
3. Labels << ex1.lab;
4. Key acddbcebbacc ! 1;
5. Model item;
6. Estimate;
7. Show >> ex1.shw;
8. Itanal >> ex1.itn;
9. Plot icc;
10. Plot mcc ! legend=yes;

Hình 4-2.File lệnh mẫu cho một bài test lưỡng phân

1. Dòng lệnh datafile cho biết tên và vị trí của file dữ liệu. Bất cứ tên file
nào được hệ điều hành bạn đang dùng chấp nhận cũng được chấp nhận
trong phần mềm này.
2. Lệnh format mô tả sự sắp xếp dữ liệu trong file ex1.dat. Lệnh format cho
biết miền được gọi tên là id nằm từ cột 1 đến cột 5 và phương án trả lời
cho các câu hỏi nằm từ cột 12 đến cột 23 trong file dữ liệu. Mỗi lệnh
format phải cho biết vị trí của các phương án trả lời. Trong thực tế, các
phương án trả lời cho các biến hiện phải có mặt trong dòng lệnh format

112
hoặc nếu không ConQuest sẽ không chạy. Trong ví dụ phân tích cụ thể
này, các phương án học sinh trả lời là cho các câu hỏi nhiều lựa chọn; và,
theo mặc định, item là các biến ẩn sẽ được sử dụng để chỉ ra các phương
án trả lời. Các mức của các biến item (tức là câu hỏi 1, câu hỏi 2, v.v.)
được xác định một cách ẩn đi thông qua vị trí của chúng trong tập các
phương án trả lời ở trong lệnh format; do đó, trong mẫu phân tích ở đây,
dữ liệu cho câu 1 nằm ở cột 12, dữ liệu cho câu 2 nằm ở cột 13, v.v.

Bổ sung: Số các câu hỏi được xác định theo thứ tự trong đó vị trí của
các cột được đặt trong các khối trả lời. Néu bạn sử dụng
lệnh:
format id 1-5 responses 12-23;
câu hỏi 1 sẽ đọc từ cột 12. Nếu bạn sử dung:
format id 1-5 responses 23,12-22;
câu hỏi 1 sẽ được đọc từ cột 23.
Mẹo: Trong một số ngữ cảnh, có thể sẽ có nhiều thông tin
hơn khi thay thế biến ứng đáp bằng một biến khác chứ
không phải item. Sử dụng tên biến là task hoặc
question có thể dẫn đến dễ tìm thấy file dữ liệu hơn.
Thay thế tên biến ứng đáp cũng rất đơn giản. Nếu bạn
muốn sử dụng tên tasks thay cho item, đơn giản, chỉ
cần thêm lựa chọn vào lệnh format như sau:
format id 1-5 responses 12-23 ! tasks(12);
Tên biến tasks sau đó sẽ được dùng để chỉ ra biến ứng
đáp trong các lệnh của ConQuest.

3. Lệnh labels chỉ ra một tập hợp các nhãn cho các biến (trong trường hợp
này, là các câu hỏi) cũng được đọc từ file ex1.lab. Một trích dẫn từ file
ex1.lab được trình bày trong hình 4-3. Dòng đầu tiên của file chứa ký
hiệu đặc biệt ===> (gồm 3 dấu = và một dấu lớn hơn) theo sau là 1 hoặc
nhiều cách trống và tên biến sẽ được gán nhãn (trong trường hợp này là,
item). Các dòng tiếp theo chưa 2 phần thông tin cách biệt nhau bởi một
cách trống. Giá trị đầu tiên trên mỗi dòng là thứ tự của biến (trong
trường hợp này là item) với mỗi biến sẽ được gán nhãn, và giá trị thứ 2
là nhãn. Nếu một nhãn có chứa dấu cách trống thì cần phải được đóng lại

113
bởi hai dấu nháy (" "). Trong mẫu phân tích này, nhãn cho câu hỏi 1 là
BSMMA01, nhãn cho câu hỏi 2 là BSMMA02, v.v.

Mẹo: ConQuest không yêu cầu các nhãn, nhưng chúng sẽ


giúp dễ dàng đọc các bản in từ ConQuest vì vậy, nên
gán nhãn cho các biến.

===> item
1 BSMMA01
2 BSMMA02
3 BSMMA03
4 BSMMA04
5 BSMMA05
6 BSMMA06
7 BSMSA07
8 BSMSA08
9 BSMSA09
10 BSMSA10
11 BSMSA11
12 BSMSA12
Hình 4-3 Nội dung của file nhãn ex1.lab
4. Lệnh key nhận dạng các phương án trả lời đúng cho mỗi câu hỏi nhiều
lựa chọn. Trong trường hợp này, câu trả lời đúng cho câu hỏi 1 là a, câu
trả lời đúng cho câu hỏi 2 là c, câu trả lời đúng cho câu 3 là d, v.v. Độ
dài của đối số trong lệnh key là 12 lý tự, đó là độ dài của khối các
phương án đã cho trước trong lệnh format.
Nếu một lệnh key đã cho, ConQuest sẽ mã lại dữ liệu để mỗi phương án
trả lời a của câu 1 sẽ được mã lại với một giá trị cho trước trong lựa chọn
trả lời(trong trường hợp này là 1. Tất cả các phương án trả lời khác của
câu 1 sẽ được mã theo giá trị của key mặc định (trong trường hợp này là
0). Tương tự, phương án c của câu 2 sẽ được mã lại là 1, còn các phương
án khác của câu 2 sẽ được mã là 0, v.v.
5. Lệnh model cần phải được cho trước khi thực hiện một phân tích theo
truyền thống hoặc phương án trả lời. Khi thực hiện các phân tích đơn
giản của các bài test nhiều lựa chọn, như trong ví dụ này, đối số của lệnh
model là tên của biến xác định dữ liệu ứng đáp dùng để phân tích (trong
trường hợp này là item).

114
6. Lệnh estimate đề xuất cách ước lưọng của mô hình ứng đáp câu hỏi.

Chú ý: Thứ tự nhập các lệnh trong ConQuest là không cố định.


Tuy nhiên, về mặt lôgic cần có thứ thự. Ví dụ, lệnh show
không thể đứng trước lệnh estimate,cũng không thể đảo lên
trước lệnh model, format hoặc datafile.

7. Lệnh show cho ta một dãy các bảng tổng kết các kết quả về mức độ phù
hợp của mô hình ứng đáp câu hỏi. Trong trường hợp này, biểu tượng về
hướng (>>) được dùng để chỉ các kết quả sẽ được xuất ra trong file
ex1.shw trong cùng một thư mục. Nếu không có biểu tượng này, kết quả
sẽ không được in ra trong bảng theo dõi.
8. Lệnh itanal cho biết sự biểu diễn các kết quả của một phân tích theo
truyền thống. Cũng với lệnh show, các kết quả được xuất trực vào 1 file
(trong trường hợp này là ex1.itn).
9. Lệnh plot icc sẽ cho ta vẽ đường cong đặc tính của 12 câu hỏi, mỗi câu
một hình vẽ. Các hình vẽ sẽ so sánh các đường cong đặc tính câu hỏi của
mô hình với các đường cong đặc tính theo kinh nghiệm.
10. Lệnh plot mcc cho ta hình vẽ của đường cong đặc tính theo loại của 12
câu hỏi, mỗi hình một câu.
THỰC HÀNH CHẠY PHÂN TÍCH VÍ DỤ BÀI TEST NHIỀU LỰA CHỌN
Để chạy phân tích mẫu này, khởi động phần mềm GUI của ConQuest. Mở
file ex1.cqc và chọn menu RunèRun All.
ConQuest bắt đầu thực hiện lệnh, các lệnh đã được nhập trong file
ex1.cqc và như vậy, khi chúng chạy xong, chúng sẽ xuất hiện trên màn hình
output. Khi ConQuest chạy đến lệnh estimate, nó sẽ bắt đầu ăn khớp với mô
hình logic đơn giản của Rasch với dữ liệu, và khi thực hiện xong, sẽ có báo cáo
về đánh giá. Trong ví dụ cụ thể này, cần 46 lần lặp. Hình 4-4 được trích dẫn cho
ta biết quá trình ước lượng (trong trường hợp này, sự thay đổi trong ước lượng là
sau 4 lần lặp).

115
Iteration: 4 ...........................
Deviance = 13433.43295

Variance Estimate:
Dimension 1 0.78460

Mean:
Dimension 1 1.03185

Maximum changes:
Item parameter estimates ==> -0.17761 (Parameter 9)
Mean estimate ==> 0.04178
Variance estimate ==> 0.01959
Change in the deviance is 91.63905

Hình 4-4 Báo cáo thông tin về quá trình ước lượng
Sau khi ước lượng xong, có 2 lệnh cho báo cáo dưới dạng text (show và itanal)
sẽ được xử lý. Trong trường hợp này, lệnh show sẽ cho tất cả 6 bảng. Tất cả các
bảng này sẽ có trong file ex1.shw. Nội dung của bảng đầu tiên được trích dẫn
như trong hình 4-5.
====================================================================
==========
ConQuest: Generalised Item Response Modelling Software Tue Oct 03
10:19 2006
SUMMARY OF THE ESTIMATION
====================================================================
===========
Estimation method was: Gauss-Hermite Quadrature with 15 nodes
Assumed population distribution was: Gaussian
Constraint was: DEFAULT
The Data File: ex1.dat
The format: id 1-5 responses 12-23
The regression model:
Grouping Variables:
The item model: item
Sample size: 1000
Final Deviance: 13274.87603
Total number of estimated parameters: 13
The number of iterations: 46
Termination criteria: Max iterations=1000, Parameter Change=
0.00010
Deviance Change= 0.00010
Iterations terminated because the deviance convergence criteria was
reached
Random number generation seed: 1.00000
Number of nodes used when drawing PVs: 2000
Number of nodes used when computing fit: 200
Number of plausible values to draw: 5
Maximum number of iterations without a deviance improvement: 100

116
Maximum number of Newton steps in M-step: 10
Value for obtaining finite MLEs for zero/perfects: 0.30000

Hình 4 - 5 Bảng tổng hợp


Bảng này được cung cấp dùng để tham khảo hoặc cho mục đích lưu giữ. Nó chỉ
ra rằng tập hợp dữ liệu đã được phân tích, định dạng được dùng để đọc dữ liệu,
mô hình đã được yêu cầu về cỡ mẫu. Nó cũng cung cấp số lượng các tham số đã
được ước lượng, số lượng các phép lặp đã được thực hiện, và nguyên nhân của
việc kết thúc phép lặp.
Như trong hình 4-5 đã chỉ ra, trong phân tích này có 13 tham số đã ước lượng.
Chúng là (a) số trung bình và phương sai của các năng lực tiềm tàng được đo bởi
các câu hỏi và (b) 11 tham số đo độ khó của câu hỏi.
Hình 4-6 là ví dụ của bảng thứ 2 trong file ex1.shw. Bảng này cho biết các tham
số ước lượng cho mỗi câu hỏi cùng với sai số chuẩn và một số dự đoán về độ
tương thích (hoà hợp) của nó.
Với số đo độ tương thích MNSQ, chúng ta có khoảng tin cậy là 95% cho giá trị
kỳ vọng của MNSQ (với giả thiết vô hiệu là 1.0). Nếu số MNSQ nằm ngoài
khoảng thì chúng ta sẽ loại bỏ giả thiết vô hiệu rằng dữ liệu tuân theo mô hình.
Nếu số đo độ tương thích MNSQ nằm ngoài khoảng thì số T tương ứng sẽ có giá
trị tuyệt đối vượt quá 2.0.
============================================================================
Bảng này cho biết các tham số ước lượng cho mỗi thuật ngữ trong lệnh model. Trong
ConQuest: Generalised Item Response
ví dụ phân tích Modelling Software
này, chúng ta cóTuemộtOct 03 10:19
thuật ngữ là 2006
item
TABLES OF RESPONSE MODEL PARAMETER ESTIMATES
============================================================================
TERM 1: item
-------------------------------------------------------------------------------
VARIABLES UNWEIGHTED FIT WEIGHTED FIT
------------- ----------------------- -----------------------
item ESTIMATE ERROR^ MNSQ CI T MNSQ CI T
-------------------------------------------------------------------------------
1 BSMMA01 0.364 0.050 0.87 ( 0.91, 1.09) -3.1 0.90 ( 0.94, 1.06) -3.4
2 BSMMA02 -0.177 0.052 0.99 ( 0.91, 1.09) -0.3 0.98 ( 0.92, 1.08) -0.4
3 BSMMA03 -0.024 0.051 0.89 ( 0.91, 1.09) -2.5 0.93 ( 0.93, 1.07) -2.1
4 BSMMA04 0.837 0.049 0.97 ( 0.91, 1.09) -0.6 0.97 ( 0.95, 1.05) -1.2
5 BSMMA05 1.179 0.049 1.10 ( 0.91, 1.09) 2.2 1.07 ( 0.95, 1.05) 2.9
6 BSMMA06 -0.313 0.052 1.01 ( 0.91, 1.09) 0.3 1.01 ( 0.92, 1.08) 0.3
7 BSMSA07 -0.391 0.053 1.09 ( 0.91, 1.09) 2.0 1.04 ( 0.92, 1.08) 0.8
8 BSMSA08 -0.326 0.053 1.15 ( 0.91, 1.09) 3.3 1.09 ( 0.92, 1.08) 2.2
9 BSMSA09 -0.966 0.056 0.91 ( 0.91, 1.09) -2.2 0.97 ( 0.88, 1.12) -0.5
10 BSMSA10 -0.391 0.053 1.11 ( 0.91, 1.09) 2.4 1.06 ( 0.92, 1.08) 1.4
11 BSMSA11 -0.499 0.053 0.91 ( 0.91, 1.09) -2.0 0.97 ( 0.91, 1.09) -0.7
12 BSMSA12 0.707* 0.172 1.02 ( 0.91, Dấu 1.09)
hoa thị chỉ0.4
ra rằng tham( số0.95,
1.02 đã 1.05) 0.6
được ràng buộc.
-------------------------------------------------------------------------------
Hình 4-6. Ước lưọng tham số của câu hỏi

117
Bảng thứ 3 trích từ file show cho ta các ước lượng về các tham số của dân số.
Trong trường hợp này, những ước lượng đơn giản về trung bình của phân bố các
năng lực tiềm tàng và phương sai của phân bố đó. Trong trường hợp này, giá trị
trung bình ước lượng được là 1.070, và phương sai ước lượng được là 0.866.
Bảng này cũng cho biết tập các chỉ số tin cậy được. Bảng thứ 4 trong các file
xuất ra, hình 4-7 cho ta hình dung về các tham số đo độ khó câu hỏi.
ConQuest: Generalised Item Response Software Tue Oct 01 12:04:10
MAP OF LATENT DISTRIBUTIONS AND RESPONSE MODEL PARAMETER ESTIMATES
================================================================================
Terms in the Model Statement
+item
---------------------------------------------------------------------------------
| |
|5 |
| |
|4 |
|12 |
| |
| Trong khung này, các câu hỏi |
|1 được vẽ theo độ khó của nó. Câu |
Khung này dành để biểu diễn
| |
phân bố các năng lực tiềm tàng, | 5 có ước lượng độ khó lớn nhất, |
có được bằng cách thêm một lựa |3 do vậy, nó được ghi ở vị trí trên |
chọn vào lệnh show hoặc lệnh | cùng của hình. Câu 9 có ước |
estimate. |2 lượng độ khó thấp nhất do đó nó |
|6 7 8 10 |
được ghi ở vị trí dưới cùng của
|11 |
| hình. |
| |
| |
|9 |
| |
=================================================================================

Hình 4-7 Bản đồ phân bố năng lực tiềm tàng theo mô hình Logic đơn giản
Phân tích câu hỏi theo truyền thống được dẫn ra nhờ lệnh itanal, và kết quả của
nó được xuất ra trong file có tên là ex1.itn. File itanal bao gồm 1 bảng mô tả độ
khó, độ phân biệt và điểm nhị phân theo cách cổ điển cho từng câu hỏi. Hình 4-8
cho ta kết quả đối với câu hỏi 2.
Kết quả tổng hợp, bao gồm hệ số alpha cho cả bài test sẽ được in ở cuối file
ex1.itn được minh hoạ như hình 4-9. Tương quan điểm nhị phân với
Item 2 mỗi mã có hiệu lực là mối tương
------ quan giữa tổng điểm của học sinh
item:2 (BSMMA02) và 1 biến chỉ số nhận giá trị là 1 nếu
Cases for this item 1000 Discrimination 0.47
Item Threshold(s): -0.18 Weighted MNSQ 0.98
trong trường hợp đáp ứng được với
Item Delta(s): -0.18 mã cụ thể của câu hỏi này hoặc lấy
giá trị là 0 trong trường hợp ngược
---------------------------------------------------------------------------
Label Score Count % of tot Pt Bis t (p) PV1Avg:1
lại. PV1 SD:1
---------------------------------------------------------------------------
M 0.00 5 0.50 -0.10 -3.03(.002) -0.02 1.30
a 0.00 59 5.90 -0.23 -7.51(.000) 0.47 1.02
b 0.00 152 15.20 -0.31 -10.32(.000) 0.57 0.85
c 1.00 743 74.30 0.47 16.62(.000) 1.24 0.86
d 0.00 41 4.10 -0.16 -4.97(.000) 0.52 0.94
================================================================================
Các mã có Là các điểm Con số này cho biết số học sinh
hiệu lực mà chúng ta lựa chọn đối với mỗi mã trả lời, cả Giá trị t là t-test cho
trong câu gán cho mỗi về số lượng và phần trăm của tất cả tương quan điểm nhị
hỏi này. mã. học sinh trả lời câu hỏi này. phân.

118
Hình 4-8. Ví dụ về kết quả phân tích câu hỏi theo truyền thống
----------------------------------------------------------------------
The following traditional statistics are only meaningful for complete
designs and when the amount of missing data is minimal.
In this analysis 0.00% of the data are missing.

The following results are scaled to assume that a single response


was provided for each item.
Một số số liệu thống kê theo
truyền thống không được tính
N 1000
nêú có hơn 10% dữ liệu trả lời là
Mean 8.44
bị bỏ qua.
Standard Deviation 2.40
Variance 5.78
Skewness -0.60
Kurtosis -0.19 Trong trường hợp dữ liệu lưỡng
Standard error of mean 0.08 phân, hệ số Alpha là được tính như
Standard error of measurement 1.43 công thức KR-20.
Coefficient Alpha 0.64

======================================================================

Hình 4-9. Số liệu tóm tắt từ kết quả phân tích câu hỏi theo truyền thống
Hình 4.10 minh hoạ cho việc vẽ 12 hình được thực hiện bởi lệnh plot icc. Đường
cong đặc tính câu hỏi cho ta so sánh giữa đường cong đặc tính theo thực tế
(đường nét đứt) với đường cong đặc tính của mô hình (đường thẳng trơn).
Hình 4.11 minh hoạ hình vẽ thực hiện bởi lệnh plot mcc. Hình vẽ này biểu diễn
thêm đường cong mô hình và đường cong thực tế phù hợp, cho thấy các đặc tính
của các câu trả lời sai – các phương án nhiễu. Cụ thể, nó chỉ ra tỉ lệ học sinh
trong một nhóm 10 học sinh trả lời với mỗi phương án trả lời có thể.

119
Hình 4-10 Đường cong mô hình và đường cong thực tế cho câu hỏi 6
Hình 4-11 Đường cong đặc tính mô hình và thực tế theo từng loại cho câu hỏi 6

120
CHƯƠNG 5
ĐÁNH GIÁ THỰC KẾT QUẢ HỌC TẬP CỦA NGƯỜI HỌC

I. Những vấn đề chung về đánh giá thực


Trong kỉ nguyên kinh tế tri thức, hội nhập quốc tế sâu sắc về tất cả các
lĩnh vực, yêu cầu về nguồn nhân lực có khả năng cạnh tranh ngày càng trở nên
gay gắt, quyết định sự thành bại của một quốc gia. Khả năng cạnh tranh của
nguồn nhân lực phụ thuộc rất nhiều vào quá trình đào tạo của hệ thống giáo dục
ĐH&CĐ của từng nước, nơi ngoài những năng lực nhận thức cơ bản về chuyên
môn, phải rèn luyện cho sinh viên những kĩ năng sống, làm việc trong môi
trường thực, luôn thay đổi và nhiều thử thách.
Hiện nay, nền giáo dục đại học Việt Nam đang tiến hành một quá trình
đào tạo mang tính hàn lâm, không tạo ra sự khát khao trong học tập để có thể
cho ra trường những công dân của thế kỉ 21. Trong quá trình đào tạo ấy, việc
kiểm tra – đánh giá kết quả học tập - một khâu trọng yếu chỉ được tiến hành
thông qua những hình thức truyền thống như các câu hỏi TNKQ hoặc TNTL.
Những bài kiểm tra – đánh giá kiểu này chỉ đòi hỏi sinh viên miêu tả lại những
sự kiện riêng rẽ, hiếm khi yêu cầu sinh viên vận dụng những kiến thức đã học
vào một tình huống thực trong cuộc sống. Và kết quả là nguồn nhân lực được
đào tạo trong bối cảnh như vậy không có khả năng đáp ứng yêu cầu phát triển
kinh tế xã hội trong kỉ nguyên hội nhập kinh tế thế giới.
Một vấn đề được đặt ra là quá trình đào tạo bậc đại học Việt Nam không
thể tự hài lòng với những kiến thức và kĩ năng cơ bản và tối thiểu như hiện nay,
mà phải gắn chặt hơn nữa những kiến thức, kĩ năng mà sinh viên học được trong
trường đại học với những gì cuộc sống thực yêu cầu ở họ. Các trường đại học
phải giúp sinh viên phát triển những kĩ năng, những năng lực trong cuộc sống
thực, bối cảnh thực và những sinh viên tốt nghiệp phải trình diễn được những
năng lực được đánh giá bằng các bài kiểm tra – đánh giá thực, chứ không phải
bằng giấy bút như hiện nay.
Do vậy, chương 5 sẽ giới thiệu một hình thức kiểm tra – đánh giá có sử
dụng kĩ thuật đánh giá thực nhằm liên kết các hoạt động ở lớp học với những
năng lực sinh viên cần trong cuộc sống sau này.

121
1. Đánh giá thực là gì?
Ø Đánh giá thực là một hình thức đánh giá trong đó người học được yêu cầu
thực hiện những nhiệm vụ thực sự diễn ra trong cuộc sống, đòi hỏi phải
vận dụng một cách có ý nghĩa những kiến thức, kĩ năng thiết yếu (J.
Mueler).
Ø Đánh giá thực “đó là những vấn đề, những câu hỏi quan trọng, đáng làm,
trong đó người học phải sử dụng kiến thức để thiết kế những hoạt động
một cách hiệu quả và sáng tạo. Những nhiệm vụ đó có thể là sự mô phỏng
lại hoặc tương tự như nững vấn đề mà một công dân trưởng thành, những
nhà chuyên môn phải đối diện trong cuộc sống (Grant Viggins).
Thông thường, một bài đánh giá thực bao gồm những nhiệm vụ mà sinh
viên phải hoàn thành và một bản miêu tả những tiêu chí đánh giá việc hoàn
thành những nhiệm vụ đó (Rubric).
2. Đánh giá thực và đánh giá truyền thống
2.1. Đánh giá truyền thống
Có nhiều hình thức đánh giá mà các giảng viên thường sử dụng để đánh
giá kết quả học tập của sinh viên. Có 2 hình thức chính là các bài thi TNKQ và
TNTL (trong đó, có TNTL có cấu trúc).
Các bài thi dùng câu hỏi TNKQ chỉ yêu cầu sinh viên chọn câu trả lời
đúng trong 4-5 phương án chọn (hoặc 1 vài hình thức khác như điền khuyết,
ghép đôi v.v.). Mặc dù các câu hỏi TNKQ thường chỉ kiểm tra được các kĩ năng
tư duy bậc thấp (tái hiện, vận dụng) song những người cổ vũ cho hình thức đánh
giá này vẫn cho rằng các bài TNKQ cũng có khả năng làm bộc lộ kĩ năng tư duy
bậc cao của sinh viên. Ngoài ra, bài TNKQ rất dễ chấm điểm một cách chính
xác và khách quan, rất thuận lợi cho các giảng viên là những người luôn không
có đủ thời gian.
Các bài TNTL có cấu trúc cũng là hình thức đánh giá được dùng khá phổ
biến. Câu hỏi tự luận cấu trúc yêu cầu sinh viên phải tự viết câu trả lời trong một
giới hạn từ nhất định (câu trả lời ngắn hoặc bài luận ngắn – essay).
Hình thức kiểm tra – đánh giá bằng bài luận có một nhược điểm lớn là rất
khó đánh giá và cho điểm một cách khách quan và công bằng.

122
2.2. Đánh giá thực (hay còn gọi là đánh giá sự thực hiện – performance
assessment)
Đầu những năm 1990 nhiều nhà làm chính sách giáo dục của Mỹ không
hài lòng với loại đánh giá truyền thống bằng giấy bút đã tìm ra một hình thức
đánh giá khác, hiệu quả hơn. Hình thức đánh giá này cho phép thu hẹp khoảng
cách giữa những gì sinh viên học được trong trường với những điều đang diễn ra
trong cuộc sống thực.
Đánh giá thực được thực hiện trong một quá trình trong đó giảng viên sử
dụng bài thi hay một nhiệm vụ mà sinh viên phải hoàn thành để thu thập thông
tin về cách thức mà họ thực hiện nhiệm vụ đó.
Đặc trưng của đánh giá thực là:
Ø Yêu cầu sinh viên phải kiến tạo 1 sản phẩm chứ không phải chọn hay viết
ra 1 câu trả lời đúng.
Ø Đo lường cả quá trình và cả sản phẩm của quá trình đó.
Ø Trình bày 1 vấn đề thực – trong thế giới thực cho phép sinh viên bộc lộ
khả năng vận dụng kiến thức vào tình huống thực tế.
Ø Cho phép sinh viên bộc lộ quá trình học tập và tư duy của họ thông qua
việc thực hiện bài thi.
Đây chính là sự ưu việt của đánh giá thực, một hình thức đánh giá được cả
mức độ nhận thức nội dung kiến thức cả về quá trình vận dụng kiến thức đó vào
cuộc sống.
3. Phân biệt đánh giá truyền thống và đánh giá thực
Đánh giá truyền thống và đánh giá thực có nhiều hình thức thực hiện khác
nhau, song có thể phân biệt 2 kiểu đánh giá thông qua những đặc trưng cơ bản
của chúng.
Đánh giá truyền thống Đánh giá thực
Lựa chọn/viết câu trả lời Trình diễn hoàn thành 1 nhiệm vụ
Mô phỏng Trong đời sống thực
Tái hiện / tái nhận Kiến tạo / vận dụng
Do giảng viên làm Do sinh viên làm

123
Minh chứng gián tiếp Minh chứng trực tiếp

Ø Lựa chọn / viết câu trả lời đúng - Hoàn thành một nhiệm vụ.
Trong đánh giá truyền thống, sinh viên phải chọn hoặc tự viết 1 câu trả lời
đúng. Còn đánh giá thực yêu cầu sinh viên thể hiện sự hiểu biết thông qua việc
hoàn thành 1 nhiệm vụ phức tạp hơn mang tính vận dụng điển hình và có ý
nghĩa thực tế.
Ø Mô phỏng - Đời sống thực
Trong đánh giá truyền thống, việc chọn hoặc viết 1 câu trả lời đúng rất ít
khả năng chỉ ra được năng lực mà sinh viên có thể thực hiện được ngoài nhà
trường. Những bài trắc nghiệm mô phỏng như vậy có thể giúp tăng số lần sinh
viên phải trình bày một kĩ năng trong thời gian hạn chế. Còn đánh giá thực yêu
cầu sinh viên trình diễn năng lực của họ trong 1 công việc cụ thể.
Ø Tái hiện/tái nhận - Kiến tạo/vận dụng
Một bài TN truyền thống (TNKQ – TNTL) được thiết kế tốt có thể đánh
giá hiệu quả của quá trình nhận thức của sinh viên, và cũng có thể tái nhận hay
tái hiện một vấn đề gì đó trong cuộc sống thực. Tuy nhiên, việc trình diễn lại
những gì sinh viên biết trong cuộc sống không nói lên năng lực của họ khi phải
kiến tạo ra một sản phẩm hoặc thực hiện một nhiệm vụ quan trọng trong 1 bối
cảnh thực. Đánh giá thực thường yêu cầu sinh viên phải phân tích, tổng hợp một
cách có phê phán những kiến thức họ học được trong bối cảnh thực và trong quá
trình đó họ sáng tạo ra ý tưởng mới.
Ø Do giảng viên thiết kế - Do sinh viên thiết kế
Một bài trắc nghiệm truyền thống (TNKQ – TNTL) thường do giảng viên
thiết kế một cách cẩn thận. Chất lượng bài trắc nghiệm (độ khó, độ phân biệt của
câu trắc nghiệm, độ giá trị, độ tin cậy của bài trác nghiệm) tuỳ thuộc vào năng
lực thiết kế của giảng viên. Sinh viên chỉ cần tập trung vào những gì có trong bài
trắc nghiệm.
Đánh giá thực cho phép sinh viên có nhiều lựa chọn trong việc kiến tạo và
xác định những gì họ sẽ trình bày như một minh chứng về năng lực thật của họ.
Ngay cả khi sinh viên không thể xác định được cách trình bày thì họ cũng có rất

124
nhiều con đường khả dĩ khác để kiến tạo 1 sản phẩm. Đương nhiên, một bài trắc
nghiệm do giảng viên thiết kế cũng có những ưu nhược điểm của nó. Một bài
đánh giá thực do sinh viên tự thiết kế cũng có những điểm mạnh, điểm yếu mà
người giảng viên phải xem xét trong quá trình lựa chọn và giao các nhiệm vụ để
đánh giá.
Ø Minh chứng gián tiếp – Minh chứng trực tiếp
Khi sinh viên chọn và ngay cả khi họ tự sáng tạo ra một câu trả lời đúng
trong 1 bài đánh giá kiểu truyền thống thì ta cũng không biết gì nhiều về sinh
viên đó. Có phải do sinh viên đoán mò? Cách tư duy nào giúp sinh viên trả lời
đúng câu hỏi? Cùng lắm chúng ta có thể dự báo sinh viên đó có thể biết cái gì và
có thể làm gì với những kiến thức đó. Đấy mới chỉ là những minh chứng gián
tiếp, nhất là khi cuộc sống đòi hỏi phải có những vận dụng phức tạp, linh hoạt và
sáng tạo những kiến thức hàn lâm học được trong trường.
Đánh giá thực cung cấp những minh chứng trực tiếp hơn về việc vận
dụng, kiến tạo những kiến thức mới. Thí dụ: để đánh giá năng lực tư duy phê
phán của sinh viên thì yêu cầu họ viết một bài phê bình một hiện tượng nào đó
đang diễn ra trong cuộc sống sẽ cung cấp những minh chứng trực tiếp về kĩ năng
này hơn là yêu cầu họ trả lời một loạt các câu hỏi.
Ví dụ 1: Câu hỏi trắc nghiệm kiểm tra kiến thức về diện tích - thể tích (theo
cách đánh giá truyền thống)
Câu 1. Diện tích xung quanh của hình trụ dưới đây là bao nhiêu?

R=3cm
a. 13 π
b. 18 π
c. 60 π
d. 78 π
h=10cm

125
Câu 2. Một lon nước ngọt có đường kính 5cm và chiều cao 10 cm. Thể tích của
lon nước ngọt này là bao nhiêu

d=5cm a. 78.5 cm3


b. 157 cm3
c. 196.25 cm3
d. 392.5 cm3
h=10cm

Câu 3. Thể tích của hình nón sau đây là bao nhiêu?

20 cm a. 4710 cm3
b. 1570 cm3
c. 942 cm3
15cm d. 300 cm3

Ví dụ 2. Nhiệm vụ thực kiểm tra mức độ hiểu về thể tích


Gói quà
Bạn có nhiệm vụ phải gói những món quà được khách hàng mua tại một cửa
hàng bách hoá. Trung bình, mỗi năm có 24000 khách mua quần áo ở cửa hàng
của bạn. Khoảng 15% khách hàng trong số đó muốn được cửa hàng bọc quà.
Trong 1 tháng, cửa hàng thường bán được 165 chiếc áo vét, 750 áo sơmi, 480
quần soóc, 160 chiếc mũ. Chi phí để gói cho các hộp quà là như nhau, và giấy
gói giá 5000/mét. Mỗi cuộn giấy gói có chiều rộng 1m và dài 100m.
Nếu là người quản lý việc bọc và gói quà, bạn muốn tiết kiệm tiền đến mức có
thể và phải lập kế hoạch chi phí cho việc bọc quà hàng năm. Bạn sẽ chọn loại
hộp để đựng các loại quần áo và mũ như thế nào để giảm tối thiểu lượng giấy
dùng để gói.
Nhiệm vụ
Đưa ra khuyến cáo với cửa hàng (bằng 1 báo cáo) về:

126
• Cỡ của các hộp quà nên dùng để bọc riêng các loại quần áo và mũ.
• Số lượng cuộn giấy bọc cần dùng.
• Số tiền cần phải chi cho giấy bọc quà của cửa hàng trong 1 năm.
Các vấn đề cần xem xét
1. Khi quần áo được gấp lại thì cần hộp lớn đến cỡ nào để bọc được? Hình
dáng của hộp quà là phụ thuộc vào cách gập quần áo mà không làm
nhàu chúng.
2. Thử nghiệm việc đo đạc, gấp và bỏ quần áo vào trong các hộp quà.
3. Cân nhắc lựa chọn loại hộp quà dễ bọc mà lại ít lãng phí, những hộp
loại nào dễ bọc nhưng sẽ tốn hoặc đỡ tốn giấy hơn; Những kết luận rút
ra về số lượng giấy mà một hộp quà lý tưởng cần, tránh việc lãng phí khi
dùng một hộp lớn hơn; Khả năng tiết kiệm chi phí khi dùng các hộp dễ
bọc bù lại cho việc tăng chi phí khi gói những hộp tốn nhiều giấy gói.
4. Không ai có thể gói một hộp quà mà không lãng phí một số ít giấy gói,
cần ước tính chi phí cho những phần giấy dư ra và những giấy không sử
dụng hoặc giấy hỏng, cho biết số lượng giấy gói một hộp quà mà người
bọc cần dùng.
Các tiêu chí đánh giá
• Lập luận về mặt toán học
• Phương pháp tiếp cận để giải quyết nhiệm vụ
• Tính hiệu quả của công việc
• Chất lượng của báo cáo
• Tính chính xác của các tính toán.
4. Kết hợp đánh giá truyền thống và đánh giá thực
Đánh giá truyền thống và đánh giá thực không loại trừ nhau, mà ngược
lại, bổ sung cho nhau nhằm đánh giá một cách toàn diện và chính xác nhất việc
đạt mục tiêu của chương trình khoá học, môn học hay bài học.
Mục tiêu của chương trình khoá học, môn học hay bài học có thể ở nhiều
lĩnh vực khác nhau (nhận thức, tình cảm, kĩ năng, năng lực v.v.) và cũng không
phải mục tiêu nào cũng yêu cầu sinh viên phải trình diễn năng lực vận dụng kiến
thức hay kĩ năng. Thí dụ, mục tiêu của bài học chỉ là nắm vững kiến thức nào
đó, thì một vài câu hỏi nhiều lựa chọn hoặc câu trả lời ngắn có thể đánh giá được
mức độ đạt mục tiêu này. Nhưng để đánh giá năng lực hoàn thành một công
việc, trình diễn 1 kĩ năng như hoàn thành 1 sản phẩm, kết thúc 1 quá trình, phát

127
triển 1 hệ thống, giải quyết 1 vấn đề, trình bày 1 vấn đề, soạn thảo 1 báo cáo,
vận hành 1 cỗ máy v.v. thì đánh giá thực là lựa chọn tối ưu của các giảng viên.
6. Các kiểu đánh giá và sự tác động của nó tới việc lựa chọn phương pháp
dạy học
Một trong những chức năng cơ bản của đánh giá là định hướng. Hai kiểu
đánh giá như trình bày ở trên có tác động không nhỏ tới việc sử dụng các
phương pháp dạy học khác nhau để có thể hoàn thành bài thi.
Theo mô hình đánh giá truyền thống, giảng viên được khuyến khích dạy
học để sinh viên trả lời được những kiểu câu hỏi thường gặp trong các bài kiểm
tra – thi khác nhau. Thông thường, 1 bài trắc nghiệm truyền thống chỉ bao gồm
một số mẫu kiến thức nhất định trong vô số kiến thức, kĩ năng được dạy trong
chương trình, để rồi từ đó phỏng đoán mức độ nắm vững kiến thức về tất cả
những gì liên quan. Nếu giảng viên trong quá trình dạy học tập trung chủ yếu
vào các mẫu kiến thức sẽ được thi thì việc trình diễn tốt kiến thức có liên quan
tới những mẫu đó không có nghĩa đã phản ánh kiến thức về toàn bộ môn học.
Do vậy, những mẫu kiến thức sẽ có trong bài thi bao giờ cũng được bảo mật
nghiêm ngặt, và kết quả là giảng viên không được phép dạy những gì sẽ thi.
Với mô hình đánh giá thực, giảng viên được khuyến khích để dạy những
gì sinh viên phải thi để họ thi tốt. Sinh viên cần học để thực hiện tốt những
nhiệm vụ có ý nghĩa thực. Để hỗ trợ sinh viên thực hiện tốt những nhiệm vụ này,
trong quá trình giảng dạy, giảng viên cần chỉ cho sinh viên biết cách thực hiện
nào là tốt, cách nào là không tốt. Ngoài ra, trước đó, sinh viên còn được cung
cấp một bản liệt kê những tiêu chí cần đạt để được đánh giá cao nhất (Rubric).
Và một khi sinh viên biết thế nào là hoàn thành tốt một nhiệm vụ, biết những
dấu hiệu (minh chứng) đặc trưng của việc hoàn thành tốt nhiệm vụ, họ sẽ phát
huy những kiến thức, kĩ năng cần thiết đã được học để hoàn thành tốt nhiệm vụ
đó.
Ngoài ra, đánh giá đích thực còn khuyến khích tích hợp việc dạy - học với
kiểm tra – đánh giá. Đánh giá truyền thống thường tách rời khỏi quá trình dạy
học, tức là bài trắc nghiệm (bài thi, kiểm tra) chỉ được tiến hành khi các kiến
thức, kĩ năng đã được giảng dạy xong. Trong mô hình đánh giá thực, một nhiệm
vụ thực được dùng để đo lường, đánh giá năng lực vận dụng kiến thức của sinh

128
viên, đồng thời, cũng được dùng như một phương tiện để sinh viên học tập. Thí
dụ, khi đưa ra một vấn đề để sinh viên giải quyết, sinh viên sẽ học được nhiều
điều trong quá trình tìm ra các giải pháp, còn giảng viên hỗ trợ sinh viên trong
quá trình đó. Và các giải pháp do sinh viên tìm ra để giải quyết vấn đề trở thành
bài làm giúp giảng viên đánh giá sinh viên đã vận dụng kiến thức một cách có ý
nghĩa như thế nào.
Mặt khác, đánh giá thực là động lực để sinh viên thể hiện những cách thức
hoàn thành một nhiệm vụ một cách đa dạng. Những sinh viên khác nhau có
những điểm mạnh, điểm yếu khác nhau, do vậy, họ cũng có những cách trình
diễn những gì họ học được bằng những cách khác nhau. Trong mô hình đánh giá
truyền thống, sinh viên ít có cơ hội để trình diễn những gì họ học được bằng
nhiều cách khác nhau.
Tuy nhiên, bài trắc nghiệm được thiết kế tốt cho phép xác định vị trí của
từng sinh viên so với những sinh viên khác trong cùng một lĩnh vực.
Như đã nói ở trên, 2 kiểu đánh giá truyền thống và đánh giá thực không
loại trừ nhau, mà bổ sung cho nhau, đảm bảo có những kiểu đánh giá đa dạng,
nhiều biến thể để sao cho đủ số mẫu cần thiết và đủ các công cụ đo để có thể đo
lường đánh giá chính xác kết quả học tập của sinh viên, để giúp họ tiến bộ
không ngừng và đặc biệt là giúp họ gắn kết những kiến thức, kĩ năng học được
trong nhà trường với đời sống thực và khi họ ra trường họ sẽ sẵn sàng tham gia
vào cuộc sống lao động.
II. Xây dựng một bài đánh giá thực
Một bài đánh giá thực được tiến hành theo 4 bước
Bước 1 – Xác định chuẩn - điều sinh viên cần và có thể thực hiện.
Bước 2 – Xây dựng nhiệm vụ - diều sinh viên phải thực hiện để chứng tỏ
đã đạt chuẩn
Bước 3 – Xác định các tiêu chí - những dấu hiệu đặc trưng cho việc thực
hiện tốt nhiệm vụ
Bước 4 – Xây dựng bảng hướng dẫn nhằm phân biệt các mức độ hoàn
thành, mức độ đạt các tiêu chí (Rubric) [holistic, analytic].
Bước 1: Xác định chuẩn
1.1.Chuẩn và các khái niệm liên quan

129
Đối với bất kỳ kiểu đánh giá nào, truyền thống hay đánh giá thực, việc đầu
tiên quan trọng nhất là phải xác định chúng ta định kết thúc ở đâu, sinh viên phải
làm gì sau một giai đoạn học tập.
Một bài đánh giá không thể cung cấp những thông tin có giá trị nếu nó
không đo được cái định đo, và nó sẽ không đo được cái định đo nếu mục đích
của sự đo không xác định tường minh! Do vậy, nếu không xác định được rõ ràng
mục đích, mục tiêu của việc học tập thì mọi bước tiếp theo đều vô ích.
Chuẩn chính là lời tuyên bố về cái sinh viên cần biết và có thể làm được.
Tuy nhiên, so với mục đích, chuẩn có phạm vi hẹp hơn, dễ thay đổi hơn trong
cách đánh giá (xem sơ đồ):

RỘNG

Sứ mạng (mission)
Không đo lường được

Mục đích (goal)

Chuẩn (standard)
Quan sát được

Mục tiêu (objective)

HẸP

Trong sơ đồ trên ta thấy được mối quan hệ giữa sứ mạng – mục đích –
chuẩn – mục tiêu – mối quan hệ của các khái niệm từ rộng, không đo lường
được, đánh giá được tới các khái niệm hẹp dần, đo lường, đánh giá và quan sát
được.
Sứ mạng là tuyên bố rộng và chung nhất của một trường đại học hay
trường phổ thông về những gì sinh viên của họ cần biết và có thể làm được khi
ra trường. Sứ mạng được công bố cho toàn thể xã hội biết về tôn chỉ, mục đích
giáo dục của nhà trường đó.

130
Một thí dụ về sứ mạng của trường THPT Mueller: “Toàn thể học sinh của
trường Mueller sẽ trở thành người biết giao tiếp, hợp tác và giải quyết vấn đề
một cách hiệu quả...”.
Đây là điểm khởi đầu của mọi hoạt động trong trường: hoạt động dạy-học,
phương pháp dạy-học, kiểm tra đánh giá kết quả học tập các môn học... đều
được thiết kế và tiến hành sao cho học sinh của họ trở thành những người biết
giao tiếp, biết hợp tác và biết giải quyết vấn đề một cách hiệu quả ở từng môn
học, bài học cụ thể.
Tuyên bố về sứ mạng đó cũng giúp kiểm tra đánh giá các hoạt động khác
của nhà trường có phục vụ cho việc hoàn thành sứ mạng đó hay không.
Sứ mạng sẽ được cụ thể hoá một bước thành tập hợp các mục đích (goal).
Mục đích hẹp hơn sứ mạng song vẫn đủ rộng cho một bài học hay cấp học, xác
định những kỳ vọng chung đối với sinh viên, học sinh ở cấp học đó.
Sứ mạng và mục đích thường chỉ cung cấp những kỳ vọng mang tính định
hướng, không đo lường đánh giá và quan sát được.
Mục đích đuợc chia nhỏ hơn thành các chuẩn. Nếu mục đích là những kỳ
vọng chug cho một cấp học thì chuẩn có xu hướng cụ thể hoá cho một lớp học
ứng với một đơn vị nội dung (1-2 chương) và một đơn vị thời gian (2-3 tuần).
Ở cuối sơ đồ là mục tiêu, là sự cụ thể hoá hơn nữa các chuẩn cho từng bài
học. Mỗi bài học có thể có 1-2 chuẩn với nhiều mục tiêu.
Khác với sứ mạng và mục đích, chuẩn và mục tiêu được xây dựng dưới
dạng hành vi, quan sát được, đo lường đánh giá được.
Đối với đánh giá thực thì khái niệm chuẩn phù hợp hơn cả, bởi lẽ cũng
như mục tiêu, chuẩn là những phát biểu có thể quan sát được, đánh giá được, là
điều kiện thiết yếu để xây dựng nhiệm vụ thực. Hơn nữa, chuẩn có phạm vi bao
quát một đơn vị nội dung lớn hơn bài học và có thời gian dài hơn, phù hợp hơn
với việc thiết kế một bài đánh giá thực.
Vì vậy, một bài đánh giá thực thường được bắt đầu từ việc tập hợp các
chuẩn cần đánh giá. Tập hợp các chuẩn bao gồm cả chuẩn nội dung, cả kỹ năng
sống khác như tư duy phê phán, năng lực giải quyết vấn đề, kỹ năng hợp tác...
mà hệ mục tiêu các bài học không bao quát được.
1.2. Các loại chuẩn: Có 3 loại chuẩn:

131
- Chuẩn nội dung
- Chuẩn quá trình
- Chuẩn giá trị
1.2.1. Chuẩn nội dung
Chuẩn nội dung là một tuyên bố miêu tả những gì sinh viên phải biết,
hoặc có thể làm được trên cơ sở một đơn vị nội dung của một môn học hoặc có
thể của 2 môn học gần nhau.
Thí dụ: “Sinh viên có thể miêu tả hiệu ứng của hoạt động thể chất lên cơ thể”
“Sinh viên có thể trình bày thông tin về việc làm bằng ngôn ngữ đang học”
“Sinh viên có thể phân biệt được các hình thức kiểm tra đánh giá kết quả học
tập”...
1.2.2. Chuẩn quá trình
Chuẩn quá trình là một tuyên bố miêu tả nhữug kỹ năng mà sinh viên phải
rèn luyện đê cải thiện quá trình học tập. Chuẩn quá trình là những kỹ năng cơ
bản để áp dụng cho tất cả các môn học mà không chỉ riêng cho môn nào.
Thí dụ: “Sinh viên có thể xác định được những mục đích khả thi cho hoạt động
học của bản thân”
“Sinh viên có thể chấp nhận ý tưởng của người khác”
“Sinh viên có thể tìm được và đánh giá được những thông tin liên quan đến môn
học”...
1.2.3. Chuẩn giá trị
Chuẩn giá trị là một tuyên bố miêu tả những phẩm chất mà sinh viên cần
rèn luyện trong quá trình học tập.
Thí dụ: “Sinh viên biết tôn trọng sự khác biệt về quan điểm trong một cộng
đồng”
“Sinh viên có thể chấp nhận sự mạo hiểm một cách có trách nhiệm”
“Sinh viên có thể đảm nhận những nhiệm vụ mang tính thách thức”...
Bước 2: Xác định nhiệm vụ thực

132
Nhiệm vụ thực là một bài tập được thiết kế để đánh giá năng lực vận dụng
kiến thức, kỹ năng do chuẩn xác định và giải quyết những thách thức trong thế
giới thực.
Nói cách khác, một nhiệm vụ mà sinh viên phải hoàn thành được coi là
nhiệm vụ thực khi:
- Sinh viên được yêu cầu tự kiến tạo câu trả lời của mình chứ không
phải lựa chọn một câu trả lời đúng;
- Nhiệm vụ đó mô phỏng lại những thách thức mà sinh viên phải đối
diện trong thế giới thực.
Trong nhà trường, thường chúng ta chỉ quan tâm đến lượng kiến thức mà
sinh viên thu nhận được chứ ít khi đánh giá được họ sẽ sử dụng những kiến thức
đó trong cuộc sống ra sao. Do vậy một bài thi chỉ có ý nghĩa khi nó yêu cầu sinh
viên thực hiện một nhiệm vụ thực.
Ngoài ra, như đã nói ở trên, những nhiệm vụ này không chỉ để đánh giá.
Hình thức đánh giá này khuyến khích tích hợp dạy, học với đánh giá. Trong mô
hình đánh giá truyền thống quá trình dạy học thường tách rời khỏi khâu đánh
giá, tức là bài thi được tổ chức sau khi quá trình dạy học đã kết thúc. Còn trong
mô hình đánh giá thực, cùng một nhiệm vụ được sử dụng để đo lường năng lực
vận dụng kiến thức, kỹ năng được học của sinh viên và đồng thời được dùng
như một phương tiện, công cụ để dạy học.
Các kiểu nhiệm vụ thực.
Đánh giá truyền thống dùng để đánh giá sự tiếp nhận kiến thức, kỹ năng
của sinh viên và thường được xây dựng từ những câu hỏi nhiều lựa chọn và một
số câu tự luận kiến tạo. Ngược lại, đánh giá thực bao gồm những nhiệm vụ như
trình diễn, sản phẩm và cả những câu hỏi kiến tạo đòi hỏi sinh viên có sự vận
dụng trực tiếp kiến thức, kỹ năng vào đời sống thực.
Những kiểu nhiệm vụ thực có thể là:
+ Câu hỏi kiến tạo
Để trả lời câu hỏi này sinh viên phải kiến tạo những câu trả lời trên cơ sở
kiến thức, kỹ năng đã được học. Thông thường không có 1 câu trả lời chính xác
duy nhất cho loại câu hỏi này. Sinh viên kiến tạo câu trả lời có thể rất khác nhau.
Đặc trưng của loại câu hỏi kiến tạo là có nội dung hẹp, đinh hướng cách trả lời,

133
có giới hạn về độ dài. Tuy nhiên, do sinh viên phải tự kiến tạo kiến thức mới nên
ít nhiều cũng bộc lộ năng lực tư duy của họ. Khác với những bài tập lựa chọn
câu trả lời đúng, trong trường hợp này giảng viên có thể ít nhiều nhận ra năng
lực tư duy của sinh viên.
Một số ví dụ về kiểu bài tập này:
- Câu hỏi – bài luận ngắn (essay)
- Bài tập mô phỏng
- Bản đồ khái niệm
- Thuyết trình theo sơ đồ
- Thực hiện các bước chuẩn bị làm một thí nghiệm
- Viết một trường đoạn kịch bản
+ Bài tập thực – sản phẩm
Để hoàn thành loại bài tập này (assignment) sinh viên phải kiến tạo một
sản phẩm cụ thể, có giá trị, bằng chứng của sự vận dụng các kiến thức, kỹ năng
đã học, và/hoặc khả năng ứng dụng, phân tích, tổng hợp, đánh giá những kiến
thức, kỹ năng đó. Cũng như các câu hỏi kiến tạo, sinh viên phải tự viết ra câu trả
lời, tuy nhiên sản phẩm này thường rộng và sâu hơn, có độ lớn hơn, sâu sắc hơn,
cần nhiều thời gian hơn.
- Bài tập lớn, truyện ngắn, bài thơ
- Báo cáo khoa học
- Báo cáo về một thí nghiệm
- Bài báo
- Poster...
Kiểu bài tập này có thể được thiết kế dưới dạng “hoàn thành một nhiệm
vụ”. Để thực hiện kiểu bài tập này sinh viên phải hoàn thành một nhiệm vụ để
chứng tỏ mức độ nắm vững các kiến thức, kỹ năng, hay khả năng vận dụng,
phân tích, tổng hợp và đánh giá những kiến thức, kỹ năng đó. Loại bài tập này
cũng đòi hỏi kiến thức rộng, sâu, cần nhiều thời gian.
- Thực hiện một thí nghiệm
- Trình diễn 1 vở kịch, điệu múa
- Tranh luận

134
- Thi đấu thể dục, thể thao
- Trình bày trước cử toạ
Bước 3: Xác định các tiêu chí đánh giá việc hoàn thành nhiệm vụ
Tiêu chí là những chỉ số (những đặc trưng) của việc hoàn thành tốt nhiệm
vụ. Ở Bước 1 chúng ta đã xác định điều giảng viên muốn sinh viên phải làm
được (chuẩn). Ở Bước 2, chúng ta đã chọn được một (hoặc nhiều) nhiệm vụ để
sinh viên hoàn thành chứng tỏ họ đã đạt chuẩn. Ở Bước 3, chúng ta phải trả lời
câu hỏi: Chúng ta sẽ đánh giá sinh viên hoàn thành nhiệm vụ đó như thế nào?
Để trả lời câu hỏi này cần xây dựng những tiêu chí đặc trưng riêng cho
việc hoàn thành tốt nhiệm vụ. Giảng viên sẽ dùng các tiêu chí này để đánh giá
sinh viên đã hoàn thành nhiệm vụ ở mức nào, tức là họ đáp ứng chuẩn ở mức
nào.
Thí dụ: Bài kiểm tra thực môn Toán
Có 6 chuẩn trong bài kiểm tra này:
- Sử dụng công cụ, phương pháp, đơn vị đo phù hợp để đo được kích
thước một vật
- Xác lập và giải thích được tỉ lệ
- Xác định được các mẫu thang đo
- Ước tính được tổng giá trị và xác định được mức độ chính xác cần
thiết
- Tổ chức tài liệu
- Giải thích quá trình tư duy
Để đánh giá việc đạt các chuẩn nêu trên giảng viên giao một nhiệm vụ
như sau:
Sắp xếp đồ đạc trong phòng
Bạn muốn sắp xếp lại đồ đạc trong phòng, song bố mẹ bạn không
nghĩ đó là ý tưởng hay. Để có thể thuyết phục bố mẹ sắp xếp lại đồ đạc,
bạn phải thiết kế một mô hình tỷ lệ hai chiều để xem sau khi sắp xếp lại đồ
đạc căn phòng sẽ như thế nào?
Trình tự các bước:

135
- Trước hết bạn cần đo các chiều của sàn căn phòng bạn muốn sắp xếp
lại đồ đạc, bao gồm cả vị trí, kích thước của cửa sổ, cửa ra vào. Bạn
cần đo cả khoảng không gian đang đặt từng món đồ trong phòng. Tất
cả những kích thước này được ghi chép lại cẩn thận.
- Sau đó sử dụng các tỉ lệ đã cho để tính toán mối tương quan giữa căn
phòng và từng món đồ.
- Tiếp theo bạn thiết kế căn phòng theo tỷ lệ có đánh dấu các cửa sổ,
cửa ra vào lên tờ giấy khổ lớn.
- Sau đó bạn vẽ các món đồ theo tỷ lệ lên giấy cứng và cắt rời ra
- Tiếp theo bạn sắp xếp mô hình các món đồ vào chỗ bạn muốn trên bản
thiết kế và đánh dấu.
- Cuối cùng bạn viết lời giải thích ngắn gọn vì sao các món đồ lại được
sắp xếp lại như vậy trên mô hình của bạn.
Mô hình của học sinh cùng bản thuyết minh sẽ được treo trong lớp và cả
lớp sẽ bình chọn mô hình tốt nhất.
Như vậy ta có thể thấy các tiêu chí giáo viên chọn như những chỉ số thực
hiện nhiệm vụ sắp xếp lại đồ đạc trong phòng là:
- Tính toán chính xác các phép đo trên mô hình chính xác
- Đánh dấu chính xác trên mô hình
- Thực hiện được các phép đo tốt
- Vẽ đẹp
- Giải thích rõ ràng
(Nhưng làm thế nào để sinh viên biết sẽ thực hiện tốt từng tiêu chí để rồi
hoàn thành tốt nhiệm vụ? Chúng ta sẽ bàn về vấn đề này ở Bước 4)
Ở ví dụ này ta thấy một số chuẩn và tiêu chí có vẻ giống nhau. Ví dụ, tiêu
chuẩn 2 xác lập được mô hình tỉ lệ và 2 tiêu chí – tính toán chính xác trên mô
hình tỷ lệ và đánh dấu chính xác trên mô hình tỷ lệ. Đó không phải là sự trùng
lặp mà có nghĩa là các tiêu chí của bạn phát triển các chuẩn và ta sẽ đo được
mức độ đạt chuẩn của sinh viên.
Những đặc trưng của một tiêu chí tốt
Một tiêu chí tốt có những đặc trưng sau:

136
- Được phát biểu rõ ràng
- Ngắn gọn
- Quan sát được
- Mô tả hành vi
- Được viết để sinh viên hiểu được
Hơn nữa phải chắc chắn rằng mỗi tiêu chí là riêng biệt, đặc trưng cho một
dấu hiệu của bài thi, tuy nhiên không nên để trùng lắp và khác thứ nguyên trong
1 bộ tiêu chí.
Nên giới hạn số tiêu chí ≥ 3 và ≤10. Ở những đặc trưng cơ bản của
nhiệm vụ đó không cần phải đánh giá hết mọi chi tiết. Nhiệm vụ càng đơn giản
thì số tiêu chí càng ít.
Bước 4: Xây dựng bản hướng dẫn (Rubric)
Như vậy, ở Bước 1 chuẩn (công việc mà sinh viên phải và có thể làm
được sau 1 đơn vị nội dung) đã được xác định.
Ở Bước 2, một nhiệm vụ thực mà sinh viên phải thực hiện để chứng tỏ đạt
chuẩn được thiết kế.
Ở Bước 3, những dấu hiệu đặc trưng cho việc thực hiện tốt 1 nhiệm vụ
cũng được xác định.
Ở Bước 4, giảng viên cần thiết kế một bản hướng dẫn để đo lường các
mức độ thực hiện nhiệm vụ này của các sinh viên khác nhau ở cùng 1 tiêu chí.
Bản hướng dẫn (kèm biểu điểm) là bản cung cấp những miêu tả hoặc các
chỉ số thực hiện chỉ từng mức độ hoàn thành nhiệm vụ ứng với các tiêu chí
(đồng thời là điểm số cho các tiêu chí đó ở mức đó).
Như vậy bản hướng dẫn giúp đánh giá chính xác mức độ đạt chuẩn của
sinh viên và cung cấp thông tin phản hồi để họ tiến bộ không ngừng.
Các loại bản hướng dẫn
Có 2 loại bản hướng dẫn:
- Bản định tính (tổng hợp – Holistic rubric)
- Bản định lượng (phân tích – Analytic rubric)
Bản hướng dẫn tổng hợp cho phép đánh giá việc thực hiện nhiệm vụ nói
chung mà không đi sâu vào từng chi tiết. Trong trường hợp này mục đích đánh

137
giá là chất lượng sự hoàn thiện của kỹ năng nói chung. Do vậy hình thức đánh
giá dùng bản hướng dẫn định tính còn có thể được gọi là đánh giá 1 chiều
(Menter, 2001).
Bản hướng dẫn định tính (tổng hợp) giúp giảng viên chấm bài nhanh, phù
hợp với các kỳ đánh giá tổng kết. Tuy nhiên, đánh giá kiểu này không cung cấp
nhiều thông tin phản hồi cho giảng viên và sinh viên.
Thí dụ:
Bản hướng dẫn định lượng (phân tích) chia nhiệm vụ thành những bộ
phận tách rời nhau và sinh viên định giá trị (bằng điểm số) cho những bộ phận
đó. Quá trình chấm bài loại này lâu hơn vì phải phân tích đánh giá từng kỹ năng,
từng đặc trưng khác nhau trong bài làm của sinh viên. Tuy nhiên, bản hướng dẫn
định lượng này cho phép thu thập nhiều thông tin phản hồi hơn, chi tiết hơn ở
từng tiêu chí. Và nếu lưu trữ và xử lí những thông tin này giảng viên sẽ có 1 bộ
hồ sơ về điểm mạnh, điểm yếu của từng sinh viên và quá trình tiến bộ của họ.
Thí dụ:
Độ tin cậy của bản hướng dẫn:
Để đánh giá độ tin cậy của bản hướng dẫn có thể dùng phương pháp thử
bằng cách cho 2 người chấm 1 bài hoặc cho 1 người chấm vào 2 thời điểm khác
nhau. Nếu điểm số trùng nhau có thể xem bản hướng dẫn là có độ tin cậy. Trong
trường hợp ngược lại, cần có sự chỉnh sửa bản hướng dẫn cho phù hợp.
Để xây dựng 1 bản hướng dẫn có chất lượng cần đầu tư kinh phí và tập
huấn cho giảng viên kỹ thuật này.
Đánh giá thực có tác động không nhỏ tới quá trình giảng dạy, tới phương
pháp dạy học. Trong giờ dạy, giáo viên có thể dùng những dữ liệu thu được qua
các kỳ KTĐG để hướng dẫn sinh viên, thậm chí có thể hướng dẫn cách thực hiện
1 bài đánh giá thực. Để hoàn thành bài đánh giá kiểu này cả thầy và trò phải
xây dựng 1 chiến lược dạy học sao cho:
- Khuyến khích các hình thức thể hiện khác nhau như đóng vai, mô
phỏng, tranh luận, trình bày, diễn giải...
- Cho phép làm việc nhóm giúp sinh viên đóng các vai trò khác nhau và
chú ý nhiều hơn tới quá trình nhóm và sản phẩm nhóm.

138
- Tạo điều kiện để sinh viên tự đánh giá, đánh giá lẫn nhau, tự xác định
mục tiêu phấn đấu để đạt chuẩn.
- Động viên sinh viên sử dụng kinh nghiệm của cá nhân để thực hiện các
nhiệm vụ trong đời sống thực.
- Rèn luyện cho sinh viên khả năng đánh giá mức độ tương quan giữa
nỗ lực và hiệu quả.
- Để sinh viên biết rằng phải tích hợp nhiều kỹ năng khác nhau mới có
được những thành công trong học tập cũng như trong cuộc sống sau
này.
Ví dụ: Rubric kiểm tra chất lượng của một rubric

Mức
Tiêu chí 3 2 1 0
Ý tưởng Có ý tưởng sáng tạo Có ý tưởng về Có ý tưởng thiết kế Không có
về cách tích hợp cách tích hợp rubric nhưng chưa ý tưởng
Rubric vào dạy, Rubric vào quá tích hợp được vào
học, tự đánh giá, trình dạy - học. quá trình dạy học.
đánh giá lẫn nhau và
đánh giá.

Cách tổ chức Cách tổ chức rubric Rubric được tổ Cách tổ chức đơn Không có
sáng tạo, cung cấp 1 chức theo thứ tự giản, chưa thể hiện biện pháp
hướng đi rõ ràng các tiêu chí cụ được cách thức đánh tổ chức
giúp người học đạt thể để đánh giá giá để giúp người
chuẩn, tạo hứng thú một bài học. học đạt chuẩn.
cho người học.
Sử dụng các Có sự liên kết tường Liên kết được Mới chỉ liệt kê được Không
chuẩn minh các nhiệm vụ một số nhiệm vụ các nhiệm vụ, chưa đánh giá
và chấm điểm theo để kiểm tra việc chứng tỏ được sự theo
các chuẩn đánh giá. đạt chuẩn. tương ứng với các chuẩn
chuẩn đánh giá.
Cách trình bày Chỉ ra được các mức Những kỳ vọng Những kỳ vọng và Không
độ hoàn thành về mức độ hoàn tiêu chí chấm điểm xây dựng
nhiệm vụ (về kiến thành nhiệm vụ đã được viết nhưng được tiêu
thức, kỹ năng, thái được chỉ ra không được công bố chí chấm
độ), có hệ thống, nhưng chưa cho người học. điểm
công bố rõ ràng cho tường minh và
người học. theo hệ thống, có
công bố cho
người học.

139
Kết luận
Đánh giá thực không loại trừ đánh giá truyền thống mà chỉ là sự bổ sung
hoàn hảo giúp người dạy cũng như người học gắn kết những kiến thức, kỹ năng
được học trong trường với cuộc sống thực, giúp người học có ý thức hơn với
những nhiệm vụ mà họ sẽ phải thực hiện khi tốt nghiệp. Quá trình dạy học trong
trường cũng nhờ đó mà trở nên sống động hơn, giảng viên sẽ tìm tòi, sáng tạo
hơn để tìm ra các bài tập hay, hỗ trợ sinh viên thực hiện các nhiệm vụ đó. Sinh
viên sẽ khát khao hơn trong quá trình tiếp nhận tri thức, rèn luyện kỹ năng để
làm một việc có ý nghĩa hơn ngay từ khi còn trên ghế nhà trường.
Đương nhiên để có thể thiết kế được 1 bộ hồ sơ đánh giá kết quả học tập
của sinh viên (trong đó có những bài đánh giá thực), để đánh giá thực sự là vì sự
tiến bộ không ngừng của người học, phải đầu tư thời gian, tiền bạc. Nhưng để
giáo dục đại học đào tạo ra nguồn nhân lực đáp ứng nhu cầu phát triển kinh tế xã
hội trong giai đoạn mới, các nhà hoạch định chính sách, các nhà trường, các
giảng viên phải dành ưu tiên thích đáng cho KTĐG thực này.
Để thực hiện được kiểu đánh giá thực trong phạm vi toàn trường, người
lãnh đạo phải thể hiện quyết tâm chính trị của mình, hỗ trợ giảng viên, sinh viên
thay đổi cách dạy, cách học, loại bỏ cách KTĐG theo những mục tiêu hạn hẹp,
lạc hậu.
Đổi mới KTĐG phải bắt đầu từ việc xác lập những mục tiêu học tập gắn
chặt với đời sống thực, rồi từ đó phát triển đội ngũ, đổi mới chương trình, tài
liệu học tập. Đây là công việc khó, phải tiến hành trong thời gian dài, tốn nhiều
công sức, nhưng đã đến lúc phải bắt đầu!

140
TÀI LIỆU THAM KHẢO

1. Đặng Bá Lãm, Kiểm tra đánh giá trong dạy - học đại học, NXB GD
2003.
2. Phan Trọng Ngọ, Dạy - học và phương pháp dạy - học trong nhà
trường, NXB ĐHSP, 2005.
3. Lê Đức Ngọc, Bµi gi¶ng: §o l­êng ®¸nh gi¸ trong gi¸o dôc, Trung
t©m §¶m b¶o chÊt l­îng ®µo t¹o vµ nghiªn cøu ph¸t triÓn gi¸o
dôc, 2000.
4. Lâm Quang Thiệp, Tập bài giảng Đo lường đánh giá trong giáo dục,
Khoa Sư phạm, ĐHQGHN, 2003.
5. Dương Thiệu Tống, Trắc nghiệm và đo lường thành quả học tập, NXB
KHXH, 2005.
6. Margaret L.Wu, Raymond J. Adams, Mark R. Wilson – ACER
CONQUEST – Generalised Item Response Modelling Software –
ACER Press, 1998.
7. Authentic Assessment Toolbook
8. Thomas A.Angelo và K.Patricia Hoss, Classroom Assessment
Techniques, Sanfransisco, 1993.

141

You might also like