You are on page 1of 9

Ton Nu My Nhat / Tạp chí Khoa học và Công nghệ Đại học Duy Tân 02(45) (2021) 117-125

117

02(45) (2021) 117-125

A proposed revised version of the scoring rubrics of VSTEP 3-5 level


Phiên bản đề xuất chỉnh sửa bộ tiêu chí đánh giá kỳ thi VSTEP bậc 3-5

Ton Nu My Nhata,b*
Tôn Nữ Mỹ Nhậta,b*
a
Institute of Linguistics, Duy Tan University, Da Nang, 550000, Vietnam
a
Viện Ngôn ngữ, Ðại học Duy Tân, Ðà Nẵng, Việt Nam
b
Faculty of English Language, School of Foreign Language, Duy Tan University, Da Nang, 550000, Vietnam
b
Khoa Tiếng Anh, Trường Ngoại Ngữ, Ðại học Duy Tân, Ðà Nẵng, Việt Nam

(Ngày nhận bài: 03/11/2020, ngày phản biện xong: 27/02/2021, ngày chấp nhận đăng: 08/03/2021)

Abstract
VSTEP (Vietnamese Standardized Test of English Proficiency) is a proficiency test in line with the Six-level
framework for foreign language proficiency in Vietnam (VNFLPF), equivalent to the CEFR, issued by the MOET dated
March 3, 2015. Of the versions for different target groups, the VSTEP 3-5 level is undoubtedly the most wide-spread so
far, and common in multiple institutions of higher education in Vietnam. This article is to describe and critically
evaluate the issued scoring rubrics of the two productive skills – Speaking and Writing; and basing on an analysis and
modification of the descriptors, to propose revised versions of the marking rubrics. The product represents the more
concise and clearer rubrics. The revised versions are of practical significance to the practice of English language
teaching for graduates and post-graduates, the issue of training the assessors of the two productive skills, and/or the
endeavor of self-improvement on the part of instructors of English in order to ensure standardized quality in assessment.
Keywords: VSTEP; VSTEP 3-5; scoring rubrics; Six-level framework for foreign language proficiency in Vietnam.
Tóm tắt
VSTEP (Vietnamese Standardized Test of English Proficiency) là kỳ thi đánh giá năng lực tiếng Anh theo Khung năng
lực ngoại ngữ 6 bậc dùng cho Việt Nam (tương đương với trình độ A1, A2, B1, B2, C1,C2), được Bộ GD&ĐT ban
hành vào tháng 03 năm 2015. Trong những phiên bản của VSTEP, dành cho những đối tượng khác nhau, thì bài thi
VSTEP bậc 3-5 là phổ biến hơn cả và đang được sử dụng rộng rãi trong các trường đại học ở Việt Nam hiện nay. Bài
viết này nhằm mục tiêu miêu tả và đánh giá bộ tiêu chí đánh giá hai kỹ năng Nói và Viết của kỳ thi này, và dựa trên
những kết quả phân tích và chỉnh sửa ngôn từ, kết quả nghiên cứu đã cho ra 2 bộ tiêu chí đánh giá ngắn gọn, súc tích, và
rõ ràng hơn. Hai bộ tiêu chí đánh giá mới có ý nghĩa đối với thực tiễn dạy-học tiếng Anh bậc đại học, sau đại học, cũng
như với thực tế bồi dưỡng đội ngũ cán bộ chấm thi hai kỹ năng Nói, Viết, hay/và thực tế tự bồi dưỡng của giảng viên
tiếng Anh để bảo đảm chất lượng trong quá trình chấm thi hướng đến các chuẩn quốc tế.
Từ khóa: Kỳ thi đánh giá năng lực tiếng Anh của Việt Nam; Kỳ thi đánh giá năng lực tiếng Anh của Việt Nam bậc 3-5;
Tiêu chí chấm thi; Khung năng lực ngoại ngữ 6 bậc dùng cho Việt Nam.

*
Corresponding Author: Ton Nu My Nhat; Institute of Linguistics, Duy Tan University, Da Nang, 550000, Vietnam;
Faculty of English Language, School of Foreign Language, Duy Tan University, Da Nang, 550000, Vietnam
Email: tnmynhat70@gmail.com
118 Ton Nu My Nhat / Tạp chí Khoa học và Công nghệ Đại học Duy Tân 02(45) (2021) 117-125

1. Introduction and Task 2 [3]. It is claimed that the


The Vietnamese Standardized Test of development of these rating rubrics was based
English Proficiency (VSTEP) was released on the Vietnamese six-level language
according to Decision No. 729/QĐ-BGDĐT, proficiency framework and the other CEFR-
dated March 11, 2015 [1]. It is claimed that this aligned rating schemes such as IELTS and
‘first-ever made-in-Vietnam standardized EFL Cambridge English exams such as PET, FCE,
tests’ was developed ‘intensively with utmost and CAE.
effort and energy’ [2, p. 74]. There are five These analytic scales contain five features for
VSTEP variants for different targeted groups, Speaking test - Grammar, Vocabulary,
of which the VSTEP 3-5 level is the most Pronunciation, Fluency, Organization - and four
influential. This multi-level test is aimed to features for Writing test - Task completion,
cater for the certification needs of a large Organization, Vocabulary, Grammar. All
number of groups. Many institutions in four/five analytical criteria are shared across the
Vietnam have made use of this specification to whole test and equally weighted. The number of
award the B1-C1 English proficiency criteria is, thus, within limit [4, p. 193].
certificates to multiple target groups in recent Each of the feature has descriptors for 11
years. It has widely been used in colleges and points - ascending from 0 to 10. The descriptors
examination bodies in Vietnam because it is are intended to focus the readers’ attention on
well developed, reliable, and economical in
the test-takers’ strengths, not on their
comparison to the international tests.
deficiencies. That there are up to 11 points
Given the wide-spread use of this nation- presents a marked weakness. Pollitt (1990,
wide test, this article is to argue that the scoring cited in [5, p. 123]) points out that it is ‘overly
rubrics of the two productive skills of VSTEP optimistic to expect a test of writing to be able
3-5 is far from practical and to propose a to distinguish reliably between five scale points
revised version of the rubrics. In this article, or more.’ In addition, although the benefits of
the currently-circulated scoring rubrics for analytical scoring are to provide valuable
the two productive skills will first be diagnostic information for test-takers, only the
described in terms of superficial textual overall score is reported, which means ‘a good
features and practicality. The paper will then deal of information provided by the analytic
go on to describe how the rating scales have scale is lost’ [5, p. 120].
been revised - the features modified and the
It should also be noted that the rules for
procedures, which is followed by the
deriving the overall score are rather complicated:
presentation of the revised products. The final
first, each feature is marked on a 11-point scale;
section concerns itself with the factors to
then, each score is converted to the assigned
consider in order to assure scoring quality of
level: 4-5.5 equals Level 3; 6-8 equals Level 4;
these tests.
8.5-10 equals Level 5); finally, the overall score
2. The study reported is decided, basing on a combination of
2.1. A critical analysis of VSTEP 3-5 scoring the four/five individual scores.
rubrics A close analysis of the rubrics of two writing
There are three rubrics altogether - one for tasks reveals that they are different in only the
Speaking test, and two for Writing test - Task 1 feature of Task completion. Another minor
Ton Nu My Nhat / Tạp chí Khoa học và Công nghệ Đại học Duy Tân 02(45) (2021) 117-125 119

difference can be seen in Organization, layout also results in the ever-highest number
concerning paragraphing, restricting to one of pages of all rubrics we can refer to so far;
descriptor in the middle scores. each rubric takes up five pages. As Luoma [6,
One noticeable weakness of these rubrics p. 81] states, to be useful, the scale descriptors
lies with the layout. That they are written in need to be practical, because if they are not
Vietnamese and there are too many columns brief, it is hard to memorize and use the scale
and rows due to the large number of points consistently. Table 1 summarizes the
highly obscures differentiation between the superficial textual features of these three
band scores. Lack of meticulous attention to the scoring rubrics.

Table 1: Textual features of three scoring rubrics


Features SPEAKING scoring WRITING TASK 1 WRITING TASK 2
rubric scoring rubric scoring rubric
No. of column 12 5 5
No. of row 6 12 12
No. of word 2,230 1,259 1,423
No. of page 5 5 5
No. of features 5 4 4

To be practical, these weaknesses need (4) The descriptors were accordingly


taking into consideration and modifications are grouped into four levels.
highly mandated. (5) Basing on Vietnamese grammar, I
2.2. Methodology conducted a discourse analysis of the group of
descriptors in each level and modified the
The procedures were as follows:
descriptors. Specifically,
(1) The PDF files were converted to Word;
 eliminating the repeated descriptors;
(2) For each feature, the points and the
 reordering some syntactic elements so
associated descriptors were set in lines, not in
that distinctions between the levels would
columns. For example:
be easier to identify, understand, and
1. Phát âm tương đối rõ ràng những từ và remember;
cụm từ đơn giản nhưng do đôi khi khó nghe nên  deleting unnecessary words (mostly modal
người đối thoại vẫn phải yêu cầu nhắc lại. words, such as ‘chỉ’, ‘được’, ‘một cách’...);
2. Phát âm rõ ràng và dễ hiểu những từ và  rewording confusing words and expressions
cụm từ, tuy còn mắc khá nhiều lỗi về các âm if any.
đơn lẻ và các lỗi về âm khác. For example:
(3) The number of levels were reduced: Original: Chỉ sử dụng được một cách hạn
Basing on the rules of converting from 11-point chế một số cấu trúc ngữ pháp và
scale to 3-5 levels, I combined points 10 and 9 mẫu câu đơn giản đã học.
to produce Level 5, points 8, 7and 6 to produce Revised: Sử dụng hạn chế một số cấu trúc
Level 4, points 5 and 4 to produce Level 3, đơn giản.
leaving all the lower points to “Không xét” Original: Đáp ứng đầy đủ và hiệu quả các
(unqualified for any levels of 3-5). yêu cầu của đề bài.
120 Ton Nu My Nhat / Tạp chí Khoa học và Công nghệ Đại học Duy Tân 02(45) (2021) 117-125

Revised: Đáp ứng các yêu cầu của đề bài paragraphing was maintained as a feature for
đầy đủ, hiệu quả. both tasks because paragraphing also must be
Original: Một số lỗi về sự không thống nhất observed in this functional genre.
và không phù hợp trong giọng văn. 3. Findings and discussion
Revised: Một số lỗi về tính thống nhất, phù The time-consuming procedures have
hợp trong giọng văn. resulted in the revised versions which bear out
Finally, I combined the two rubrics for two many strengths in comparison to the original
tasks of the writing test into only one scale. The versions: they are shorter, clearer, more user-
only feature which presents to be different, friendly, and accordingly more useful and
namely Task completion, was categorized into practical (Table 2 and Table 3). Table 4
the subscales for Task 1 and those for Task 2. compares the two versions.
Furthermore, the descriptor associated to
Table 2: Scoring rubrics for speaking test (Tiêu chí chấm điểm bài thi Nói)
BẬC NGỮ PHÁP TỪ VỰNG PHÁT ÂM ĐỘ LƯU BỐ CỤC
PHẠM VI PHẠM VI ÂM ĐƠN LẺ LOÁT NỘI DUNG
ĐỘ CHÍNH KIỂM SOÁT TRỌNG ÂM, NGẬP PHÁT TRIỂN
XÁC NGỮ ĐIỆU NGỪNG CHỦ ĐỀ
NÓI DÀI MẠCH LẠC
LIÊN KẾT
Không  Cấu trúc đơn  Từ, ngữ:  Độ chính xác:  Từ, ngữ: (rất)  Liên kết: giữa
xét giản, hạn chế/ thông dụng về thấp/ tương đối ngắn/ câu đã các từ, ngữ;
chính xác; chủ đề (rất) rõ ràng/ rõ ràng học thuộc;  Trả lời câu hỏi:
 Có thể thể quen thuộc; / dễ hiểu;  Rời rạc/ ngập không phù hợp/
hiện ý;  Có thể lặp từ,  Người nghe: ngừng/ chậm tương đối phù hợp
 Lỗi: cơ bản, ngữ; thấy khó hiểu / chạp;  Phương tiện liên
hệ thống/  Đúng chính yêu cầu nhắc  Có thể nói kết: kết từ thông
nhiều. tả / dạng thức. lại; vấp, nhắc lại; dụng - “và”,
 Lỗi: âm đơn lẻ,  Ý đơn giản, “nhưng”, “vì”; có
khá nhiều. hầu như thể lặp
không diễn  Phát triển ý: hầu
đạt được ý như không/ hạn
phức tạp. chế, dùng từ gợi ý
trong đề, liệt kê
 Câu đơn:  Từ, ngữ: về  Từ, âm đơn lẻ:  Ý đơn giản:  Liên kết: có liên
chính xác / chủ đề quen rõ ràng, dễ trôi chảy; kết giữa các ý;
3 ít lỗi; thuộc/ không hiểu;  Ý phức tạp:  Trả lời câu hỏi:
 Câu phức: quen thuộc;  Lỗi: âm đơn lẻ, chậm, ngập phù hợp,
có thể có  Đôi lúc lặp trọng âm; một ngừng, do phải  Phương tiện liên
nhiều lỗi. từ, ngữ; số/ nhiều tìm cấu trúc và kết: môt số/ đa
 Có thể thể  Lỗi: một số /  Có nhấn trọng từ vựng. dạng phương tiện
hiện ý: rõ nhiều; lỗi kết âm từ.  Có thể phát đơn giản / phức
ràng. hợp từ, diễn triển câu trả tạp; có thể thể
đạt ý. lời bằng các hiện quan hệ liên
cụm từ, câu kết chưa chính
đơn; xác; đôi khi lặp.
Ton Nu My Nhat / Tạp chí Khoa học và Công nghệ Đại học Duy Tân 02(45) (2021) 117-125 121

 Lỗi: có thể  Phát triển ý: liệt


mắc khi nói kê / tương đối dễ
các đoạn dài; dàng;
biết sửa lỗi.  Mở rộng ý:
chưa rõ / lặp / với
(những) chi tiết,
ví dụ minh họa
phù hợp;

 Các dạng  Từ, ngữ: về  Từ, âm đơn lẻ:  Ý đơn giản  Phương tiện liên
câu đơn: chính hầu hết các (hầu như) rõ và phức tạp: kết: nhiều/ đa
4 xác, linh hoạt; chủ đề quen ràng, chính giao tiếp dễ dạng; thể hiện
 Câu phức: thuộc/ không xác, tự nhiên, dàng, tương (khá) rõ ràng mối
một số/ khá quen thuộc; dễ hiểu; đối/ khá lưu quan hệ giữa các
nhiều;  Lặp từ, ngữ: ít  Trọng âm từ: loát; ý.
 Lỗi: một số, khi, với các tương đối  Có thể nói  Phát triển ý: dễ
không hệ chủ đề không chính xác; các đoạn dài: dàng;
thống, có thể quen thuộc;  Có nhấn trọng có thể lặp từ;  Mở rộng ý: với
tự sửa, không  Kết hợp từ, âm câu;  Lỗi: có thể những chi tiết, ví
gây hiểu diễn đạt: tương  Có thể hiện mắc một số dụ minh họa phù
nhầm. đối chính xác; ngữ điệu câu. lỗi nhỏ/ hợp.
 Chính tả / dạng không hệ
thức từ: (tương thống, có thể
đối) chính xác sửa lỗi;
(cao);  Ngập
 Có từ, ngữ ít ngừng: thỉnh
thông dụng; thoảng, không
cụm từ cố định, quá lâu.
thành ngữ.
 Lỗi: một số;
lỗi kết hợp từ,
dạng thức từ,
diễn đạt ý.
 Nhiều cấu trúc  Từ, ngữ:  Từ, âm đơn  Đoạn dài: dễ  Phát triển, mở
5 câu: đa dạng, phong phú; có lẻ: rõ ràng, dàng, lưu loát, rộng ý: dễ dàng,
linh hoạt, từ, ngữ thuộc chính xác, tự tự nhiên; (khá) tường tận,
chính xác; tần số sử dụng nhiên, dễ hiểu;  Lặp từ, sửa với những chi tiết,
 Lỗi: khó phát thấp; thành ngữ;  Trọng âm từ, lỗi: đôi khi, ví dụ minh họa
hiện/ hầu như  Lặp từ, ngữ: câu: chính xác; hiếm khi; phù hợp; kết luận
không. hiếm khi; có thay đổi để thể  Ngập ngừng: phù hợp;
thể còn còn hiện các sắc hầu như  Tổ chức ý: rõ
ngập ngừng thái ý nghĩa không; chỉ khi ràng, mạch lạc,
khi tìm từ, ngữ khác nhau; diễn đạt một số cấu trúc chặt chẽ;
thay thế;  Ngữ điệu câu: chủ đề/ khái  Phương tiện liên
 Lỡ lời: đôi khi/ phù hợp; thay niệm khó. kết: (khá) thành
hầu như không; đổi để thể hiện thạo, đa dạng các
 Lỗi: nhỏ; một các sắc thái ý phương tiện.
vài / không. nghĩa khác nhau.
122 Ton Nu My Nhat / Tạp chí Khoa học và Công nghệ Đại học Duy Tân 02(45) (2021) 117-125

Table 3: Scoring rubrics for Writing test (Tiêu chí chấm điểm bài thi Viết)
BAND Không xét 3 4 5
 Không đáp ứng  Đáp ứng một nửa  Đáp ứng (gần như)  Đáp ứng các yêu
yêu cầu nào của đề hay một phần yêu đầy đủ yêu cầu của cầu của đề bài đầy
bài; cầu của đề bài; đề bài; đủ, hiệu quả;
 Bài viết hoàn  Thể hiện mục đích  Thể hiện mục đích  Phát triển điểm
toàn không phù bài viết không rõ viết (nhìn chung) rõ chính đầy đủ với
hợp, không thể ràng (ở một số chỗ); ràng; (tất cả) thông tin chi
hiểu được;  Có thể nhầm lẫn ý  Dạng thức bài viết tiết phù hợp;
 Trình bày được chính với thông tin có thể không phù  Thể hiện mục đích
rất ít ý, phần lớn chi tiết; hợp ở một số chỗ; viết rõ ràng, hiệu
những ý này không  Một số phần có  Các điểm chính: quả; giọng văn
TASK 1

phù hợp, lặp lại. thể không rõ ràng, được trình bày (gần thống nhất, phù
không phù hợp như) đầy đủ; hợp.
hoặc lặp lại;  Phát triển ý: hầu
 Các điểm chính có hết thông tin chi tiết
thể không được trình phù hợp; 1-2 điểm
bày đầy đủ; có xu chính có thể cần
hướng tập trung vào phát triển hơn nữa;
MỨC ĐỘ HOÀN THÀNH BÀI THI

những chi tiết;  Có thể mắc 1-2,


 Có thể mắc một số một số lỗi (nhỏ) về
lỗi về tính thống tính thống nhất, phù
nhất, phù hợp trong hợp trong giọng văn.
giọng văn.

 Bỏ thi / Không  Đáp ứng một  Đáp ứng (gần  Đáp ứng đầy đủ
viết từ nào/ Viết lại phần yêu cầu của như) đầy đủ các / hiệu quả các yêu
một bài theo trí đề bài; yêu cầu của đề bài; cầu của đề bài;
nhớ/thuộc lòng;  Những ý chính:  Những ý chính:  Những ý chính:
 Bài hoàn toàn trình bày một số, phát triển gần như phát triển đầy đủ,
không phù hợp/ có thể lặp, phát đầy đủ, với hầu hết phù hơp, đươc ̣ mở
không thể hiểu triển không đầy thông tin chi tiết rộng/ chứng minh
được; đủ với những chi phù hợp; đầy đủ;
 Hầu như không tiết phù hợp/  Quan điểm thể  Quan điểm thể
đáp ứng yêu cầu không phù hợp; hiện nhìn chung rõ hiện rõ ràng trên
TASK 2

nào của đề bài;  Quan điểm thể ràng trên toàn bài, toàn bài.
 Quan điểm hiện không hẳn có thể lặp/ không
không được thể rõ ràng trên toàn rõ ở một số phần/
hiện; bài; có thể không phần kết luận.
 Không trả lời rút ra kết luận.
đầy đủ bất cứ yêu
cầu nào của đề
bài;
 Trình bày 1-2 ý
chính nhưng
(phần lớn) không
được phát triển.
Ton Nu My Nhat / Tạp chí Khoa học và Công nghệ Đại học Duy Tân 02(45) (2021) 117-125 123

 Phương tiện liên kết:


 Chia đoạn không  Chia đoạn (tương  Chia đoạn đủ và hợp
những từ nối cơ bản, hợp lý, hoặc đối) logic; lí;
thường gặp; không viết theo  Phương tiện liên kết:  Phương tiện liên kết:
 Tổ chức thông tin, đoạn; trong câu, liên câu; phong phú, linh hoạt,
TỔ CHỨC BÀI VIẾT

lập luận: không có, Phương tiện liên nhiều; phù hợp; có hiệu quả;
hạn chế. kết: sử dụng đúng thể quá nhiều/ ít/ đôi  Tổ chức thông tin,
một số từ nối, khi còn sai; lập luận: lô-gíc,
phương tiện cơ  Tổ chức thông tin, mạch lạc, hiệu quả.
bản, thường gặp, ở lập luận: hợp lý,
trong câu, liên mạch lạc.
câu; có thể lặp,
thiếu chính xác;
Tổ chức thông tin,
lập luận: mạch lạc.

 Sử dụng phạm  Sử dụng phạm vi  Sử dụng được dải từ  Sử dụng dải từ rất
vi từ (rất) hạn từ hẹp theo chủ đề rộng rộng, bao gồm
chế. bài viết; có xu  Sử dụng một số từ ít những từ ít thông
 Sử dụng từ, ngữ hướng lặp một số thông dụng, ngữ cố dụng, ngữ cố định;
rời rạc; từ; định, có thể mắc lỗi; chính xác, linh hoạt;
TỪ VỰNG

 Mắc (rất) nhiều  Sử dụng từ, ngữ cơ  Dùng từ tương đối  Dùng từ (nhìn chung)
lỗi, lỗi có thể làm bản; phù hợp phong cách; phù hợp phong cách;
thay đổi nghĩa;  Mắc (khá nhiều) lỗi, (Rất) Ít lỗi hệ thống,  (Hầu như) không
thỉnh thoảng gây lỗi có thể gây mắc lỗi, hoặc 1-2 lỗi
khó hiểu. khó hiểu. không hệ thống;
không gây khó hiểu.

 Viết một vài từ,  Cấu trúc đơn  Cấu trúc: đơn giản và  Cấu trúc: đa dạng
ngữ đã học thuộc giản: sử dụng phức tạp; - đơn giản và phức
trước; chính xác;  Đa số các câu không tạp; chính xác, linh
 Không viết  Cấu trúc phức có lỗi; hoạt;
được thành câu; tạp: có thể sử dụng  Có thể mắc lỗi không  Gần như không
 Cấu trúc đơn sai; hệ thống, hầu như mắc lỗi, hoặc 1-2
NGỮ PHÁP

giản: một vài, sử  Có thể (tương không gây khó hiểu, lỗi không hệ thống,
dụng chính xác; đối nhiều) lỗi, hiểu nhầm. không gây khó
 (Nhiều) lỗi cơ nhưng không, hiểu.
bản, làm thay đổi hoặc thỉnh thoảng
nghĩa; gây khó khăn cho
 Lỗi xuất hiện người đọc;
rất nhiều và làm
thay đổi nghĩa.
124 Ton Nu My Nhat / Tạp chí Khoa học và Công nghệ Đại học Duy Tân 02(45) (2021) 117-125

Table 4: The original scoring rubrics vs. The revised


Features SPEAKING scoring rubric WRITING scoring rubric

ORIGINAL REVISED ORIGINAL REVISED


No. of column 12 6 10 (five each) 5
No. of row 6 5 24 (12 each) 9
No. of word 2,230 856 2,682 (1259 + 931
1423)
No. of page 5 2 10 (5 each) 2
No. of levels 11 4 11 4
No. of 5 5 4 4
features

Luoma [6, p.80] maintains the number of multiple sample scripts/ oral performances that
levels in a scale is one of the ‘central questions exemplify points on the scale. It is believed that
in scale development’, adding that ‘the lower “only when all raters are in close agreement on
the number of levels, the more consistent the the scores for these samples that reliable
decisions.’ The basic rules to have been scoring can take place.” (White, 1984, cited in
followed when I revised the descriptors are [5, p. 128]
“brief, clear, definite, and comprehensible - As far as the speaking test is concerned,
independently” [4, p. 205-207]. Brevity makes each candidate’s performance must be recorded
these scales user-friendly, for assessors, who for the second independent rating.
may use the scales as a reference during the - As for the writing test, there can be a
rating process, and for assessor-trainers, who number of other measures. First, each script
need to facilitate the trainees in training must be scored independently by two raters.
workshops. Clarity refers to simple wordings The first rating can be done on a rating sheet,
and sentence structures to help readers
which is hidden from the second rater; they are
understand the descriptors more quickly and
allowed neither to write any comments nor to
easily.
underline errors when scoring scripts. A third
In order to assure scoring quality, every rater is invited to adjudicate in cases of
effort should be made to maintain high discrepancy. Second, rating must be done in a
reliability in assessing these two productive “controlled reading” - “readers meet together
skills, such as: to grade scripts at the same place and time” in
- Conducting seminars on assessment, order to eliminate unnecessary sources of error
VSTEP, CEFR and/or Vietnamese 6-level variance and to form a positive social
framework, when the trained, experienced environment helping to maintain the assessing
assessors returning from workshops can train standards (White, 1984, cited in [5, p. 128]. An
the others in the staff; additional measure is randomly checking the
- Regarding the scoring rubrics, there should results by senior assessors to ensure individual
be extensive training so that would-be raters raters have followed the agreed-upon standards
come to an understanding of the criteria for grading of the ongoing assessment. This
through repeated discussion and exposure to step is also aimed to keep records on the level
Ton Nu My Nhat / Tạp chí Khoa học và Công nghệ Đại học Duy Tân 02(45) (2021) 117-125 125

of expertise of the raters so that decisions can References


be made on whether each can be kept on, [1] Bộ Giáo dục và Đào tạo, Quyết định số 729/QĐ-
retrained, or dropped. BGDĐT “Ban hành định dạng đề thi đánh giá năng
lực sử dụng tiếng Anh từ bậc 3 đến bậc 5 theo
4. Conclusion khung năng lực ngoại ngữ 6 bậc dùng cho Việt
Nam, Hà Nội, ngày 11 tháng 3 năm 2015”.
In this article, to my best knowledge, for the [2] Quynh, N. T. N. (2020), Vietnamese Standardized
first time, the scoring rubrics of the VSTEP 3- Test of English Proficiency - A Panorama. In Lily
5, is critically analyzed and described from the I-Wen Su, et al. (eds). (2020), English Language
Proficiency Testing in Asia. Routledge, pp. 71-1000
perspective of Vietnamese grammar and a
[3] Bộ Giáo dục và Đào tạo, Tài liệu “Hướng dẫn áp
revised rubric is proposed, which is far more dụng Định dạng đề thi đánh giá năng lực sử dụng
concise, linguistically grounded, and tiếng Anh từ bậc 3 đến bậc 5 theo Khung năng lực
undoubtedly useful to users. ngoại ngữ 6 bậc dùng cho Việt Nam trong việc xây
dựng đề thi và chấm thi (Phê duyệt kèm theo Quyết
Weigle (2020) states: định số: 730/QĐ-BGDĐT ngày 11 tháng 3 năm
2015 của Bộ trưởng Bộ Giáo dục và Đào tạo).
the scoring rubric is critical, as it represents [4] Council of Europe. 2001. The Common European
as explicitly as possible the definition of the Framework of Reference for Languages (CEFR) -
skill(s) that the test is intended to measure...It is euroexam international (www.euroexam.org)
not enough for a rubric to be clear and explicit: it [5] Weigle, S. C. 2002. Assessing Writing. New York:
Cambridge University Press.
must also be useable and interpretable, certainly [6] Luoma, S. 2002. Assessing Speaking. New York:
by raters, and preferably by any and all Cambridge University Press.
stakeholders in the testing process, particularly KPG exams. The A/ B/ C level. Speaking Test –
test takers and decision makers. (p. 122) Assessing Oral Production. Oral Examiners
information Pack, September 2014.
VSTEP 3-5 has had a positive reception https://rcel2.enl.uoa.gr/kpg/files/C_level_oral_exam
among students, lecturers, and other community iner_info_pack.pdf
Pölzleitner and Bauer. 2020. Assessment Scale for
members. I hope that the revised versions are of Written Work / Assessment Scale for Written Work
some practical significance to the endeavor of in Lower School
the stakeholders in order to bring excellence to (https://www.polzleitner.com/epep/Assessment/New
AssessmentScales/all-three-files.pdf).
EFL education and assessment.

You might also like