o Bất kể dữ liệu ban đầu dưới dạng gì, khi đưa vào mô hình định lượng, các dữ liệu đó phải được “số hóa” o Những nhân tố thuần định tính, ví dụ sự trung thành của khách hàng, sự gắn kết của nhân viên, phong cách lãnh đạo… => Cần được thể hiện bằng con số trong nghiên cứu định lượng - Trọng tâm là lượng háo mối quan hệ giữa các nhân tố: o Nhiều người lầm tưởng nghiên cứu định lượng đơn thuần là sử dụng các con số o Việc sử dụng các con số để lập bảng biểu, vẽ sơ đồ => Chỉ là bước ban đầu – phân tích mô tả - của nghiên cứu định lượng o Trong tường hợp “lượng hóa mối quan hệ giữa các nhân tố” không khả thi, chỉ dừng lại ở việc mô tả => Không được coi là nghiên cứu định lượng theo đúng nghĩa
MỘT SỐ KHÁI NIỆM CƠ BẢN TRONG DỮ LIỆU ĐỊNH LƯỢNG
1. Đơn vị phân tích - Thực thể cơ bản mà nghiên cứu tiến hành phân tích - Đơn vị phân tích được thể hiện dưới dạng “cái gì” hoặc “ai”. Trong khoa học kinh tế và quản lý, đơn vị phân tích có thể là cá nhân, nhóm, tổ chức, địa phương, hoặc quốc gia - Đơn vị phân tích cũng có thể là hệ thống quản lý trong tổ chức hay mối uan hệ kinh doanh giữa các đối tác khi các “thực thể” này là trọng tâm phân tích trong nghiên cứu - Các đơn vị phân tích thông dụng trong nghiên cứu kinh tế - quản lý: Đơn vị Nhóm/tổ Các cấp độ phân Cá nhân Sự kiện Mối quan hệ chức hành chính tích Cá nhân là đơn vị phân tích khá thông dụng, đặc Đơn vị phân biệt của nhân viên tích có thể là và hành vi trong các nhóm Mối quan hệ Cấp xã, các nghiên cứu về Đây là sự kiện người: ví dụ giữa các cá Mô tả chia sẻ tri thức có cụ thể nhóm làm nhân hoặc huyện, tỉnh, quốc gia đơn vị phân hành việc, phòng nhóm/tổ chức vi tổ chức. Đó có ban hay cả tổ thể là các nhà chức quản lý, nhân viên hay khách hàng. Nghiên cứu về Nghiên cứu về Nghiên cứu “chữ tín” giữa nhân tố tác Nghiên cứu về sự về phong cách các đối tác Các nghiên động tới quyết cam kết của nhân lãnh đạo => KD => đơn vị cứu kinh tế, định biểu tình viên và hành vi đơn vị phân phân tích ở quản lý công của công nhân Ví dụ chia sẻ tri thức => tích là nhóm, đây là “mối => có đơn vị có đơn vị đơn vị phân tích là phòng, ban quan hệ” giữa phân tích là phân tích cá nhân từng nhân hay cả tổ chức các doanh cấp độ hành chính là “sự viên – tùy theo nghiệp chứ chính kiện biểu từng đề tài không phải tình” bản thân DN 2. Nhân tố, biến số, thước đo - Nhân tố: o Là một khái niệm mang tính lý thuyết, thể hiện đặc tính của sự vật hiện tượng nào đó o Ví dụ: Nghiên cứu sự phát triển kinh tế xã hội của tỉnh: Tỉnh: là sự vật hiện tượng; đối tượng nghiên cứu là sự phát triển KT- XH của tỉnh - Biến số: o Là những biểu hiện cụ thể của nhân tố. Biến số cũng thể hiện đặc điểm của sự vật, hiện tượng, song theo từng khía cạnh cụ thể o Gồm các loại: Biến phụ thuộc: Là biến số thể hiện nhân tố mục tiêu. Đây là biến số mà sự thay đổi của nó có thể được giải thích theo sự thay đổi của các biến số khác (biến độc lập) Biến độc lập: Là biến số mà sự thay đổi của nó có thể dụng để dự đoán hoặc giải thích sự thay đổi của biến phụ thuộc Biến điều tiết (moderator): Được biết đến là moderating variable, control variable Là những biến ảnh hưởng đến độ mạnh yếu của mối quan hệ biến độc lập và biến phụ thuộc Biến trung gian (mediator): Được biết đến là mediating variable, intermidiary variable Là biến được giải thích bởi cả các biến độc lập (independent variable) đồng thời giải thích các biến phụ thuộc (dependent variable) Là hệ quả của biến độc lập và là nguyên nhân dẫn đến biến phụ thuộc. Khi loại bỏ biến trung gian thì mối quan hệ giữa biến phụ thuộc và độc lập cũng sẽ biến mất o Ví dụ: Nghiên cứu ảnh hưởng của lao động và vốn đến tăng trưởng kinh tế của Việt Nam giai đoạn 2021-2022 Biến phụ thuộc: tăng trưởng kinh tế Biến độc lập: lao động + vốn o Biến số có 2 đặc điểm quan trọng: Biến số phải thay đổi, nói cách khác nó phải có nhiều hơn một giá trị giữa các thực thể khác nhau hoặc đối với cùng một thực thể nhưng qua các thời điểm khác nhau Những giá trị khác nhau đó của biến số phải có thể quan sát hoặc đo lường được - Thang đo: o Thang đo là biểu hiện quan sát và đo lượng được của biến số. Có hai yêu cầu quan trọng đối với thang đo: Thang đo phải thể hiện sát nhất với bản chất của biến số (validity) Thang đo phải có độ tin cậy chấp nhận được (reliability) 3. Giả thuyết, giả thiết - Giả thuyết (hypothesis): Là luận điểm khoa học ban đầu cần được cứng minh hoặc kiểm định o Luận điểm Là những nhận định về quy luật khách quan và cụ thể là về mối quan hệ giữa các nhân tố Giả thuyết có thể gọi là câu trả lời sơ bộ cho câu hỏi nghiên cứu (nếu câu hỏi nghiên cứu được trình bày cụ thể) o Khoa học Những luận điểm hay nhận định này được rút ra trên cơ sở khoa học. Thông thường, cơ sở khoa học chính là các trường phái lý thuyết, kết quả các nghiên cứu trước, hoặc kết quả nghiên cứu định tính Những nhận định chỉ đơn giản dựa vào suy đoán chủ quan hoặc kinh nghiệm cá nhân không được coi là giả thuyết trong nghiên cứu khoa học o Cần được chứng minh hoặc kiểm định Vì giả thuyết mới chỉ là luận điểm ban đầu hay câu trả lời sơ bộ Luận điểm hay câu trả lời này cần được kiểm định trên cơ sở dữ liệu khách quan. Vì vậy, giả thuyết cần được trình bày dưới dạng có thể kiểm chứng được
4. Một số công cụ phân tích thông dụng
4.1. Phân tích mô tả và khám phá a. Thống kê mô tả (Descriptive analysis) Thống kê mô tả cung cấp các chỉ số cơ bản của biến số với dữ liệu của mẫu nghiên cứu. Hầu hết các nghiên cứu định lượng đều cần cung cấp các chỉ số thống kê mô tả để giúp người đọc hiểu về dữ liệu sử dụng. Các chỉ số và cách trình bày có thể khác nhau với biến định lượng và biến định danh. - Đối với các biến có giá trị liên tục (biến định lượng) (ví dụ: tuổi), các nhà nghiên cứu thường cung cấp các các chỉ số trung bình (mean), cao nhất (max), thấp nhất (min) và độ lệch chuẩn (standard deviation) của biến. Trong một số tường hợp, giá trị trung bình (median) cũng được quan tâm. - Đối với các biến định danh (ví dụ: giới tính), các chỉ số cơ bản là tần suất, tỷ lệ % trong tổng số, giá trị trung vị, giá trị yếu vị (mode) - Bảng tần số (frequency) cung cấp cho chúng ta các thống kê về số lần xuất hiện giá trị, tỷ lệ cơ cấu % của giá trị - Các hệ số cơ bản: o Mean: giá trị trung bình o Std. Deviation: độ lệch chuẩn o Minimum: giá trị nhỏ nhất o Maximum: giá trị lớn nhất - Phân tích chéo (cross analysis)
b. Ma trận hệ số tương quan (correclation matrix)
- Các biến số có thể có tương quan với nhau - Ma trận hệ số tương quan là một công cụ ban đầu giúp tác giả và người đọc quan sát về mối tương quan giữa từng cặp biến số - Công đoạn này cũng giúp các tác giả nhận biết các hiện tượng bất thường (thường là những gặp có tương quan quá lớn) hoặc đề phòng trường hợp đa cộng tuyến (multi- conllinerity) khi các biến độc lập có tương quan lớn (chặt) với nhau
c. Phân tích nhân tố khám phá (Exploratory factor analysis – EFA)
- Phân tích nhân tố khám phá là một phương pháp phân tích thống kê dùng để rút gọn một tập gồm nhiều biến quan sát có liên hệ với nhau thành một tập biến (gọi là các nhân tố) ít hơn để chúng có ý nghĩa hơn nhưng vẫn chứa đựng hầu hết nội dung thông tin của tập biến ban đầu (Hair & cộng sự, 1998) - Phân tích nhân tố khám phá thường được sử dụng nhiều nhất trong nghiên cứu khảo sát khi mà tác giả phải dùng nhiều câu hỏi để thu thập thông tin về một vấn đề trừu tượng hơn, đặc biệt là những thông tin về tâm lý, thái độ, thậm chí hành vi. Kể cả khi chúng ta sử dụng thước đo đã được các tác giả trước phát triển và kiểm định thì cũng vẫn nên thực hiện kỹ thuật này xem liệu các mệnh đề / câu hỏi có “nhóm” đúng theo thước đo ban đầu hay không. Kết quả phân tích nhân tố là cơ sở để tạo biến số cho các phân tích tiếp theo. - Tiêu chí phân tích trong EFA: o Hệ số KMO: xem xét sự thích hợp của phân tích nhân tố. Trị số KMO phải đạt giá trị 0.5 trở lên (0.5 <= KMO <= 1) là điều kiện đủ để phân tích nhân tố o Kiểm định Bartlett: xem xét các biến quan sát có tương quan với nhau hay không (sig Bartlett’s Test < 0.5) o Trị số Eigenvalue: xác định số lượng nhân tố trong phân tích EFA. Nhân tố nào có Eigenvalue >= 1 mới được giữ lại o Tổng phương sai trích >= 50% o Hệ số tải nhân tố: biểu thị mối quan hệ giữa biến quan sát và nhân tố
d. Phân tích độ tin cậy của thước đo (reliability analysis)
- Phân độ tin cậy cho phép chúng ta xác định thuộc tính của thước đo mà chủ yếu là liệu các mệnh đề / câu hỏi của thước đo có “thống nhất” với nhau hay không. Thông thường các tác giả sử dụng chỉ số Cronbach’s alpha để xem xét độ tin cậy của thước đo. Chỉ số Cronbach’s alpha nên từ 0.7 trở lên, song giá trị tối thiểu để thước đo có thể sử dụng được là 0.63 (DeVellis, 1990)
4.2. So sánh nhóm
- Một dạng nghiên cứu định lượng khá thông dụng là so sánh sự khác biệt giữa các nhóm về một hoặc một số chỉ số nào đó. Dưới đây là liệt kê các công cụ chính và trường hợp có thể sự dụng - Một số công cụ chính: o T-test 1 mẫu: so sánh giá trị trung bình của mẫu với giá trị cho trước (kiểm định với một mẫu) o T-test mẫu độc lập: kỹ thuật này được sử dụng khi so sánh giá trị trung bình của 2 mẫu độc lập ở đó các thành viên của mẫu được lựa chọn ngẫu nhiên o T-test mẫu cặp đôi: so sánh giá trị trung bình của 2 mẫu, trong đó mỗi thành viên của mẫu thứ nhất được cặp đôi với thành viên của mẫu thứ hai theo tiêu chí nhất định
4.3. Hồi quy
- Hồi quy là kỹ thuật phân tích mối quan hệ giữa một hoặc một số biến độc lập với biến phụ thuộc, trong đó, biến phụ thuộc là biến liên tục
4.4. Hàm logistics
- Thực chất cũng là hồi quy song biến phụ thuộc là biến định danh - Hàm logistics cho biết mối quan hệ của từng biến độc lập tới xác suất xảy ra một trong các giá trị của biến phụ thuộc - Dạng đơn giản nhất của biến phụ thuộc là có 2 lựa chọn (ví dụ: có hoặc không xảy ra đình công)