Sử dụng phần mềm SPSS (Statistical package for social sciences) để thống kê tần suất trong phân tích dữ liệu khoa học

Trong hoạt động kinh doanh, việc hiểu được các khía cạnh người tiêu dùng mong muốn là điều hết sức cần thiết. Nếu nắm được nhu cầu của người tiêu dùng và làm thỏa mãn được nhu cầu đó, các nhà cung cấp sẽ bán được lượng hàng tối ưu và tối đa được lợi nhuận. Để biết được thông tin về người tiêu dùng, các nhà sản xuất phải tiến hành khảo sát (survey) thị trường bằng các phiếu thu thập thông tin (questionnaire). Sau đó, phải thống kê phân nhóm câu trả lời để có những phân tích nhất định cung cấp thông tin cho nhà quản lý ra quyết định. Việc thống kê các câu trả lời nếu không có sự hỗ trợ của phần mềm ứng dụng sẽ tốn rất nhiều thời gian và độ chính xác không cao. Trong bài viết này, tôi xin giới thiệu với quý thầy cô, đồng nghiệp và các em sinh viên những thao tác cơ bản để sử dụng phần mềm SPSS trong phân tích dữ liệu khoa học.

                                                                     

Ngày nay, hoạt động giáo dục và đào tạo cũng có những đặc điểm tương tự như hoạt động kinh doanh. Các Nhà trường muốn thu hút được đông đảo học sinh, sinh viên cẩn phải liên tục đổi mới chương trình đào tạo cho phù hợp với nhu cầu của người học và người sử dụng lao động. Để có thông tin về sự phù hợp của chương trình đào tạo cần phải tiến hành khảo sát bằng phiếu thu thập thông tin. Phiếu có thể được thiết kế minh họa như sau:

PHIẾU KHẢO SÁT SỰ HỢP LÝ VỀ CHƯƠNG TRÌNH

ĐÀO TẠO NGÀNH KẾ TOÁN

( Anh hoặc chị hãy đánh giá khách quan các nội dung dưới đây bằng cách điền số từ 1 đến 5 vào ô vuông phía bên phải của bảng câu hỏi)

 

1. Rất không hợp lý           

2. Không hợp lý       

3. Tương đối hợp lý          

4. Hợp lý   

5. Rất hợp lý

 

TT

CHƯƠNG TRÌNH ĐÀO TẠO

1

2

3

4

5

1

Nội dung chương trình đào tạo ngành kế toán

 

 

 

 

 

2

Thời lượng và phân bổ thời lượng giữa lý thuyết và thực hành

 

 

 

 

 

3

Sự phù hợp nội dung đề thi và nội dung giảng dạy

 

 

 

 

 

4

Thời gian tổ chức kỳ thi, cách sắp xếp thứ tự các môn thi

 

 

 

 

 

 







Việc thiết kế phiếu cần phải tham khảo ý kiến chuyên gia để đảm bảo câu hỏi dễ hiểu và thu nhập được đúng thông tin mong muốn. Sau khi phiếu thiết kế xong sẽ được phát cho sinh viên để thu thập thông tin. Do sự giới hạn về thời gian và kinh phí nên thông thường việc khảo sát được tiến hành trên mẫu (sample) bởi rất khó có thể thực hiện trên tổng thể (population). Vậy câu hỏi đặt ra là lấy mẫu bao nhiêu sinh viên trên tổng thể là phù hợp? Thông thường việc xác định kích cỡ mẫu sẽ tính toán theo công thức Slovin's:

 

n

=

N

1+Ne2

Trong đó

n: Kích cỡ mẫu

N: Kích cỡ tổng thể;

e : Sai số chuẩn của chọn mẫu (giao động cho phép từ 0.01 đến 0.05)

Ví dụ: Sinh viên ngành kế toán của trường CĐ Kinh tế - Tài chính Thái Nguyên là 2.000 với sai số chọn mẫu là 0.05 thì kích cỡ mẫu sẽ được tính như sau:

n

=

2.000

=

334 (sinh viên)

1+2.000*0.052

Sau khi phát phiếu cho sinh viên để thu thập thông tin (thông thường phải phát  số lượng lớn hơn 334 phiếu để khi thu về lọc được 334 phiếu hợp lệ). Người xử lý số liệu bắt đầu đánh mã phiếu từ 1 đến 334 và tiến hành nhập dữ liệu vào phần mềm SPSS.  Trước tiên phải khai báo các biến chứa thông tin (variable). Tại Tab Variable View tiến hành khai báo các thuộc tính về biến như hình 1:


         







- Name: Tên biến gồm tối đa 8 ký tự không chứa ký tự đặc biệt

- Type: Kiểu dữ liệu

- Width: Độ rộng cột

- Decimals: số thập phân

- Nhãn của biến (thường là nội dung câu hỏi)

- Giá trị mã hóa của biến (1. Rất không hợp lý ……..  5. Rất hợp lý)

- Missing: Ký hiệu câu trả lời bị lỗi ( người trả lời không điền câu trả lời)

- Columns: Thiết lập độ rộng của cột mang tên biến

- Measure: Thang đo ( Biểu danh, thứ tự, khoảng cách và tỷ lệ)

Sau khi khai báo biến, các thuộc tính của biến có thể được trình bầy như  hình 2:



Chuyển sang Tab Data View để nhập dữ liệu đã được mã hóa [từ (1) Rất không hợp lý đến (5) Rất hợp lý]  cho 334 phiếu điều tra, mỗi phiếu trên một dòng dữ liệu như hình 3


Khi công việc nhập số liệu đã hoàn thành, việc xác định tần suất của một biến trở nên rất đơn giản. Người sử dụng vào menu Analyze/Descriptive Statistics/123 Frequencies…hình 4.

 

Khi đó sẽ xuất hiện một hộp hội thoại cho phép lựa chọn một biến hoặc nhiều biến để thống kê tần suất như hình 5.

 

Sau đó ấn OK để thực hiện lệnh và được kết quả như phía dưới đây:

Noi_dung_chuong_trinh_dao_tao

 

Frequency

Percent

Valid Percent

Cumulative Percent

Rat_khong_hop_ly

13

3.9

3.9

3.9

Khong_hop_ly

81

24.3

24.3

28.1

Tuong_doi_hop_ly

228

68.2

68.2

96.4

Hop_ly

8

2.4

2.4

98.8

Rat_hop_ly

4

1.2

1.2

100.0

Total

334

100.0

100.0

 

Qua bảng tổng hợp này, chúng ta thấy rằng có 13 sinh viên (3.9%) trả lời nội dung chương trình đào tạo là rất không hợp lý; 81 sinh viên (24.3%) cho rằng không hợp lý; 228 sinh viên (68.2%) đánh giá tương đối hợp lý; 8 sinh viên (2.4%) trả lời là hợp lý và 4 sinh viên (1.2%) cho rằng rất hợp lý; tổng số người trả lời là 334. Thông tin này sẽ rất hữu ích cho những người ra quyết định và nó đảm bảo được tính chính xác, kịp thời.

Như vậy, người sử dụng dễ dàng xác định tần suất của từng biến nghiên cứu mà không phải dùng các lệnh phức tạp trong excel để đếm các giá trị quan sát. Đây chính là một trong những ưu điểm của phần mềm SPSS trong phân tích dữ liệu khoa học.

Trong khuôn khổ bài viết này, tôi chỉ xin giới thiệu một chức năng thông dụng của phần  mền SPSS khi xử lý số liệu thông kê. Nếu bài viết này có phản hồi tốt, ở những số tiếp theo tôi sẽ tiếp tục giới thiệu các chức năng khác của phần mềm mà tôi tin chắc sẽ rất hữu ích cho các thầy cô đang chuẩn bị làm đề tài tốt nghiệp thạc sĩ, tiến sĩ hoặc những sinh viên yêu mến khoa học thống kê. Mọi thông tin phản hồi, trao đổi vui lòng gửi vào hòm thư ngoctcef@gmail.com.

                                             TS. Phạm Anh Ngọc

                                           Phó trưởng phòng Quản lý đào tạo