1. Một nhà nghiên cứu quan sát thấy rằng những người tập thể dục thường xuyên có chỉ số huyết áp thấp hơn. Đây là ví dụ về loại mối quan hệ nào?
A. Tương quan âm (Negative Correlation)
B. Tương quan dương (Positive Correlation)
C. Không có tương quan (No Correlation)
D. Nhân quả trực tiếp (Direct Causation)
2. Khi phân tích dữ liệu, ‘hiện tượng ngoại lai’ (outlier) là gì?
A. Một giá trị dữ liệu rất phổ biến.
B. Một giá trị dữ liệu nằm xa phần lớn các giá trị khác.
C. Giá trị trung bình của tập dữ liệu.
D. Sự biến động của dữ liệu.
3. Trong kiểm định giả thuyết, ‘sai lầm loại II’ xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi H0 đúng.
B. Không bác bỏ giả thuyết H0 khi H0 sai.
C. Bác bỏ giả thuyết H0 khi H0 sai.
D. Không bác bỏ giả thuyết H0 khi H0 đúng.
4. Phân tích tương quan Pearson (Pearson correlation) đo lường điều gì giữa hai biến số định lượng?
A. Mối quan hệ nhân quả giữa hai biến.
B. Mức độ tuyến tính và chiều hướng của mối quan hệ.
C. Sự khác biệt về giá trị trung bình giữa hai nhóm.
D. Tần suất xuất hiện của các giá trị trong một biến.
5. Hệ số tương quan Spearman (Spearman correlation) được sử dụng khi nào?
A. Khi mối quan hệ giữa hai biến là tuyến tính.
B. Khi dữ liệu có phân phối chuẩn.
C. Khi muốn đo lường mối quan hệ đơn điệu (monotonically) hoặc khi dữ liệu không tuân theo phân phối chuẩn.
D. Khi biến số là định danh (nominal).
6. Trong hồi quy tuyến tính đơn giản (simple linear regression), hệ số góc (slope coefficient) của biến độc lập (X) cho biết điều gì?
A. Giá trị trung bình của biến phụ thuộc (Y).
B. Giá trị ước tính của biến phụ thuộc (Y) khi biến độc lập (X) bằng 0.
C. Mức độ thay đổi ước tính của biến phụ thuộc (Y) khi biến độc lập (X) thay đổi một đơn vị.
D. Mối quan hệ nhân quả giữa X và Y.
7. Trong thống kê mô tả, ‘khoảng tứ phân vị’ (Interquartile Range – IQR) được tính như thế nào?
A. Q3 – Q1
B. Q2 – Q1
C. Q3 – Q2
D. Q4 – Q1
8. Một nhà nghiên cứu muốn ước tính chiều cao trung bình của nam giới trưởng thành tại Việt Nam. Nếu họ chọn một mẫu ngẫu nhiên và tính toán khoảng tin cậy 95% cho chiều cao trung bình là [165 cm, 170 cm], điều này có nghĩa là gì?
A. 95% nam giới trưởng thành tại Việt Nam có chiều cao từ 165 cm đến 170 cm.
B. Có 95% khả năng chiều cao trung bình của tất cả nam giới trưởng thành tại Việt Nam nằm trong khoảng từ 165 cm đến 170 cm.
C. Nếu lặp lại quá trình lấy mẫu và tính toán khoảng tin cậy nhiều lần, 95% các khoảng tin cậy đó sẽ chứa giá trị trung bình thực của tổng thể.
D. Chiều cao trung bình của mẫu được chọn là 167.5 cm.
9. Một nhà nghiên cứu muốn khảo sát ý kiến của sinh viên về chất lượng bữa ăn tại căng tin trường đại học. Phương pháp nào sau đây là phù hợp nhất để đảm bảo tính đại diện cho toàn bộ sinh viên của trường?
A. Chọn ngẫu nhiên 100 sinh viên từ danh sách tất cả các khoa.
B. Chỉ khảo sát các sinh viên ăn trưa tại căng tin vào thứ Hai.
C. Phát phiếu khảo sát cho tất cả sinh viên đang có mặt tại thư viện.
D. Chọn 50 sinh viên từ mỗi khoa theo phương pháp chọn mẫu ngẫu nhiên đơn giản.
10. Trong một phân tích hồi quy, nếu ‘hệ số xác định’ (coefficient of determination, R-squared) là 0.85, điều này có nghĩa là gì?
A. 85% biến độc lập giải thích được sự biến thiên của biến phụ thuộc.
B. 85% biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
C. Có 85% khả năng các biến độc lập có mối quan hệ với biến phụ thuộc.
D. Sai số của mô hình là 15%.
11. Khi đường cong phân phối tần suất có dạng lệch trái (lệch về bên trái), điều này thường ngụ ý mối quan hệ nào giữa các đại lượng đo lường xu hướng trung tâm?
A. Trung bình > Trung vị > Mốt
B. Trung bình < Trung vị < Mốt
C. Trung bình = Trung vị = Mốt
D. Trung vị > Trung bình > Mốt
12. Một công ty dược phẩm muốn kiểm tra hiệu quả của một loại thuốc mới trong việc giảm huyết áp. Họ chọn ngẫu nhiên 100 bệnh nhân và chia thành hai nhóm: nhóm dùng thuốc và nhóm dùng giả dược (placebo). Phương pháp thống kê suy luận nào phù hợp để so sánh huyết áp trung bình giữa hai nhóm?
A. Kiểm định t-test cho hai mẫu độc lập (Independent samples t-test).
B. Kiểm định Chi-square (Chi-square test).
C. Phân tích hồi quy tuyến tính đơn giản.
D. Kiểm định Wilcoxon rank-sum test.
13. Trong kiểm định giả thuyết, ‘sai lầm loại I’ xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi H0 đúng.
B. Không bác bỏ giả thuyết H0 khi H0 sai.
C. Bác bỏ giả thuyết H0 khi H0 sai.
D. Không bác bỏ giả thuyết H0 khi H0 đúng.
14. Khi một nhà thống kê nói rằng họ đang thực hiện ‘lấy mẫu ngẫu nhiên đơn giản’ (simple random sampling), điều đó có nghĩa là gì?
A. Mỗi phần tử trong tổng thể có cơ hội được chọn như nhau.
B. Chỉ những phần tử dễ tiếp cận mới có cơ hội được chọn.
C. Các phần tử được chọn theo một quy luật nhất định.
D. Người chọn mẫu có quyền lựa chọn phần tử nào sẽ được đưa vào mẫu.
15. Loại biểu đồ nào thường được sử dụng để hiển thị sự phân bố tần suất của một biến định lượng liên tục?
A. Biểu đồ cột (Bar Chart)
B. Biểu đồ tròn (Pie Chart)
C. Biểu đồ tần suất (Histogram)
D. Biểu đồ phân tán (Scatter Plot)
16. Trong lý thuyết lấy mẫu, ‘sai số lấy mẫu’ (sampling error) là gì?
A. Lỗi do người thu thập dữ liệu mắc phải.
B. Sự khác biệt giữa kết quả thống kê của mẫu và kết quả thống kê của tổng thể.
C. Sai sót trong việc chọn mẫu, dẫn đến mẫu không đại diện.
D. Lỗi do sử dụng công thức tính toán sai.
17. Trong thống kê mô tả, đại lượng nào đo lường mức độ phân tán của dữ liệu quanh giá trị trung bình?
A. Trung vị (Median)
B. Mốt (Mode)
C. Độ lệch chuẩn (Standard Deviation)
D. Trung bình cộng (Mean)
18. Trong bảng tần suất, ‘tần suất tích lũy’ (cumulative frequency) của một lớp được định nghĩa là gì?
A. Số lượng quan sát trong lớp đó.
B. Tổng số quan sát trong lớp đó và tất cả các lớp trước đó.
C. Tỷ lệ phần trăm của các quan sát trong lớp đó.
D. Tần suất của lớp ngay trước đó.
19. Một nhà nghiên cứu muốn so sánh hiệu quả của ba phương pháp giảng dạy khác nhau đối với kết quả học tập của sinh viên. Phương pháp thống kê nào phù hợp nhất để thực hiện điều này?
A. Phân tích hồi quy đa biến (Multiple Regression Analysis).
B. Kiểm định Chi-square.
C. Phân tích phương sai (ANOVA).
D. Kiểm định t-test cho hai mẫu độc lập.
20. Một nhà khoa học thực hiện một thí nghiệm và thu được một giá trị p (p-value) là 0.03. Nếu mức ý nghĩa (alpha) được đặt là 0.05, kết luận nào sau đây là hợp lý?
A. Không đủ bằng chứng để bác bỏ giả thuyết H0.
B. Bác bỏ giả thuyết H0, kết quả có ý nghĩa thống kê.
C. Chấp nhận giả thuyết H0.
D. Cần tăng cỡ mẫu để có kết quả ý nghĩa.
21. Một nhà thống kê đang phân tích dữ liệu về mối quan hệ giữa số giờ học mỗi tuần và điểm thi cuối kỳ của sinh viên. Họ phát hiện ra hệ số tương quan Pearson là 0.75. Điều này cho thấy điều gì?
A. Sinh viên học ít giờ hơn có điểm thi cao hơn.
B. Có mối quan hệ tuyến tính mạnh mẽ và dương giữa số giờ học và điểm thi.
C. Số giờ học không ảnh hưởng đến điểm thi.
D. Mối quan hệ này là ngẫu nhiên và không có ý nghĩa.
22. Khi nào chúng ta nên ưu tiên sử dụng trung vị (median) thay vì trung bình cộng (mean) làm thước đo xu hướng trung tâm?
A. Khi dữ liệu có phân phối chuẩn.
B. Khi dữ liệu có ít giá trị ngoại lai.
C. Khi dữ liệu bị lệch hoặc có giá trị ngoại lai.
D. Khi muốn đo lường mức độ phân tán của dữ liệu.
23. Khi thực hiện phân tích ANOVA một yếu tố (One-way ANOVA), mục đích chính là để so sánh điều gì?
A. Mối quan hệ giữa hai biến định lượng.
B. Sự khác biệt giữa các giá trị trung bình của ba nhóm trở lên.
C. Tần suất xuất hiện của các danh mục trong một biến định tính.
D. Sự phân tán của dữ liệu trong một nhóm duy nhất.
24. Một nhà marketing muốn biết liệu chiến dịch quảng cáo mới có làm tăng doanh số bán hàng hay không. Giả thuyết vô hiệu (H0) trong trường hợp này nên được phát biểu như thế nào?
A. Chiến dịch quảng cáo mới làm tăng doanh số bán hàng.
B. Không có sự khác biệt về doanh số bán hàng giữa trước và sau chiến dịch quảng cáo.
C. Doanh số bán hàng sau chiến dịch cao hơn doanh số bán hàng trước chiến dịch.
D. Chiến dịch quảng cáo mới không ảnh hưởng đến doanh số bán hàng.
25. Một nhà kinh tế sử dụng dữ liệu GDP hàng năm của một quốc gia từ năm 1990 đến 2020 để phân tích xu hướng tăng trưởng. Phương pháp thống kê mô tả nào là quan trọng nhất để xác định xu hướng dài hạn này?
A. Tính toán độ lệch chuẩn của GDP hàng năm.
B. Vẽ biểu đồ chuỗi thời gian (time series plot) của GDP.
C. Xác định mốt của các giá trị GDP.
D. Tính toán trung vị của GDP.
26. Một nhà nghiên cứu muốn kiểm tra xem liệu có sự khác biệt có ý nghĩa thống kê về chiều cao trung bình giữa nam và nữ sinh viên trong một trường đại học hay không. Phương pháp thống kê nào phù hợp nhất để phân tích dữ liệu này?
A. Phân tích hồi quy (Regression Analysis)
B. Kiểm định t-test độc lập (Independent Samples t-test)
C. Phân tích phương sai (ANOVA)
D. Kiểm định Chi-squared (Chi-squared test)
27. Một nhà nghiên cứu sử dụng phân tích hồi quy để dự đoán điểm số của sinh viên dựa trên số giờ học. Nếu hệ số hồi quy cho ‘số giờ học’ là 2.5, điều này có nghĩa là gì?
A. Mỗi giờ học thêm làm tăng điểm số trung bình lên 2.5 điểm.
B. Mỗi giờ học thêm làm giảm điểm số trung bình đi 2.5 điểm.
C. Điểm số trung bình là 2.5.
D. Không có mối quan hệ giữa số giờ học và điểm số.
28. Giả sử bạn có một tập dữ liệu về thu nhập của các hộ gia đình và bạn nhận thấy rằng phân phối thu nhập bị lệch phải (right-skewed). Điều này có nghĩa là gì?
A. Hầu hết các hộ gia đình có thu nhập thấp.
B. Hầu hết các hộ gia đình có thu nhập trung bình.
C. Có một số ít hộ gia đình có thu nhập rất cao, kéo dài đuôi của phân phối về phía bên phải.
D. Phân phối thu nhập là đối xứng hoàn hảo.
29. Khi nào cần sử dụng kiểm định Chi-squared cho mối quan hệ giữa hai biến định tính?
A. Khi cả hai biến là định lượng.
B. Khi một biến định lượng và một biến định tính.
C. Khi cả hai biến là định tính (phân loại).
D. Khi cần ước lượng mối quan hệ tuyến tính.
30. Khi ước lượng một tham số quần thể, việc tăng kích thước mẫu (n) sẽ ảnh hưởng như thế nào đến khoảng tin cậy?
A. Khoảng tin cậy sẽ rộng hơn.
B. Khoảng tin cậy sẽ hẹp hơn.
C. Khoảng tin cậy không thay đổi.
D. Khoảng tin cậy sẽ trở nên kém tin cậy hơn.
31. Trong biểu đồ phân tán (Scatter Plot), điểm dữ liệu nằm càng xa đường xu hướng (trendline) thì điều gì xảy ra?
A. Mối quan hệ giữa hai biến càng mạnh.
B. Mối quan hệ giữa hai biến càng yếu hoặc càng không có tương quan.
C. Biến độc lập có ảnh hưởng lớn hơn đến biến phụ thuộc.
D. Phân phối của dữ liệu càng đối xứng.
32. Một nhà tiếp thị muốn ước tính khoảng tin cậy 95% cho doanh thu quảng cáo trung bình hàng tháng. Điều này có nghĩa là gì?
A. 95% các hộ gia đình có doanh thu quảng cáo nằm trong khoảng này.
B. Nếu chúng ta lặp lại quy trình lấy mẫu nhiều lần, 95% các khoảng tin cậy được tạo ra sẽ chứa doanh thu quảng cáo thực tế của quần thể.
C. Chỉ có 5% khả năng doanh thu quảng cáo thực tế nằm ngoài khoảng này.
D. Doanh thu quảng cáo trung bình của mẫu chắc chắn nằm trong khoảng này.
33. Khi phân tích dữ liệu về sự hài lòng của khách hàng (thang đo Likert: Rất không hài lòng, Không hài lòng, Bình thường, Hài lòng, Rất hài lòng), phương pháp thống kê nào thường được sử dụng để so sánh sự hài lòng giữa hai nhóm khách hàng khác nhau?
A. Kiểm định t-test độc lập
B. Kiểm định Chi-squared
C. Phân tích hồi quy tuyến tính
D. Kiểm định Mann-Whitney U
34. Độ lệch chuẩn (Standard Deviation) là thước đo gì trong thống kê?
A. Tỷ lệ phần trăm các quan sát nằm trong một khoảng xác định.
B. Mức độ phân tán hoặc trải rộng của dữ liệu so với giá trị trung bình.
C. Giá trị xuất hiện thường xuyên nhất trong tập dữ liệu.
D. Khoảng cách giữa giá trị lớn nhất và nhỏ nhất trong tập dữ liệu.
35. Trong thống kê mô tả, tứ phân vị (Quartiles) được sử dụng để làm gì?
A. Đo lường xu hướng trung tâm của dữ liệu.
B. Xác định giá trị xuất hiện nhiều nhất.
C. Chia tập dữ liệu đã sắp xếp thành bốn phần bằng nhau để hiểu sự phân bố.
D. Đo lường sự biến động của dữ liệu.
36. Độ tin cậy (Confidence Level) trong khoảng tin cậy đề cập đến điều gì?
A. Xác suất một giá trị ngoại lai nằm trong khoảng.
B. Tỷ lệ các mẫu mà khoảng tin cậy sẽ chứa tham số quần thể thực.
C. Độ chính xác của phép đo.
D. Kích thước của mẫu.
37. Khi nào chúng ta sử dụng phân phối Poisson?
A. Để mô tả số lần xảy ra một sự kiện trong một khoảng thời gian hoặc không gian cố định, khi các sự kiện xảy ra độc lập với nhau và với một tỷ lệ trung bình không đổi.
B. Để mô tả số lần thành công trong một số lần thử Bernoulli cố định.
C. Để mô tả sự phân bố của dữ liệu liên tục có hình chuông.
D. Để mô tả số lần xảy ra một sự kiện khi xác suất xảy ra là rất nhỏ.
38. Một nhà khoa học thực hiện một thí nghiệm và thu được một tập dữ liệu. Họ muốn xác định xem kết quả thí nghiệm có thể được khái quát hóa cho toàn bộ quần thể hay không. Đây là mục tiêu của loại thống kê nào?
A. Thống kê mô tả (Descriptive Statistics)
B. Thống kê suy luận (Inferential Statistics)
C. Thống kê ứng dụng (Applied Statistics)
D. Thống kê toán học (Mathematical Statistics)
39. Một nhà nghiên cứu quan sát thấy rằng khi nhiệt độ tăng lên, số lượng kem bán ra cũng tăng theo. Mối quan hệ này có thể được mô tả tốt nhất bằng loại tương quan nào?
A. Tương quan nghịch biến (Negative Correlation)
B. Tương quan đồng biến (Positive Correlation)
C. Không có tương quan (No Correlation)
D. Tương quan phi tuyến (Non-linear Correlation)
40. Một nhà kinh tế muốn kiểm tra mối quan hệ giữa chi tiêu quảng cáo và doanh số bán hàng. Ông ấy thu thập dữ liệu và thực hiện phân tích hồi quy tuyến tính bội. Biến nào sau đây có thể được coi là biến phụ thuộc?
A. Chi tiêu quảng cáo.
B. Giá sản phẩm.
C. Doanh số bán hàng.
D. Thu nhập khả dụng.
41. Khi nào một nhà thống kê nên sử dụng trung vị (Median) thay vì trung bình cộng (Mean) để mô tả xu hướng trung tâm của dữ liệu?
A. Khi dữ liệu có phân phối chuẩn.
B. Khi dữ liệu có phân phối đối xứng.
C. Khi dữ liệu có các giá trị ngoại lai đáng kể.
D. Khi tập dữ liệu rất lớn.
42. Trong kiểm định giả thuyết, mức ý nghĩa (Alpha, α) đại diện cho điều gì?
A. Xác suất thu được kết quả quan sát được nếu giả thuyết không là đúng.
B. Xác suất bác bỏ giả thuyết không khi nó thực sự đúng (Lỗi Loại I).
C. Xác suất chấp nhận giả thuyết không khi nó thực sự sai (Lỗi Loại II).
D. Xác suất của giả thuyết không là đúng.
43. Trong thống kê suy luận, sai số chuẩn (Standard Error) của trung bình mẫu đo lường điều gì?
A. Độ lệch của dữ liệu trong mẫu so với trung bình mẫu.
B. Độ lệch của trung bình mẫu so với trung bình quần thể.
C. Khoảng cách giữa giá trị lớn nhất và nhỏ nhất trong mẫu.
D. Xác suất thu được giá trị trung bình mẫu nhất định.
44. Trong phân tích hồi quy tuyến tính đơn, hệ số hồi quy (regression coefficient) cho biết điều gì?
A. Giá trị trung bình của biến phụ thuộc.
B. Sự thay đổi trung bình của biến phụ thuộc khi biến độc lập thay đổi một đơn vị.
C. Mức độ mạnh yếu của mối quan hệ tuyến tính.
D. Sai số chuẩn của ước lượng.
45. Một nhà nghiên cứu muốn so sánh trung bình của ba nhóm độc lập trở lên. Phương pháp thống kê nào là phù hợp nhất?
A. Kiểm định t-test độc lập
B. Kiểm định Chi-squared
C. Phân tích phương sai một yếu tố (One-way ANOVA)
D. Phân tích tương quan Pearson
46. Khi nào một tập dữ liệu được coi là có phân phối chuẩn (Normal Distribution)?
A. Khi dữ liệu có hình dạng đối xứng giống như quả chuông.
B. Khi tất cả các giá trị đều giống nhau.
C. Khi dữ liệu chỉ có hai giá trị có thể xảy ra.
D. Khi dữ liệu có nhiều giá trị ngoại lai.
47. Trong thống kê mô tả, thước đo nào dưới đây được sử dụng để mô tả xu hướng trung tâm của dữ liệu và nhạy cảm với các giá trị ngoại lai?
A. Trung vị (Median)
B. Yếu vị (Mode)
C. Trung bình cộng (Mean)
D. Khoảng biến thiên (Range)
48. Biến nào sau đây là biến định tính (Categorical Variable)?
A. Chiều cao của một người (tính bằng centimet).
B. Nhiệt độ đo được (tính bằng độ Celsius).
C. Màu mắt của một người (ví dụ: xanh, nâu, xám).
D. Số tiền chi tiêu hàng tháng (tính bằng đồng Việt Nam).
49. Trong một nghiên cứu về mối quan hệ giữa số giờ học và điểm thi, nhà nghiên cứu thu thập dữ liệu và tính toán hệ số tương quan Pearson là 0.85. Điều này cho thấy điều gì?
A. Không có mối quan hệ tuyến tính nào giữa số giờ học và điểm thi.
B. Có mối quan hệ tuyến tính nghịch biến mạnh mẽ giữa số giờ học và điểm thi.
C. Có mối quan hệ tuyến tính đồng biến mạnh mẽ giữa số giờ học và điểm thi.
D. Số giờ học là nguyên nhân trực tiếp gây ra điểm thi.
50. Trong kiểm định giả thuyết, giá trị P (P-value) là gì?
A. Xác suất giả thuyết không (null hypothesis) là đúng.
B. Xác suất thu được kết quả quan sát được (hoặc cực đoan hơn) nếu giả thuyết không là đúng.
C. Xác suất giả thuyết đối (alternative hypothesis) là sai.
D. Mức ý nghĩa (significance level) của kiểm định.
51. Một nhà kinh tế muốn dự đoán giá cổ phiếu dựa trên các chỉ số kinh tế vĩ mô. Phương pháp thống kê nào thường được sử dụng cho mục đích dự báo này?
A. Phân tích nhân tố (Factor Analysis)
B. Phân tích cụm (Cluster Analysis)
C. Phân tích hồi quy (Regression Analysis)
D. Kiểm định phi tham số (Non-parametric Tests)
52. Một nhà thống kê đang xem xét phân phối chuẩn. Đặc điểm nào sau đây là SAI về phân phối chuẩn?
A. Phân phối đối xứng quanh giá trị trung bình.
B. Trung bình, trung vị và yếu vị đều trùng nhau.
C. Độ lệch chuẩn có thể nhận bất kỳ giá trị dương nào.
D. Tổng diện tích dưới đường cong phân phối bằng 0.
53. Một nhà nghiên cứu muốn phân loại khách hàng dựa trên hành vi mua sắm của họ. Phương pháp thống kê nào thích hợp nhất cho nhiệm vụ này?
A. Phân tích hồi quy (Regression Analysis)
B. Kiểm định giả thuyết (Hypothesis Testing)
C. Phân tích cụm (Cluster Analysis)
D. Phân tích phương sai (ANOVA)
54. Khi chọn mẫu ngẫu nhiên đơn giản, mỗi phần tử trong tổng thể có đặc điểm nào sau đây?
A. Được chọn với xác suất lớn hơn các phần tử khác.
B. Được chọn với xác suất bằng nhau và độc lập với các phần tử khác.
C. Được chọn dựa trên sự tiện lợi của người thu thập dữ liệu.
D. Được chọn dựa trên đặc điểm có sẵn của chúng.
55. Một nhà nghiên cứu muốn kiểm tra xem có sự khác biệt về tỷ lệ hài lòng của khách hàng giữa ba cửa hàng khác nhau. Phương pháp thống kê nào phù hợp cho dữ liệu định tính (tỷ lệ) này?
A. Kiểm định t độc lập
B. Phân tích phương sai (ANOVA)
C. Kiểm định Chi-bình phương cho bảng tần số độc lập (Chi-squared test for independence)
D. Hồi quy logistic
56. Trong một nghiên cứu về mối quan hệ giữa giờ học và điểm thi, nhà nghiên cứu thu được hệ số tương quan Pearson là 0.85. Điều này cho thấy mối quan hệ giữa hai biến số là gì?
A. Không có mối quan hệ tuyến tính
B. Mối quan hệ tuyến tính nghịch biến mạnh
C. Mối quan hệ tuyến tính đồng biến mạnh
D. Mối quan hệ phi tuyến tính mạnh
57. Trong thống kê, ‘sai số chuẩn của trung bình’ (standard error of the mean) đo lường điều gì?
A. Độ lệch của từng quan sát so với trung bình mẫu.
B. Độ lệch của trung bình mẫu so với trung bình tổng thể.
C. Sự biến thiên của các giá trị trong mẫu.
D. Tỷ lệ sai lầm trong quá trình thu thập dữ liệu.
58. Trong phân tích dữ liệu chuỗi thời gian, yếu tố nào thường được xem xét để hiểu xu hướng dài hạn?
A. Tính thời vụ (Seasonality)
B. Tính chu kỳ (Cyclicality)
C. Xu hướng (Trend)
D. Yếu tố ngẫu nhiên (Randomness)
59. Trong thống kê suy luận, mục tiêu chính là gì?
A. Mô tả đặc điểm của mẫu dữ liệu.
B. Rút ra kết luận về tổng thể dựa trên dữ liệu mẫu.
C. Trực quan hóa dữ liệu bằng biểu đồ.
D. Tính toán các tham số của mẫu.
60. Độ tin cậy (Confidence Level) trong khoảng tin cậy biểu thị điều gì?
A. Xác suất mà tham số tổng thể nằm ngoài khoảng tin cậy.
B. Xác suất mà tham số tổng thể nằm trong khoảng tin cậy.
C. Mức độ sai lệch chuẩn của mẫu.
D. Giá trị p của kiểm định giả thuyết.
61. Một nhà nghiên cứu muốn dự báo số lượng bán hàng của một sản phẩm trong 6 tháng tới dựa trên dữ liệu bán hàng trong 2 năm qua. Phương pháp nào phù hợp nhất cho việc dự báo này?
A. Kiểm định giả thuyết (Hypothesis Testing)
B. Mô hình ARIMA (Autoregressive Integrated Moving Average)
C. Phân tích phương sai (ANOVA)
D. Phân tích tương quan (Correlation Analysis)
62. Khi phân tích dữ liệu về thu nhập của người dân, phát hiện có nhiều giá trị ngoại lai (outliers) làm sai lệch giá trị trung bình. Đại lượng đo lường xu hướng trung tâm nào ít bị ảnh hưởng bởi các giá trị ngoại lai này nhất?
A. Trung bình cộng (Mean)
B. Khoảng biến thiên (Range)
C. Trung vị (Median)
D. Phương sai (Variance)
63. Một nhà nghiên cứu muốn đánh giá hiệu quả của ba chiến dịch quảng cáo khác nhau đối với doanh số bán hàng. Cô ấy có dữ liệu doanh số từ các thời điểm có và không có chiến dịch. Phương pháp thống kê nào có thể giúp phân tích tác động của từng chiến dịch?
A. Kiểm định Chi-bình phương
B. Phân tích hồi quy đa biến (Multiple Regression Analysis)
C. Kiểm định t độc lập
D. Phân tích tương quan
64. Khi nào thì việc sử dụng trung bình cộng là phù hợp nhất để biểu diễn xu hướng trung tâm của dữ liệu?
A. Khi dữ liệu có nhiều giá trị ngoại lai.
B. Khi dữ liệu có phân phối lệch.
C. Khi dữ liệu có phân phối đối xứng và không có giá trị ngoại lai đáng kể.
D. Khi dữ liệu là định tính.
65. Trong phân tích hồi quy, hệ số xác định R-squared cho biết điều gì?
A. Mức độ thay đổi của biến phụ thuộc khi biến độc lập thay đổi một đơn vị.
B. Tỷ lệ phần trăm sự biến thiên của biến phụ thuộc được giải thích bởi mô hình hồi quy.
C. Mức độ chính xác của dự báo từng điểm.
D. Sự hiện diện của các giá trị ngoại lai trong dữ liệu.
66. Khi cỡ mẫu tăng lên, điều gì thường xảy ra với khoảng tin cậy cho trung bình tổng thể (với cùng độ tin cậy)?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy trở nên hẹp hơn.
C. Khoảng tin cậy không thay đổi.
D. Khoảng tin cậy trở nên không xác định.
67. Khi nào thì kiểm định phi tham số là lựa chọn ưu tiên hơn kiểm định tham số?
A. Khi dữ liệu có phân phối chuẩn và phương sai đồng nhất.
B. Khi dữ liệu không đáp ứng các giả định về phân phối của kiểm định tham số.
C. Khi cỡ mẫu lớn hơn 30.
D. Khi muốn ước lượng khoảng tin cậy chính xác.
68. Một nhà khoa học muốn xác định mối quan hệ giữa liều lượng thuốc và mức độ giảm đau. Ông ta thu thập dữ liệu và thấy rằng khi liều lượng thuốc tăng lên, mức độ giảm đau cũng tăng theo một cách tuyến tính. Hệ số tương quan nào thể hiện rõ nhất mối quan hệ này?
A. Hệ số tương quan Spearman (Spearman’s rank correlation coefficient)
B. Hệ số tương quan Pearson (Pearson correlation coefficient)
C. Hệ số tương quan Kendall tau (Kendall’s tau correlation coefficient)
D. Hệ số tương quan nội bộ (Intraclass correlation coefficient)
69. Một nhà khoa học muốn ước lượng khoảng tin cậy cho chiều cao trung bình của một loài cây mới. Ông ta thu thập một mẫu và tính toán trung bình mẫu, sai số chuẩn. Bước tiếp theo trong quá trình này là gì?
A. Tính toán giá trị p (p-value)
B. Xác định giá trị tới hạn (critical value) dựa trên độ tin cậy mong muốn và phân phối phù hợp
C. Thực hiện kiểm định giả thuyết về trung bình
D. Vẽ biểu đồ phân tán (scatter plot)
70. Một nhà nghiên cứu muốn so sánh trung bình của ba nhóm trở lên. Phương pháp thống kê nào sau đây phù hợp nhất?
A. Kiểm định t độc lập (Independent Samples t-test)
B. Phân tích tương quan (Correlation Analysis)
C. Phân tích phương sai một yếu tố (One-way ANOVA)
D. Kiểm định Chi-bình phương (Chi-squared test)
71. Trong thống kê mô tả, đại lượng nào sau đây đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị (Median)
B. Trung bình cộng (Mean)
C. Độ lệch chuẩn (Standard Deviation)
D. Mode (Yếu vị)
72. Khi xây dựng biểu đồ tần suất (histogram), chiều rộng của các khoảng (bins) có thể ảnh hưởng đến hình dạng của biểu đồ như thế nào?
A. Chiều rộng khoảng lớn hơn làm biểu đồ chi tiết hơn.
B. Chiều rộng khoảng nhỏ hơn làm biểu đồ chi tiết hơn.
C. Chiều rộng khoảng không ảnh hưởng đến hình dạng biểu đồ.
D. Chỉ có số lượng khoảng mới ảnh hưởng đến hình dạng.
73. Khi thực hiện kiểm định giả thuyết, nếu giá trị p (p-value) nhỏ hơn mức ý nghĩa (alpha) đã chọn, chúng ta có xu hướng làm gì?
A. Chấp nhận giả thuyết không (null hypothesis)
B. Bác bỏ giả thuyết không (null hypothesis)
C. Tăng mức ý nghĩa alpha
D. Thu thập thêm dữ liệu để xác nhận
74. Trong quy trình kiểm định giả thuyết, sai lầm loại II (Type II error) xảy ra khi nào?
A. Bác bỏ giả thuyết không khi nó đúng.
B. Chấp nhận giả thuyết không khi nó sai.
C. Bác bỏ giả thuyết không khi nó sai.
D. Chấp nhận giả thuyết không khi nó đúng.
75. Một nhà nghiên cứu muốn xác định liệu có sự khác biệt đáng kể về điểm thi giữa hai nhóm sinh viên học theo phương pháp A và phương pháp B. Phương pháp thống kê nào phù hợp nhất để kiểm định giả thuyết này?
A. Phân tích hồi quy tuyến tính (Linear Regression Analysis)
B. Kiểm định t độc lập (Independent Samples t-test)
C. Phân tích phương sai (ANOVA)
D. Kiểm định Chi-bình phương (Chi-squared test)
76. Trong một phân phối chuẩn tắc (standard normal distribution), giá trị trung bình bằng bao nhiêu?
A. 0
B. 1
C. 0.5
D. Không xác định
77. Khi nào thì phương pháp lấy mẫu ngẫu nhiên đơn giản là phương pháp lấy mẫu hiệu quả nhất trong Thống kê học?
A. Khi quần thể rất lớn và không đồng nhất.
B. Khi quần thể có các nhóm con (strata) khác biệt rõ rệt.
C. Khi các đơn vị mẫu có thể được phân nhóm một cách tự nhiên.
D. Khi mọi đơn vị trong quần thể đều có cơ hội được chọn như nhau và độc lập.
78. Phân phối nhị thức (binomial distribution) được sử dụng khi nào?
A. Khi có nhiều kết quả có thể xảy ra trong mỗi phép thử.
B. Khi đo lường một biến liên tục.
C. Khi có một số cố định các phép thử độc lập, mỗi phép thử chỉ có hai kết quả có thể (thành công/thất bại).
D. Khi dữ liệu tuân theo phân phối chuẩn.
79. Trong Thống kê học, tham số nào sau đây được sử dụng để mô tả xu hướng trung tâm của một tập dữ liệu định lượng?
A. Độ lệch chuẩn
B. Phương sai
C. Trung vị
D. Khoảng biến thiên
80. Khi phân tích dữ liệu định tính, phương pháp nào sau đây thường được sử dụng để tìm kiếm các mẫu và chủ đề lặp lại?
A. Hồi quy tuyến tính
B. Phân tích nhân tố
C. Phân tích nội dung
D. Kiểm định chi-square
81. Giả sử bạn đang nghiên cứu mối liên hệ giữa chiều cao và cân nặng của một nhóm người. Bạn tính được hệ số tương quan Pearson là 0.85. Điều này có ý nghĩa gì?
A. Chiều cao và cân nặng không có mối liên hệ.
B. Có một mối liên hệ tuyến tính âm yếu giữa chiều cao và cân nặng.
C. Có một mối liên hệ tuyến tính dương mạnh giữa chiều cao và cân nặng.
D. Chiều cao dự đoán được cân nặng một cách hoàn hảo.
82. Trong Thống kê, thuật ngữ ‘quần thể’ (population) đề cập đến điều gì?
A. Tập hợp tất cả các mẫu có thể thu được.
B. Tập hợp tất cả các đơn vị mà chúng ta quan tâm đến việc đưa ra kết luận.
C. Tập hợp dữ liệu đã được thu thập.
D. Tập hợp các biến độc lập trong một mô hình.
83. Khi nào thì việc sử dụng trung vị (median) làm thước đo xu hướng trung tâm là phù hợp hơn trung bình cộng (mean)?
A. Khi dữ liệu có phân phối đối xứng hoàn hảo.
B. Khi dữ liệu có nhiều giá trị ngoại lai (outliers).
C. Khi dữ liệu có độ lệch chuẩn rất nhỏ.
D. Khi dữ liệu có số lượng quan sát lớn.
84. Trong phân tích hồi quy tuyến tính bội, hệ số xác định R-squared đo lường điều gì?
A. Tỷ lệ biến thiên của biến phụ thuộc được giải thích bởi các biến độc lập.
B. Mức độ ảnh hưởng của từng biến độc lập đến biến phụ thuộc.
C. Độ chính xác của dự báo khi chỉ sử dụng một biến độc lập.
D. Khả năng khái quát hóa của mô hình đến quần thể lớn hơn.
85. Trong kiểm định giả thuyết, giá trị p (p-value) cho biết điều gì?
A. Xác suất giả thuyết không là đúng.
B. Xác suất quan sát được kết quả thử nghiệm hoặc kết quả cực đoan hơn, giả sử giả thuyết không là đúng.
C. Xác suất giả thuyết đối là đúng.
D. Mức độ sai số của phép đo.
86. Trong Thống kê suy luận, sai số chuẩn (standard error) đo lường điều gì?
A. Sự biến thiên của dữ liệu trong mẫu.
B. Độ lệch của mẫu so với quần thể.
C. Độ chính xác của ước lượng tham số quần thể từ mẫu.
D. Tỷ lệ sai sót trong quá trình thu thập dữ liệu.
87. Mục tiêu chính của việc lấy mẫu trong Thống kê là gì?
A. Thu thập càng nhiều dữ liệu càng tốt.
B. Suy luận về các đặc tính của quần thể dựa trên một phần nhỏ của nó.
C. Mô tả chi tiết từng cá thể trong quần thể.
D. Loại bỏ tất cả các sai số khỏi dữ liệu.
88. Khi nào thì sử dụng hệ số tương quan Pearson (Pearson correlation coefficient)?
A. Để đo lường mối quan hệ giữa hai biến định tính.
B. Để đo lường mối quan hệ tuyến tính giữa hai biến định lượng.
C. Để so sánh trung bình của nhiều nhóm.
D. Để dự đoán giá trị của biến phụ thuộc.
89. Khi nào bạn nên sử dụng phân tích hồi quy logistic?
A. Khi biến phụ thuộc là một biến định lượng liên tục.
B. Khi biến phụ thuộc là một biến định tính nhị phân (ví dụ: có/không, đúng/sai).
C. Khi muốn so sánh trung bình của ba nhóm trở lên.
D. Để đo lường mối quan hệ tuyến tính giữa hai biến.
90. Đâu là thước đo sự phân tán mà không bị ảnh hưởng bởi các giá trị ngoại lai (outliers)?
A. Độ lệch chuẩn
B. Phương sai
C. Khoảng cách tứ phân vị (Interquartile Range – IQR)
D. Tầm với (Range)
91. Trong Thống kê suy luận, khoảng tin cậy (confidence interval) cho một tham số quần thể cung cấp một phạm vi giá trị nào?
A. Chỉ chứa giá trị trung bình của mẫu.
B. Chắc chắn chứa tham số quần thể đã biết.
C. Một phạm vi các giá trị mà tham số quần thể có khả năng nằm trong đó với một mức độ tin cậy nhất định.
D. Tất cả các giá trị có thể có của biến trong quần thể.
92. Độ lệch chuẩn (standard deviation) đo lường mức độ phân tán của dữ liệu xung quanh đâu?
A. Trung vị
B. Trung bình cộng
C. Yếu vị
D. Phân vị thứ 75
93. Phân tích phương sai (ANOVA) được sử dụng để làm gì?
A. So sánh trung bình của hai nhóm.
B. So sánh trung bình của ba nhóm trở lên.
C. Kiểm tra mối quan hệ giữa hai biến định tính.
D. Ước lượng giá trị của biến phụ thuộc dựa trên biến độc lập.
94. Yếu tố nào sau đây KHÔNG phải là một giả định cơ bản của kiểm định t-Student cho mẫu độc lập?
A. Tính độc lập của các quan sát trong mỗi nhóm.
B. Phân phối chuẩn của dữ liệu trong mỗi nhóm.
C. Độ lệch chuẩn tương đương giữa hai nhóm.
D. Dữ liệu phải là thang đo danh nghĩa.
95. Khi nào bạn nên sử dụng kiểm định Chi-square cho tính độc lập?
A. So sánh trung bình của hai nhóm định lượng.
B. Kiểm tra mối quan hệ giữa hai biến định tính.
C. Đánh giá sự phù hợp của dữ liệu với một phân phối lý thuyết.
D. Ước lượng mối quan hệ tuyến tính giữa hai biến định lượng.
96. Trong phân tích dữ liệu, outlier (giá trị ngoại lai) là gì?
A. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
B. Giá trị trung bình của tập dữ liệu.
C. Một giá trị khác biệt đáng kể so với phần còn lại của dữ liệu.
D. Giá trị nằm ở giữa tập dữ liệu đã sắp xếp.
97. Nếu bạn muốn phân tích mối quan hệ giữa số giờ học và điểm thi của sinh viên, phương pháp nào là phù hợp nhất?
A. Kiểm định t-test
B. Phân tích hồi quy tuyến tính
C. Kiểm định Chi-square
D. ANOVA
98. Giả sử bạn đang thực hiện một nghiên cứu về tác động của một loại thuốc mới lên huyết áp. Bạn chia đối tượng nghiên cứu thành hai nhóm: nhóm dùng thuốc và nhóm dùng giả dược. Phương pháp thống kê nào phù hợp nhất để so sánh trung bình huyết áp giữa hai nhóm này?
A. Kiểm định Chi-square
B. Phân tích hồi quy tuyến tính
C. Kiểm định t-Student cho mẫu độc lập
D. Phân tích phương sai (ANOVA)
99. Đâu là thước đo độ xiên (skewness) của một phân phối?
A. Trung vị
B. Độ lệch chuẩn
C. Hệ số xiên
D. Phần tư
100. Yếu tố nào sau đây KHÔNG ảnh hưởng đến kích thước mẫu cần thiết trong một nghiên cứu?
A. Mức độ tin cậy mong muốn.
B. Sai số biên (margin of error) chấp nhận được.
C. Độ biến thiên của quần thể.
D. Thời gian có sẵn để thu thập dữ liệu.
101. Phương pháp lấy mẫu nào mà mỗi phần tử trong tổng thể có cơ hội được chọn như nhau và độc lập với các phần tử khác?
A. Lấy mẫu phân tầng
B. Lấy mẫu theo cụm
C. Lấy mẫu ngẫu nhiên đơn
D. Lấy mẫu có hệ thống
102. Trong thống kê suy luận, mục đích chính của việc sử dụng ‘ước lượng điểm’ (point estimate) là gì?
A. Cung cấp một phạm vi giá trị có khả năng chứa tham số tổng thể
B. Đưa ra một giá trị đơn lẻ để ước tính giá trị của tham số tổng thể
C. Kiểm định giả thuyết về tham số tổng thể
D. Đo lường sự biến động của dữ liệu mẫu
103. Khi nói về phân phối chuẩn (normal distribution), đặc điểm nào sau đây là đúng?
A. Phân phối có dạng bất đối xứng hoàn toàn
B. Trung bình, trung vị và mốt khác nhau
C. Phân phối đối xứng với hình dạng chuông
D. Có nhiều đỉnh
104. Đâu là một biện pháp ‘tập trung’ (measure of central tendency) trong thống kê?
A. Khoảng biến thiên (Range)
B. Độ lệch chuẩn (Standard Deviation)
C. Trung bình cộng (Mean)
D. Phương sai (Variance)
105. Trong phân tích hồi quy, sai số chuẩn của hệ số hồi quy (standard error of the coefficient) dùng để làm gì?
A. Đo lường mức độ phù hợp tổng thể của mô hình
B. Ước lượng sự biến động của hệ số hồi quy nếu lấy mẫu khác
C. Xác định giá trị dự đoán của biến phụ thuộc
D. Kiểm tra tính tự tương quan của phần dư
106. Phương pháp lấy mẫu nào chia tổng thể thành các nhóm (strata) dựa trên đặc điểm chung, sau đó lấy mẫu ngẫu nhiên từ mỗi nhóm?
A. Lấy mẫu ngẫu nhiên đơn
B. Lấy mẫu phân tầng (Stratified Sampling)
C. Lấy mẫu thuận tiện (Convenience Sampling)
D. Lấy mẫu có hệ thống (Systematic Sampling)
107. Trong lấy mẫu, ‘sai số lấy mẫu’ (sampling error) là gì?
A. Lỗi do người thực hiện khảo sát mắc phải
B. Sự khác biệt ngẫu nhiên giữa thống kê mẫu và tham số tổng thể
C. Lỗi do sử dụng phương pháp lấy mẫu không phù hợp
D. Sai sót trong quá trình nhập liệu
108. Phân tích hồi quy với biến độc lập là biến giả (dummy variable) được sử dụng để:
A. Dự đoán giá trị trung bình của biến phụ thuộc
B. Đo lường ảnh hưởng của một biến định tính lên biến phụ thuộc định lượng
C. Kiểm tra mối quan hệ tuyến tính giữa hai biến định lượng
D. Ước lượng sự biến động của dữ liệu
109. Trong phân tích hồi quy, hệ số xác định hiệu chỉnh (Adjusted R-squared) được giới thiệu để giải quyết vấn đề gì của R-squared thông thường?
A. R-squared luôn có xu hướng tăng khi thêm biến, ngay cả khi biến đó không có ý nghĩa thống kê
B. R-squared không đo lường được mức độ phù hợp tổng thể của mô hình
C. R-squared không thể xử lý các biến định tính
D. R-squared bị ảnh hưởng bởi sai số lấy mẫu
110. Kiểm định Chi-squared (χ²) thường được sử dụng để phân tích mối quan hệ giữa hai biến thuộc loại nào?
A. Hai biến định lượng
B. Một biến định lượng và một biến định tính
C. Hai biến định tính
D. Hai biến thứ bậc
111. Phân tích hồi quy logistic thường được áp dụng khi biến phụ thuộc là loại biến nào?
A. Biến định lượng liên tục
B. Biến định tính với hai hoặc nhiều nhóm
C. Biến định tính nhị phân (ví dụ: Có/Không, Thành công/Thất bại)
D. Biến thứ bậc
112. Phương pháp lấy mẫu nào mà người nghiên cứu chọn các đơn vị mẫu một cách tùy tiện, dựa trên sự sẵn có và thuận tiện?
A. Lấy mẫu ngẫu nhiên đơn
B. Lấy mẫu phân tầng
C. Lấy mẫu thuận tiện (Convenience Sampling)
D. Lấy mẫu có hệ thống
113. Độ lệch (skewness) trong thống kê mô tả cho biết điều gì về phân phối dữ liệu?
A. Mức độ nhọn hoặc bẹt của đỉnh phân phối
B. Mức độ đối xứng của phân phối
C. Tỷ lệ giá trị nằm ngoài khoảng biến thiên
D. Sự tập trung của dữ liệu tại giá trị trung bình
114. Trong phân tích chuỗi thời gian, khái niệm ‘tính mùa vụ’ (seasonality) đề cập đến yếu tố nào?
A. Xu hướng tăng hoặc giảm dài hạn của dữ liệu
B. Sự biến động ngẫu nhiên không thể dự đoán
C. Các mẫu lặp lại có quy luật theo chu kỳ cố định (ví dụ: hàng ngày, hàng tuần, hàng quý)
D. Ảnh hưởng của các sự kiện bất thường
115. Trong phân tích hồi quy, ‘đa cộng tuyến’ (multicollinearity) là hiện tượng gì?
A. Biến phụ thuộc có mối quan hệ mạnh với các biến độc lập
B. Các biến độc lập có mối tương quan mạnh với nhau
C. Phần dư của mô hình có sự tự tương quan
D. Sai số chuẩn của các hệ số hồi quy quá lớn
116. Khi xây dựng một mô hình hồi quy tuyến tính bội, chỉ số R-squared (hệ số xác định) cho biết điều gì?
A. Tỷ lệ phần trăm biến thiên của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình
B. Mức độ ảnh hưởng của từng biến độc lập riêng lẻ
C. Khả năng dự đoán của mô hình đối với các quan sát mới
D. Độ chính xác của các hệ số hồi quy ước lượng
117. Trong thống kê mô tả, ‘median’ (trung vị) là giá trị:
A. Xuất hiện nhiều nhất trong tập dữ liệu
B. Trung bình cộng của tất cả các giá trị
C. Chia tập dữ liệu đã sắp xếp thành hai nửa bằng nhau
D. Chênh lệch giữa giá trị lớn nhất và nhỏ nhất
118. Trong Thống kê học, đâu là đại lượng đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị
B. Mốt
C. Độ lệch chuẩn
D. Khoảng biến thiên
119. Trong kiểm định giả thuyết, ‘mức ý nghĩa’ (significance level, alpha) đại diện cho xác suất tối đa chấp nhận mắc phải loại sai lầm nào?
A. Sai lầm loại I (Type I error)
B. Sai lầm loại II (Type II error)
C. Cả sai lầm loại I và loại II
D. Không mắc sai lầm
120. Hệ số tương quan Pearson đo lường mối quan hệ tuyến tính giữa hai biến định lượng. Giá trị của hệ số này nằm trong khoảng nào?
A. Từ 0 đến 1
B. Từ -1 đến 0
C. Từ -1 đến 1
D. Từ -∞ đến +∞
121. Khi một nhà thống kê nói về ‘khoảng tin cậy’ (confidence interval), họ đang đề cập đến điều gì?
A. Giá trị chính xác của tham số tổng thể
B. Một phạm vi giá trị mà tham số tổng thể có khả năng nằm trong đó với một mức độ tin cậy nhất định
C. Tỷ lệ các giá trị trong mẫu nằm trong một khoảng nhất định
D. Độ chính xác của ước lượng điểm
122. Khi thực hiện kiểm định giả thuyết thống kê, nếu giá trị p-value nhỏ hơn mức ý nghĩa (alpha), ta sẽ có hành động gì?
A. Chấp nhận giả thuyết không (H0)
B. Bác bỏ giả thuyết không (H0)
C. Không đủ thông tin để kết luận
D. Tăng kích thước mẫu
123. Phương pháp thống kê nào thường được sử dụng để so sánh trung bình của ba nhóm độc lập trở lên?
A. T-test độc lập
B. Phân tích phương sai một yếu tố (One-way ANOVA)
C. Hồi quy tuyến tính
D. Kiểm định Chi-squared
124. Kiểm định T-test thường được sử dụng để so sánh điều gì?
A. Sự khác biệt giữa hai nhóm độc lập hoặc hai lần đo trên cùng một nhóm
B. Mối quan hệ giữa hai biến định lượng
C. Sự khác biệt giữa nhiều hơn hai nhóm
D. Tần suất xuất hiện của một biến định tính
125. Trong kiểm định giả thuyết, ‘sai lầm loại II’ (Type II error) xảy ra khi nào?
A. Bác bỏ giả thuyết không (H0) khi nó đúng
B. Chấp nhận giả thuyết không (H0) khi nó sai
C. Bác bỏ giả thuyết không (H0) khi nó sai
D. Chấp nhận giả thuyết không (H0) khi nó đúng