Bộ số 1

Câu 1

Một nhà nghiên cứu quan sát thấy rằng những người tập thể dục thường xuyên có chỉ số huyết áp thấp hơn. Đây là ví dụ về loại mối quan hệ nào?

Câu 2

Khi phân tích dữ liệu, 'hiện tượng ngoại lai' (outlier) là gì?

Câu 3

Trong kiểm định giả thuyết, 'sai lầm loại II' xảy ra khi nào?

Câu 4

Phân tích tương quan Pearson (Pearson correlation) đo lường điều gì giữa hai biến số định lượng?

Câu 5

Hệ số tương quan Spearman (Spearman correlation) được sử dụng khi nào?

Câu 6

Trong hồi quy tuyến tính đơn giản (simple linear regression), hệ số góc (slope coefficient) của biến độc lập (X) cho biết điều gì?

Câu 7

Trong thống kê mô tả, 'khoảng tứ phân vị' (Interquartile Range - IQR) được tính như thế nào?

Câu 8

Một nhà nghiên cứu muốn ước tính chiều cao trung bình của nam giới trưởng thành tại Việt Nam. Nếu họ chọn một mẫu ngẫu nhiên và tính toán khoảng tin cậy 95% cho chiều cao trung bình là [165 cm, 170 cm], điều này có nghĩa là gì?

Câu 9

Một nhà nghiên cứu muốn khảo sát ý kiến của sinh viên về chất lượng bữa ăn tại căng tin trường đại học. Phương pháp nào sau đây là phù hợp nhất để đảm bảo tính đại diện cho toàn bộ sinh viên của trường?

Câu 10

Trong một phân tích hồi quy, nếu 'hệ số xác định' (coefficient of determination, R-squared) là 0.85, điều này có nghĩa là gì?

Câu 11

Khi đường cong phân phối tần suất có dạng lệch trái (lệch về bên trái), điều này thường ngụ ý mối quan hệ nào giữa các đại lượng đo lường xu hướng trung tâm?

Câu 12

Một công ty dược phẩm muốn kiểm tra hiệu quả của một loại thuốc mới trong việc giảm huyết áp. Họ chọn ngẫu nhiên 100 bệnh nhân và chia thành hai nhóm: nhóm dùng thuốc và nhóm dùng giả dược (placebo). Phương pháp thống kê suy luận nào phù hợp để so sánh huyết áp trung bình giữa hai nhóm?

Câu 13

Trong kiểm định giả thuyết, 'sai lầm loại I' xảy ra khi nào?

Câu 14

Khi một nhà thống kê nói rằng họ đang thực hiện 'lấy mẫu ngẫu nhiên đơn giản' (simple random sampling), điều đó có nghĩa là gì?

Câu 15

Loại biểu đồ nào thường được sử dụng để hiển thị sự phân bố tần suất của một biến định lượng liên tục?

Câu 16

Trong lý thuyết lấy mẫu, 'sai số lấy mẫu' (sampling error) là gì?

Câu 17

Trong thống kê mô tả, đại lượng nào đo lường mức độ phân tán của dữ liệu quanh giá trị trung bình?

Câu 18

Trong bảng tần suất, 'tần suất tích lũy' (cumulative frequency) của một lớp được định nghĩa là gì?

Câu 19

Một nhà nghiên cứu muốn so sánh hiệu quả của ba phương pháp giảng dạy khác nhau đối với kết quả học tập của sinh viên. Phương pháp thống kê nào phù hợp nhất để thực hiện điều này?

Câu 20

Một nhà khoa học thực hiện một thí nghiệm và thu được một giá trị p (p-value) là 0.03. Nếu mức ý nghĩa (alpha) được đặt là 0.05, kết luận nào sau đây là hợp lý?

Câu 21

Một nhà thống kê đang phân tích dữ liệu về mối quan hệ giữa số giờ học mỗi tuần và điểm thi cuối kỳ của sinh viên. Họ phát hiện ra hệ số tương quan Pearson là 0.75. Điều này cho thấy điều gì?

Câu 22

Khi nào chúng ta nên ưu tiên sử dụng trung vị (median) thay vì trung bình cộng (mean) làm thước đo xu hướng trung tâm?

Câu 23

Khi thực hiện phân tích ANOVA một yếu tố (One-way ANOVA), mục đích chính là để so sánh điều gì?

Câu 24

Một nhà marketing muốn biết liệu chiến dịch quảng cáo mới có làm tăng doanh số bán hàng hay không. Giả thuyết vô hiệu (H0) trong trường hợp này nên được phát biểu như thế nào?

Câu 25

Một nhà kinh tế sử dụng dữ liệu GDP hàng năm của một quốc gia từ năm 1990 đến 2020 để phân tích xu hướng tăng trưởng. Phương pháp thống kê mô tả nào là quan trọng nhất để xác định xu hướng dài hạn này?