Gốc > Mục:Toán học >
a1330a >
title:ly thuyet thong ke
date:23-06-2009
sender:Lê Đức Tân
source:
type:ppt
TỔNG HỢP DỮ LIỆU THỐNG KÊ dulieu.ppt
KHÁI NIỆM
Các số liệu thu thập phản ánh các đặc trưng cá biệt của từng đơn vị. Tuy nhiên, các tài liệu này rất rời rạc nên rất khó rút ra các kết luận về hiện tượng đang nghiên cứu cũng như việc sử dụng chúng trong việc phân tích và dự báo. Vì vậy, cần phải tiến hành tóm tắt những tài liệu thu thập được và trình bày chúng dưới dạng phù hợp.
Tóm tắt dữ liệu thống kê là tiến hành sắp xếp, phân loại những đặc trưng riêng biệt trên từng đơn vị điều tra, bước đầu chuyển thành các đặc trưng chung của toàn bộ tổng thể. Tức là chuyển cái riêng thành cái chung, từ ngẫu nhiên sang tất nhiên và làm bộc lộ bản chất nội tại của hiện tượng nghiên cứu.
Phương pháp cơ bản để tóm tắt dữ liệu là phân tổ dữ liệu.
PHÂN TỔ DỮ LIỆU
Phân tổ dữ liệu là chia dữ liệu thành các nhóm (tổ) có giá trị gần giống như nhau. Số dữ liệu nằm trong một tổ gọi là tần số của tổ.
Phương pháp phân tổ dữ liệu :

ĐỐI VỚI DỮ LIỆU ĐỊNH TÍNH
Mỗi biểu hiện (thuộc tính ) là một tổ.
Ví Dụ : Có số liệu về giống lúa gieo trồng của 30 hộ điều tra như sau :
Sử dụng phương pháp phân tổ, ta có bảng sau :
ĐỐI VỚI DỮ LIỆU ĐỊNH LƯỢNG CÓ ÍT BIỂU HIỆN VÀ RỜI RẠC
Mỗi biểu hiện là một tổ .
Ví Dụ : Có số liệu điều tra về số lần tham gia khuyến nông của 30 hộ như sau :
Sử dụng phương pháp phân tổ, ta có bảng sau :
ĐỐI VỚI DỮ LIỆU ĐỊNH LƯỢNG CÓ NHIỀU BIỂU HIỆN
Tiến hành phân tổ có khoảng cách tổ : Chia dữ liệu thành n tổ (mỗi tổ có giới hạn trên và giới hạn dưới), đếm các quan sát có giá trị nằm trong khoảng cách tổ đã chia. Số quan sát trong mỗi tổ gọi là tần số xuất hiện của tổ.
Phương pháp phân tổ :
Xác định số tổ dự định chia.
Tính trị số khoảng cách tổ :
Xây dựng các tổ định chia .
Đếm các quan sát nằm trong mỗi tổ.
Có dữ liệu về thu nhập của 110 hộ nuôi tôm tại huyện Cần Giờ năm 2003 như sau : ViduPT.xls
Phân tổ dữ liệu trên thành 5 tổ có khoảng cách tổ đều nhau.
Chia dãy số lượng biến thành 5 tổ, ta tính được trị số khoảng cách tổ như sau :
TẦN SỐ TÍCH LUỸ
Tần số tích luỹ là tần số cộng dồn theo thứ tự tăng dần của các tổ nhằm xác định khả năng tối đa hoặc tối thiểu của giá trị lượng biến.
Ví dụ : Một cửa hàng kinh doanh sữa tươi muốn xác định số lọ sữa tồn trử tối ưu nên đã tiến hành thống kê 100 ngày bán thì ghi nhận được số liệu sau :
TRÌNH BÀY DỮ LIỆU THỐNG KÊ
1- BẢNG THỐNG KÊ
2- ĐỒ THỊ THỐNG KÊ
Bảng thống kê
Là loại bảng dùng để trình bày dữ liệu điều tra theo một quy tắc nào đó nhằm thể hiện kết quả nghiên cứu.
Bảng thống kê bao gồm ba phần :
- Tên bảng : mô tả tóm tắt nội dung nghiên cứu.
- Nội dung bảng : gồm phần chủ đề và phần giải thích.
- Xuất xứ : nguồn gốc các dữ liệu trong bảng.

Đồ thị thống kê
Là hình thức trình bày các dữ liệu nghiên cứu bằng hình ảnh. Có ba loại biểu đồ cơ bản :
* Biểu đồ hình thanh (hình cột).
* Biểu đồ hình tròn.
* Biểu đồ hình gấp khúc.

Giá trị sản xuất nông nghiệp tại tỉnh An Giang năm 1998-2002
Đơn vị tính : Tỷ đồng
Nguồn tin : Niên giám thống kê tỉnh An Giang năm 2003
ĐỒ THỊ HÌNH CỘT
ĐỒ THỊ HÌNH TRÒN
ĐỒ THỊ HÌNH GẤP KHÚC
MÔ TẢ DỮ LIỆU ĐỊNH LƯỢNG
CÁC ĐẠI LƯỢNG ĐO ĐỘ TẬP TRUNG.
CÁC ĐẠI LƯỢNG ĐO ĐỘ PHÂN TÁN.

CÁC ĐẠI LƯỢNG ĐO LƯỜNG ĐỘ TẬP TRUNG
1- Số bình quân.
2- Mode.
3- Median.
SỐ BÌNH QUÂN
1-Khái niệm : Số bình quân là chỉ tiêu biểu hiện mức độ đại diện chung nhất của hiện tượng nghiên cứu bao gồm nhiều đơn vị cá biệt cùng loại theo một tiêu thức số lượng nào đó.
Ví dụ : Giá thành bình quân, năng suất lao động bình quân, tiền lương bình quân.
2-Các loại số bình quân :
a-Số bình quân cộng đơn giản.
b-Số bình quân gia quyền.
c-Số bình quân nhân.
SỐ BÌNH QUÂN CỘNG GIẢN ĐƠN
Được tính bằng cách cộng giá trị các lượng biến của tiêu thức và chia cho số các lượng biến.
Công thức tính :
Ví dụ : Tính năng suất lao động trung bình của nhóm công nhân theo bảng thống kê sau :
SỐ BÌNH QUÂN GIA QUYỀN
Ví dụ : Có tài liệu về năng suất lao động của công nhân một Cty X như sau :
Được dùng trong trường hợp lượng biến xuất hiện nhiều lần. Số lần xuất hiện gọi là tần số xuất hiện.
Công thức tính :
Đối với dãy số lượng biến có khoảng cách tổ, cần tính trị số giữa của từng tổ. Ví dụ :
SỐ BÌNH QUÂN NHÂN :
Ví dụ : Có số liệu về doanh thu của một công ty từ năm 2000 đến năm 2005 như sau :
Dùng để tính trung bình cho các lượng biến có quan hệ tích số với nhau.
Công thức tính :
MODE : Mo
Mode là biểu hiện của tiêu thức xuất hiện nhiều lần trong tổng thể.
Phương pháp xác định :
@ Đối với dãy số lượng biến rời rạc : Mo = xi (fi max)
@ Đối với dãy số lượng biến có phân tổ :
* Xác định tổ chứa số Mode : Tổ có tần số lớn nhất.
* Ap dụng công thức tính số Mode :
Ví dụ : Có số liệu về thu nhập của các nhân viên thuộc công ty X năm 2006 như sau :
MEDIAN : Me
Median là lượng biến đứng giữa dãy số lượng biến được sắp xếp theo trật tự từ thấp đến cao.
Phương pháp xác định :
@ Đối với dãy số lượng biến rời rạc :
@ Đối với dãy số lượng biến có phân tổ :
* Xác định tổ chứa số Me : Tính tần số tích luỹ. Tổ chứa số Me là tổ có tần số tích luỹ bằng hoặc vượt quá phân nữa tổng tần số.
* Ap dụng công thức tính số Me :
Ví dụ : Có số liệu về thu nhập của các nhân viên thuộc công ty X năm 2006 như sau :
CÁC ĐẶC TRƯNG ĐO LƯỜNG ĐỘ PHÂN TÁN
Có số liệu thu thập hàng tháng của hai nhóm hộ gia đình ở hai khu vực A và B như sau:

Khu vực A (1000 đ) : 1800 1900 2000 2100 2200

Khu vực B (1000 đ) : 500 1000 2000 2500 4000

CÁC SỐ ĐO KHẢO SÁT ĐỘ PHÂN TÁN
1- Khoản biến thiên (Range) : R = Xmax - Xmin

2- Phương sai : (Variance)
* Đối với dãy số lượng biến có tần số bằng 1 :
* Đối với dãy số lượng biến có tần số > 1 :
CÁC SỐ ĐO KHẢO SÁT ĐỘ PHÂN TÁN
3- Độ lệch tiêu chuẩn : (Standard Deviation)
4- Heä soá bieán thieân (Coefficient of Variation) :
CÁC ĐẠI LƯỢNG THỂ HIỆN HÌNH DÁNG CỦA PHÂN PHỐI
ĐẠI LƯỢNG ĐO ĐỘ NGHIÊNG (Measure of Skewness)
ĐẠI LƯỢNG ĐO ĐỘ NHỌN (Measure of Kurtosis)
Đại lượng đo độ nghiêng (Measure of Skewness)
Skewness cho biết độ lệch của một phân phối.(không đối xứng).
Công thức tính (Excel) :
Skew = 0 : Phân phối đối xứng.
Skew < 0 : Phân phối lệch trái (đuôi kéo dài về phía trái).
Skew > 0 : Phân phối lệch phải (đuôi kéo dài về phía phải).
Đại lượng đo độ nhọn (Measure of Kurtosis)
Kurtosis cho biết độ tập trung của một phân phối.
Công thức tính (Excel) :
Kurt = 0 : Phân phối khảo sát có cùng độ tập tung với phân phối chuẩn.
Kurt > 0 : Phân phối khảo sát có độ tập trung cao hơn phân phối chuẩn.
Kurt < 0 : Phân phối khảo sát có độ tập trung thấp hơn phân phối chuẩn.
Công thức tính Skew và Kurt trong Eview
Skew = 0 : Phân phối đối xứng.
Skew < 0 : Phân phối lệch trái (đuôi kéo dài về phía trái).
Skew > 0 : Phân phối lệch phải (đuôi kéo dài về phía phải).
Kurt = 3 : Phân phối khảo sát có cùng độ nhọn với phân phối chuẩn.
Kurt > 3 : Phân phối khảo sát có độ tập trung cao hơn phân phối chuẩn.
Kurt < 3 : Phân phối khảo sát có độ tập trung thấp hơn phân phối chuẩn.
MÔ TẢ DỮ LIỆU BẰNG PHẦN MỀM EXCEL
Có dữ liệu về thu nhập của 95 hộ nuôi tôm tại huyện Cần Giờ năm 2003 như sau :
Dùng phần mềm Excel ta được Output sau : ViduPT.xls