1. Trang chủ
  2. » Thể loại khác

Bài giảng nguyên lý thống kê về kinh tế eg20 Đại học mở hà nội

60 12 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Bài giảng nguyên lý thống kê về kinh tế: Nhập môn thống kê học
Trường học Đại học Mở Hà Nội
Chuyên ngành Nguyên lý thống kê về kinh tế
Thể loại Bài giảng
Thành phố Hà Nội
Định dạng
Số trang 60
Dung lượng 4,33 MB

Nội dung

BÀI I: NHẬP MÔN THỐNG KÊ HỌC Mục tiêu: Trang bị cho người học một số khái niệm và thuật ngữ chung nhất của thống kê học: 1. Thống kê học là gì. 2. Đối tượng n/c của thống kê học. 3. Một số khái niệm thống kê cơ bản. 4. Các loại thang đo trong thống kê. 5. Hai hình thức trình bày tài liệu thống kê. 6. Các giai đoạn của quá trình n/c thống kê. Nội dung: 1. THỐNG KÊ HỌC LÀ GÌ (slide 4) Thuật ngữ “thống kê” có hai nghĩa: Theo nghĩa thứ nhất, thống kê là những dữ liệu được ghi chép để phản ánh các hiện tượng tự nhiên, kỹ thuật, kinh tế, xã hội. Chẳng hạn như số liệu về GDP, về vốn đầu tư phát triển của nền kinh tế; về giá trị sản xuất của một DN… Theo nghĩa thứ hai, thống kê là khoa học về hệ thống các phương pháp thu thập và phân tích các dữ liệu về mặt định lượng. Chẳng hạn, qua số liệu về kết quả sản xuất, lao động và thu nhập của lao động ở một DN theo thời gian, ta có thể tính được NSLĐ bq và TNBQ của lao động. Qua đó phân tích được tính quy luật của sự biến động năng suất và TNBQ của lao động, phân tích được tính quy luật giữa tốc độ tăng năng suất và tốc độ tăng TNBQ của lao động… từ đó giúp lãnh đạo DN có những giải pháp kịp thời. Trong giáo trình này, thống kê học được hiểu đầy đủ theo nghĩa thứ hai.

Trang 1

BÀI I: NHẬP MÔN THỐNG KÊ HỌC

Mục tiêu:

Trang bị cho người học một số khái niệm và thuật ngữ chung nhất của thống kê học:

1 Thống kê học là gì

2 Đối tượng n/c của thống kê học

3 Một số khái niệm thống kê cơ bản

4 Các loại thang đo trong thống kê

5 Hai hình thức trình bày tài liệu thống kê

6 Các giai đoạn của quá trình n/c thống kê

Nội dung:

1 THỐNG KÊ HỌC LÀ GÌ (slide 4)

Thuật ngữ “thống kê” có hai nghĩa:

Theo nghĩa thứ nhất, thống kê là những dữ liệu được ghi chép để phản ánh các

hiện tượng tự nhiên, kỹ thuật, kinh tế, xã hội Chẳng hạn như số liệu về GDP, về vốn đầu

tư phát triển của nền kinh tế; về giá trị sản xuất của một DN…

Theo nghĩa thứ hai, thống kê là khoa học về hệ thống các phương pháp thu thập và

phân tích các dữ liệu về mặt định lượng Chẳng hạn, qua số liệu về kết quả sản xuất, lao động và thu nhập của lao động ở một DN theo thời gian, ta có thể tính được NSLĐ bq và TNBQ của lao động Qua đó phân tích được tính quy luật của sự biến động năng suất và TNBQ của lao động, phân tích được tính quy luật giữa tốc độ tăng năng suất và tốc độ tăng TNBQ của lao động… từ đó giúp lãnh đạo DN có những giải pháp kịp thời Trong giáo trình này, thống kê học được hiểu đầy đủ theo nghĩa thứ hai

2 ĐỐI TƯỢNG N/C CỦA THỐNG KÊ HỌC (slide 5)

Là các dữ liệu về mặt định lượng của các hiện tượng KT-XH số lớn, trong điều kiện lịch sử cụ thể

Một số điểm cần nhận thức thống nhất về đối tượng của môn học:

(1) Thống kê học thông qua n/c các biểu hiện về lượng của hiện tượng KT-XH để tìm hiểu bản chất và tính quy luật của chúng

(2) Thống kê học n/c hiện tượng số lớn, tức là một tổng thể bao gồm nhiều đơn vị

Trang 2

hợp thành Mặt lượng của các đơn vị này thường chịu tác động của nhiều nhân tố Viêc tổng hợp mặt lượng trên một số lớn các đơn vị của hiện tượng sẽ làm cho tác động của các nhân tố ngẫu nhiên sẽ được bù trừ và triệt tiêu, bản chất và tính quy luật của hiện tượng n/c được bộc lộ ra

(3) Thống kê học n/c hiện tượng số lớn kết hợp với mở rộng nội dung n/c (theo ph/ pháp chọn mẫu) các hiện tượng cá biệt và các đơn vị tiến tiến, lạc hậu nhằm giúp nhận thức đầy đủ hơn bản chất và tính quy luật của hiện tượng n/c

(4) Hiện tượng số lớn mà thống kê học n/c luôn tồn tại trong những điều kiện lịch

sử cụ thể Trong những điều kiện lịch sử khác nhau hiện tượng n/c sẽ có đặc điểm về chất

và biểu hiện về lượng không giống nhau Chính vì thế, khi sử dụng các dữ liệu thống kê

về hiện tượng n/c phải để ý tới điều kiện lịch sử cụ thể của nó

3 MỘT SỐ KHÁI NIỆM THỐNG KÊ CƠ BẢN

Nội dung của mục này làm rõ các khái niệm: (1) Tổng thể thống kê và đơn vị

tổng thể; (2) Tiêu thức thống kê; và, (3) Chỉ tiêu thống kê

3.1 Tổng thể thống kê và đơn vị tổng thể thống kê (slide 7)

Tổng thể thống kê là hiện tượng số lớn, gồm nhiều đơn vị hoặc phần tử cá biệt hợp thành, cần được quan sát, phân tích mặt lượng của chúng Những đơn vị hoặc phần tử cá biệt cấu thành hiện tượng n/c được gọi là đơn vị tổng thể Đơn vị tổng thể là bộ phận nhỏ nhất trong tổng thể thống kê, nơi phát sinh ra nguồn thông tin ban đầu cần thu thập Chẳng hạn, toàn bộ các DN trên lãnh thổ Việt Nam tại một thời điểm nào đó là một tổng thể thống kê, trong đó mỗi DN là một đơn vị tổng thể

Như vậy, thực chất của việc xác định tổng thể thống kê chính là việc xác định các đơn vị của nó

♦ Dựa vào đặc điểm nhận biết được hay không nhận biết được của các đơn vị tổng thể, người ta chia tổng thể thống kê thành: (i) Tổng thể bộc lộ; và, (ii) Tổng thể tiềm ẩn

- Tổng thể gồm các đơn vị cấu thành có thể xác định được bằng trực quan gọi là

tổng thể bộc lộ (ví dụ, tổng thể dân số của một quốc gia)

- Tổng thể gồm các đơn vị cấu thành không thể nhận biết được bằng trực quan

được gọi là tổng thể tiềm ẩn (chẳng hạn, tổng thể những người chuyên buôn bán và tàng

Trang 3

trữ các chất ma tuý)

Nghiên cứu thống kê đối với các tổng thể bộc lộ tiến hành khá thuận lợi Song sẽ gặp rất nhiều khó khăn khi n/c các tổng thể tiềm ẩn, đòi hỏi phải sử dụng kết hợp nhiều phương pháp khác nhau, chi phí n/c tốn kém gấp nhiều lần mới có được kết quả mong đợi

♦ Dựa vào các đặc điểm chung giống nhau và không giống nhau, người ta phân

chia tổng thể thống kê thành: (i) Tổng thể đồng chất; và, (ii) Tổng thể không đồng chất

- Tổng thể đồng chất gồm các đơn vị cấu thành có các đặc điểm chung giống nhau

theo mục đích n/c, các đặc điểm chung này cũng chính là các đặc điểm hình thành nên tổng thể thống kê Chẳng hạn, tổng thể sinh viên của một trường đại học

- Tổng thể không đồng chất gồm các đơn vị cấu thành khác nhau về loại hình và

không có các đặc điểm chung giống nhau theo mục đích n/c Ví dụ, tổng thể hành khách trên một chuyến tàu là tổng thể không đồng chất nếu mục đích n/c là tìm hiểu tình hình thu nhập, việc làm hoặc trình độ tay nghề

Nghiên cứu thống kê chỉ đặt ra đối với các tổng thể đồng chất

♦ Ngoài ra, còn có thể phân chia thành: (i) Tổng thể chung (bao gồm tất cả các đơn vị của hiện tượng n/c); và, (ii) Tổng thể bộ phận (chỉ gồm một phần các đơn vị của

tổng thể chung) Cả hai tổng thể này, nếu là đồng chất, thì đều có thể thực hiện được các n/c thống kê khác nhau

3.2 Tiêu thức thống kê (slide 8)

Tiêu thức thống kê là các đặc điểm của đơn vị tổng thể Khi n/c về một tổng thể thống kê, do gặp phải giới hạn về thời gian, về nhân lực, vật lực và tài lực nên tuỳ theo mục đích n/c, người ta chỉ chọn ra một số tiêu thức có liên quan để thu thập thông tin ban đầu

Tiêu thức thống kê được chia thành hai loại là: (i) Tiêu thức thuộc tính; và, (ii) Tiêu thức số lượng

- Tiêu thức thuộc tính là tiêu thức mà các biểu hiện của nó được dùng để phản ánh

tính chất hoặc loại hình của các đơn vị tổng thể, không biểu hiện trực tiếp được bằng con

số Ví dụ, giới tính, nghề nghiệp, thành phần kinh tế…

Trang 4

- Tiêu thức số lượng là tiêu thức có thể biểu hiện trực tiếp được bằng con số Ví

dụ, GDP của 1 quốc gia, doanh thu về BH & CCDV của 1 DN…

- Các tiêu thức chỉ có hai biểu hiện không trùng nhau trên một đơn vị tổng thể

được gọi là tiêu thức thay phiên Ví dụ, tiêu thức giới tính Trong tổng thể dân số hoặc

lao động, một người đã nhận biểu hiện nam thì không nhận biểu hiện nữ, và ngược lại

3.3 Chỉ tiêu thống kê (slide 9)

Chỉ tiêu thống kê là tiêu chí mà biểu hiện bằng số của nó phản ánh quy mô, tốc độ phát triển, cơ cấu, quan hệ tỷ lệ của hiện tượng KT-XH trong điều kiện lịch sử cụ thể Ví

dụ, GDP bình quân đầu người của Việt Nam năm 2011 là 2.000 USD

♦ Chỉ tiêu thống kê bao gồm hai mặt: (i) Khái niệm; và, (ii) Con số

- Mặt khái niệm bao gồm định nghĩa và các giới hạn về thực thể, thời gian và

không gian của hiện tượng KT-XH, phản ánh nội dung của chỉ tiêu thống kê

- Mặt con số của chỉ tiêu thống kê là trị số được phát hiện, đo tính được theo các

đơn vị tính toán phù hợp

♦ Căn cứ vào nội dung, có thể chia các chỉ tiêu thống kê thành: (i) Chỉ tiêu chất lượng; và, (ii) Chỉ tiêu khối lượng (hay số lượng)

- Chỉ tiêu chất lượng biểu hiện các tính chất, tốc độ phát triển, trình độ phổ biến,

mối quan hệ của tổng thể (như giá bán đơn vị sản phẩm, năng suất lao động,…)

- Chỉ tiêu khối lượng biểu hiện quy mô của tổng thể (ví dụ: số lượng SP SX, tổng

vốn dùng vào SXKD…) Việc phân loại này nhằm đáp ứng yêu cầu của một số phương pháp phân tích thống kê

♦ Tập hợp các chỉ tiêu số lượng và chất lượng theo từng yêu cầu n/c cụ thể ta được các hệ thống chỉ tiêu thống kê

4 CÁC LOẠI THANG ĐO TRONG THỐNG KÊ (slide 10)

Nội dung của mục này, dựa theo tính chất của việc đo lường, giới thiệu bốn loại

thang đo trong thống kê, đó là: (1) Thang đo định danh (hay đặt tên); (2) Thang đa thứ

bậc; (3) Thang đo khoảng; và, (4) Thang đo tỷ lệ

4.1 Thang đo định danh (hay đặt tên)

Dùng để đếm biểu hiện của tiêu thức thuộc tính Ví dụ, khi tổng hợp giới tính của

Trang 5

dân số, biểu hiện “nam” được đánh số 1 và “nữ” được đánh số 2 Các con số ở đây không

có quan hệ hơn, kém Vì thế, các phép tính với chúng đều vô nghĩa

4.2 Thang đo thứ bậc

Là thang định danh dùng để đếm số lần biểu hiện của tiêu thức thuộc tính có sự hơn kém khi tổng hợp dữ liệu thống kê Ví dụ: trình độ văn hóa gồm 3 cấp, chất lượng học tập của sinh viên gồm 5 loại, …Con số có trị số lớn hơn không có nghĩa là ở bậc cao hơn và ngược lại Thang đo này được dùng để tính toán đặc trưng chung của tổng thể một cách tương đối như tính bậc thợ bình quân, bậc chất lượng bình quân của sản phẩm,…

4.3 Thang đo khoảng

Là thang đo thứ bậc có khoảng cách đều nhau Có thể đánh giá được sự khác biệt

cụ thể về lượng giữa các biểu hiện của tiêu thức Ví dụ như NSLĐ bq và TNBQ hàng tháng của lao động trong DN Trong thang đo này, lượng biến của tiêu thức n/c có thể được trình bày dưới dạng một phân bố tần số Yêu cầu có khoảng cách đều nhau là đặt ra đối với thang đo, còn biểu hiện về lượng của tiêu thức được đo không nhất thiết phải bằng nhau Như vậy, thang đo khoảng luôn có đơn vị đo và được dùng để tổng hợp lượng biến của tiêu thức số lượng, có thể thực hiện được các phép tính số học và tính toán được các đặc trưng thống kê đối với các lượng biến của tiêu thức n/c

4.4 Thang đo tỷ lệ

Là thang đo khoảng với một điểm không (0) tuyệt đối (điểm gốc) Do có điểm gốc trên thang đo nên có thể so sánh được tỷ lệ giữa các trị số đo, cho biết số lượng thực tế của một đặc trưng đo lường Ví dụ: số lao động trong DN đạt mức thu nhập 5 triệu đồng,

số công nhân hoàn thành vượt định mức khoán sản phẩm,…Đây là thang đo định lượng chặt chẽ nhất Thang đo này có thể đo lường được các biểu hiện của tiêu thức bằng đơn vị hiện vật và thực hiện được tất cả các phép tính đối với trị số đo

Trong bốn loại thang đo trên, hai loại đầu được gọi là thang đo định danh (hay định tính), còn hai loại sau được gọi là thang đo định lượng

5 HAI HÌNH THỨC TRÌNH BÀY TÀI LIỆU THỐNG KÊ

Nội dung mục này giới thiệu hai hình thức trình bày dữ liệu thống kê đó là: (1)

Bảng (biểu) thống kê; và, (2) Đồ thị thống kê

Trang 6

5.1 Bảng (biểu) thống kê (slide 12)

a Khái niệm: là sự sắp xếp theo hệ thống hai chiều số liệu về các chỉ tiêu thống

kê trên các hàng và cột

b Tác dụng của bảng thống kê: (i) Các dữ liệu trong bảng đã được sắp xếp một

cách hệ thống, nên có thể sử dụng các phương pháp so sánh, đối chiếu và các phương

pháp phân tích khác để nêu lên bản chất của hiện tượng n/c; (ii) Bảng thống kê được

thiết kế và trình bày một cách khoa học sẽ trở thành cơ sở dữ liệu quan trọng để phân tích, chứng minh hiện tượng n/c một cách sinh động

c Kết cấu của một bảng thống kê, gồm: (i) Tên bảng hoặc tiêu đề: Trước hết có

tiêu đề chung hay tên gọi chung, đặt ở phía trên đầu của bảng; phía trong bảng có các tiêu

đề nhỏ (hay tiêu mục) là tên riêng của mỗi hàng và cột;

(ii) Phần chủ đề (hay chủ từ): Nêu lên tổng thể n/c được trình bày trong bảng và được

phân chia thành những bộ phận nào; (3i) Phần giải thích (hay tân từ): Gồm các chỉ tiêu

giải thích các đặc điểm của hiện tượng n/c, nghĩa là giải thích phần chủ đề của bảng; (4i)

Thân bảng: Phần giao nhau giữa các hàng và cột tạo thành các ô, dùng để ghi các số liệu

thống kê (Sơ đồ về kết cấu của một bảng thống kê được biên tập trong gt tr 12)

d Các loại bảng thống kê: Căn cứ vào kết cấu của phần chủ đề, có thể chia bảng

thống kê thành: (i) Bảng giản đơn; (ii) Bảng phân tổ; và, 3i) Bảng kết hợp

e Những yêu cầu chung về xây dựng bảng thống kê: cần tuân thủ 9 yêu cầu (hv

tự đọc gt tr 13)

5.2 Đồ thị thống kê (slide 13)

a Khái niệm: là các hình vẽ hoặc đường nét hình học dùng để mô tả có tính chất quy ước các tài liệu thống kê về hiện tượng n/c

b Tác dụng của đồ thị thống kê: (i) Các đồ thị thống kê sử dụng các con số kết

hợp với các hình vẽ, đường nét và màu sắc để trình bày một cách khái quát các đặc điểm

số lượng của hiện tượng n/c; (ii) Nó giúp người đọc nhận thức được các đặc điểm cơ bản của hiện tượng một cách dễ dàng, nhanh chóng Vì thế nó trở thành một phương tiện truyền thông có tính quần chúng, có sức hấp dẫn và sinh động làm cho những người ít hiểu biết về thống kê vẫn dễ dàng lĩnh hội được những vấn đề chủ yếu về hiện tượng n/c

Trang 7

c Các loại đồ thị thống kê

- Theo nội dung phản ánh, có thể chia các đồ thị thống kê thành: (i) Đồ thị phát

triển; (ii) Đồ thị kết cấu; (3i) Đồ thị liên hệ; (4i) Đồ thị phân phối; và, (5i) Đồ thị hoàn thành KH (hoặc định mức)

- Theo hình thức biểu hiện, có thể phân chia đồ thị thống kê thành: (i) Đồ thị

đường biểu diễn; (ii) Biểu đồ hình cột; (3i) Biểu đồ diện tích; (4i) Biểu đồ tượng hình;

và, (5i) Bản đồ thống kê

d Những yếu tố chính của đồ thị thống kê

Để đồ thị thống kê đáp ứng được các yêu cầu: chính xác, dễ xem, dễ hiểu thì khi xây dựng đồ thị phải chú ý đến các yếu tố chính, gồm: (i) Hệ tọa độ;

(ii) Các ký hiệu hình học hoặc hình vẽ; (3i) Thang và tỷ lệ xích; (4i) Tên và lời ghi chú

(Xem ví dụ gt tr 44-46)

6 CÁC GIAI ĐOẠN CỦA QUÁ TRÌNH N/C THỐNG KÊ

Nội dung của mục này giới thiệu khái quát 3 giai đoạn của quá trình n/c

thống kê, gồm: (1) Điều tra thống kê; (2) Tổng hợp thống kê; và, (3) Phân tích và dự

đoán thống kê Nôi dung trọng tâm là tổng hợp thống kê Hai nội dung kia học viên tự

n/c trong giáo trình

6.1 Tổng hợp thống kê

Nội dung của mục này, gồm: (i) Khái niệm và nhiệm vụ của tổng hợp thống kê;

(ii) Các phương pháp tổng hợp thống kê

a Khái niệm và nhiệm vụ của tổng hợp thống kê

♦ Khái niệm: là tiến hành tập trung, chỉnh lý, hệ thống hóa 1 cách khoa học các tài

liệu ban đầu thu thập được trong điều tra thống kê

♦ Nhiệm vụ của tổng hợp thống kê, gồm: (i) Chuyển từ các đặc trưng cá biệt của

từng đơn vị thành đặc trưng chung của tổng thể; (ii) Tính toán được các chỉ tiêu phản ánh quy mô của tổng thể và của từng bộ phận, cơ cấu của tổng thể, mức bq của tổng thể

và của từng bộ phận

b Phương pháp tổng hợp thống kê

Trang 8

Sử dụng 3 phương pháp là: (i) Bảng thống kê; (ii) Đồ thị thống kê; và, (3i) Phân

tổ thống kê Trọng tâm là phương pháp phân tổ thống kê Hai phương pháp kia học

viên tự n/c trong giáo trình

(1) Phân tổ thống kê (slide 16-20)

♦ Khái niệm, ý nghĩa và nhiệm vụ của phân tổ thống kê

- Khái niệm: phân tổ thống kê là căn cứ vào một hay một số tiêu thức nào đó để

tiến hành phân chia các đơn vị của hiện tượng n/c thành các tổ có tính chất khác nhau

- Ý nghĩa của phân tổ thống kê: (i) Là phương pháp cơ bản để tổng hợp thống kê;

(ii) Là cơ sở dữ liệu để tính toán các chỉ tiêu phục vụ cho phân tích thống kê

- Nhiệm vụ của phân tổ thống kê, gồm: (i) Phân chia các loại hình KT-

XH; (ii) Nghiên cứu cơ cấu (hay kết cấu) của tổng thể; và, (3i) Nghiên cứu mối liên hệ

giữa các tiêu thức (Xem ví dụ gt tr 48-50)

♦ Các loại phân tổ thống kê, gồm: (i) Phân tổ theo một tiêu thức; và, (ii) Phân tổ

theo nhiều tiêu thức (Xem ví dụ gt tr 50-55)

♦ Quy trình phân tổ thống kê, gồm các bước sau:

Bước 1- Xác định tiêu thức phân tổ

- Tiêu thức phân tổ: là tiêu thức mà căn cứ vào đó để tiến hành phân chia các đơn

vị của hiện tượng n/c thành các tổ có tính chất khác nhau

- Nguyên tắc lựa chọn tiêu thức phân tổ, cần tuân thủ 3 nguyên tắc: (i) Phải dựa

trên cở sở phân tích lý luận để tìm ra các tiêu thức bản chất nhất phù hợp với mục đích n/c; (ii) Phải căn cứ vào điều kiện lịch sử cụ thể cuả hiện tượng n/c để chọn ra tiêu thức phân tổ thích hợp; và, (3i) Phải căn cứ vào mục đích n/c và điều kiện tài liệu thực tế để chọn tiêu thức phân tổ

Bước 2- Xác định số tổ cần thiết và khoảng cách tổ

Vấn đề này phụ thuộc vào tiêu thức phân tổ là thuộc tính hay số lượng

(*) Khi phân tổ theo tiêu thức thuộc tính

Với tiêu thức này, số tổ được hình thành không phải do lượng biến của tiêu thức quyết đinh mà do sự khác nhau về loại hình, hay các biểu hiện khác nhau của tiêu thức

Trang 9

- Nếu các loại hình hay các biểu hiện của tiêu thức không nhiều thì thường là cứ mỗi loại hình hay mỗi biểu hiện của tiêu thức là cơ sở để hình thành 1 tổ, ví dụ: phân tổ dân số theo giới tính (hình thành 2 tổ nam và nữ); phân tổ các DN theo loại hình DN (hình thành 6 tổ: DNNN, DNTN, CTTNHH, CTCP, HTX, DNCVĐTNN); phân tổ các ngành xản xuất theo khu vực kinh tế (hình thành 3 tổ: khu vực kinh tế nhà nước; khu vực kinh tế ngoài nhà nước; và, khu vực có vốn đầu tư nước ngoài);…

- Trường hợp có nhiều loại hình khác nhau thì cần gộp một số loại hình gần giống nhau thành 1 tổ, ví dụ: phân tổ các ngành kinh tế Việt Nam thành 21 ngành cấp 1, 88 ngành cấp 2,…; 21 ngành cấp 1 lại gộp thành 3 nhóm ngành (N-L-TS, CN&XD, DV)

(*) Khi phân tổ theo tiêu thức số lượng

Với tiêu thức này việc phân tổ được tiến hành theo nhiều cách khác nhau:

- Phân tổ không có khoảng cách tổ, áp dụng cho trường hợp lượng biến rời rạc (số

các lượng biến của tiêu thức không nhiều), ví dụ: phân tổ công nhân cơ khí theo bậc thợ (hình thành 7 tổ); phân tổ hộ gia đình của một địa phương theo quy mô số người trong hộ;…

- Phân tổ có khoảng cách tổ, áp dụng cho trường hợp lượng biến liên tục (số các

lượng biến của tiêu thức rất lớn) mỗi tổ sẽ bao gồm một phạm vi lượng biến (có tính chất

giống nhau hoặc gần giống nhau) gồm 2 giới hạn (giới hạn dưới: là lượng biến nhỏ nhất của tổ; và, giới hạn trên: là lượng biến lớn nhất của tổ, vượt quá giới hạn này chất của tổ

sẽ thay đổi và chuyển sang tố khác) Cần phân biệt 3 trường hợp:

+ Nếu lượng biến tiêu thức biến thiên tương đối đồng đều thì phân tổ có khoảng cách tổ bằng nhau Trị số khoảng cách tổ (h) được xác định theo công thức: h = (xmax –

xmin)/n Với xmax là lượng biến lớn nhất; xmin là lượng biến nhỏ nhất; n là số tổ dự kiến

phân (Xem ví dụ gt tr 57)

+ Nếu lượng biến tiêu thức biến thiên không đều thì phải phân tổ có khoảng cách

tổ không bằng nhau (Xem vd bảng 06, 08, 09 gt tr 51, 54 và 55)

+ Nếu lượng biến tiêu thức quá trễ về 1 phía hoặc cả 2 phía thì phải phân tổ có

khoảng cách tổ mở (có thể mở 1 phía hoặc cả 2 phía) (Xem ví dụ gt các bảng 06, 08, 09,

10 tr 51, 54, 55 và 59)

Trang 10

Bước 3- Sắp xếp các đơn vị vào từng tổ

Sau khi đã xác định được số tổ cần thiết và khoảng cách tổ, công việc

cuối cùng của phân tổ thống kê là sắp xếp các đơn vị vào từng tổ Công việc này được tiến hành dựa vào lượng biến của từng đơn vị, vào số tổ và khoảng cách tổ vừa xác định ở trên Số lượng các đơn vị được sắp xếp vào từng tổ là cơ sở để tính toán các chỉ tiêu giải thích

♦ Dãy số phân phối

- Khái niệm: là sản phẩm của phân tổ thống kê Mỗi dãy số phân phối đều gồm 2

thành phần chủ yếu là lượng biến của tiêu thức n/c (ký hiệu xi) và tần số của từng tổ (ký hiệu fi) (Xem ví dụ bảng 10 gt tr 59-60)

- Tác dụng của dãy số phân phối: (i) Cho biết tình hình phân phối các đơn vị của

hiện tượng n/c vào các tổ theo tiêu thức n/c; và, (ii) Là cơ sở để tính toán các chỉ tiêu phục vụ cho phân tích và dự đoán thống kê

- Các loại dãy số phân phối, gồm: (i) Dãy số thuộc tính (sản phẩm của phân tổ

theo tiêu thức thuộc tính); và, (ii) Dãy số lượng biến (sản phẩm của phân tổ theo tiêu thức số lượng)

Các anh/chị học viên thân mến, nội dung của bài 1 đến đây là hết Cám ơn sự chú

ý theo dõi của các anh/chị

Chúc Anh/Chị học tập tốt!

Trang 11

BÀI 2: NGHIÊN CỨU THỐNG KÊ CÁC MỨC ĐỘ CỦA

HIỆN TƯỢNG KINH TẾ - XÃ HỘI

Mục tiêu:

Trang bị cho người học kiến thức về:

1 Các chỉ tiêu (hay các loại số) đo quy mô, mức độ, cường độ của hiện tượng KT-XH

2 Các chỉ tiêu (hay các loại số) đo độ hội tụ của phân phối

3 Các chỉ tiêu đo độ phân tán của phân phối

Nội dung:

1 CÁC CHỈ TIÊU (HAY CÁC LOẠI SỐ) ĐO QUY MÔ, MỨC ĐỘ, CƯỜNG

ĐỘ CỦA HIỆN TƯỢNG KT-XH

Nội dung mục này giới thiệu pp tính và sử dụng 2 loại số là số tuyệt đối và số

tương đối

1.1- Số tuyệt đối trong thống kê (slide 4 & 5)

a Khái niệm, ý nghĩa, đặc điểm, đơn vị tính số tuyệt đối

- Khái niệm: là chỉ tiêu biểu hiện quy mô, khối lượng của hiện tượng KT-XH (Xem ví dụ gt tr 64)

- Ý nghĩa của số tuyệt đối: (i) Cho ta biết được quy mô, khối lượng của hiện

tượng n/c; (ii) Được sử dụng để lập KH và kiểm tra tình hình THKH của

các chỉ tiêu kinh tế; (3i) Là cơ sở để tính ra các số tương đối, số bq phục vụ cho

phân tích thống kê

- Đặc điểm của số tuyệt đối: (i) Là sản phẩm của điều tra và tổng hợp

thống kê; (ii) Luôn gắn với 1 nội dung KT-XH cụ thể (Xem vd gt tr 65)

- Đơn vị tính của số tuyệt đối: là đơn vị của hiện tượng n/c

b Các loại số tuyệt đối, gồm: số tuyệt đối thời kỳ và thời điểm

♦ Số tuyệt đối thời kỳ: phản ánh quy mô, khối lượng của hiện tượng trong 1

khoảng thời gian nhất định Do vậy, ta có thể cộng số tuyệt đối thời kỳ của cùng 1 hiện tượng trong những khoảng thời gian kế tiếp nhau để phản ánh quy mô, khối lượng của nó

trong 1 khoảng thời gian dài hơn (Xem ví dụ gt tr 65)

Trang 12

♦ Số tuyệt đối thời điểm: phản ánh quy mô, khối lượng của hiện tượng n/c tại 1

thời điểm nhất định Qua thời điểm đó quy mô, khối lượng của hiện tượng đã thay đổi Vì

thế, không thể cộng các số tuyệt đối thời điểm của cùng 1 hiện tượng với nhau (Xem ví

dụ gt tr 66)

1.2- Số tương đối trong thống kê (slide 6-8)

a Khái niệm, ý nghĩa, đặc điểm và đơn vị tính số tượng đối

- Khái niệm: số tương đối trong thống kê phản ánh quan hệ so sánh giữa hai chỉ

tiêu thống kê cùng loại nhưng khác nhau về thời gian và không gian,

hoặc giữa hai chỉ tiêu khác nhau nhưng có quan hệ với nhau

- Ý nghĩa của số tương đối: (i) Dùng để đánh giá sự biến động của hiện tượng

theo thời gian; (ii) Dùng để phản ánh những đặc điểm về kết cấu, quan hệ tỷ lệ, trình độ phát triển, trình độ phổ biến của hiện tượng n/c; (3i) Sử dụng để công bố trên các phương tiện thông tin đại chúng khi cần giữ bí mật về số tuyệt đối; (4i) Dùng để so sánh các hiện tượng không cùng quy mô; (5i) Dùng để lập KH và kiểm tra tình hình THKH của hiện tượng n/c

- Đặc điểm của số tương đối: (i) Là sản phẩm tính toán từ các số tuyệt đối; (ii)

Muốn tính được các số tương đối cần phải có gốc so sánh

- Đơn vị tính của số tương đối: là số lần, số % hoặc các đơn vị kép

b Các loại số tương đối và phương pháp tính, gồm 5 loại là: Số tương đối động

thái, KH, kết cấu, không gian và cường độ

♦ Số tương đối động thái (t Đ ): là sự so sánh mức độ của h/tượng ở kỳ b/cáo (y1) với mức độ ở k/gốc so sánh (y0): tĐ = [y 1 /y 0].100 (3.1) ( vd tr 68)

♦ Số tương đối KH: dùng để lập KH và kiểm tra tình hình THKH của hiện tượng

n/c Số tương đối KH bao gồm: (i) Số tương đối nhiệm vụ KH; và, (ii) Số tương đối THKH

- Số tương đối nhiệm vụ KH (t kh ) dùng để lập KH phát triển về hiện tượng n/c,

công thức tính: t kh = [y k /y 0].100 (3.2) (Xem vd gt tr 69-70)

- Số tương đối THKH (t th ) dùng để kiểm tra tình hình THKH về hiện tượng n/c: tth

= [y 1 /y k].100 (3.3) (Xem vd gt tr 69-70)

Trang 13

Chú ý: (i) Tích của tkh tth = tĐ (3.4) (Xem ví dụ trang 69-70); (ii) Đối với các hiện tượng KH dự kiến tăng là tốt (doanh thu, lợi nhuận, NSLĐ,…) thì tth ≥ 100 là hoàn thành và hoàn thành vượt mức KH, còn nếu ngược lại là hụt KH; (3i) Đối với các chỉ tiêu KH dự kiến giảm là tốt (giá thành đơn vị SP, thời gian hao phí để SX 1 đơn vị SP,…) thì tth ≤ 100 là hoàn thành và hoàn thành vượt mức KH, còn nếu ngược lại là hụt KH

♦ Số tương đối kết cấu (t kc ) phản ánh cơ cấu (hay tỷ trọng) của từng bộ phận (yi) chiếmtrong tổng thể (∑yi) Công thức tính như sau:

t kc = [y i /∑y i].100 (3.5) (Xem ví dụ gt tr 70)

♦ Số tương đối không gian (hay số tương đối so sánh) (t ss ) phản ánh quan hệ so

sánh giữa: (i) Mức độ của 2 hiện tượng cùng loại hình (yA, yB); (ii) Hoặc so sánh mức

độ của 2 bộ phận thuộc cùng một tổng thể (yi, yj) ở 2 không gian khác nhau Được tính theo công thức:

- Trường hợp thứ nhất: t ss = [y A /y B ].100 (3.6a)

- Trường hợp thứ hai: t ss = [y i /y j].100 (3.6b) (Xem vd gt tr 71)

♦ Số tương đối cường độ (t cđ ) phản ánh quan hệ so sánh giữa mức độ của 2 hiện

tượng khác nhau (yi , yp) nhưng có quan hệ với nhau

t cđ = [y i /y p].100 (3.7) (Xem ví dụ gt tr 72)

2 CÁC CHỈ TIÊU ĐO ĐỘ HỘI TỤ CỦA PHÂN PHỐI

Nội dung mục này giới thiệu pp tính và sử dụng 3 chỉ tiêu đo độ hội tụ của phân

phối, đó là: (1) Số bq; (2) Số trung vị; và, (3) Số mốt

2.1 Số bq (hay số trung bình) trong thống kê

a Khái niệm: số bq trong thống kê phản ánh mức độ đại biểu của hiện tượng n/c

theo 1 tiêu thức nào đó (vd: TNBQ 1 lao động, giá bán BQ 1 SP,…)

b Các loại số bq

Trong n/c KT-XH người ta phân biệt 3 loại số bq, đó là: (i) BQ cộng; (ii) BQ điều hòa; và, (3i) BQ nhân

♦ Số bq cộng (x) (slide 11-12): là số bq của tổng các lượng biến của tiêu thức n/c

của các đơn vị tổng thể Có 2 trường hợp tính bq cộng

Trang 14

- BQ cộng giản đơn: ( i 1 , n )

n

x

x   i  (3.8) (Xem ví dụ gt tr 76-77)

(Giải thích các thông số trong công thức)

- BQ cộng gia quyền, gồm các trường hợp tính toán như sau:

(i) Trường hợp phân tổ không có khoảng cách tổ:

)n,1i(f

fxx

(ii) Trường hợp quyền số là số tương đối kết cấu (fi’= fi/∑fi ), khi đó bq

cộng gia quyền được tính theo công thức:

f

fx

x ( i  1 , n ) (3.10)

Với xilà bq cộng của 2 lượng biến ở tổ i (Xem vd gt tr 80-82)

(4i) Trường hợp phân tổ có khoảng cách tổ mở, bq cộng gia quyền vẫn được tính

theo công thức (3.10) Chỉ khác ở chỗ, khi tình số bq tổ ở tồ có khoảng cách tổ mở thì

giới hạn còn thiếu được suy ra từ khoảng cách của tổ liền kề (Xem ví dụ gt tr 82-84)

♦ Số bq điều hòa (slide 13-14): là một dạng đặc biết của số bq cộng, được tính

toán trong trường hợp biết lượng biến (xi) và tổng lượng biến của tiêu thức n/c ở từng tổ

(Mi = xi.fi), nhưng chưa biết được tần số của từng tổ (fi) Cần phân biệt 2 trường hợp tính

bq điều hòa:

- BQ đ/hòa gia quyền: x =

i i i

x M

M

(3.11) Với Mi - quyền số (vd tr 85-86)

- BQ điều hòa giản đơn: ( i 1 , n )

x 1

n x

Trang 15

trường hợp các lượng biến có quan hệ tích số với nhau Tương tự như các số bq

đã n/c, bình quân nhân cũng có 2 trường hợp tính toán:

- BQ nhân giản đơn: x n 1 x (i 2,n)

n

2 i

f i

♦ Trường hợp dãy số lượng biến không có khoảng cách tổ

- Nếu số lượng biến của dãy số là lẻ (n = 2m + 1= ∑fi) thì Me = lượng biến xiđứng ở vị trí chính giữa trong dãy số Tức lượng biến đứng ở vị trí thứ

Bước 1- Tìm tổ chứa Me (dựa vào khái niệm Me);

Bước 2- Tìm giá trị gần đúng của Me theo công thức:

Me

1 Me Me

min Me e

f

S2

fh

xM

Trang 16

♦ Trường hợp dãy số phân phối không có khoảng cách tổ thì M0 được xác định dựa vào khái niệm: M0 = xi có fi max (3.19) (Xem ví dụ gt tr 92)

♦ Trường hợp dãy số phân phối có khoảng cách tổ bằng nhau, trình tự tìm M0được tiến hành theo 2 bước như sau:

Bước 1- Tìm tổ chứa M0 (dựa vào khái niệm M0);

Bước 2- Tìm giá trị gần đúng của M0 theo công thức:

2 Mo 1

Mo 1 Mo min Mo 0

f f 2 f

f f h x

(Giải thích các thông số trong công thức)

♦ Trường hợp dãy số phân phối có khoảng cách tổ không bằng nhau,

M0 vẫn đươc tính theo công thức (3.20) nhưng thay vì dùng fi, ta sử dụng mật độ phân phối di’ (di’ = fi/hi)

, 2 , 0 M , 1

, 0 M , 1 Mo min Mo 0

d d d

d d h

♦ Tr/hợp dãy số phân phối chuẩn, thì: M0 = M e & = số bq cộng (3.22)

c Tác dụng của mốt, gồm: (i) Giúp tính nhanh số bq đối với dãy số phân phối

chuẩn; (ii) Mốt được sử dụng rất rộng rãi trong SX các SP SX hàng loạt có nhiều kích cỡ khác nhau (như quần áo, giầy dép, các SP đóng chai, đóng túi, )

d Ưu điểm của mốt, thể hiện ở chỗ: (i) Không chịu ảnh hưởng bởi những lượng

biến đột xuất; (ii) Có thể tính được cho cả dãy số lượng biến và dãy số thuộc tính

e Hạn chế của mốt, thể hiện ở chỗ: (i) Kém nhạy bén với sự biến thiên

của tiêu thức, nó chỉ quan tâm tới lượng biến lớn nhất; (ii) Đối với dãy số phân phối theo hình sin có thể xác định được nhiều số mốt, điều đó gây bất lợi cho việc sử dụng mốt trong phân tích thống kê

3 CÁC CHỈ TIÊU ĐO ĐỘ PHÂN TÁN CỦA PHÂN PHỐI

Mục này giới thiệu phương pháp tính và sử dụng 5 chỉ tiêu đo độ phân tán của phân phối, đó là: (1) Khoảng biến thiên; (2) Độ lệch tuyệt đối trung bình; (3) Phương

sai; (4) Độ lệch tiêu chuẩn; và, (5) Hệ số biến thiên

3.1 Khoảng biến thiên (hay toàn cự) (R) (slide 23)

Trang 17

Là biên độ giao động giữa lượng biến lớn nhất và lượng biến nhỏ nhất

trong dãy số: R = xmax – xmin (3.23)

Ưu điểm của khoảng biến thiên là tính toán đơn giản Song nhược điểm của nó là chỉ quan tâm đến lượng biến ở hai đầu mút, bỏ qua các lượng biến trung tâm nên khó có được nhận xét nhuẩn xác

3.2 Độ lệch tuyệt đối bq (d ) (slide 24)

Là bq cộng của trị tuyệt đối các độ lệch giữa lượng biến với số bq cộng của các lượng biến của dãy số Công thức tính như sau:

- Trường hợp không có quyền số: (i 1,n)

n

|xx

|d

3.3 Phương sai ( 2) (slide 25)

Là bq cộng của tổng bình phương các độ lệch giữa lượng biến với số bq cộng của các lượng biến của dãy số, công thức tính như sau:

- Trường hợp không có quyền số: ( i 1 , n )

n

) x x ( i 2

i i 2 i

  (3.25b)

- Hoặc tính nhanh theo công thức: 2 = x2 -  x 2 (3.25c)

Do lấy bình phương các độ lệch nên phương sai đã khắc phục được hạn chế của độ lệch tuyệt đối bq Song cũng do chính việc lấy bình phương các độ lệch nên đã làm cho đơn vị tính của chỉ tiêu không phù hợp với thực tế

3.4 Độ lệch tiêu chuẩn () (slide 26)

Là căn bậc hai của phương sai Công thức tính như sau:

- Công thức tổng quát:  2 (3.26a)

Trang 18

- Trường hợp không có quyền số:

2 i

n

)xx(

f

f)xx(

(3.26c)

Độ lệch tiêu chuẩn là chỉ tiêu hoàn thiện nhất trong số các chỉ tiêu đo độ phân tán của dãy số

Bốn chỉ tiêu trên được sử dụng để đo độ phân tán của từng dãy số lượng biến Để

đo độ phân tán giữa các dãy số khác nhau cần sử dụng chỉ tiêu hệ số biến thiên

3.5 Hệ số biến thiên (V) (slide 27)

Là số tương đối phản ánh quan hệ so sánh giữa độ lệch tuyệt đối bq (hoặc độ lệch tiêu chuẩn) với số bq cộng của các lượng biến của dãy số Chỉ tiêu được tính theo công thức:

Các anh/chị học viên thân mến, nội dung của bài 2 đến đây là hết Cám ơn sự chú

ý theo dõi của các anh/chị

Chúc Anh/Chị học tập tốt!

Trang 19

BÀI 3: ĐIỀU TRA CHỌN MẪU

Mục tiêu:

Trang bị cho người học kiến thức về:

1 Khái niệm chung về điều tra chọn mẫu

2 Những vấn đề cơ bản trong điều tra chọn mẫu

Nội dung:

1 KHÁI NIỆM CHUNG VỀ ĐTCM

Mục này gồm các nội dung: (i) Khái niệm về đtcm; (ii) Ưu, nhươc điểm của

đtcm; (3i) Phạm vi áp dụng đtcm; và, (4i) Các pp tổ chức chọn mẫu

1.1 Khái niệm về đtcm (slide 4) Là một loại điều tra không toàn bộ, trong đó

người ta chỉ chọn ra một số đơn vị đủ lớn trong toàn bộ số đơn vị của hiện tượng n/c để tiến hành điều tra thực tế, rồi từ kết quả điều tra được trên một số đơn vị này tiến hành tính toán suy rộng cho toàn bộ hiện tượng n/c

1.2 Ưu, nhược điểm của đtcm (slide 5)

♦ So với đttb, đtcm có một số ưu điểm nổi trội như: (i) Tiết kiệm được thời gian

và nhân, tài, vật lực; (ii) Công việc chuẩn bị được t/hành nhanh gọn hơn nên đtcm được t/hành nhanh hơn nhiều so với đttb và có tính kip thời cao; (3i) Có thể tuyển chọn được những người có k/nghiệm và có tr/độ, tài liệu thu thập được có độ ch/xác cao, có thể hạn chế sai số do đăng ký đến mức thấp nhất; (4i) Cho phép mở rộng n/dung đ/tra, đi sâu n/c nhiều mặt của h/tượng

♦ Tuy nhiên, đtcm cũng có một số mặt hạn chế, không thể thay thế được

hoàn toàn cho đttb, biểu hiện: (i) Trong đttb, người ta thu thập thông tin trên từng đơn vị

của hiện tượng, nên có thể tiến hành n/c hiện tượng và các bộ phận của nó theo tất cả các khía cạnh cần n/c; (ii) Kết quả suy rộng từ tài liệu đtcm bao giờ cũng có sai số do tính chất đại biểu mà sai số này không có trong đttb

1.3 Các trường hợp áp dụng đtcm (slide 6) Do những ưu điểm nổi trội của

đtcm nên nó có phạm vi áp dụng khá rộng rãi, cụ thể: (i) Khi hiện tượng n/c vừa cho phép đttb, vừa cho phép đtcm thì người ta thường chọn đtcm vì những ưu điểm của nó; (ii) Đối với các hiện tượng không cho phép đttb, chẳng hạn như các cuộc kiểm tra chất

Trang 20

lượng liên quan đến phá hủy SP thì phải dùng đtcm; (3i) Dùng để phục vụ tổng hợp nhanh tài liệu trong đttb và bổ sung cho kết quả của đttb; (4i) đtcm có thể ứng dụng rộng rãi trong các lĩnh vực n/c KT-XH như: điều tra mức sống dân cư; điều tra nhu cầu tiêu dùng SP hàng hóa…

1.4 Các pp tổ chức chọn mẫu (slide 7) Có hai pp tiến hành chọn n đơn vị của

ttm từ N đơn vị thuộc ttc là chọn ngẫu nhiên và chọn phi ngẫu nhiên

a Chọn mẫu ngẫu nhiên (hay chọn xác suất) Theo pp này thì các đơn vị được

chọn ra để điều tra đều đã biết xác suất Có 5 pp c/m ngẫu nhiên thường được sử dụng là: (i) c/m ngẫu nhiên đơn giản; (ii) c/m ngẫu nhiên hệ thống (hay chọn máy móc); (3i) c/m phân tổ (hay chọn phân loại); (4i) c/m cả khối (hay mẫu chùm); và, (5i) c/m nhiều cấp

(hay chọn phân tầng)

b Chọn mẫu phi ngẫu nhiên (hay c/m phi xác suất) Bài 3 chỉ đề cập đến pp

c/m ngẫu nhiên

2 NHỮNG VẤN ĐỀ CƠ BẢN TRONG ĐIỀU TRA CHỌN MẪU

Mục này gồm các nội dung: (i) ttc và ttm; (ii) Các pp (hay các cách) chọn số đơn

vị mẫu điều tra; (3i) Sai số trong đtcm; (4i) Các nhân tố tác động đến sai số chọn mẫu; (5i) Các biện pháp giảm sai số trong đtcm; (6i) Các cách xác định sai số chọn mẫu; (7i)

Suy rộng kết quả đtcm; và, (8i) Xác định cỡ mẫu (hay kích thước mẫu)

2.1 TỔNG THỂ CHUNG VÀ TỔNG THỂ MẪU (slide 9 & 10)

a Tổng thể chung (N), là tổng thể bao gồm tất cả các đơn vị của hiện

tượng n/c Việc xác định đúng và đủ số đơn vị của ttc có ý nghĩa rất quan trọng, nếu xác

định sai sẽ dẫn đến các kết quả tính toán từ mẫu bị chệch

b Tổng thể mẫu (n), là tổng thể gồm n đơn vị được chọn ngẫu nhiên từ N đơn vị

của ttc để tiến hành điều tra Các đơn vị được chọn ra phải đủ lớn và đảm bảo tính đại biểu

c Các tham số của ttc và ttm (slide 9-10)

♦ Khi n/c chỉ tiêu trung bình:

Trang 21

Số trung bình

)N,1i(N

)X( i 2

1n

)xx(S

2 i

Phương sai б 2 = P(1 – P) S 2 = f(1 – f)

2.2 CÁC PHƯƠNG PHÁP (HAY CÁC CÁCH) CHỌN SỐ ĐƠN VỊ MẪU ĐIỀU TRA (slide 11), gồm có: (i) Chọn mẫu với xác suất đều và không

đều; và, (ii) Chọn lặp và không lặp

a Chọn mẫu với xác suất đều và không đều

♦ Chọn mẫu với xác suất đều: theo pp này, mỗi đơn vị thuộc ttc đều có

cơ hội được chọn vào mẫu như nhau

♦ Chọn mẫu với xác suất không đều: pp này không cần đảm bảo khả

năng được chọn vào mẫu của mỗi đơn vị là phải bằng nhau mà sẽ ấn định riêng cho từng đơn vị (còn gọi là xác suất bao hàm, có vai trò làm trọng số) Nếu xác suất bao hàm tỷ lệ với kích thước nào đó của đơn vị điều tra thì gọi là c/m theo tỷ lệ kích thước PP này thích hợp cho trường hợp các đơn vị của ttc chênh lệch nhiều về quy mô

b Chọn lặp và không lặp

♦ Chọn không lặp (hay chọn một lần): theo cách chọn này, mỗi đơn vị được chọn

ra để điều tra sẽ không được trả về ttc, số đơn vị của ttc sẽ giảm dần trong quá trình c/m

Với cách chọn này thì số lượng mẫu (k) có thể được thiết lập từ N đơn vị của ttc là: k =

n

N

C =

! n )!

Trang 22

♦ Chọn lặp (hay chọn nhiều lần): theo cách chọn này, mỗi đơn vị được chọn ra từ

ttc để điều tra sau đó sẽ trả lại ttc, số đơn vị của ttc sẽ không thay đổi trong suốt quá trình

c/m Với cách chọn này số lượng mẫu (k) có thể được thiết lập từ N đơn vị của ttc là: k =

Nn (7.2)

Như vậy, với cả 2 cách chọn ngẫu nhiên n đơn vị của ttm thì số lượng mẫu có thể được thiết lập từ N đơn vị của ttc là rất lớn Mẫu được chọn ra để điều tra chỉ là một trong

số rất lớn mẫu có thể được thiết lập nói trên

2.3 SAI SỐ TRONG ĐIỀU TRA CHỌN MẪU (slide 12)

a Khái niệm: là sự chênh lệch giữa mức độ được tính ra từ ttm và mức độ tương

ứng từ ttc, tức là chênh lệch giữa (x  ) và giữa (f – p)

b Các loại sai số trong đtcm: trong bất cứ một cuộc đtcm nào cũng phát sinh 2

loại sai số là sscm và sai số phi c/m

♦ Sai số phi c/m: là sai số xẩy ra do không hiểu đúng nội dung điều tra,

do cân đong đo đếm sai, hoặc do ghi chép phiếu điều tra không chính xác,…Loại sai số này có thể xẩy ra ở bất kỳ một cuộc điều tra thống kê nào

♦ Sai số c/m (sscm): là sai số do việc c/m gây ra, làm cho mẫu điều tra không đại

biểu cho ttc Nguyên do là chỉ tiến hành điều tra trên một số lượng (đủ lớn) các đơn vị được rút ra từ ttc, nên dù ttm có được chọn ngẫu nhiên đến mấy thì nó cũng không thể trở thành bức tranh hoàn hảo phản ánh đầy đủ các khía cạnh của ttc Loại sai số này chỉ xẩy

ra trong đtcm, có 2 loại sscm là: (i) Sai số hệ thống; và, (ii) Sai số ngẫu nhiên

2.4 CÁC NHÂN TỐ TÁC ĐỘNG ĐẾN SSCM (slide 13) Mặc dù sscm là

không thể tránh khỏi, song nếu biết các nhân tố gây ra sai số thì ta có thể khống chế sai số này trong giới hạn cho phép Các nhân tố chủ yếu gây ra sscm, gồm có: (i) Quy mô của ttm, số đơn vị của ttm càng lớn thì tính chất đại biểu của mẫu càng cao; (ii) Độ đồng đều của các đơn vị tổng thể, được đo bằng phương sai của tiêu thức n/c, nếu phương sai càng nhỏ thì sscm càng nhỏ, và ngược lại; (iii) pp tổ chức c/m, pp tổ chức c/m kh/nhau sẽ cho sscm kh/nhau

2.5 CÁC BIỆN PHÁP GIẢM SAI SỐ TRONG ĐTCM (slide 14), gồm có:

a Biện pháp giảm sai số phi chọn mẫu là làm tốt công tác chuẩn bị

Trang 23

b Biện pháp giảm sscm, là: (i) Tăng kích thước mẫu; và, (ii) Sử dụng phương

đơn vị của ttc (như đã đề cập ở trên) ta có thể thiết lập được một số lượng lớn mẫu, giá trị

của từng tham số tính toán trên tất cả các mẫu sẽ là một biến ngẫu nhiên, độ lệch chuẩn

)

( của từng phân phối ngẫu nhiên này phản ánh chênh lệch trung bình của từng tham số tính ra từ tất cả các mẫu so với tham số tương ứng của ttc Chênh lệch trung bình đó được gọi là ssbqcm và được tính tương ứng với từng nhiệm vụ ước lượng Mục đích của đtcm

là để ước lượng hai tham số của ttc là số bq hoặc tỷ lệ, do vậy:

- ssbqcm khi suy rộng số bq được tính dựa vào độ lệch tiêu chuẩn của số bq tất cả các mẫu so với số bq của ttc, ký hiệu là ;

x

- Và, ssbqcm khi suy rộng tỷ lệ được tính dựa vào độ lệch tiêu chuẩn của tỷ lệ tất

cả các mẫu so với tỷ lệ của ttc, ký hiệu là f;

Với các pp tổ chức c/m kh/nhau ta có các công thức tính ssbqcm kh/nhau

♦ Đối với phương pháp chọn ngẫu nhiên đơn thuần: với pp chọn mẫu này, ta có

bảng công thức tính ssbqcm cho từng nhiệm vụ ước lượng và theo từng cách chọn như

sau (slide 17):

- Khi ước lượng số

n1(

) N

n 1 (

S2

Trang 24

- Khi ước lượng tỷ

)p1(p

)1(

n1)(

p1(p

) N

n 1 )(

f 1 (

♦ Đối với pp chọn máy móc (hay chọn ngẫu nhiên hệ thống): ssbqcm của pp này

cũng được tính như công thức của trường hợp chọn ngẫu nhiên đơn

thuần Song để ý rằng, chọn máy móc là cách chọn không lặp nên chỉ áp dụng

công thức cho cách chọn không lặp theo từng nhiệm vụ ước lượng

♦ Đối với pp chọn phân loại (hay phân tầng): với pp c/m này, ta chỉ n/c cho

trường hợp phổ biến nhất là chọn phân loại (hay phân tầng) theo tỷ lệ Công thức tính ssbqcm cho từng nhiệm vụ ước lượng và theo từng cách chọn cũng tương tự như với với

pp chọn ngẫu nhiên đơn giản, chỉ khác ở chỗ khi ước lượng số bq thì dùng bq các ph/sai

tổ ( i2) để thay cho ph/sai của ttc (2)

♦ Đối với pp chọn cả khối (slide 19): ssbqcm của pp này tính cho cách chọn lặp

và không lặp theo từng nhiệm vụ ước lượng, như sau:

- Khi suy rộng (hay ước

2 x x

1R

rRr

2 x x

- Khi suy rộng(hay ước

2 f f

rRr

2 f f

Trong slide 19: 2x - Phương sai các số bình quân khối; 2

Trang 25

là ta đưa ra một xác suất của việc suy rộng tài liệu (P) để tham số của ttc cần ước lượng chênh lệch trong một phạm vi nhất định so với tham số tương ứng đã tính được trên ttm Phạm vi này được gọi là phạm vi sscm hay độ chính xác của suy rộng tài liệu đtcm (ký hiệu là ) Xác suất tin cậy suy rộng tài liệu đtcm được tính như sau:

▪ - ssbqcm (được tính theo các công thức ở các slide trước)

▪ Nếu nhiệm vụ của ước lượng là ước lượng số bq của ttc thì ta có:

2.7 SUY RỘNG KẾT QUẢ ĐTCM (slide 22) Do mục đích của đtcm là tìm

hiểu các tham số của ttc Vì thế, sau khi đã tính toán được các tham số trên ttm, ta tiến

Trang 26

hành suy rộng trị số của các tham số tương ứng trên ttc Trình tự tiến hành suy rộng số bq

và tỷ lệ của ttc đều tương tự nhau

Để ý rằng, phạm vi sscm () thường đi liền với xác suất tin cậy của phép

ước lượng (P) Nghĩa là khi suy rộng kết quả đtcm ta phải chấp nhận một sai số nhất định Sai số này phản ánh xác suất mà tham số của ttc không nằm trong khoảng ước lượng Gọi sai số này là , do đó xác suất tin cậy của phép ước lượng sẽ là P = (1 - )

a Trường hợp ước lượng số bq của ttc, xác suất tin cậy của phép ước lượng này

là: P(|x  | X z X) = (1 - ) (7.8) Khi biết α ta xác địng được P tìm được z

tìm được x, do đó công thức ước lượng số bq của ttc sẽ là: xx xx (7.9)

(Xem vd 7.3 gt tr 205)

b Trường hợp ước lượng tỷ lệ của ttc, xác suất tin cậy của phép ước lượng này

là: P(|pf | f  z f) = (1 - ) (7.10) Khi biết α ta tìm được P tìm được z tìm được f , do đó công thức ước lượng tỷ lệ của ttc sẽ là:

f – εf ≤ P ≤ f + εf (7.11) (Xem vd 7.4 gt tr 205-206)

Như vậy, để giải bài toán suy rộng tài liệu đtcm phải cho trước sai số của phép ước lượng () , tức cho trước xác suất (hay độ tin cậy) suy rộng tài liệu (P)

2.8 XÁC ĐỊNH CỠ MẪU (slide 23-24) Xác định cỡ mẫu hay số đơn vị của ttm

là bài toán thứ ba cần phải giải quyết trong n/c đtcm Với quy mô về số lượng các đơn

vị của ttc (N) đã được xác định, cỡ mẫu (n) phụ thuộc vào: (i) Độ tin cậy của phép ước

lượng, tức phụ thuộc vào xác suất suy rộng tài liệu đtcm (P) Xác suất tin cậy càng gần 1 thì cỡ mẫu càng lớn; (ii) Mức độ biến thiên của tiêu thức n/c, tức phụ thuộc vào phương sai của ttc (2) Tiêu thức n/c biến thiên càng lớn thì sẽ làm tăng cỡ mẫu; (3i) Phạm vi sscm () Phạm vi sscm càng nhỏ thì ttm càng “đồng dạng phối cảnh” với ttc, khoảng giá trị ước lượng càng nhỏ, cỡ mẫu do đó sẽ phải tăng, và ngược lại

Vấn đề là ở chỗ phải xác định được một cỡ mẫu hợp lý để vừa tiết kiệm

được các nguồn lực cho điều tra, vừa lợi dụng được các mặt ưu điểm của đtcm, đồng thời vẫn có đủ thông tin về hiện tượng n/c phục vụ cho quản lý và điều

hành Công thức xác định cỡ mẫu theo từng nhiệm vụ ước lượng và theo từng

Trang 27

cách chọn như sau (slide 68):

- Khi suy rộng số bình quân

2 X

2 2

z n

N z

N z

n 2

X 2 2

2 2

2

)p1(pzn

N)p1(Pz

N)p1(pz

f 2

Lưu ý: Trong các công thức tính cỡ mẫu ở trên thường chưa biết trước phương sai

và tỷ lệ của ttc, hướng giải quyết như sau:

- Nếu như trước đây đã tiến hành một số cuộc đtcm đối với hiện tượng này thì chọn lần nào có phương sai lớn nhất và có tỷ lệ gần 0,5 nhất chọn như vậy sẽ làm tăng tình đại diện của ttm

- Nếu đây là lần đầu tiên tiến hành đtcm thì có thể tiến hành điều tra thử ở phạm vi hẹp để có tài liệu tính phương sai và tỷ lệ, hoặc có thể dùng phương sai và tỷ lệ của nơi khác có đặc điểm và điều kiện tương tự

- Khi suy rộng số bq, nếu lượng biến của tiêu thức n/c phân phối chuẩn thì có thể

ước lượng độ lệch tiêu chuẩn theo công thức:

tính ra phương sai của ttc (Xem vd 7.6 tr 208-211)

Các anh/chị học viên thân mến, nội dung của bài 3 đến đây là hết Cám ơn sự chú

ý theo dõi của các anh/chị

Chúc Anh/Chị học tập tốt!

Trang 29

BÀI 4: PHÂN TÍCH HỒI QUY VÀ TƯƠNG QUAN

Mục tiêu:

Trang bị cho người học các kiến thức về:

1 Liên hệ tương quan, quy trình giải bài toán phân tích hồi quy và tương quan

2 Liên hệ tương quan tuyến tính giữa hai tiêu thức số lượng (liên hệ tương quan và tuyến tính đơn)

Nội dung:

1 LHTQ, QUY TRÌNH GIẢI BÀI TOÁN PHÂN TÍCH HQ&TQ

Mục này gồm các nội dung: (i) Liên hệ hàm số và LHTQ; và (ii) Quy trình giải

bài toán phân tích HQ&TQ

- MLH giữa các hiện tượng KT-XH không hoàn toàn chặt chẽ như các hiện tượng trong tự nhiên, đơn cử như MLH giữa tuổi nghề và NSLĐ, giữa TN

và tiêu dùng Trong các liên hệ trên, khi hiện tượng này thay đổi thì có thể làm cho hiện tượng có liên quan thay đổi theo, nhưng không có ảnh hưởng hoàn toàn quyết định và

không theo một tỷ lệ nhất định

Mặt khác, MLH giữa các hiện tượng trên không thể hiện rõ trên từng đơn vị mà

phải thông qua quan sát 1 số lớn các đơn vị MLH này được gọi là LHTQ

1.2 Quy trình giải bài toán phân tích HQ&TQ

Phân tích hồi quy liên quan đến việc xây dựng 1 dạng hàm số để biểu diễn MLH

TQ giữa 1 biến phụ thuộc [ký hiệu Y] và 1 hoặc 1 số biến độc lập [ký hiệu Xi] Các biến

Trang 30

độc lập Xi được chọn là các biến có ảnh hưởng đáng kể đến biến phụ thuộc Y Điều này

có nghĩa là, để thuận tiện cho việc n/c MLH TQ giữa các Xi và Y, chúng ta đã chuyển MLH không hoàn toàn chặt chẽ giữa các Xi và Y thành MLH hoàn toàn chặt chẽ giữa chúng Quy trình giải 1 bài toán phân tích HQ&TQ được tiến hành theo các bước sau:

Bước 1, Xác định b/chất của MLH Đây là nhiệm vụ quan trọng đầu tiên của

ph/tích hồi quy Muốn vậy, phải tiến hành ph/tích (cả về mặt lý luận và th/tiễn) để tìm hiểu xem giữa các Xi và Y có thật sự tồn tại MLH TQ hay không

Bước 2, Thăm dò dạng hàm của MLH bằng pp đơn giản là sử dụng đồ thị

Bước 3, Xác định phương trình hồi quy phản ánh MLH TQ giữa các Xi và Y Ở

bước này, dựa vào kết quả thăm dò bằng đồ thị ở bước 2, nếu các chấm trên đồ thị tương thích với dạng hàm sơ cấp nào thì ta sẽ quyết định xây dựng phương trình hồi quy phản ánh MLH TQ giữa các Xi và Y theo dạng hàm đó

Bước 4, Ước lượng các tham số của phương trình hồi quy và giải thích ý nghĩa của

từng tham số

Bước 5, Đánh giá m/độ ch/chẽ của MLH (hay k/định sự ph/hợp của MH), thông

qua sử dụng các tham số: hệ số xác định hay hệ số TQ hoặc tỷ số TQ

2 LIÊN HỆ TQTT GIỮA HAI TIÊU THỨC SỐ LƯỢNG

Mục này gồm các nội dung: (i) Mô hình HQTT đơn; và, (ii) Đánh giá mức độ

chặt chẽ của MLH

2.1 Mô hình HQTT đơn (slide 7-13)

Ví dụ 4.1, gt tr106 - Có tài liệu về SL và NL tiêu hao của 10 DN cùng SX một loại

Ngày đăng: 02/06/2024, 21:46

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w