1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Giáo trình phân tích số liệu thống kê phần 2

81 3 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 81
Dung lượng 1,47 MB

Nội dung

C hương II CƠSỞDÌÌÍLIỆU Cơ sở liệu mẫu thơng tin dạng điện tị, bao gồm nhiều tệp liệu khác Cơ sở liệu có ửiể tìiể duới dạng bảng số liệu gồm nhiều hàng cột khác dịng thể tiêu cột thể cho quan sát, ví dụ hộ hay doanh nghiệp Mỗi ô ừong bảng thể giá trị cụ thể Có nhiều phần mềm cho phép xây dựng quản lý sở liệu, như: phần mềm MS ACCESS, EXCEL hay LOTUS Các ửiông tm sở ỉiệu phải thể dạng số phép xử lý tốn học tiến hành thơng tin ỉượng hố, thơng tin mặt định tính phải mã hoá ừarớc tiến hành phép xử lý ửiống kê Tất cà thơng tin định tính mã hố ttong q ừình thu thập hay vào số liệu sở liệu phải ghi lại đ ể n h nhầm ỉẫn íT o n g tìn h x l ý tín h tốn sau Một ví dụ sở liệu bao gồm nhiều thông tin nhiều mẫu quản ỉý chung ữong tệp tin Như ví 73 dụ này, số liệu hộ thể trang cùa sách, ừang thông tin hộ khác theo ứật tự hộ '.Ngudti.Wc’ciia %ờ ■*ỉ^kí)ồạt đ ộ r i ậ n g l ụ ệ j » if f , iU ■r a ,O aếb iố i/d ự jrự - ’ ^ ịJ ệ íÌ ầ í^ :ĩ-H w * Ẹ aq u ý ếtđịnh.niụ cq ích thái,độ m - ' 'ỳ- ■■'■■- ^ ÍTặứi tóáii ữỉu nỊĩạp cua hộ, cung cấ^ịi ittợ ^ tìiục, ,inự^' uống, tíiứi u ^gs& ; klioe ■ Hình 2.1: MƠ PHỎNG MỘT sở DỮ LIỆU Một ví dụ sở liệu trình bày dạng bảng dịng thể cho hộ (mẫu) điều tra cột thể cho tiêu điều tra (một thơng tin), vậy, ừong trưịfng hợp số lượng mẫu điều tra định đến số lượng hàng cần phải có sở liệu, 74 số lượng tiêu cần điều tra định số lượng cột ữong sở liệu Chúng ta thay đổi theo hàng tiêu thông tin thu thập theo cột mẫu điều tra tuỳ ửieo yêu cầu cách phù hợp cho ta Thông tin xác định 1.0001 Tên người hỏi Quàng V Liên Khổng M Ngụ Nguyễn V A 1.0002 Huyện Mai Son Mai Son Mai Son 1.0003 Tên xã Mường Bon Hát Lót Hát Lót 1.0004 Tên Bản Un Bắc Quang Bắc Quang 1.0005 Dân tộc Thái Kinh Kinh 1.0006 Ngày phòng vấn 25.05.06 25.05.06 26.05.06 1.0007 Hộ số 2.1001 Số nhân hộ 2.1002 Số trẻ em 15 tuổi 2.1003 Chủ hộ (Nam =1; Nữ = 2) 1 2.1004 Tuổi chủ hộ 50 48 40 Quá trinh quản lý nhập số liệu vào máy tính bao gồm hai cơng đoạn: 75 (1) Chuẩn bị sở liệu Là việc chuẩn bị cấu trúc sở liệu theo trật tự định cho việc quản lý thông tm khoa học đảm bảo việc kết xuất liệu sang phần mềm tính tốn khác có khả thi Thơng thường, phải dựa vào kết cấu phiếu điều tra, số lượng mẫu, số lượng chi tiêu chi tiếí ữong phiếu điều ừa để có kết cấu sở liệu phù hợp Trong việc chuẩn bị cấu trúc sở liệu ừong vấn đề quan trọng cần phải lưu tâm từ đầu hệ thống mã hố thơng tin liên quan Các phần mềm tính tốn thơng thường xử lý thông tin định tính (cho câu hỏi mở), vậy, việc phải chuyển thơng tin dạng sang dạng định lượng điều cần thiết để làm điều này, cần phải xây dựng hệ thống mã hố cho tìmg câu hỏi ý ữả lịd (2) Kết chuyển liệu tìr sở liệu sang phần mềm xử ỉýViệc xử !ý thông tin điều tra thường bàng phần mềm thống kê phần mềm SPSS Stata, bên cạnh sử dụng cơng cụ ừong Excel Lotus để tính tốn thơng tin cần thiết cho nghiên cửi Việc kếí chuyển làm trực tiếp bàng số câu lệnh phân mềm đối VỚI SPSS sừ dụng phần mềm cho phéo chuyển định dạng củạ file liệu sang dạng thích hợp cho phẩn mềm xử lý thống kê nhu phần mềm Stat Transfer 76 2.ỉ Các dạng sở liệu Định dạng sở liệu liên quan mật thiết đến hình thức /ào số liệu sở liệu đó, nhiên có dạng định lạng chính: Cơ sờ liệu dạng bảng tính Excel Lotus: dạng thông dụng hay nhà nghiên cứu ứng dụng để quản lý thông tin Tuy nhiên, hạn chế định dạng sở liệu ta phải thực việc truy nhập liệu cách thủ cơng nhiều thời gian khả để xảy nhầm lẫn cao hay nói cách khác nguy tiềm ẩn sai số phi thống kê cao Bảng tính Excel chương trình quản lý sở liệu khác (MS Access) đêu thích hợp cho việc vào số liệu từ phiếu điều ừa cho phép kết chuyển số liệu sang phần mềm xử lý khác có SPSS hay Stata Một số lợi bảng tính Excel chươne ừình sẵn có tất máy ĩính điện tử, địi hỏi hiểu b i ế i íơi t h i ể u , c ó th ể TÍnh ío n tr ự c t iế p ĩ i g a y b ả n g tín h Nhưng bên cạnh tồn bất lợi việc sử dụng bảng íính Excel, là: {]) hạn chế lệnh tính tốn phức tạp (địi hỏi phải vào cáu lệnh thường xuvên băng tay); (2) Khơng thích hợp việc tạo hàng loạt báo cáo cho mẫu 77 Hình 2.2: sơ Đ ổ CÁC PHƯƠNG THỨC NHẬP TIN VÀO MÁY TÍNH Cơ sở liệu định dạng lật hay nói cách khác một vài thông tin thiết kế thành trang, vậy, phải sử dụng nhiều ữang khác sách Đối với định dạng kiểu chủng ta sử dụng vài chương trình để nhập thơng tin với máy Scanner, liệu phiếu điều ữa phải thể theo quy định định để máy đọc Với hình thức sở liệu phù hợp cho trường hợp điều tra lớn, người ta xây dựng riêng cơng cụ để điều tra phần mềm riêng cho việc nhập xử lý liệu (Hình 2 ) 2.2 Biểu diễn thông tin thống kê C tf s liệu Các liệu thống kê đo đạc dạng chữ, dạng thứ tự dạng số liên tục ta quy dạng chung định tính định lượng 78 2.2.1 D ữ liệu dạng định tính Là loại thông tin dạng giá trị số mà thông tin thể phù hợp với hạng loại đó, ví dụ lủiư giới nơi sinh Những thơng tm dạng gọi số liệu dạng, loại Vì dụ: Các câu hỏi cho ta thu thơng tin định tính sau: Giới người trao cho cơng việc là; (Khoanh trịn vào mục phù hợp) Nam Nữ 2 Mô tả loại ung thư phổi (khoanh tròn mục phủ hợp) Khối nhỏ Khối lớn Dạng sợi Như vậy, câu hỏi phân loại câu trả lời Các câu ừả lời tên loại phân, số liệu thể câu trả lời thuộc tính khơng có giá trị thực Khi mà thơng tin định tính có lựa chọn câu hỏi giới nam nữ gọi dạng phân đơi Cịn có nhiều lựa chọn dạng câu hỏi gọi phân loại Các ứiơng túi định túủi cịn thể dạng theo thứ tự Nếu ứiứ tự tìiuộc từủi tồn bên trone 79 thông tin loại ứù gọi có chứa đựng xếp ứieo ứiứ tự chứig ta có tìiể minh hoạ qua ví dụ sau; Câu hỏi: Mức độ học vấn mà anh qua? (lựa chọn một) Chưa hồn thành chương trình tiểu học Hồn thành chương frinh cấp I chưa xong THCS2 Hết THCS chưa xong THPT Hết THPT không tiếp tục học đại học Câu hỏi: Mức độ thường xuyên anh cảm thấy căng thẳng tháng qua? (lựa chọn một) Luôn Thi thoảng Rất thường xuyên Không Thường xuyên Việc biểu diễn số liệu dạng định tính thể hai dạng chính: chữ, thường sử dụng có nhiều điểm hạn chế khó có khả tính tốn, dùng cơng cụ thống kê SPSS hay Stata để tính tốn Ví dụ: Khi hỏi chất lượng nguồn nước sinh hoạt thu thông tin kết sau: - Nước - Nước bình thường - Nước bẩn 80 Dạng thứ hai thể tìiơng tin theo mã số tự quy định, dạng chứng ta dễ dàng tính tốn sử dụng công cụ thống kê chuyên dừig hay bảng tính Thơng thường, thơng tin định tứứi chiing ta thu thập để ứánh nhầm lẫn q trình ghi chép khơng nhớ mã ký hiệu mà đặt nên quy định ghi đầy đủ, sau kiểm tra lại mói chuyển sang mã số tương ứng, đảm bảo thu thập đầy đủ thơng tin mà mắc lỗi sai sót 2.2.2 D ữ liệu dạng định lượng Dữ liệu dạng định lượng thể dễ dàng ứong sở liệu dạng số Chính q trình xử lý thơng tin khơng cần phải chuyển đổi hay mã hố mà làm ừạrc tiếp Vi dụ: Khi thu thập thơng tin diện tích đất nơng nghiệp hộ thể dạng số hay 100 v.v 2.2.3 Các tiêu nghiên cứu Một tiêu đặc trưng nghiên cứu đo được, chẳng hạn ttọng lượng tiêu chí người cân 55 kg có số trọng lượng tiêu chí Người ta chia tiêu nghiên cứu làm hai nhóm: Chỉ tiêu độc lập tiêu phụ thuộc 81 Chỉ tiêu độc lập hay gọi tiêu giải ứiích hoặi tiêu dự báo tiêu ứiường sử dụn] để giải thích dự báo cho kết đầu ch tiêu phụ thuộc Các tiêu độc lập hay phụ thuộc có ứiể đượi xác định thông qua việc nghiên cứu mục đích nhón mục tiêu nghiên cứu Ví dụ: Mục đích: Tìm hiểu chất lượng sống cho người già thuộc nhóm bệnh khác có tiền sử khác Nhóm mục tiêu: Những người già 65 tuổi có bệnh già khác có tiền sử khác Các tiêu độc lập: Tuổi, đặc trưng bệnh tiền sử trước Chỉ tiêu phụ thuộc: Chất lượng sống 2.3 Mã hố thơng tín sở ỉỉệu Mã hố thơng tin ừong sở liệu vấn đề rấ quan trọng có ảnh hưởng đến việc xử lý tính tốn nhi kết việc tính tốn Có nhiều vấn đề địi hỏi chún; ta phải mã hố thơng tin, tạm thò phân làm loại; - Mã hố cho liệu mang tính định tính, ví dụ nhu đánh giá, tên mẫu v.v - Mã hố cho thơng tin định lượng bị thiếu vưọ trội 82 ầy, chuyển đổi ứiông tin dịch vụ hợp ỉồng thoả tìiuận nhân tố Ví dụ: Trường hợp hệ thống tưới tìêu, nơng dàn ừuyền tải thơng điệp đến người khác, họ có tfiể biết mức nước điểm khác Bản thân nhân tố hỏi để trao đổi dịch vụ địa chi Trong tìixờng hợp ứiể phát ttiển cùa hệ tìiống có tìiể tác động đến cấu trúc chuyên động mạng xã hội Cách tiếp cận tìiứ hai, dựa hiểu biết tíiể hiện, qua xác định nhân tổ nguồn lực tác động qua lại Mỗi nhân tố phát triển sau có hoạt động sở ữình bày cá nhân chúng với nguồn lực Trong hoạt động nhân tố chuyển giao nguồn lực cho nhân tố khác Mơ hình trình bày tương tác điều mà ù-ong kinh tế gọi quan hệ bên Chúng ta quan tâm đến quản lý nguồn tài nguyên tái tạo thơng qua việc kiểm tra q trình ứiể hoạt động có ửiể tác động đến nguồn lực Kết nguồn lực có tìiể tìioả mãn khơng thể ứiồ mãn cho nhân tố, điều có ứiể lĩũnh hoạ sẳp xếp qua môi ừirờng Phương pháp cung cấp sở cho việc áp dụng mơ hình đa nhân tố vào xử lý vấn đề liên quan vấn đề xă hội nguồn lực 139 4.6.3 ng dụng GIS phân tích, nghiên cửu lành tế - xã hội 4.6.3.1 G lS g ì? GIS (Geographic Information System) hệ tíiổng thơng tin địa lý, tạo khác biệt ữong quản lý thông tin so với dạng qxiản lý ứiông tm khác hệ sở liệu, bảng tính chồ cơng cụ xử lý thơng tin khoảng cách GIS có khả tạo chồng ghép ứiông tũi vị trí, kết hợp chúng, phân tích chúng cuối vẽ đồ Do vậy, frong phân tích kinh tế GIS cơng cụ hữu ích cho việc nghiên cứu tầm vĩ mô 4.6.3.2 Khả ứng dụng GIS Ngày nay, GIS khơng chì ứng dụng để xây dựng đồ ữạng sử dụng đất, chất đất, v.v mà cịn ứng dụng nghiên cứu kinh tế - xã hội Thông qua việc kết hợp ứiông tin kmh tế cho phép xây dựng lên đồ sử dụng đất hợp lý mang lại nguồn lợi kinh tế lớn cho khu vực, đồ quan hệ sử dụng đất phát ưiên kinh tế cho khu vực 17 dụ: Bằng việc sừ dụng cơng cụ GIS ứiu thập số liệu theo phương pháp vấn người có hiểu biết khu vực nghiên cứu xây dựng đồ ước lượng thu nhập ứieo hình ứiức sử dụng đất hay tác động việc ứioái hoá đất đến ứiu nhập/đầu neười Mai Sơn, Sơn La 140 Nguồn: Lentes, 2004 141 Đây vài ví dụ rmnh hoạ cho việc ứng dụng công nghệ GIS nghiên cửu kinh tế đất, để có ứiể vận dụng thành cơng phương pháp đòi hỏi người học phải nắm vững kiến thức kinh tế kiến thức GIS 4.6.33 Trình tự bước sử dụng công cụ GIS nghiên cứu Khi ứng dụng công nghệ GIS ữong nghiên cứu vấn đề kinh tế - xã hội thông thường cần phải thực theo nội dimg sau: (1) Xây dựng đồ số hố khu vực nghiên cứu (2) Thú thập thơng, tin kinh tế, xã hội thông tin liên quan đến vấn đề cần nghiên cửu thông qua việc sử dụng phương pháp thu thập thông tin khác như: điều ưa vấn người am hiểu toàn khu vực (được phân bố đều), sử dụng công cụ PRA hay sử dụng bảng câu hỏi điều tra hộ phân bố toàn khu vực Tất thơng tin thu thập cần phải có vị ữí địa lý cụ thể để số hoá đưa vào đồ (3) Số hoá thông tin kinh tế - xã hội thu thập thông qua việc sử dụng phần mềm xử lý đồ Arcview hay Mapinfor v.v (4) Chồng ghép đồ khác để làm rõ vấn đề quan tâm 142 (5) Phân tích đưa kết luận Trong trình tiến hành nội dung frên khơng thiết phải tn tìiủ tíieo trật tự cố định vậy, ví dụ đồng ứiời tiến hành nội diing nội dung lại thay đổi ữật tự tiến hành Đồng thời việc sử dụng cơng cụ GIS địi hỏi người học phải kết hợp với nhiều phương pháp khác thu thập số liệu, kinh tế lượng v.v hay nói cách khác việc vận dụng uyển chuyển nhuần nhuyễn phương pháp ữên trình bày cách đồng thời giúp ích ừong việc phân tích nghiên cứu 143 BÀI TẬP ■ THựC ■ HÀNH Phần giúp cho sinh viên thực hành kỹ lý thuyết

Ngày đăng: 17/06/2023, 09:48

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w