Phân loại các số liệu (biến số) trong nghiên cứu

Một phần của tài liệu Luận văn: Phân tích dự báo sản lượng chè xuất khẩu tỉnh Thái Nguyên (Trang 33)

4. Cách tiếp cân, phương pháp nghiên cứu, phạm vi nghiên cứu

1.6.2. Phân loại các số liệu (biến số) trong nghiên cứu

Có 2 loại biến số chính trong hầu hết các nghiên cứu đó là biến số định tính và biến số định lượng.

- Biến định tính: là loại biến số phản ảnh tính chất, sự hơn kém. Có thể biểu diễn dưới dạng định danh (ví dụ: nam/nữ) hay thứ bậc (tốt/khá/trung bình/yếu)…Đối với loại biến số này ta không tính được giá trị trung bình của số liệu.

- Biến định lượng: Thường được biểu diễn bằng các con số. Các con số này có thể ở dưới dạng biến thiên liên tục (ví dụ: huyết áp của bệnh nhân theo thời gian) hoặc rời rạc (ví dụ: chiều cao, cân nặng của người bệnh lúc vào viện). Dạng biến này cho phép chúng ta tính được giá trị trung bình của biến. Cần lưu ý là tất cả các biến định lượng đều phải có đơn vị tính (mmHg, mmol/L, mg%, Kg…)

Chương 2.

PHÂN TÍCH THIẾT KẾ HỆ THỐNG PHÂN TÍCH VÀ DỰ BÁO KINH TẾ 2.1. Xử lý dữ liệu

2.1.1. Nguyên nhân dữ liệu cần tiền xử lý

 Dữ liệu không hoàn chỉnh có thể xảy ra vì một số nguyên nhân:

Một vài thuộc tính quan trọng không được cung cấp. Ví dụ: thông tin khách hàng đối với giao dịch bán hàng vì lý do cá nhân có thể khách hàng không muốn cung cấp thông tin của họ, hay thuộc tính mã số bằng lái xe đối với người không có bằng lái xe họ không thể cung cấp thông tin được yêu cầu…

Một số dữ liệu không được chọn lựa đơn giản bởi vì nó không được xem làm quan trọng tại thời điểm nhập dữ liệu. Hay nói cách khác việc xem xét dữ liệu tại thời điểm nhập dữ liệu và thời điểm phân tích là khác nhau. Vấn đề con người/ phần mềm/ phần cứng.

Dữ liệu không nhất quán với những dữ liệu đã được lưu trước đó có thể bị xóa dẫn đến việc mất mát dữ liệu.

 Dữ liệu nhiễu có thể xảy ra vì một số nguyên nhân:  Công cụ lựa chọn dữ liệu được sử dụng bị lỗi.  Lỗi do con người hay máy tính lúc ghi chép dữ liệu.  Lỗi trong quá trình truyền tải dữ liệu.

 Giới hạn về công nghệ như là kích thước buffer bị giới hạn trong quá trình truyền, nhận dữ liệu…

 Dữ liệu không chính xác cũng có thể là do không nhất quán trong việc đặt tên, định dạng dữ liệu.

 Dữ liệu không nhất quán có thể là do:

 Dữ liệu được tập hợp từ nhiều nguồn khác nhau.

 Vài thuộc tính được biểu diễn bằng những tên khác nhau trong cơ sở dữ liệu. Ví dụ: thuộc tính customer indentification có thể là customer_id trong cơ sở dữ liệu này nhưng là cust_id trong cơ sở dữ liệu khác.

2.1.2. Tầm quan trọng của việc tiền xử lý dữ liệu

 Quá trình làm sạch dữ liệu sẽ lắp đầy những giá trị bị thiếu, làm mịn các dữ liệu nhiễu, xác định và xóa bỏ những dữ liệu sai miền giá trị, và giải quyết vấn đề không nhất quán.

 Nếu người dùng cho rằng dữ liệu là dơ thì họ sẽ không tin tưởng vào bất kỳ kết quả khai thác nào từ dữ liệu đó.

 Ngoài ra, dữ liệu dơ có thể là nguyên nhân gây ra sự lộn xộn trong quá trình khai thác, cho ra kết quả không đáng tin. Việc có một số lượng lớn dữ liệu dư thừa có thể làm giảm tốc độ và làm hỗn loạn quá trình tìm kiếm tri thức.  Rõ ràng, việc thêm vào quá trình làm sạch dữ liệu giúp chúng ta tránh những

dữ liệu dư thừa không cần thiết trong quá trình phân tích dữ liệu.

 Làm sạch dữ liệu là một bước quan trọng trong quá trình tìm kiếm tri thức vì dữ liệu không có chất lượng thì kết quả khai thác cũng không có chất lượng. Những quyết định có chất lượng phải dựa trên dữ liệu có chất lượng.

 Quá trình làm giàu dữ liệu, làm sạch dữ liệu và mã hóa dữ liệu có vai trò quan trọng trong việc xây dựng data warehouse.

2.1.3. Nhiệm vụ chính trong quá trình tiền xử lý dữ liệu

 Làm sạch dữ liệu (Data cleaning): Thêm vào những giá trị bị thiếu, làm mịn dữ liệu, nhận biết hoặc xóa những dữ liệu sai miền giá trị và giải quyết sự không nhất quán.

 Tích hợp dữ liệu (Data integration): Kết hợp nhiều cơ sở dữ liệu, khối dữ liệu hoặc từ nhiều file.

 Chuyển hóa dữ liệu (Data transformation): Chuẩn hóa và kết hợp dữ liệu.  Thu gọn dữ liệu (Data reduction): Giảm bớt kích thước dữ liệu nhưng vẫn

cho ra kết quả phân tích tương tự. Một dạng của thu gọn dữ liệu là rời rạc hóa dữ liệu (Data discretization), rất có ích cho việc phát sinh tự động khái niệm hệ thống thứ bậc từ dữ liệu số.

Hình 2.1. Những nhiệm vụ chính trong quá trình tiền xử lý dữ liệu

2.2. Phân tích thiết kế hệ thống phân tích dữ liệu và dự báo kinh tế2.2.1. Biểu đồ phân cấp chức năng 2.2.1. Biểu đồ phân cấp chức năng

2.2.2. Biểu đồ luồng dữ liệu

2.2.2.1. Biểu đồ luồng dữ liệu mức khung cảnh

Hình 2.3. Biểu đồ luồng dữ liệu mức khung cảnh

2.2.2.2. Biểu đồ luồng dữ liệu mức đỉnh

Hình 2.4. Biểu đồ luồng dữ liệu mức đỉnh

Phân tích dự báo sản lượng chè xuất khẩu tỉnh Thái Nguyên Chuyên viên

dự báo

Ban lãnh đ oạ

Dữ liệu cần dự báo

Dữ liệu đã kiểm tra đánh giá

Biểu đồ báo cáo

Thông tin kết quả dự báo

Phương pháp dự báo lựa chọn Bảng đánh giá các chỉ số dự báo

Xử lý dữ liệu

Phân tích dự báo

Thống kê báo cáo Chuyên viên

dự báo

Ban lãnh đạo Dữ liệu cần dự báo

Dữ liệu đã kiểm tra đánh giá

Phương pháp dự báo lựa chọn Thông tin kết quả dự báo

Bảng kết quả chỉ số dự báo

Biểu đồ báo cáo

Bảng đánh giá các chỉ số

Dữ liệu dự báo

Dữ liệu đã được kiểm tra

Phương pháp dự báo được lựa chọn

2.2.2.3. Biểu đồ luồng dữ liệu mức dưới đỉnh chức năng Xử lý dữ liệu

Hình 2.5. Biểu đồ luồng dữ liệu mức dưới đỉnh chức năng xử lý dữ liệu

2.2.2.3. Biểu đồ luồng dữ liệu mức dưới đỉnh chức năng Phân tích dự báo

Chương 3.

PHÂN TÍCH DỰ BÁO SẢN LƯỢNG CHÈ XUẤT KHẨU TỈNH THÁI NGUYÊN

3.1. Đặt vấn đề

Bài toán phân tích và dự báo là một bài toán có ý nghĩa quan trọng trong việc hỗ trợ các nhà quản lý đưa ra quyết định đúng đắn dựa vào các dữ liệu đã thu thập được. Khi tiến hành dự báo cần căn cứ vào việc thu thập, xử lý số liệu trong quá khứ và hiện tại để xác định xu hướng vận động của các hiện tượng trong tương lai nhờ vào một số mô hình toán học.

Trên thế giới đã có nhiều tác giả đưa ra cách phân loại các phương pháp dự báo khác nhau. Tuy nhiên, theo Gordon trong hai thập kỷ gần đây, có 08 phương pháp dự báo được áp dụng rộng rãi trên thế giới như: Tiên đoán, ngoại suy xu hướng, dự báo tổng hợp,….

Hiện nay, ở Việt Nam có rất nhiều đơn vị tham gia công tác phân tích dữ liệu và dự báo phục vụ việc lập và triển khai các kế hoạch phát triển kinh tế xã hội như: Bộ Kế hoạch và Đầu tư, Trung tâm Thông tin và Dự báo Kinh tế Xã hội Quốc gia, Viện Chiến lược phát triển, Tổng cục Thống kê và Vụ Tổng hợp kinh tế quốc dân,… Bên cạnh đó, bài toán phân tích và dự báo đã được một số nhà quản lý, chuyên gia kinh tế nghiên cứu và đề xuất một số giải pháp ứng dụng vào một số lĩnh vực cụ thể: Phân tích và dự báo tình hình tài chính, tiền tệ, hoạch định và điều hành chính sách tài chính, xây dựng mô hình dự báo chỉ số thống kê xã hội chủ yếu, dự báo biến động giá chứng khoán, dự báo sự tác động của vốn đầu tư từ nước ngoài, dự báo giá một số mặt hàng tư liệu sản xuất. Tuy nhiên, những nghiên cứu này chưa tập trung nhiều vào việc dự báo sản lượng cho một số cây công nghiệp nhằm có được những biện pháp phát triển đem lại hiệu quả kinh tế cao.

Trong các cây công nghiệp trên địa bàn Trung du và miền núi phía Bắc nói chung và Thái Nguyên nói riêng, chè là cây công nghiệp quan trọng trong phát triển kinh tế, xã hội của khu vực. Trước yêu cầu phát triển kinh tế, đặc biệt là trong quá trình hội nhập kinh tế quốc tế hiện nay, để tồn tại và phát triển vững chắc ngành chè phải có những giải pháp mới phù hợp để có thể phát triển sản lượng và chất lượng chè. Một trong những công việc cấp thiết của các giải pháp là việc phân tích đánh giá và dự báo sản lượng chè xuất khẩu trong những năm tiếp theo ở tỉnh Thái Nguyên.

Qua quá trình thu thập và tiền xử lý dữ liệu từ 2 nguồn chủ yếu là:Dữ liệu từ Cục thống kê và Dữ liệu thu thập từ báo cáo của ngành chè Tỉnh Thái Nguyên. Yêu cầu đặt ra là phân tích đánh giá và dự báo sản lượng chè xuất khẩu trong những năm tiếp theo ở tỉnh Thái Nguyên.

3.2. Giải quyết bài toán

Bước 1. Thu thập và tổ chức dữ liệu

Dựa vào Số liệu được trích dẫn từ Niên giám thống kê Việt Nam năm 2008 của tổng cục thống kê Việt Nam; Niên giám thống kê Tỉnh Thái Nguyên 2011 của Cục thống kê tỉnh Thái Nguyên; Niên giám thống kê Tỉnh Thái Nguyên 2012 của Cục thống kê tỉnh Thái Nguyên; Báo cáo tình hình sản xuất, chế biến, tiêu thụ, xuất khẩu chè tỉnh Thái Nguyên giai đoạn 2000 – 2013. Nhóm tác giả đã tiến hành thu thập được sản lượng chè các loại xuất khẩu tỉnh Thái Nguyên qua các năm qua bảng số liệu sau:

Bảng 3.1. Bảng số liệu thống kê sản lượng chè

Thời gian Sản lượng (Đơn vị 1000 tấn) 2008 5.054 2009 6.165 2010 6.438 2011 6.926 2012 7.468 2013 7.754

Dữ liệu sau khi được thu thập sẽ được tiến hành nhập vào chương trình qua 3 phương pháp:

 Tải dữ liệu trực tiếp từ các tệp tin excel, XML…

 Tải dữ liệu trực tiếp từ hệ quản trị cơ sở dữ liệu SQL Server  Nhập trực tiếp vào chương trình

Bước 2. Lựa chọn phương pháp

Dựa vào bảng số liệu đầu vào, hệ thống sẽ tiến hành phân tích và thể hiện dữ liệu ở dạng biểu đồ để thế hiện tính xu hướng của dữ liệu

Hình 3.1. Biểu đồ thể hiện xu hướng của dữ liệu

Với bộ dữ liệu thu thập được về sản lượng chè Tỉnh Thái Nguyên từ năm 2008 đến năm 2013 và dựa vào biểu đồ thể hiện xu hướng của dữ liệu(hình 3.8), cho thấy sản lượng chè đều có xu hướng tăng với một tỉ lệ tương đối ổn định. Do đó, với bộ dữ liệu trên chúng ta có thể áp dụng một số phương pháp phân tích và dự báo phổ biến và phù hợp hiện nay như: Phương pháp trung bình động, phương pháp san bằng mũ, phương pháp hồi quy tuyến tính…

Bước 3. Áp dụng phương pháp dự báo

+ Phương pháp dự báo hồi quy tuyến tính

Hình 3.3. Kết quả dự báo phương pháp hồi quy tuyến tính + Phương pháp trung bình động

Hình 3.4. Kết quả dự báo phương pháp trung bình động + Phương pháp holt – winter

Bước 4. Thống kê báo cáo

Hệ thống hỗ trợ chức năng xuất thống kê báo cáo tổng hợp. Báo cáo sẽ tiến hành so sánh các phương pháp dự báo đối với cùng một bộ dữ liệu. Thông qua các chỉ tiêu đánh giá phân tích dự báo chuyên viên dự báo sẽ biết được phương pháp dự báo nào là phù hợp nhất cho bộ dữ liệu hiện tại. Bên cạnh đó, báo cáo được xuất ra tệp excel để tiện cho ban lãnh đạo theo dõi từ đó hỗ trợ việc ra quyết định.

Hình 3.6. Thống kê báo cáo

3.2.2.3. Kiến nghị giải pháp phát triển sản lượng chè xuất khẩu Tỉnh Thái Nguyên

a. Giải pháp phát triển sản lượng chè xuất khẩu Tỉnh Thái Nguyên + Giải pháp về mở rộng và nâng cao sản lượng chè

 Hoàn thiện công tác quy hoạch.

 Giải pháp về vốn đầu tư: Ngành chè Thái Nguyên cần thu hút vốn từ các nguồn như: vốn đầu tư từ ngân sách nhà nước, vốn đầu tư theo kế hoạch của Tỉnh, Vốn ADB và tín dụng ngân hàng cho dự án phát triển chè…

 Nhân và đưa nhanh các giống có năng suất cao, chất lượng tốt vào các vườn chè.  Tăng đầu tư cho công tác đào tạo cán bộ kỹ thuật, tập huấn khuyến nông cho

người trồng chè: Ngành chè Thái Nguyên cần tổ chức đào tạo và đào tạo lại đội ngũ cán bộ kỹ thuật tại cơ sở. Do hiện tại lực lượng cáh bộ kỹ thuật còn thiếu, trình độ còn yếu kém tay nghề chưa cao, ngành chè Thái Nguyên cần đưa ra những biện pháp đào tạo hợp lý.

sản lượng chè: Chè có khâu trồng, chăm sóc, chế biến chè đều có vấn đề trong đảm bảo quy trình kỹ thuật. Kiên quyết uốn nắn theo quy trình, phát hiện được kịp thời các khuyết tật và sự cố xẩy ra.

 Nghiên cứu và ứng dụng các quy trình, tiến bộ khoa học công nghệ vào nâng cao sản lượng chè.

 Nâng cao chất lượng sản phẩm chè, xây dựng hệ thống quản lý, kiểm tra giám sát, đánh giá chất lượng và sản lượng chè.

 Củng cố phát triển trị trường cũ, tìm kiếm thị trường đầu ra hướng tới ổn định thị trường tiêu thụ.

 Xây dựng thương hiệu cho ngành chè Thái Nguyên

 Tăng cường hoạt động thông tin thị trường và xúc tiến thương mại để tiêu thụ sản phẩm chè.

+ Giải pháp về chủ trương, chính sách của Đảng và Nhà nước phát triển sản lượng chè xuất khẩu Tỉnh Thái Nguyên

 Hoàn thiện cơ cấu tổ chức và quản lý ngành chè ở Tỉnh Thái Nguyên: Cơ cấu tổ chức là một nhân tố quan trọng góp phần khảng định hiệu quả sản xuất kinh doanh của một đơn vị kinh tế. Bởi vậy xét cho cùng thì việc tổ chức quản lý các yếu tố sản xuất chính là việc tổ chức quản lý con người. Do đó, hoàn thiện và đổi mới cơ cấu tổ chức quản lý luôn là vấn đề cần thiết hàng đầu đặt ra với ngành chè Thái Nguyên. Công tác tổ chức sẽ đưa tới hiệu quả sản xuất kinh doanh cao, tạo uy tín trên thị trường là cơ sở mở rộng phát triển sản lượng chè.

 Hoàn thiện chính sách phát triển sản lượng xuất khẩu chè: Để tạo điều kiện cho việc phát triển sản lượng chè thuận lợi thì việc hoàn thiện chính sách phát triển ngành chè là cần thiết. Cùng với chính sách, Tỉnh cần phải thực hiện các chính sách hỗ trợ cho sự phát triển xuất khẩu chè của Tỉnh.

b. Kiến nghị

 Tăng cường sự hợp tác đồng bộ giữa các bên liên quan, phối hợp giữa các cơ quan quản lý nhà nước, các trường đại học cao đẳng, doanh nghiệp, người trồng, chế biến chè.

 Ủy ban nhân dân tỉnh sớm hoàn thành việc giao đất và cấp giấy chứng nhận quyền sử dụng đất cho các hộ nông dân trồng chè yên tâm đầu tư mở rộng sản xuất. Đồng thời tăng cường hệ thống tín dụng nông thôn để tạo điều kiện thuận lợi cho các hộ nông dân vay vốn phát triển sản xuất.

 Cần ban hành quy định hạn chế việc sử dụng nguồn thuốc trừ sâu, khuyến khích các hình thức bảo vệ sinh học giúp hạn chế chi phí vật chất, giảm nhẹ

ô nhiễm môi trường. Đảm bảo sức khỏe cho người lao động, đồng thời nâng cao chất lượng sản phẩm.

 Tổ chức lễ hội chè hàng năm vừa phát triển văn hóa chè, vừa quảng bá sản phẩm chè Thái Nguyên

KẾT LUẬN

Đề tài nghiên cứu phân tích chuỗi tuần tự theo thời gian và dự báo sản lượng chè xuất khẩu tỉnh Thái Nguyên là một đề tài mang không chỉ ý nghĩa về khoa học,

Một phần của tài liệu Luận văn: Phân tích dự báo sản lượng chè xuất khẩu tỉnh Thái Nguyên (Trang 33)

Tải bản đầy đủ (DOCX)

(49 trang)
w