1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu ảnh hưởng của một số yếu tố đến chất lượng khí thải của xe ô tô con phổ biến ở việt nam

101 8 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên Cứu Ảnh Hưởng Của Một Số Yếu Tố Đến Chất Lượng Khí Thải Của Xe Ô Tô Con Phổ Biến Ở Việt Nam
Tác giả Hoàng Anh Tuấn
Người hướng dẫn TS. Nguyễn Văn Tựu
Trường học Trường Đại Học Lâm Nghiệp
Chuyên ngành Kỹ Thuật Cơ Khí
Thể loại luận văn thạc sĩ
Năm xuất bản 2023
Thành phố Hà Nội
Định dạng
Số trang 101
Dung lượng 14,14 MB

Cấu trúc

  • Chương 1. TỔNG QUAN VỀ VẤN ĐỀ NGHIÊN CỨU (11)
    • 1.1. Đặt vấn đề (11)
    • 1.2. Tổng quan vấn đề nghiên cứu trong và ngoài nước (13)
      • 1.2.1. Trên thế giới (13)
      • 1.2.2. Ở Việt Nam (18)
      • 1.2.3. Nhận xét (20)
    • 1.3. Mục tiêu, nội dung và phương pháp nghiên cứu (21)
      • 1.3.1. Mục tiêu nghiên cứu (21)
      • 1.3.2. Nội dung nghiên cứu (21)
      • 1.3.3. Phương pháp nghiên cứu (22)
    • 1.4. Các tiêu chuẩn khí thải xe ô tô (22)
      • 1.4.1. Hệ thống tiêu chuẩn khí thải xe ô tô hạng nhẹ của châu Âu (22)
      • 1.4.2. Hệ thống tiêu chuẩn khí thải của Trung Quốc áp dụng cho hạng nhẹ (30)
      • 1.4.3. Hệ thống tiêu chuẩn khí thải xe ô tô của Việt Nam (34)
      • 1.4.4. Mức giới hạn khí thải của xe ô tô theo TCVN (35)
  • Chương 2. PHÂN TÍCH CÁC TIÊU CHUẨN KHÍ THẢI VÀ MỘT SỐ YẾU TỐ CHÍNH ẢNH HƯỞNG CHẤT LƯỢNG KHÍ THẢI CỦA XE Ô TÔ CON (40)
    • 2.1. Quy trình kiểm tra khí thải xe ô tô theo tiêu chuẩn Việt Nam (40)
    • 2.2. Các yếu tố chính ảnh hưởng đến chất lượng khí thải của xe ô tô (41)
      • 2.2.1. Thu thập số liệu về kiểm định khí thải xe ô tô con tại Việt Nam (42)
      • 2.2.2. Phân bố số liệu kiểm định khí thải xe ô tô con theo khối lượng chuẩn, chỉ số công tơ mét và số năm sử dụng (48)
      • 2.2.3. Ảnh hưởng của chỉ số công tơ mét đến tỷ lệ kiểm định khí thải không đạt (51)
      • 2.2.4. Ảnh hưởng của số năm sử dụng đến tỷ lệ kiểm định khí thải không đạt (53)
      • 2.2.5. Ảnh hưởng của khối lượng chuẩn đến tỷ lệ kiểm định khí thải không đạt (54)
    • 2.3. Kết luận Chương 2 (56)
  • Chương 3. CƠ SỞ LÝ LUẬN VỀ HỌC MÁY VÀ ỨNG DỤNG PYTHON (57)
    • 3.1. Khái quát chung về phương pháp học máy (57)
      • 3.1.1. Khái niệm học máy (57)
      • 3.1.2. Phân loại thuật toán học máy (57)
    • 3.2. Vấn đề liên quan đến dự đoán, phân loại dựa trên học máy (59)
      • 3.2.1. Khái quát về vấn đề dự đoán, phân loại (59)
      • 3.2.2. Tiêu chí đánh giá kết quả dự đoán của vấn đề phân loại (60)
    • 3.3. Các thuật toán học máy thường dùng và cơ sở lý luận (63)
      • 3.3.1. Thuật toán hồi quy logistic (63)
      • 3.3.2. Thuật toán phân tích phân biệt tuyến tính (65)
      • 3.3.3. Thuật toán K-láng giềng gần nhất (K-Nearest Neighbor) (66)
      • 3.3.4. Thuật toán Gaussian Naive Bayes (68)
    • 3.4. Ý nghĩa của việc ứng dụng học máy trong dự đoán nhanh trạng thái khí thải của xe ô tô (69)
    • 3.5. Xây dựng ứng dụng dự đoán nhanh trạng thái khí thải của xe ô tô dựa trên ngôn ngữ lập trình Python (70)
      • 3.5.1. Trình tự thiết kế và lập trình ứng dụng dự đoán nhanh trạng thái khí thải của xe ô tô con (70)
      • 3.5.2. Lập trình xây dựng ứng dụng dự đoán nhanh trạng thái khí thải của xe ô tô con (72)
      • 3.5.3. Kết quả lập trình ứng dụng dự đoán nhanh trạng thái khí thải của xe ô tô con (77)
    • 3.6. Đánh giá và lựa chọn mô hình dự đoán (79)
      • 3.6.1. Tách bộ dữ liệu dự đoán (80)
      • 3.6.2. Đánh giá thuật toán và chọn mô hình dự đoán tối ưu (80)
    • 3.7. Kết luận chương 3 (83)
  • Chương 4. NGHIÊN CỨU THỰC NGHIỆM (84)
    • 4.1. Bố trí thí nghiệm (84)
      • 4.1.1. Chuẩn bị xe thí nghiệm (84)
      • 4.1.2. Thiết bị thí nghiệm (84)
      • 4.1.3. Bố trí thí nghiệm (85)
    • 4.2. Kết quả thí nghiệm và so sánh (86)
      • 4.2.1. Kết quả đo nồng độ khí thải của xe ô tô (86)
      • 4.2.2. So sánh kết quả thí nghiệm với kết quả dự đoán nhanh (88)
    • 4.3. Kết luận chương 4 (91)
  • TÀI LIỆU THAM KHẢO (94)

Nội dung

TỔNG QUAN VỀ VẤN ĐỀ NGHIÊN CỨU

Đặt vấn đề

Ô tô hiện nay là phương tiện giao thông chủ yếu ở các thành phố, mang lại sự thuận tiện cho đời sống và sản xuất, nhưng cũng gây ra ô nhiễm khí thải nghiêm trọng, đặc biệt tại những khu vực đông dân cư như New York, Sao Paulo, New Delhi, Bắc Kinh và TP Hồ Chí Minh Nhiều nghiên cứu đã chỉ ra rằng khí thải từ phương tiện giao thông là nguyên nhân chính gây ô nhiễm không khí đô thị Do đó, việc giảm thiểu ô nhiễm từ khí thải ô tô đang trở thành mối quan tâm lớn của chính phủ nhiều quốc gia, cũng như các nhà khoa học và chuyên gia trong lĩnh vực công nghệ ô tô.

Sự phát triển kinh tế xã hội đã cải thiện đời sống con người, dẫn đến sự gia tăng số lượng ô tô lưu hành toàn cầu, đặc biệt ở các nước phát triển như Hoa Kỳ, Nhật Bản, Hàn Quốc và một số nước đang phát triển ở châu Á như Trung Quốc, Ấn Độ, Việt Nam Đến cuối năm 2020, Hoa Kỳ ghi nhận khoảng 300 triệu ô tô (91 xe/100 người), Nhật Bản có 74 triệu xe (58 xe/100 người), trong khi Trung Quốc đạt 310 triệu xe (22 xe/100 người).

Tính đến tháng 9 năm 2022, Việt Nam có gần 5 triệu xe ô tô đang lưu hành, tương đương khoảng 5 xe/100 người Dự báo số lượng ô tô trên toàn cầu sẽ tiếp tục gia tăng trong tương lai Để giảm thiểu ô nhiễm môi trường do khí thải từ phương tiện giao thông, các nhà khoa học và nhà nghiên cứu đang tập trung vào việc cải tiến công nghệ và kỹ thuật, bao gồm nâng cao hiệu suất động cơ, giảm trọng lượng xe, phát triển động cơ mới và cải thiện chất lượng nhiên liệu Về mặt quản lý, nhiều quốc gia đã thiết lập các tiêu chuẩn khí thải nghiêm ngặt, yêu cầu xe mới phải tuân thủ trước khi được bán ra thị trường và thực hiện kiểm định định kỳ cho xe đang lưu hành Hệ thống tiêu chuẩn khí thải ô tô hiện nay chủ yếu bao gồm bốn hệ thống chính.

Hệ thống tiêu chuẩn khí thải của Mỹ, Châu Âu, Nhật Bản và Trung Quốc được thực hiện theo từng giai đoạn, với mỗi lần nâng cấp tiêu chuẩn sẽ nghiêm ngặt hơn trước Các tiêu chuẩn này quy định giới hạn nồng độ các thành phần khí thải của phương tiện lắp ráp mới và phương tiện đang lưu hành, nhằm kiểm soát và giảm thiểu ô nhiễm môi trường do khí thải giao thông gây ra.

Sự gia tăng ô tô mới đưa vào sử dụng so với số lượng ô tô bị loại bỏ đã dẫn đến tình trạng ô nhiễm không khí đô thị ngày càng nghiêm trọng Mặc dù xe mới đáp ứng tiêu chuẩn khí thải hiện hành, nhưng theo thời gian, hiệu suất hoạt động và trạng thái kỹ thuật của xe sẽ giảm sút, làm gia tăng nồng độ khí độc hại trong khí thải Các quy định yêu cầu phương tiện lưu hành phải trải qua kiểm tra định kỳ tại các trạm đăng kiểm về kỹ thuật và bảo vệ môi trường Nếu không đạt yêu cầu trong lần kiểm định đầu tiên, chủ phương tiện phải bảo dưỡng và sửa chữa xe Sau ba lần kiểm định không đạt tiêu chuẩn, phương tiện sẽ buộc phải bị loại bỏ.

Hàng năm, các trạm đăng kiểm xe cơ giới trên toàn quốc thu thập một lượng lớn dữ liệu về hiệu suất phương tiện, bao gồm thông tin về khí thải và tỷ lệ xe đạt hoặc không đạt tiêu chuẩn Việc tổng hợp và phân tích dữ liệu kiểm định khí thải này sẽ giúp xác định mối liên hệ với cường độ sử dụng phương tiện, từ đó đưa ra các giải pháp thiết thực nhằm giảm ô nhiễm môi trường và tiết kiệm chi phí trong công tác kiểm định khí thải.

Dựa trên sự đồng thuận của Ban giám hiệu Trường Đại học Lâm nghiệp, tôi đã tiến hành nghiên cứu về ảnh hưởng của các yếu tố đến chất lượng khí thải của xe ô tô con phổ biến tại Việt Nam Mục tiêu nghiên cứu là tìm hiểu mối quan hệ giữa cường độ sử dụng phương tiện, khối lượng chuẩn RM và tỷ lệ xe ô tô con không đạt tiêu chuẩn khí thải Sử dụng dữ liệu kiểm định khí thải, tôi áp dụng ngôn ngữ lập trình Python cùng với các thuật toán học máy để phát triển ứng dụng dự đoán nhanh tình trạng khí thải của xe Nghiên cứu này nhằm cung cấp tài liệu tham khảo cho các cơ quan quản lý môi trường và đăng kiểm trong việc xây dựng và sửa đổi tiêu chuẩn khí thải cũng như quy trình kiểm định hàng năm cho xe ô tô con.

Tổng quan vấn đề nghiên cứu trong và ngoài nước

(1) Nghiên cứu liên quan đến công nghệ, kỹ thuật và phương pháp kiểm soát khí thải xe ô tô

Khí thải từ phương tiện giao thông, đặc biệt là xe ô tô, là nguyên nhân chính gây suy giảm chất lượng không khí ở đô thị Để giảm thiểu ô nhiễm, nhiều quốc gia phát triển như Mỹ, Nhật Bản, Hàn Quốc và các nước châu Âu, cùng với một số quốc gia đang phát triển ở châu Á như Trung Quốc, Ấn Độ, đã ban hành quy định và tiêu chuẩn khí thải cho ô tô Trong những năm gần đây, việc kiểm soát và giảm thiểu khí thải độc hại từ động cơ ô tô đã thu hút sự quan tâm và đầu tư nghiên cứu từ các cơ quan quản lý, nhà sản xuất ô tô và các viện nghiên cứu công nghệ.

Vào năm 1966, bang California đã thiết lập tiêu chuẩn khí thải xe cơ giới đầu tiên trên thế giới, thu hút sự chú ý của các nhà sản xuất, cơ quan bảo vệ môi trường và người tiêu dùng đối với vấn đề kiểm soát ô nhiễm khí thải Nghiên cứu cho thấy, việc kiểm soát khí thải chủ yếu tập trung vào công nghệ động cơ đốt trong như hệ thống đa van, phun nhiên liệu, đánh lửa và tuần hoàn khí thải Đặc biệt, khoảng 60% đến 80% lượng khí thải ô nhiễm được phát ra trong 120 giây đầu tiên sau khi xe khởi động nguội Vì vậy, các nhà sản xuất ô tô đang đầu tư vào việc cải tiến động cơ và tối ưu hóa hệ thống hòa trộn nhiên liệu với không khí để giảm nồng độ khí ô nhiễm trong khí thải.

Năm 2006, Honda đã giới thiệu động cơ VTEC với cam biến thiên, sử dụng vấu cam có kích thước khác nhau để điều khiển xupap Công nghệ này giúp duy trì quá trình đốt cháy ổn định trong buồng đốt với tỷ lệ không khí-nhiên liệu từ 15,5 đến 16,0, góp phần giảm đáng kể lượng khí thải ô nhiễm sau khi khởi động nguội.

Ford đã phát triển bộ chuyển đổi xúc tác điện làm nóng trước nhằm cải thiện hiệu suất lọc khí thải ở nhiệt độ thấp, tuy nhiên, độ tin cậy và chi phí vẫn là thách thức lớn Trong khi đó, Mazda đã giới thiệu bộ chuyển đổi xúc tác ba chiều cho động cơ đốt trong vào năm 1981, với thiết kế nhỏ gọn và khả năng giảm tới 90% nồng độ phát thải oxit nitơ (NOx) cho các mẫu ô tô mới.

Trong những năm gần đây, nhiều nghiên cứu đã được thực hiện trên toàn cầu về công nghệ và phương pháp kiểm soát khí thải ô tô, bao gồm cải tiến động cơ, thí nghiệm và đánh giá chất lượng khí thải Các nghiên cứu cũng tập trung vào nhiên liệu mới, xây dựng tiêu chuẩn khí thải, cùng với các chính sách quản lý và kiểm soát ô nhiễm từ khí thải ô tô Dưới đây là một số công trình tiêu biểu trong lĩnh vực này.

GIECHASKIEL B và cộng sự đã đề xuất việc áp dụng công nghệ cải tiến động cơ nhằm giảm thiểu ô nhiễm khí thải ô tô trong môi trường đô thị Nghiên cứu thực nghiệm đo kiểm tra khí thải trong phòng thí nghiệm với băng thử động lực cho xe ô tô sử dụng động cơ diesel đã cho thấy nồng độ khí thải NOx giảm từ 350-1100mg/km, tương đương với mức giảm 60-85%.

MALIK L và cộng sự đã tiến hành phân tích thông tin vận chuyển của các phương tiện chở hàng tại Ấn Độ, bao gồm hệ thống tiêu chuẩn khí thải hiện tại và các yếu tố như tuổi thọ trung bình của phương tiện, quãng đường xe chạy hàng năm và mức tiết kiệm nhiên liệu Từ những dữ liệu này, họ đánh giá hiệu quả của các tiêu chuẩn khí thải hiện hành trong việc kiểm soát khí thải ô tô, làm cơ sở cho việc đề xuất kế hoạch sửa đổi tiêu chuẩn khí thải nhằm giảm thiểu khí thải ô tô.

Nghiên cứu của PUŠK R M và cộng sự đã giới thiệu công nghệ đánh lửa nén nạp đồng nhất (HCCI) cho động cơ đốt trong nhằm giảm thiểu phát thải NOx Công nghệ HCCI hoạt động dựa trên nguyên lý tự bốc cháy của hỗn hợp nhiên liệu đồng nhất được nén, giúp giảm đáng kể lượng phát thải NOx Nghiên cứu cũng đề xuất các giải pháp kỹ thuật để kiểm soát chính xác quá trình tự bốc cháy của hòa khí trong buồng đốt của động cơ.

Nghiên cứu của CHA J và cộng sự đã tiến hành kiểm tra ô nhiễm khí thải từ 17 xe ô tô sử dụng động cơ cháy do nén tại Hàn Quốc, nhằm đánh giá mức độ khí thải theo tiêu chuẩn Euro VI trong điều kiện lái xe thực tế Kết quả cho thấy nồng độ NO x trung bình của hầu hết các phương tiện vượt quá giới hạn cho phép tới 6,6 lần, trong khi nhiệt độ môi trường không ảnh hưởng đáng kể đến mức NO x Hơn nữa, nồng độ khí thải CO 2 của các xe khi di chuyển trong khu vực nội đô thường cao hơn so với các khu vực khác.

CO 2 khi xe di chuyển ở các khu vực còn lại [55]

GIECHASKIEL B và cộng sự đã thực hiện thí nghiệm kiểm tra khí thải theo tiêu chuẩn Euro 5 đối với xe ô tô tải sử dụng hệ thống xử lý khí thải xúc tác chọn lọc SCR Nghiên cứu cho thấy hệ thống này có khả năng giảm nồng độ khí thải NOx, nhưng đồng thời cũng phát sinh khí NH3 và N2O Các khí thải được thu thập và phân tích bằng công cụ PEMS, cho kết quả nồng độ phát thải N2O trung bình dao động từ 0,063 g/kWh đến 0,139 g/kWh.

NH 3 trung bình nằm trong khoảng từ 0,9 ppm đến 5,7 ppm Trong khi lượng phát thải

N2O và NH3 trung bình được tính toán nằm trong giới hạn cho phép theo tiêu chuẩn Euro 5 Tuy nhiên, lượng phát thải NOx trong điều kiện thí nghiệm đo được lại cao hơn nhiều so với giá trị giới hạn trong tiêu chuẩn Euro V.

Luján và cộng sự đã thực hiện thử nghiệm kiểm tra khí thải cho xe ô tô hạng nhẹ sử dụng động cơ diesel đạt tiêu chuẩn Euro 6, với thiết bị đo khí thải Horiba OBS-ONE-GS12 được lắp đặt trong cốp xe Tuyến đường thử nghiệm được thiết kế theo yêu cầu của quy trình kiểm tra khí thải RDE Kết quả cho thấy, lượng phát thải NOx và NO2 cao nhất xảy ra ở các đoạn đường đô thị, và việc xe di chuyển với tốc độ thấp hoặc thường xuyên tăng giảm tốc là nguyên nhân chính dẫn đến lượng phát thải NOx cao hơn so với khi xe chạy nhanh ở tốc độ ổn định.

Hu Qizhou và các cộng sự đã phân tích đặc điểm và quy luật phát thải của động cơ xe ô tô, kết hợp với thực nghiệm trên 04 xe thí nghiệm di chuyển trong thành phố Nghiên cứu đã thiết lập mối quan hệ hàm số giữa lượng phát thải của xe với các loại đường khác nhau, bao gồm đường trục chính, đường trục phụ và đường nhánh Đồng thời, nhóm nghiên cứu cũng xây dựng mô hình chẩn đoán tác động của khí thải ô tô đối với môi trường đô thị dựa trên hàm số đã xác lập.

Nghiên cứu của Tie Zhengming và cộng sự đã chỉ ra rằng điều kiện vận hành khi tăng tốc là yếu tố chính ảnh hưởng đến nồng độ khí thải NO x, CO và HC của động cơ ô tô Kết quả thực nghiệm đo khí thải trên đường với bảy dải tốc độ khác nhau (0-70 km/h) cho thấy tốc độ xe là yếu tố quyết định, với nồng độ HC và CO giảm rõ rệt khi tốc độ xe tăng.

(2) Nghiên cứu liên quan đến công nghệ học máy ứng dụng trong lĩnh vực ô tô và giám sát giao thông

Trong những năm gần đây, công nghệ học máy đã trở thành động lực chính cho sự phát triển của trí tuệ nhân tạo và được ứng dụng rộng rãi trong nhiều ngành công nghiệp Trong lĩnh vực công nghệ ô tô, học máy chủ yếu được nghiên cứu và ứng dụng trong các lĩnh vực như lái xe thông minh, nhận dạng biển số xe, đếm số lượng phương tiện trên các làn đường, nhận dạng loại phương tiện và xác định khoảng cách với các phương tiện phía trước.

Mục tiêu, nội dung và phương pháp nghiên cứu

Kiểm soát ô nhiễm khí thải từ phương tiện giao thông, đặc biệt là ô tô, là vấn đề quan trọng mà nhiều quốc gia và nhà sản xuất ô tô đang chú trọng nhằm giảm thiểu ô nhiễm môi trường và bảo vệ sức khỏe con người Chất lượng khí thải của ô tô hiện nay chủ yếu được đánh giá qua việc kiểm tra nồng độ các thành phần khí thải từ ống xả, dựa trên các tiêu chuẩn khí thải liên quan, để xác định xem xe có đạt tiêu chuẩn hay không Luận văn này được thực hiện với mục tiêu nghiên cứu các khía cạnh liên quan đến vấn đề này.

Nghiên cứu mối liên hệ giữa cường độ sử dụng và niên hạn sử dụng của xe ô tô con tại Việt Nam với tỷ lệ kiểm định khí thải không đạt tiêu chuẩn, nhằm đề xuất cải tiến tiêu chuẩn khí thải cho xe ô tô con trong nước.

Lập trình ứng dụng dự đoán nhanh trạng thái khí thải của ô tô con tại Việt Nam nhằm đề xuất giải pháp kiểm soát và đánh giá hiệu quả Kết quả dự đoán này có thể làm tài liệu tham khảo cho quy trình kiểm tra nhanh khí thải, đồng thời hỗ trợ đề xuất chính sách miễn kiểm tra đối với những xe đạt tiêu chuẩn Điều này giúp giảm áp lực cho các trạm đăng kiểm, tiết kiệm thời gian và chi phí kiểm tra khí thải.

1.3.2 Nội dung nghiên cứu Để đạt được mục tiêu nghiên cứu nêu trên, luận văn tập trung chủ yếu vào nghiên cứu các nội dung sau:

- Nghiên cứu hệ thống các tiêu chuẩn khí thải xe ô tô trên thế giới và ở Việt Nam;

- Các yếu tố chính ảnh hưởng đến tỷ lệ kiểm định khí thải không đạt tiêu chuẩn của xe ô tô con chạy xăng ở Việt Nam;

Xây dựng ứng dụng dự đoán nhanh trạng thái khí thải của xe ô tô con sử dụng ngôn ngữ lập trình Python, kết hợp với thuật toán học máy và mô hình phân loại dự đoán, nhằm cung cấp thông tin chính xác và kịp thời về mức độ ô nhiễm môi trường từ các phương tiện giao thông.

Nghiên cứu thực nghiệm nhằm đo kiểm tra khí thải của một số xe con chạy xăng đã được thực hiện để đánh giá và kiểm chứng độ tin cậy của phần mềm dự đoán nhanh trạng thái khí thải của ô tô.

Phương pháp kế thừa tài liệu bao gồm việc tổng hợp và phân tích các số liệu thống kê liên quan đến nội dung nghiên cứu Đồng thời, nó cũng kế thừa các kết quả nghiên cứu trong và ngoài nước có liên quan, nhằm cung cấp căn cứ khoa học cho việc triển khai các nội dung nghiên cứu của đề tài.

Phương pháp thống kê phân tích kết hợp với công nghệ thông tin được áp dụng để đánh giá chất lượng khí thải của xe ô tô con Dữ liệu kiểm định khí thải từ các trạm đăng kiểm xe cơ giới được sử dụng làm cơ sở cho việc thống kê và phân tích Qua đó, một ứng dụng dự đoán nhanh trạng thái khí thải của xe ô tô con được xây dựng, nhằm nâng cao hiệu quả kiểm soát ô nhiễm môi trường.

Phương pháp nghiên cứu thực nghiệm được áp dụng để tiến hành thí nghiệm kiểm tra nồng độ khí thải của các loại xe con phổ biến Mục tiêu là kiểm chứng và đánh giá tính chính xác cũng như độ tin cậy của ứng dụng dự đoán nhanh trạng thái khí thải của ô tô con đã được phát triển.

Các tiêu chuẩn khí thải xe ô tô

Tiêu chuẩn khí thải ô tô hiện nay chủ yếu bao gồm các hệ thống từ Châu Âu, Hoa Kỳ, Nhật Bản và Trung Quốc Trong đó, hệ thống tiêu chuẩn khí thải của Châu Âu đang được nhiều quốc gia đang phát triển công nhận và áp dụng, vượt trội hơn so với các tiêu chuẩn của Hoa Kỳ và Nhật Bản.

1.4.1 Hệ thống tiêu chuẩn khí thải xe ô tô hạng nhẹ của châu Âu

Hệ thống tiêu chuẩn khí thải của Châu Âu được xây dựng từ quy định của Ủy ban Kinh tế Châu Âu (ECE) và chỉ thị của Cộng đồng Châu Âu (EEC), trong đó các quốc gia tham gia công nhận tự nguyện Tuy nhiên, các chỉ thị này là bắt buộc đối với các quốc gia thuộc khối EEC và Liên minh Châu Âu (EU) Nhiều nước đang phát triển ở Châu Á cũng công nhận hoặc lấy tiêu chuẩn khí thải của Châu Âu làm cơ sở khi xây dựng quy định và tiêu chuẩn khí thải cho phương tiện giao thông cơ giới.

Các tiêu chuẩn khí thải của Châu Âu được phân chia thành hai hệ thống chính: một cho xe tải hạng nặng sử dụng động cơ diesel và một cho xe hạng nhẹ Các tiêu chuẩn khí thải cho xe tải hạng nặng được đánh dấu từ Euro I đến Euro VI, trong khi các tiêu chuẩn cho xe hạng nhẹ được ký hiệu từ Euro 1 đến Euro 4.

(1) Tổng quan về tiêu chuẩn khí thải đối với xe ô tô hạng nhẹ của Châu Âu

Tiêu chuẩn khí thải của Liên minh Châu Âu cho xe hạng nhẹ mới, bao gồm xe chở khách và xe thương mại, được quy định trong Chỉ thị 70/220/EEC và đã được sửa đổi vào năm 2004, sau đó được thay thế bởi Quy định 715/2007 (Euro 5/6) Sự phát triển của các tiêu chuẩn khí thải xe hạng nhẹ tại châu Âu diễn ra qua nhiều giai đoạn khác nhau.

Tiêu chuẩn Euro 1 (còn gọi là EC 93): Chỉ thị 91/441/EEC (chỉ dành cho xe khách) hoặc 93/59/EEC (xe khách và xe tải hạng nhẹ)

Tiêu chuẩn Euro 2 (EC 96): Chỉ thị 94/12/EC hoặc 96/69/EC

Tiêu chuẩn Euro 3/4 (2000/2005): Chỉ thị 98/69/EC, sau đó được sửa đổi bổ sung vào trong chỉ thị 2002/80/EC

Tiêu chuẩn Euro 5/6 (2009/2014): Chỉ thị số 715/2007/EC

(2) Khả năng áp dụng các quy định về khí thải của phương tiện hạng nhẹ Châu Âu

Tiêu chuẩn khí thải cho xe hạng nhẹ, bao gồm các loại xe M1, M2, N1 và N2 với khối lượng chuẩn không vượt quá 2610kg, áp dụng các quy định Euro 5 và Euro 6 Châu Âu quy định các giá trị giới hạn khí thải khác nhau cho xe sử dụng động cơ cháy do nén (diesel) và động cơ cháy cưỡng bức (xăng, NG, LPG, ethanol) Đặc biệt, xe sử dụng động cơ cháy do nén phải tuân thủ các yêu cầu nghiêm ngặt hơn về nồng độ khí thải.

Tiêu chuẩn Euro 4 cho phép miễn kiểm tra chỉ số hạt ô nhiễm PM đối với xe có động cơ cháy cưỡng bức, trong khi Euro 5 và Euro 6 đưa ra các quy định nghiêm ngặt hơn về nồng độ NOx Điều này cho thấy rằng mặc dù giới hạn CO được nới lỏng, nhưng các tiêu chuẩn mới vẫn yêu cầu kiểm soát chặt chẽ hơn đối với ô nhiễm không khí.

PM cần thực hiện kiểm tra đối với phương tiện sử dụng động cơ cháy cưỡng bức, với giá trị giới hạn tương đương với các phương tiện lắp động cơ cháy do nén.

(3) Chu trình kiểm tra khí thải theo tiêu chuẩn châu Âu

Chu trình kiểm tra khí thải được thực hiện trên băng thử công suất, với đơn vị đo là g/km cho hầu hết các chỉ tiêu khí thải, ngoại trừ chỉ tiêu PN được đo bằng 1/km Qua thời gian, quy trình kiểm tra khí thải xe hạng nhẹ ở Châu Âu đã được cập nhật và thay đổi dần dần.

ECE 15 + EUDC: Quy trình kiểm tra khí thải đầu tiên của Châu Âu (còn được gọi là kiểm tra MVEG-A), bao gồm hai giai đoạn kiểm tra xe chạy trong nội thành và xe chạy ở vùng ngoại ô, bắt đầu đo khí thải từ khởi động ở trạng thái nóng

NEDC: Kể từ năm 2000 (Euro 3), quy trình kiểm tra ECE 15 + EUDC đã được điều chỉnh để loại bỏ việc lấy mẫu khí thải trong giai đoạn 40 giây trước khi động cơ khởi động Kiểm tra khí thải với động cơ ở trạng thái nguội được gọi là chu trình kiểm tra mới của châu Âu, được ký hiệu là NEDC hoặc MVEG-B.

WLTP, hay chu trình kiểm tra xe hạng nhẹ toàn cầu, cùng với quy trình kiểm tra tương ứng WLTC, đã thay thế chu trình NEDC Quá trình chuyển đổi từ NEDC sang WLTC được thực hiện qua nhiều giai đoạn khác nhau.

Tháng 9 năm 2017: Bắt đầu áp dụng quy trình kiểm tra và chứng nhận khí thải theo chu trình WLTP cho các mẫu xe mới Đối với các mẫu xe ô tô đã được phê duyệt với chu trình kiểm tra NEDC trước đây thì vẫn có thể được bán ra thị trường

Tháng 9 năm 2018: Tất cả ô tô mới phải được chứng nhận theo chu trình kiểm tra WLTP

Tháng 1 năm 2019: Tất cả ô tô tại các đại lý phải có giá trị WLTP-CO2

Các chính phủ trong Liên minh Châu Âu cần xem xét điều chỉnh thuế xe và cung cấp ưu đãi tài chính cho các phương tiện có giá trị WLTP, ngoại trừ một số lượng xe tồn kho trước đây.

Tiêu chuẩn Euro 5/6 đã thiết lập các phương pháp đo lường lượng phát thải PM và PN, đồng thời đưa ra các giới hạn phát thải khối lượng cho các chỉ tiêu hạt gây ô nhiễm.

PM và chỉ tiêu số hạt PN cũng được quy định cụ thể

Kiểm tra khí thải khi lái xe thực tế (RDE) là một quy trình quan trọng nhằm đảm bảo rằng khí thải của xe không chỉ được kiểm tra trong phòng thí nghiệm mà còn phải được đánh giá khi xe hoạt động trên đường Các yêu cầu kiểm tra RDE đã được thiết lập thông qua nhiều sửa đổi quy định, với quy định RDE đầu tiên được công bố vào tháng 3 năm 2016, tiếp theo là quy định RDE lần thứ hai vào tháng 4 năm 2016, và quy định RDE lần thứ ba được ban hành sau đó.

PHÂN TÍCH CÁC TIÊU CHUẨN KHÍ THẢI VÀ MỘT SỐ YẾU TỐ CHÍNH ẢNH HƯỞNG CHẤT LƯỢNG KHÍ THẢI CỦA XE Ô TÔ CON

Quy trình kiểm tra khí thải xe ô tô theo tiêu chuẩn Việt Nam

Theo QCVN 109:2021/BGTVT và TCVN 6785-2015, việc đo khí thải cho xe khối lượng chuẩn thấp được thực hiện theo quy trình cụ thể Phép thử loại I yêu cầu tuân thủ các tiêu chuẩn về khí thải gây ô nhiễm từ ô tô, với phương pháp thử được quy định rõ trong các tài liệu hướng dẫn Sơ đồ hình 2-1 minh họa quy trình thực hiện đo khí thải này.

Hình 2-1 Quy trình đo khí thải xe ô tô theo phép thử loại I

V1 là kết quả của lần thử thứ nhất, V2 là kết quả của lần thử thứ hai và L là giá trị giới hạn đối với mỗi loại khí và PM

Theo sơ đồ hình 2-1, phép thử cần thực hiện 03 lần, với kết quả mỗi lần thử được tính bằng giá trị đo nhân với hệ số suy giảm tương ứng trong Bảng 2-1 và Bảng 2-2 Nếu có hệ thống tái sinh định kỳ, cần nhân với hệ số Ki Khối lượng khí và PM (xe lắp động cơ cháy do nén) thu được trong mỗi lần thử phải nhỏ hơn giới hạn nêu trong Bảng 1-10, Bảng 1-11, hoặc Bảng 1-14 Tuy nhiên, một trong ba kết quả đo có thể vượt quá 10% mức giới hạn quy định, miễn là giá trị trung bình của ba kết quả vẫn nhỏ hơn mức giới hạn.

Bảng 2-1 Hệ số suy giảm theo mức từ mức 4 trở về trước

Loại động cơ Các hệ số suy giảm

CO THC NO x HC +NO x PM

Bảng 2-2 Hệ số suy giảm theo mức 5

Loại động cơ Các hệ số suy giảm

CO THC NMHC NO x HC +NO x PM

Số lần thử quy định nêu trên sẽ được giảm trong các điều kiện xác định sau đây:

- Chỉ phải thử một lần, nếu tất cả các khí và PM đều có: V1  0,70 L;

- Chỉ phải thử hai lần, nếu kết quả thử V1 của mỗi khí và PM không thoả mãn điều kiện nêu trên nhưng vẫn thoả mãn yêu cầu sau: V1  0,85 L; V1 + V2  1,70 L và V2  L.

Các yếu tố chính ảnh hưởng đến chất lượng khí thải của xe ô tô

Chất lượng khí thải của xe ô tô được đánh giá chủ yếu qua nồng độ khí thải trung bình ở đuôi ống xả sau khi khởi động nguội (phép thử loại I) Để xác định xem chất lượng khí thải đạt hay không, người ta so sánh nồng độ khí thải trung bình đo được với giá trị giới hạn quy định trong các tiêu chuẩn khí thải liên quan.

Nghiên cứu toàn cầu đã chỉ ra rằng nồng độ khí thải xe ô tô bị ảnh hưởng bởi nhiều yếu tố, bao gồm điều kiện đường xá, tốc độ di chuyển và quãng đường đã đi (chỉ số công tơ mét).

Để đánh giá chất lượng khí thải của xe ô tô con tại Việt Nam, các yếu tố như cường độ sử dụng xe (chỉ số công tơ mét và số năm sử dụng) là rất quan trọng Luận văn này tiến hành thu thập và phân tích dữ liệu kiểm định khí thải từ một trạm đăng kiểm xe cơ giới, nhằm tìm hiểu mối quan hệ giữa cường độ sử dụng và chất lượng khí thải, cụ thể là trạng thái đạt hoặc không đạt của khí thải xe ô tô khi kiểm định.

2.2.1 Thu thập số liệu về kiểm định khí thải xe ô tô con tại Việt Nam

Luận văn này thu thập dữ liệu kiểm định khí thải của gần 45.000 lượt xe tại một trạm đăng kiểm ở Việt Nam, bao gồm thông tin cơ bản như biển số xe, ngày đăng ký, loại hình xe, dung tích động cơ, chỉ số công tơ mét, mã hiệu kiểm định, nồng độ các khí thải (CO, HC, NOx), phương pháp kiểm định, thời gian kiểm định và kết luận kiểm định (đạt/không đạt).

Sau khi thu thập số liệu, quá trình tiền xử lý được thực hiện để lọc ra các xe con, đồng thời loại bỏ những xe không có đủ dữ liệu cần thiết Chỉ giữ lại các xe con có thông tin đầy đủ về khối lượng chuẩn, chỉ số công tơ mét, ngày đăng ký và kiểm định.

Để xác định khối lượng chuẩn (RM) của xe, cần sử dụng hàm lọc dữ liệu trong Excel nhằm loại bỏ các thông tin không đầy đủ và những dữ liệu có khối lượng chuẩn nhỏ hơn 100kg hoặc lớn hơn 2500kg Theo tiêu chuẩn khí thải, khối lượng chuẩn RM được tính bằng "khối lượng toàn bộ" cộng thêm 100kg, với khối lượng chuẩn tối đa RM cho xe con (xe hạng nhẹ) là 2500kg Sau khi thực hiện lọc, chỉ giữ lại những dữ liệu có khối lượng chuẩn trong khoảng 100kg≤RM≤2500kg.

Chỉ số công tơ mét là một yếu tố quan trọng trong việc phân tích dữ liệu xe Để đảm bảo độ chính xác, cần lọc các dữ liệu theo khối lượng chuẩn (RM), đồng thời sử dụng hàm lọc dữ liệu trong Excel để loại bỏ những dữ liệu thiếu chỉ số công tơ mét Ngoài ra, cần loại trừ các dữ liệu có chỉ số công tơ mét vượt quá 6010^4 km hoặc nhỏ hơn 0 km.

Để tính số năm sử dụng xe ô tô, trước tiên, cần sử dụng hàm lọc của Excel để loại bỏ dữ liệu thiếu ngày đăng ký và ngày kiểm định Do dữ liệu thu thập không có thông tin về số năm sử dụng, chúng ta sẽ dựa vào ngày đăng ký và thời gian kiểm định để tính toán Công thức tính số năm sử dụng xe ô tô sẽ được áp dụng để đưa ra kết quả chính xác.

Số năm sử dụng = (ngày kiểm định – ngày đăng ký)/365

Trong nghiên cứu này, chúng tôi chỉ tập trung vào các loại xe con sử dụng nhiên liệu xăng, nhằm đảm bảo tính đồng nhất và chính xác trong việc phân tích dữ liệu.

Sau khi dữ liệu đã được tiền xử lý, thu được dữ liệu kiểm định khí thải của

Trong số 38,929 xe ô tô con chạy xăng, bảng 2-3 dưới đây trình bày một phần dữ liệu về khí thải của các phương tiện này, đã được tiền xử lý để phục vụ cho các nghiên cứu và thuận tiện cho quá trình xử lý số liệu tiếp theo.

Bảng 2-3 Tổng hợp dữ liệu kiểm định khí thải sau khi tiền xử lý

TT Biển số Ngày đăng ký

Dung tích động cơ (lít)

CP chở Nhãn hiệu Nhiên liệu

Chỉ số công tơ mét (km)

Kết luận Ngày kiểm định

2.4 2220 6 TOYOTA VIOS Xăng 140000 Loại I 0.003 0.1 0.18 1 0.049 0.08 Đạt 6/19/2018 6

TT Biển số Ngày đăng ký

Dung tích động cơ (lít)

CP chở Nhãn hiệu Nhiên liệu

Chỉ số công tơ mét (km)

Kết luận Ngày kiểm định

2 1890 5 TOYOTA Xăng 150000 Loại I 0.14 0.1 0.47 1 0.145 0.08 Không đạt 2/18/2018 14

2 1870 5 TOYOTA VIOS Xăng 80000 Loại I 0.005 0.1 0.2 1 0.001 0.08 Đạt 5/14/2018 7

1.8 1710 5 KIA Xăng 208740 Loại I 0.152 0.1 0.93 1 0.043 0.08 Không đạt 7/4/2018 16.4

1.8 1710 5 TOYOTA VIOS Xăng 208740 Loại I 0.08 0.1 0.6 1 0.036 0.08 Đạt 1/14/2019 17

TT Biển số Ngày đăng ký

Dung tích động cơ (lít)

CP chở Nhãn hiệu Nhiên liệu

Chỉ số công tơ mét (km)

Kết luận Ngày kiểm định

1 1550 8 HYUNDAI Xăng 42585 Loại I 0.147 0.1 1.33 1 0.204 0.08 Không đạt 12/13/2018 12

2 2280 7 TOYOTA VIOS Xăng 26491 Loại I 0.087 0.1 0.42 1 0.043 0.08 Đạt 1/21/2019 1.9

Xe ô tô con (KD VT)

1.6 1525 5 TOYOTA VIOS Xăng 130620 Loại I 0.188 0.1 0.45 1 0.096 0.08 Không đạt 5/16/2018 6

Xe ô tô con (KD VT)

2 1490 5 KIA FORTE Xăng 105487 Loại I 0.016 0.1 0.3 1 0.01 0.08 Đạt 4/4/2018 8.1

TT Biển số Ngày đăng ký

Dung tích động cơ (lít)

CP chở Nhãn hiệu Nhiên liệu

Chỉ số công tơ mét (km)

Kết luận Ngày kiểm định

1 1545 5 TOYOTA Xăng 62001 Loại I 0.066 0.1 0.65 1 0.086 0.08 Không đạt 12/23/2018 4

2.2.2 Phân bố số liệu kiểm định khí thải xe ô tô con theo khối lượng chuẩn, chỉ số công tơ mét và số năm sử dụng

Sau khi tiền xử lý dữ liệu của 38,929 mẫu xe ô tô con chạy xăng, chúng tôi đã tiến hành phân tích phân bố dữ liệu kiểm định khí thải thuộc phép thử loại I Sử dụng công cụ Histogram trong phần mềm Excel, chúng tôi đã khảo sát biểu đồ dựa trên khối lượng chuẩn, chỉ số công tơ mét và số năm sử dụng để đánh giá mức độ phân tán và xu hướng tập trung của dữ liệu Dưới đây là kết quả phân bố dữ liệu kiểm định khí thải theo các yếu tố này.

Hình 2-1 và Bảng 2-4 trình bày sự phân bố số xe được kiểm định theo khối lượng chuẩn RM, cho thấy cách phân bổ các mẫu thử nghiệm dựa trên tiêu chí khối lượng này.

Bảng 2-4 Phân bố số các xe được kiểm định theo khối lượng chuẩn RM

TT Khối lượng chuẩn RM (kg) Số xe kiểm định (chiếc) Tỷ lệ (%)

Hình 2-2 Phân bố số các xe kiểm định khí thải theo khối lượng chuẩn

Số xe kiểm định (chiếc)

Khối lượng chuẩn RM (kg)

Theo biểu đồ phân bổ trong Hình 2-2 và dữ liệu từ Bảng 2-4, 62,69% số xe được kiểm định có khối lượng chuẩn nằm trong khoảng 1305-1760 kg, trong khi 31,16% số xe có khối lượng trên 1760 kg.

2500) Số xe được kiểm định có khối lượng chuẩn nằm trong khoảng (0-1305) là ít nhất, chỉ có 2396 xe, chiếm 6,15%

Sự phân bố số xe được kiểm định khí thải theo chỉ số công tơ mét được thể hiện rõ trong Hình 2-3 và Bảng 2-5 Những tài liệu này cung cấp cái nhìn tổng quan về tình trạng kiểm định xe, cho thấy mối liên hệ giữa số lượng xe và chỉ số công tơ mét của chúng.

Bảng 2-5 Thống kê phân bố các xe được kiểm định theo chỉ số công tơ mét

TT Chỉ số công tơ mét (10 4 km) Số xe (chiếc) Tỷ lệ (%)

Hình 2-3 Phân bố các xe được kiểm định theo chỉ số công tơ mét

Số xe kiểm định (chiếc)

Chỉ số công tơ mét (10 4 km)

Theo sơ đồ phân bố và dữ liệu kiểm định, 57,50% xe có chỉ số công tơ mét trong khoảng (0÷5)×10^4 km, trong khi 22,01% xe nằm trong khoảng (5÷10)×10^4 km Đặc biệt, khoảng (15÷20)×10^4 km ghi nhận số lượng xe thấp nhất.

Kết luận Chương 2

Chương này phân tích hệ thống tiêu chuẩn khí thải xe ô tô hạng nhẹ trong nước và quốc tế, làm cơ sở cho việc đánh giá chất lượng khí thải Đồng thời, nghiên cứu ảnh hưởng của số năm sử dụng, chỉ số công tơ mét và khối lượng chuẩn RM đến tỷ lệ kiểm định không đạt tiêu chuẩn Những dữ liệu này sẽ hỗ trợ xây dựng phần mềm dự đoán nhanh trạng thái khí thải của xe ô tô dựa trên các yếu tố đã nêu.

CƠ SỞ LÝ LUẬN VỀ HỌC MÁY VÀ ỨNG DỤNG PYTHON

Khái quát chung về phương pháp học máy

Học máy là một lĩnh vực trong khoa học máy tính, kết hợp các yếu tố từ nhận dạng mẫu, trí tuệ nhân tạo, thống kê và khai thác dữ liệu.

Học máy sử dụng dữ liệu lịch sử để tạo ra tập dữ liệu huấn luyện cho các thuật toán Qua đó, nó học hỏi các quy tắc và mô hình từ mối quan hệ giữa các dữ liệu trong tập huấn luyện Những quy tắc và mô hình này sau đó được áp dụng để dự đoán kết quả cho dữ liệu mới.

3.1.2 Phân loại thuật toán học máy

Trong học máy, có bốn loại chính: học có giám sát, học không giám sát, học bán giám sát và học tăng cường Học có giám sát sử dụng dữ liệu huấn luyện với thông tin phân loại, thường áp dụng cho các bài toán phân loại và hồi quy, với các thuật toán tiêu biểu như hồi quy logistic, mạng nơ-ron BP và hồi quy tuyến tính Ngược lại, học không giám sát không có thông tin phân loại, chủ yếu giải quyết vấn đề phân cụm, với các thuật toán điển hình như K-Means và DBSCAN.

Học bán giám sát kết hợp dữ liệu có gán nhãn và không gán nhãn, tạo ra sự giao thoa giữa học có giám sát và học không giám sát Thuật toán trong học bán giám sát thường được mở rộng từ thuật toán học có giám sát để có khả năng mô hình hóa dữ liệu chưa được gán nhãn Dưới đây là khái quát đơn giản về quá trình cơ bản của học có giám sát và học không giám sát.

Học có giám sát, hay còn gọi là học có thầy, là quá trình dự đoán nhãn hoặc đầu ra của dữ liệu mới dựa trên tập dữ liệu huấn luyện đã được gán nhãn Qua quá trình này, một mô hình được xây dựng để đưa ra các dự đoán, và khi các dự đoán sai, mô hình sẽ được tinh chỉnh Quá trình huấn luyện tiếp tục cho đến khi mô hình đạt được độ chính xác mong muốn trên dữ liệu huấn luyện Hình 3-1 minh họa quá trình cơ bản của học có giám sát.

Hình 3-1 Học có giám sát Hình 3-2 Học không giám sát

Học không giám sát là phương pháp mà dữ liệu chỉ chứa thông tin đặc trưng mà không có thông tin gán nhãn, dẫn đến việc không thể xác định độ chính xác của kết quả phân loại trong quá trình học Quy trình của học không giám sát được minh họa trong Hình 3-2 Bước đầu tiên trong một nhiệm vụ học không giám sát là thu thập các mẫu dữ liệu huấn luyện có chứa thông tin đặc trưng.

Xử lý m mẫu dữ liệu {X1, X2, , Xm} nhằm thu thập thông tin hữu ích từ các mẫu này được gọi là trích xuất đặc trưng Sau khi hoàn tất quá trình trích xuất, các mẫu sẽ được xử lý bằng thuật toán học không giám sát, ví dụ như thuật toán phân cụm, để nhóm các mẫu lại với nhau.

Vấn đề liên quan đến dự đoán, phân loại dựa trên học máy

3.2.1 Khái quát về vấn đề dự đoán, phân loại

Trong học máy, phân loại là quá trình sử dụng các phương pháp học có giám sát hoặc không giám sát để rút ra kiến thức từ các đặc trưng của dữ liệu trong mẫu huấn luyện Qua đó, các mô hình phân loại được xây dựng nhằm dự đoán và phân loại dữ liệu mới dựa trên những gì đã học được.

Giả thiết X là tập con của không gian p chiều và Y là biến phân loại với K loại, thường được biểu thị bằng tập hợp các số nguyên {1, 2, , K} Nếu K = 2, đây là vấn đề phân loại nhị phân; còn nếu K > 2, gọi là vấn đề phân loại đa lớp Các vấn đề phân loại nhị phân có thể được biểu diễn bằng {0, 1} hoặc {+1, -1} Mục đích của mô hình phân loại là xây dựng một ánh xạ từ không gian đầu vào X sang không gian đầu ra Y, phân chia không gian đầu vào thành nhiều vùng, mỗi vùng tương ứng với một lớp Ranh giới giữa các vùng, hay còn gọi là decision boundaries, có thể có nhiều dạng hàm số khác nhau.

, thì ranh giới giữa loại thứ k và loại thứ m là

, đó cũng chính là tất cả các điểm hình thành nên không gian

 x :  ˆ k 0   ˆ m 0  ˆ k   ˆ m T x  0  Nhưng trên thực tế đòi hỏi hàm số ranh giới K-1 Để không mất tính tổng quát, có thể giả thiết rằng hệ số của hàm số thứ K là

Đối với mỗi loại k, có thể ước đoán hàm phân biệt (discriminant function) δk(x) và sau đó xác định x tại phần có giá trị lớn nhất của hàm này Phương pháp kiểm tra xác suất P(Y = k | X = x) được áp dụng sau khi ước tính Nếu δk(x) hoặc P(Y = k | X = x) là hàm số tuyến tính của x, thì hàm số ranh giới của phân loại cũng sẽ là hàm số tuyến tính.

Sai số dự đoán kỳ vọng (EPE) của mô hình được định nghĩa là EPE = E[L(Y, f(x))], trong đó L là hàm tổn thất trong bài toán phân loại, và kỳ vọng được tìm từ phân phối chung của (X, Y) EPE cũng có thể được diễn đạt dưới dạng phân phối có điều kiện.

  ,       (3.1) Để tìm tối ưu f x ˆ  , trong trường hợp cho trước X thì có thể tối ưu từng điểm, sau đó tối thiểu hóa EPE , ta được:

Trong phân tích hồi quy, thường sử dụng hàm tổn thất bình phương

Trong phân loại, thường dùng hàm tổn thất dạng tổn thất 0-1

Trên thực tế, tổn thất 0-1 chính là sai số phân loại của bộ phân loại Dưới đây là ước tính của mô hình:

Cũng có thể viết thành dạng sau:

Kết quả này được gọi là bộ phân loại Bayes (Bayes classifier), cho biết mẫu được đánh giá là loại tốt nhất với xác suất cao nhất dựa trên phân phối có điều kiện P(y|X) = P(y|x).

Sai số của bộ phân loại Bayes được gọi là Bayes rate

3.2.2 Tiêu chí đánh giá kết quả dự đoán của vấn đề phân loại

1) Đối với vấn đề phân loại nhị phân: Ký hiệu là Y{1, 1} Trong vấn đề phân loại nhị phân, có thể tồn tại 4 loại kết quả dự đoán, đó là: true positive (TP), false positive (FP), true negative (TN) và false negative (FN), như thể hiện trong Bảng 3-1

Bảng 3-1 Ma trận nhầm lẫn

Tính chân thực Giá trị dự đoán

1 True positive(TP) False negative(FN)

1 False positive(FP) True negative(TN)

Trong quá trình huấn luyện mô hình, có thể xảy ra tình trạng mất cân bằng giữa số lượng mẫu của các đặc trưng, dẫn đến việc cần chú ý đến khả năng dự đoán của mô hình cho từng đặc trưng riêng biệt Khả năng dự đoán này có thể khác nhau đáng kể giữa các đặc trưng Nếu chỉ tập trung vào độ chính xác tổng thể, mô hình có thể dự đoán tất cả dữ liệu thuộc về loại có số lượng mẫu lớn nhất, nhưng điều này không mang lại ý nghĩa thực tiễn Do đó, việc đánh giá tính chính xác dự đoán của mô hình cho từng loại đặc trưng là rất quan trọng Các tiêu chí đánh giá phân loại được trình bày trong Bảng 3-2.

Bảng 3-2 chỉ ra rằng giá trị của các thang đo precision và recall càng cao càng tốt, nhưng không thể cải thiện đồng thời cả hai Vì vậy, cần sử dụng giá trị F để làm chỉ tiêu tổng hợp cho cả hai thang đo này.

Bảng 3-2 Tiêu chuẩn đánh giá vấn đề phân loại

Tên gọi Công thức Ý nghĩa Tên gọi tương đồng

Phản ánh tỷ lệ mẫu thực tế “không đạt” nhưng được dự đoán là “đạt” trên tổng số mẫu “không đạt”

Sai lầm loại I (type I error), 1-Độ đặc hiệu (specificity)

Phản ánh tỷ lệ các mẫu được dự đoán chính xác là “đạt” trên tổng số các mẫu “đạt”

Sai lầm loại II (type II error), độ nhạy (sensitively), tỷ lệ triệu hồi (recall)

Phản ánh tỷ lệ mẫu thực sự “đạt” trong số các mẫu được dự đoán là

“đạt” Độ chính xác (precision)

Phản ánh tỷ lệ mẫu thực sự

“không đạt” trong tổng số các mẫu được dự đoán là “không đạt”

2) Đối với mô hình của vấn đề phân loại nhị phân: Trong hầu hết các trường hợp, không cần thiết phải đưa ra từng mẫu được dự đoán thuộc loại nào mà chỉ đưa ra dự đoán xác suất của một loại, do đó cần chọn giá trị ngưỡng Các ngưỡng khác nhau tương ứng với các kết quả dự đoán phân loại khác nhau, do đó tỷ lệ sai số tổng thể và các chỉ tiêu đánh giá cũng khác nhau

3) Đối với các bộ phân loại khác nhau (thuật toán phân loại khác nhau):

Hiệu quả phân loại của các bộ phân loại khác nhau có thể được so sánh thông qua đường cong ROC (Receiver Operating Characteristics) Đường cong này di chuyển qua các giá trị ngưỡng từ 0 đến 1, tạo ra nhiều cặp FPR (Tỷ lệ dương giả) và TPR (Tỷ lệ dương thật) Trục hoành biểu thị FPR, trong khi trục tung biểu thị TPR, và các điểm được nối lại để tạo thành đường cong thể hiện mối quan hệ giữa hai loại này ở các ngưỡng khác nhau Điểm ở góc dưới bên trái của đường cong (FPR = TPR = 0) tương ứng với giá trị ngưỡng là 1, khi đó tất cả các điểm đều thuộc lớp "không đạt" Ngược lại, góc trên bên phải (1, 1) với FPR = TPR = 1, tương ứng với giá trị ngưỡng là 0, khi đó tất cả các điểm đều thuộc lớp "đạt" Các điểm ở giữa đường cong phản ánh các giá trị ngưỡng khác nhau của TPR và FPR.

Diện tích dưới đường cong ROC (AUC) phản ánh khả năng của bộ phân loại khi áp dụng các ngưỡng khác nhau, giúp đánh giá hiệu suất tổng thể của nó AUC càng cao, mô hình càng tốt, do đó nó có thể được sử dụng như một tiêu chí để chọn lựa mô hình Bộ phân loại lý tưởng sẽ nằm ở góc trên bên trái của đồ thị, với TPR bằng 1 và FPR bằng 0, dẫn đến AUC đạt giá trị 1 Đường gạch ngang trong đồ thị biểu thị mô hình dự đoán ngẫu nhiên, với AUC là 0,5; do đó, giá trị AUC của bộ phân loại hữu ích cần phải lớn hơn 0,5.

4) Đối với mô hình của vấn đề phân loại nhiều lớp: (thuật toán phân loại khác nhau): Tỷ lệ chính xác tổng thể được định nghĩa là số điểm mẫu của tỷ lệ chính xác dự đoán chia cho tổng số mẫu và tỷ lệ lỗi là 1 trừ đi tỷ lệ chính xác Ngoài ra, bằng cách sử dụng phương pháp "một đối một", mỗi loại (k k1, 2, ,K) được coi là kết quả của một dạng phân loại nhị phân, rồi tính toán TP FN k , k , FP TN k , k , sau đó dựa vào công thức dưới đây để tính toán tỷ lệ chính xác và tỷ lệ triệu hồi (recall rate)

- Tỷ lệ chính xác tổng thể: k k k k k k

Các thuật toán học máy thường dùng và cơ sở lý luận

3.3.1 Thuật toán hồi quy logistic

Mô hình hồi quy logistic (Logistic Regression, LR) được sử dụng để xử lý các biến phản hồi không liên tục và có phân phối không chuẩn Hồi quy logistic áp dụng hàm liên hệ (|)E y x để chuyển đổi dữ liệu và từ đó xây dựng mô hình dự đoán hiệu quả.

Mô hình hồi quy logistic là một phương pháp phân loại, trong đó biến phản hồi là một biến nhị phân, có giá trị 0 hoặc 1, thường tập trung vào danh mục "1" Khi có biến độc lập X, kỳ vọng có điều kiện của biến phụ thuộc chính là xác suất mà biến này nhận giá trị "1" tại một mức nhất định của X, tức là xác suất của sự kiện quan tâm: P(Y=1|X=x) Do đó, mô hình hồi quy logistic có thể được biểu diễn một cách rõ ràng.

Trong đó: p- Đại diện cho xác suất xảy ra sự kiện quan tâm;

Mô hình logistic thường được xem là một mô hình tuyến tính, phản ánh mối quan hệ tuyến tính giữa hệ số  và hiệp phương sai X Tuy nhiên, trong thực tế, mối quan hệ giữa biến độc lập và biến phụ thuộc lại phi tuyến tính Khi biến độc lập là liên tục, mối quan hệ giữa nó và biến phụ thuộc có thể được mô tả bằng một đường cong hình chữ U.

Mô hình được trình bày trong Hình 3-4 không chỉ đảm bảo giá trị xác suất của biến phụ thuộc nằm trong khoảng [0, 1], mà còn phản ánh chính xác mối quan hệ giữa biến độc lập và biến phụ thuộc Để dễ dàng giải thích, công thức (3.8) có thể được chuyển đổi thành dạng Logit như sau: ln 0.

Vế trái của công thức (3-9) thể hiện logarit của tỷ lệ xác suất xảy ra và không xảy ra sự kiện, trong khi vế phải là dạng hồi quy tuyến tính thông thường.

Hình 3-4 Đường cong hình chữ S của mối quan hệ giữa biến độc lập và biến phụ thuộc trong hồi quy logistic

Trong mô hình hồi quy tuyến tính bội trong đó biến đáp ứng là liên tục, giả sử rằng phân phối y có giá trị trung bình 0

Trong hồi quy logistic, biến đáp ứng y là biến nhị phân với các giá trị 0 hoặc 1, và được giả định tuân theo phân phối nhị thức với tham số là phương sai σ².

  Kết quả cuối cùng của mô hình hồi quy logistic có thể được chuyển từ công thức (3.9) thành dạng dễ giải thích hơn như sau: exp( 0 )

Vế trái của phương trình (3.10) thể hiện tỷ lệ giữa xác suất xảy ra và không xảy ra của sự kiện quan tâm Tỷ lệ này càng cao, sự kiện càng dễ xảy ra, với khoảng giá trị từ 0 đến vô cùng.

3.3.2 Thuật toán phân tích phân biệt tuyến tính

Phân tích phân biệt tuyến tính (LDA) là một phương pháp phi phân tích hiệu quả, giúp xác định hàm số biệt thức dựa trên các đặc điểm thuộc tính và giá trị biến trong tập dữ liệu huấn luyện Sau khi xây dựng hàm số này, LDA được sử dụng để phân loại các đối tượng trong tệp dữ liệu mới, mang lại độ chính xác cao trong việc phân nhóm dữ liệu.

Phân tích phân biệt tuyến tính khác với hồi quy logistic ở chỗ nó ước tính phân phối của biến X cho từng loại Y đã cho Sau đó, phương pháp này áp dụng định lý Bayes để thực hiện ước lượng.

Giả sử các quan sát được phân bổ vào K lớp (K ≥ 2) và đã biết phân phối của từng loại dữ liệu là f_k cùng với xác suất trước của mỗi loại là π_k Khi đó, xác suất P(Y = k | X = x) có thể được tính theo công thức đã được xác định.

Giả sử rằng phân phối của từng loại dữ liệu có mang tham số chưa biết và xuất phát từ phân phối chuẩn đa biến riêng biệt:

Trong phân tích phân biệt tuyến tính (LDA), các tham số k và tổng hợp Σ k có thể được xác định thông qua ước tính Để so sánh giữa lớp k và lớp l, ta có thể sử dụng tỷ lệ logarit.

  k , l lần lượt là vectơ trung bình của các mẫu thuộc lớp k và lớp l;

 k là ma trận hiệp phương sai của mẫu thuộc lớp k

Có thể thấy công thức (3.13) là hàm số tuyến tính của X

Từ (3.3) có thể thu được hàm số biệt thức tương đương sau:

Trong thực tế, việc ước tính   k , k , có thể áp dụng các công thức sau [84] : ˆ k n k

Trong đó: n k là số mẫu thuộc lớp k

Trong đó: ˆ là phương sai thống nhất được giả định trong LDA

3.3.3 Thuật toán K-láng giềng gần nhất (K-Nearest Neighbor)

Thuật toán K-láng giềng gần nhất (KNN) là một phương pháp học máy có giám sát, được sử dụng để phân loại dữ liệu mà không cần giả định về phân phối của nó Nguyên tắc chính của KNN là xác định K điểm mẫu gần nhất trong không gian mẫu đã học để phân loại cho một điểm mẫu trong tập kiểm tra Khoảng cách giữa các điểm mẫu thường được tính bằng khoảng cách Euclide hoặc Manhattan Nếu đa số K điểm mẫu thuộc về một loại nhất định, điểm mẫu cần phân loại sẽ được xác định là thuộc về loại đó.

Ba yếu tố quan trọng trong thuật toán K-láng giềng gần nhất bao gồm công thức tính khoảng cách giữa các mẫu, lựa chọn giá trị K và quy tắc quyết định phân loại Những yếu tố này ảnh hưởng trực tiếp đến hiệu quả và độ chính xác của quá trình phân loại trong mô hình.

Khi lựa chọn phép tính khoảng cách giữa các mẫu, cần chọn công thức phù hợp với đặc điểm của biến mẫu Đối với biến mẫu liên tục, nên sử dụng khoảng cách Euclide, trong khi đó, nếu biến mẫu không liên tục, khoảng cách Ming hoặc khoảng cách Manhattan sẽ là lựa chọn thích hợp.

Giả sử không gian đặc trưng X là không gian vectơ thực n chiều R n , thì khoảng cách L của

, , ( , , , n ) T i j i i i i x x X x  x x x , x j  ( x (1) j , x (2) j , , x ( ) j n ) T , x x i , j được xác định như sau:

Khi p = 1, được gọi là khoảng cách Manhattan, tức là:

Khi p = 2, được gọi là khoảng cách Euclide, tức là:

Khi p = , đây chính là giá trị lớn nhất của các khoảng cách tọa độ riêng lẻ, tức là:

Sau đây sẽ lấy không gian số thực hai chiều (n=2) làm ví dụ để minh họa các định nghĩa vật lý về khoảng cách Euclide và khoảng cách Manhattan

     (3.24) Đường nét đứt trong Hình 3-5 là ý nghĩa vật lý của khoảng cách Euclide, có thể nhận được theo định lý Pythagore

Hình 3-5 Sự khác biệt giữa khoảng cách Euclide và khoảng cách Manhattan

Trong thuật toán K-láng giềng gần nhất, việc chọn giá trị K là yếu tố quan trọng ảnh hưởng đến độ chính xác của dự đoán Thông thường, giá trị K nên được chọn là nhỏ hơn, và phương pháp xác thực chéo là công cụ hữu hiệu để xác định giá trị K tối ưu.

Ý nghĩa của việc ứng dụng học máy trong dự đoán nhanh trạng thái khí thải của xe ô tô

Ngày nay, khoa học máy tính và công nghệ thông tin ngày càng được áp dụng rộng rãi trong sản xuất, quản lý và khoa học kỹ thuật, giúp nâng cao hiệu quả, giảm chi phí và tiết kiệm thời gian Việc ứng dụng công nghệ thông tin vào thực tế sản xuất và quản lý trở thành xu hướng nghiên cứu tất yếu Luận văn này sử dụng hàm số, thư viện hàm số, thuật toán học máy và các mô hình dự đoán trong ngôn ngữ lập trình Python để phát triển ứng dụng dự đoán nhanh trạng thái khí thải của xe ô tô con Mục tiêu chính là đánh giá nhanh chóng xem xe có đạt tiêu chuẩn khí thải hay không, với tỷ lệ đạt tiêu chuẩn đi kèm thông tin về độ tin cậy của kết quả Độ tin cậy cao hơn sẽ mang lại kết quả dự đoán chính xác hơn, làm cơ sở khoa học cho việc xây dựng chính sách miễn kiểm định cho xe đạt tiêu chuẩn và yêu cầu kiểm tra thực tế khí thải cho xe không đạt.

Theo thống kê từ Chương 2, 87,62% xe ô tô được kiểm định khí thải đạt tiêu chuẩn, trong khi chỉ 12,38% không đạt Điều này cho thấy tỷ lệ xe không đạt tiêu chuẩn là rất thấp Nếu áp dụng biện pháp miễn kiểm tra khí thải cho những xe được chẩn đoán là đạt tiêu chuẩn, chúng ta có thể nâng cao hiệu quả kiểm định và tiết kiệm thời gian cũng như chi phí cho việc kiểm tra khí thải.

Xây dựng ứng dụng dự đoán nhanh trạng thái khí thải của xe ô tô dựa trên ngôn ngữ lập trình Python

Python là ngôn ngữ lập trình cao cấp phổ biến trong lĩnh vực học máy Chương này sẽ áp dụng thuật toán học máy Scikit-learn của Python để phát triển ứng dụng dự đoán nhanh trạng thái phát thải của phương tiện hạng nhẹ Ứng dụng này dựa trên thông tin cơ bản của phương tiện, sử dụng các phương pháp như hồi quy logistic (Logistic Regression, LR) và phân tích phân biệt tuyến tính (Linear Discriminant Analysis, LDA).

K Neighbors Classifier (KNN) và Gaussian Naive Bayes (Gaussian NB) là hai trong số những thuật toán máy học phổ biến nhất để dự đoán nhanh tình trạng khí thải của phương tiện Việc đánh giá độ chính xác của các thuật toán này sẽ giúp lựa chọn phương pháp phù hợp nhất cho việc dự đoán khí thải ô tô.

3.5.1 Trình tự thiết kế và lập trình ứng dụng dự đoán nhanh trạng thái khí thải của xe ô tô con

Kết quả phân tích cho thấy các yếu tố chính ảnh hưởng đến tình trạng khí thải của phương tiện không đạt tiêu chuẩn bao gồm khối lượng chuẩn RM, số năm sử dụng và chỉ số công tơ mét Những thông tin này sẽ được sử dụng để thiết kế ứng dụng dự đoán nhanh trạng thái khí thải của xe ô tô con Cơ sở dữ liệu lịch sử về khí thải từ việc phát hiện phương tiện sẽ làm mẫu huấn luyện cho máy học Ứng dụng sẽ được lập trình bằng ngôn ngữ Python, kết hợp với các thư viện học máy, thuật toán và mô hình dự đoán để cung cấp kết quả chính xác.

Trình tự thiết kế và lập trình ứng dụng dự đoán nhanh trạng thái khí thải của xe ô tô con bao gồm 8 bước cơ bản, như trong Hình 3-6

Hình 3-6 Trình tự thiết kế và lập trình ứng dụng dự đoán nhanh trạng thái khí thải của xe ô tô con

Chuẩn bị dữ liệu là bước quan trọng, bao gồm việc tích hợp dữ liệu kiểm định khí thải của xe ô tô con đã thu thập và tiền xử lý vào một bảng dữ liệu thống nhất Quá trình này cần loại bỏ các phần dữ liệu không cần thiết, chỉ giữ lại những thông tin cần thiết để tạo ra tập huấn luyện cho mô hình học máy.

(2) Chuyển đổi dữ liệu: Chuyển đổi dữ liệu của bảng dữ liệu đã chuẩn bị thành một tệp tuân theo định dạng “*.csv”

Để bắt đầu lập trình học máy, bạn cần cài đặt ngôn ngữ lập trình Python phiên bản 3.5 64bit và phần mềm PyQt5 GPL v5.6 nhằm thiết kế giao diện cho ứng dụng.

Cài đặt các thư viện mở rộng cho học máy là bước quan trọng, bao gồm các thư viện như PyQt5, NumPy, Matplotlib, Pandas và Scikit-learn, mỗi thư viện cung cấp những chức năng khác nhau để hỗ trợ quá trình phát triển và phân tích dữ liệu.

Lập trình ứng dụng dự đoán nhanh sử dụng ngôn ngữ lập trình Python với các câu lệnh điều kiện, vòng lặp và cú pháp vào ra tương ứng Ứng dụng này kết hợp thuật toán học máy và mô hình dự đoán để nhanh chóng xác định trạng thái khí thải của xe ô tô con Quá trình lập trình được thực hiện trong mô-đun giao diện thiết kế "IDLE (Python 3.5 64-bit)".

(6) Thiết kế giao diện của ứng dụng dự đoán nhanh: Sử dụng mô-đun

Designer của PyQt5 GPL v5.6 cho Python 3.5 để thiết kế giao diện của ứng dụng;

Trước khi xác thực một ứng dụng, việc rà soát và sửa lỗi mã là rất quan trọng Từng dòng mã cần được kiểm tra kỹ lưỡng để phát hiện và khắc phục kịp thời các lỗi hoặc lỗi chính tả, đảm bảo ứng dụng hoạt động hiệu quả.

Để đảm bảo ứng dụng hoạt động ổn định, cần tiến hành chạy và gỡ lỗi chương trình để xác minh các chức năng của ứng dụng có hoạt động bình thường hay không Kiểm tra kết quả dự đoán để phát hiện bất kỳ sự bất thường nào Nếu ứng dụng không chạy đúng, quay lại bước kiểm tra câu lệnh lập trình và lỗi ngữ pháp, đồng thời xem xét thiết kế giao diện Lặp lại quá trình này cho đến khi ứng dụng hoạt động bình thường, lúc này công việc lập trình sẽ được hoàn tất.

3.5.2 Lập trình xây dựng ứng dụng dự đoán nhanh trạng thái khí thải của xe ô tô con

Theo quy trình thiết kế và yêu cầu chức năng cơ bản của ứng dụng, ngôn ngữ lập trình Python được sử dụng để phát triển ứng dụng Dưới đây là một số đoạn mã lập trình cho ứng dụng dự đoán nhanh trạng thái khí thải của xe ô tô con, kèm theo chú thích cho từng bước lập trình.

(1) Định nghĩa dự án, mã hóa ký tự, nhập vào các thư viện lớp và định nghĩa hiển thị tiếng Việt:

To ensure proper display of Vietnamese characters, set the font family to 'Times New Roman' in Matplotlib Additionally, configure the system to handle Unicode encoding by using utf-8 Import necessary libraries such as sys, csv, codecs, and os for data handling and manipulation in your Python environment.

To display the user interface of the application using Python, import the relevant modules from the PyQt5 library, including QtCore, pyqtSlot, QImage, QPixmap, QDialog, QApplication, QFileDialog, and loadUi.

To implement machine learning algorithms and correlation matrices using Python, you can utilize several libraries Begin by importing essential modules such as pandas for data manipulation, matplotlib for plotting, and scikit-learn for machine learning functions Key imports include `model_selection` for model evaluation, `classification_report`, `confusion_matrix`, and `accuracy_score` for performance metrics You can also import various classifiers like `LogisticRegression`, `DecisionTreeClassifier`, `KNeighborsClassifier`, `LinearDiscriminantAnalysis`, `GaussianNB`, and `SVC` Additionally, PCA from `sklearn.decomposition` and numpy for numerical operations are essential for effective data analysis and visualization.

The user interface of the application is defined within the Vehicle_Test class, which inherits from QDialog In the constructor, the application initializes essential functional buttons by calling the superclass constructor and loading the UI from 'main_VN.ui' Additionally, it sets up variables for image handling, including a placeholder for an image and a filename, with a default name set to "Liste".

In the application, each button is assigned a specific function to enhance user interaction: the first button (self.btl_01) is linked to loading CSV files, while the second button (self.btl_02) initiates data distribution analysis The third button (self.btl_03) generates box plots, and the fourth button (self.btl_04) creates histogram plots The fifth button (self.btl_05) is designated for scatter matrix plots, whereas the sixth button (self.btl_06) serves multiple functions, including making predictions, displaying results, and showing confidence levels Finally, the seventh button (self.btl_07) is connected to the print function, enabling users to print their findings.

Đánh giá và lựa chọn mô hình dự đoán

Ứng dụng dự đoán trạng thái khí thải của xe ô tô con sử dụng các thuật toán học máy như k-láng giềng gần nhất (kNN), hồi quy logistic (Logistic Regression, LR), phân tích phân biệt tuyến tính (LDA) và Gaussian Naive Bayes (GaussianNB) Việc đánh giá độ chính xác của các mô hình dự đoán là cần thiết để xác định thuật toán phù hợp nhất cho ứng dụng này.

3.6.1 Tách bộ dữ liệu dự đoán

Khi lựa chọn thuật toán, các phương pháp thống kê đóng vai trò quan trọng trong việc đánh giá mô hình Để xác định độ chính xác của thuật toán trên dữ liệu thực, một phần dữ liệu sẽ được giữ lại nhằm phục vụ cho việc đánh giá.

Khi tách tập dữ liệu để dự đoán, cần đảm bảo sự tách biệt hoàn toàn giữa tập dữ liệu và mô hình huấn luyện, điều này rất quan trọng cho việc phân tích và đánh giá độ chính xác của mô hình Trong quá trình chia tập dữ liệu kiểm định khí thải, nên phân chia thành hai phần: 20% dữ liệu cho bộ dữ liệu đánh giá và 80% cho bộ dữ liệu huấn luyện Dưới đây là đoạn mã để thực hiện việc phân tách dữ liệu: array = dataset.values.

X_train, X_validation, Y_train, Y_validation = train_test_split(X, Y, test_size = validation_size, random_state=seed)

3.6.2 Đánh giá thuật toán và chọn mô hình dự đoán tối ưu

Đối với bất kỳ bài toán nào, việc lựa chọn thuật toán hiệu quả không thể chỉ dựa vào dữ liệu Điều này cũng áp dụng cho phân tích và dự đoán trạng thái khí thải của xe ô tô Các thuật toán tính khoảng cách thường cho kết quả chính xác hơn, nhưng việc xác định thuật toán phù hợp nhất vẫn là thách thức Do đó, cần thiết kế một chương trình đánh giá thuật toán để chọn lựa chính xác Sử dụng xác thực chéo 10 lần, dữ liệu được phân tích và các thuật toán được so sánh theo độ chính xác nhằm nhanh chóng tìm ra thuật toán tối ưu Thuật toán sẽ được đánh giá dựa trên dữ liệu lịch sử kiểm định khí thải của xe ô tô con, với 4 thuật toán cụ thể sẽ được xem xét.

Các thuật toán tuyến tính: Hồi quy logistic (Logistic Regression, LR) và Phân tích phân biệt tuyến tính (Linear Discriminant Analysis, LDA)

Non-linear algorithms include the K-Nearest Neighbors (KNN) classifier and Gaussian Naive Bayes (GaussianNB) The model initialization code for these algorithms is as follows: ```pythonmodels = {}models['LR'] = LogisticRegression(solver='lbfgs')models['LDA'] = LinearDiscriminantAnalysis()models['KNN'] = KNeighborsClassifier()models['NB'] = GaussianNB()```

Tất cả các tham số của các thuật toán được sử dụng đều giữ nguyên giá trị mặc định mà không có bất kỳ sự sửa đổi nào Các thuật toán được đánh giá dựa trên độ chính xác, thông qua việc so sánh giá trị trung bình và độ lệch chuẩn Đoạn mã cụ thể sử dụng KFold để thực hiện phân chia dữ liệu và áp dụng cross-validation, từ đó thu thập kết quả và in ra độ chính xác trung bình cùng độ lệch chuẩn của từng mô hình.

Kết quả thực thi các đoạn mã cho thấy thuật toán LDA và LR đạt điểm số cao (Hình 3-10), do đó chúng sẽ được lựa chọn để phân tích tiếp theo.

Hình 3-10 Điểm đạt được về độ chính xác của thuật toán

Hình 3-10 minh họa số điểm đạt được về độ chính xác khi dự đoán trạng thái khí thải của xe ô tô thông qua phương pháp xác thực chéo 10 lần Kết quả cho thấy thuật toán LR và LDA có độ chính xác cao hơn so với các thuật toán khác Để so sánh kết quả dự đoán của các thuật toán, cần tạo một boxplot Đoạn code lập trình cho việc này như sau: fig = pyplot.figure(), fig.suptitle('Đánh giá thuật toán'), ax = fig.add_subplot(111), pyplot.boxplot(results), ax.set_xticklabels(models.keys()), pyplot.show().

Thực thi đoạn mã trên để có được kết quả như trong Hình 3-11

Hình 3-11 So sánh độ chính xác của mô hình dự đoán

Biểu đồ boxplot cho thấy kết quả thực hiện của thuật toán hồi quy logistic (LR) và phân tích phân biệt tuyến tính (LDA) có sự phân bố tương đối tập trung và cao, cho thấy độ chính xác cao trong việc phân tích và dự đoán trạng thái khí thải của xe ô tô Do đó, nên lựa chọn hai thuật toán này để xây dựng mô hình dự đoán trạng thái khí thải cho xe ô tô con.

Kết luận chương 3

Chương này giới thiệu tổng quan về phương pháp học máy, bao gồm các vấn đề liên quan đến phân loại và dự đoán, cùng với các thuật toán học máy phổ biến và cơ sở lý luận của chúng Ngoài ra, chương cũng trình bày về lập trình ứng dụng dự đoán nhanh trạng thái khí thải của ô tô con bằng ngôn ngữ Python, kết hợp với các thuật toán học máy và mô hình phân loại Thuật toán và mô hình dự đoán phù hợp đã được xác định dựa trên tập dữ liệu lịch sử về kiểm định khí thải của ô tô con chạy xăng.

NGHIÊN CỨU THỰC NGHIỆM

Bố trí thí nghiệm

4.1.1 Chuẩn bị xe thí nghiệm

Trước khi tiến hành thí nghiệm kiểm tra khí thải ô tô, cần chuẩn bị xe bằng cách để tay số ở vị trí trung gian và kích hoạt hệ thống phanh đỗ Tiếp theo, xác định kiểu động cơ (cháy cưỡng bức hay cháy do nén) và loại động cơ (số kỳ, số xy lanh) Đảm bảo động cơ và các hệ thống hoạt động bình thường, với đủ dầu, áp suất dầu bôi trơn và nhiệt độ nước làm mát trong giới hạn cho phép Kiểm tra hệ thống dẫn khí thải để đảm bảo không bị tắc hoặc rò rỉ, sau đó làm sạch hệ thống bằng cách tăng tốc độ động cơ lên khoảng 2500 vòng/phút trong 20 giây Cuối cùng, xác định loại nhiên liệu sử dụng (xe ô tô chạy xăng) và đưa phương tiện vào trạng thái sẵn sàng để đo.

- Tắt tất cả các thiết bị phụ tiêu thụ năng lượng trên xe như điều hoà nhiệt độ, quạt gió, các hệ thống chiếu sáng, tín hiệu, sấy kính…;

- Để động cơ hoạt động ở chế độ tốc độ vòng quay không tải nhỏ nhất

Các thiết bị thí nghiệm chính để đo và kiểm tra khí thải bao gồm băng thử động lực M13/APM210, thiết bị phân tích khí xả CVS-7200S và quạt gió QHP320 Bảng tổng hợp các thiết bị này được trình bày trong Bảng 4-1.

Bảng 4-1 Các thiết bị thí nghiệm kiểm tra khí thải xe ô tô

STT Tên thiết bị Mã hiệu Hãng sản xuất

1 Thiết bị phân tích khí xả CVS-7200S HORIBA

2 Băng thử động lực (Chassis dynamometer) M13/APM210 AVL

3 Quạt gió QHP320 Nanjing Jianmao

Hình 4-1 Băng thử động lực Hình 4-2 Thiết bị phân tích khí xả

Dưới đây là sơ đồ mô tả hệ thống thí nghiệm kiểm tra khí thải đuôi ống xả xe ô tô với thiết bị phân tích khí xả CVS-7200S (Hình 4-3)

Hình 4-3 Sơ đồ hệ thống thí nghiệm kiểm tra khí thải xe ô tô

Xe ô tô con thí nghiệm, sau khi được chuẩn bị theo yêu cầu, sẽ được lái lên băng thử động lực để kiểm tra khí thải Băng thử động lực mô phỏng tải của xe khi chạy trên đường Trong quá trình thử nghiệm, nhiệt độ phòng phải duy trì từ 20ºC đến 30ºC, và quạt gió cần thổi một dòng không khí với vận tốc thay đổi từ 10 km/h đến ít nhất 50 km/h Vận tốc gió tại cửa ra của quạt phải tương ứng với vận tốc của con lăn trên băng thử, với sai số cho phép.

5% trong khoảng tốc độ từ 10km/h đến 50km/h Từ 50km/h trở lên cho phép sai số 10%

Quy trình lấy mẫu và phân tích khí thải xe ô tô con được thực hiện theo các quy định của phép thử loại I cho xe có khối lượng chuẩn thấp, được quy định chi tiết trong TCVN 6785-2015 Tiêu chuẩn này đề cập đến yêu cầu và phương pháp thử nghiệm khí thải gây ô nhiễm từ ô tô theo nhiên liệu sử dụng cho động cơ, nhằm đảm bảo sự tuân thủ trong phê duyệt kiểu.

Dưới đây là hình ảnh trong quá trình thí nghiệm đo kiểm tra khí thải của xe ô tô con (Hình 4-4)

Hình 4-4 Hình ảnh thí nghiệm kiểm tra khí thải của xe ô tô con

Kết quả thí nghiệm và so sánh

4.2.1 Kết quả đo nồng độ khí thải của xe ô tô

Quá trình thí nghiệm kiểm tra khí thải theo phép thử loại I đã được thực hiện cho 06 xe ô tô con chạy xăng với khối lượng toàn bộ không vượt quá 2500kg, được ký hiệu từ xe 01 đến xe 06 Các xe đã được chuẩn bị theo yêu cầu và kết quả đo khí thải được ghi chép, tính giá trị trung bình và so sánh với các giới hạn khí thải quy định Dựa trên mức 4 của chuẩn khí thải cho xe lắp động cơ cháy cưỡng bức, trạng thái khí thải của các xe được xác định là đạt hoặc không đạt tiêu chuẩn Kết quả thí nghiệm được tổng hợp trong bảng 4-2.

Bảng 4-2 Kết quả đo kiểm tra khí thải của xe của xe ô tô con

Thông tin cơ bản của xe

Giá trị giới hạn mức 4 Kết quả kiểm tra

Khối lượng bản thân (kg)

Chỉ số công tơ mét (km)

Ngày đăng ký CO HC NO x CO HC NO x Kết luận

(Nguồn: Tổng hợp từ kết quả thí nghiệm)

Kết quả thử nghiệm cho thấy trong số 06 xe thí nghiệm, có 05 xe đạt tiêu chuẩn khí thải Euro 4 theo TCVN 6785-2015, trong khi 01 xe không đạt Xe không đạt tiêu chuẩn là xe 06, có cường độ sử dụng cao với chỉ số công tơ mét 426506 km và thuộc nhóm xe có chỉ số công tơ mét từ (40÷60)×10^4 km, có tỷ lệ kiểm định không đạt khí thải cao Xe 06 cũng là xe có số năm sử dụng lớn nhất, trên 12 năm, và nằm trong nhóm có tỷ lệ không đạt tiêu chuẩn khí thải cao nhất Kết quả này phù hợp với các phân tích ở chương 2 về mối liên hệ giữa cường độ sử dụng xe và tỷ lệ kiểm định không đạt yêu cầu khí thải.

4.2.2 So sánh kết quả thí nghiệm với kết quả dự đoán nhanh Để so sánh và kiểm chứng giữa kết quả thí nghiệm với kết quả dự đoán nhanh trạng thái khí thải của xe ô tô bằng ứng dụng dự đoán nhanh đã lập trình ở chương 3, tiến hành khởi chạy “Ứng dụng dự đoán nhanh trạng thái khí thải của xe ô tô con”, nhập lần lượt các thông số của 06 xe thí nghiệm nêu trên vào ứng dụng dự đoán nhanh, lựa chọn mô hình dự đoán LD (một trong 02 mô hình đã được đánh giá là phù hợp trong đánh giá nhanh trạng thái khí thải của xe ô tô con), sau đó nhấn nút “KẾT QUẢ DỰ ĐOÁN NHANH” Kết quả dự đoán nhanh bằng ứng dụng đã lập trình được tổng hợp ở bảng 4-3 dưới đây

Bảng 4-3 Kết quả đoán nhanh tình trạng khí thải của xe ô tô con

Thông tin đầu vào của xe Mô hình dự đoán đã chọn

Số năm sử dụng (năm)

Chỉ số công tơ mét

Trạng thái khí thải Độ tin cậy (%)

Thông tin đầu vào của xe Mô hình dự đoán đã chọn

Số năm sử dụng (năm)

Chỉ số công tơ mét

Trạng thái khí thải Độ tin cậy (%)

Theo Bảng 4-3, trong số 06 xe được dự đoán nhanh về trạng thái khí thải, có 04 xe đạt tiêu chuẩn khí thải, bao gồm xe 01 và xe 02.

Trong quá trình kiểm tra khí thải, xe 01, xe 02 và xe 05 đạt tiêu chuẩn với độ tin cậy lần lượt là 87,03%, 85,72% và 76,43% Xe 03 cũng đạt tiêu chuẩn nhưng với độ tin cậy thấp hơn, chỉ 53,18% Ngược lại, xe 04 và xe 06 không đạt tiêu chuẩn khí thải Kết quả này phù hợp với các thí nghiệm đã được thực hiện, đặc biệt là trong bảng 4-2.

Xe 04 đạt tiêu chuẩn về khí thải trong thí nghiệm, nhưng ứng dụng đánh giá nhanh lại cho kết quả "Không đạt" với độ tin cậy 54,78% Điều này xuất phát từ việc ứng dụng dựa vào dữ liệu lịch sử của các xe ô tô con, trong khi xe 04 đã sử dụng 14,4 năm và đi được 19,65 x 10^4 km Mặc dù độ tin cậy của dự đoán chỉ khoảng 50%, kết quả thí nghiệm cho thấy xe vẫn có thể đạt tiêu chuẩn khí thải nếu được vận hành và bảo trì đúng cách Đối với xe 06, kết quả dự đoán là "Không đạt" với độ tin cậy 92,70%, phù hợp với kết quả thí nghiệm đã nêu.

Dưới đây là một số ảnh chụp màn hình từ ứng dụng dự đoán nhanh, thể hiện trạng thái khí thải của 06 xe ô tô con được đề cập (từ hình 4-5 đến hình 4-10).

Hình 4-5 Kết quả dự đoán của xe 01 Hình 4-6 Kết quả dự đoán của xe 02

Hình 4-7 Kết quả dự đoán của xe 03 Hình 4-8 Kết quả dự đoán của xe 04

Hình 4-9 Kết quả dự đoán của xe 05 Hình 4-10 Kết quả dự đoán của xe 06

Kết quả từ phân tích và so sánh cho thấy ứng dụng lập trình dự đoán nhanh trạng thái khí thải của xe ô tô con tại Việt Nam là chính xác và đáng tin cậy.

Kết luận chương 4

Chương này tiến hành thí nghiệm đo nồng độ khí thải của một số xe ô tô con chạy xăng, nhằm so sánh và đánh giá hiệu quả cũng như độ tin cậy của ứng dụng dự đoán nhanh trạng thái khí thải đã được xây dựng ở chương 3 Kết quả thí nghiệm sẽ là cơ sở đề xuất giải pháp tham khảo cho cơ quan đăng kiểm xe cơ giới trong việc kiểm định khí thải ô tô con.

KẾT LUẬN VÀ KIẾN NGHỊ

Luận văn này áp dụng phương pháp thống kê phân tích và kỹ thuật học máy để dự đoán trạng thái khí thải của xe ô tô con sử dụng nhiên liệu xăng Bằng cách phân tích gần 40.000 dữ liệu kiểm định khí thải, nghiên cứu đã xem xét mối quan hệ giữa cường độ sử dụng phương tiện, khối lượng chuẩn RM và tỷ lệ kiểm định không đạt Sử dụng ngôn ngữ lập trình Python cùng với các thuật toán học máy, luận văn xây dựng ứng dụng dự đoán nhanh trạng thái khí thải Kết quả nghiên cứu lý thuyết và thực nghiệm đã đưa ra những kết luận quan trọng về tình trạng khí thải của xe ô tô con.

Bài viết đã tổng hợp hệ thống tiêu chuẩn khí thải cho xe ô tô hạng nhẹ tại châu Âu, Trung Quốc và Việt Nam, đồng thời trình bày phương pháp xác định giá trị giới hạn nồng độ khí thải theo tiêu chuẩn Việt Nam Ngoài ra, quy trình đo kiểm định khí thải xe ô tô theo phép thử loại I cũng được đề cập.

Dựa trên dữ liệu kiểm định khí thải từ gần 40.000 lượt xe, nghiên cứu đã phân tích và đánh giá ảnh hưởng của chỉ số công tơ mét, số năm sử dụng và khối lượng chuẩn RM của xe ô tô con chạy xăng đến tỷ lệ không đạt tiêu chuẩn về khí thải.

Chỉ số công tơ mét và số năm sử dụng xe ô tô là hai yếu tố quan trọng ảnh hưởng đến chất lượng khí thải Khi chỉ số công tơ mét và tuổi thọ xe tăng lên, tỷ lệ xe ô tô con không đạt tiêu chuẩn về khí thải cũng gia tăng đáng kể.

Luận văn đã nghiên cứu các thuật toán học máy và phát triển ứng dụng dự đoán nhanh trạng thái khí thải của ô tô con, sử dụng ngôn ngữ lập trình Python Ứng dụng này cung cấp cơ sở để đánh giá nhanh tình trạng khí thải của các xe ô tô con chạy bằng xăng.

Luận văn đã thực hiện thí nghiệm đo kiểm tra khí thải của 06 xe ô tô con chạy xăng và so sánh với kết quả đánh giá nhanh thông qua ứng dụng dự đoán Kết quả cho thấy ứng dụng này có khả năng dự đoán chính xác trạng thái khí thải của xe ô tô con với độ tin cậy cao.

Do hạn chế về thời gian và nội dung nghiên cứu, luận văn chỉ tập trung vào việc đánh giá các yếu tố ảnh hưởng đến chất lượng khí thải của xe ô tô con chạy xăng qua tỷ lệ kiểm định không đạt tiêu chuẩn Các loại xe khác như ô tô tải, ô tô buýt và xe lắp động cơ diesel chưa được nghiên cứu đầy đủ Kiến nghị các nghiên cứu tiếp theo nên mở rộng để đánh giá nồng độ khí thải của các loại xe này Bên cạnh đó, ứng dụng đánh giá nhanh trạng thái khí thải hiện tại còn đơn giản và dữ liệu tập huấn hạn chế, vì vậy cần tiếp tục nghiên cứu để hoàn thiện ứng dụng dự đoán nhanh với bộ dữ liệu lớn hơn, tích hợp thông tin kiểm tra khí thải từ nhiều loại xe khác nhau.

Ngày đăng: 16/12/2023, 08:39

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w