Với sự phát triển của khoa học công nghệ, các hệ thống trên ô tô hiện nay đang được nâng cấp và ngày một trở lên phức tạp. Cùng với đó, việc chẩn đoán các sai lệch và hư hỏng của động cơ cũng như các hệ thống trên ô tô đòi hỏi các phương pháp chẩn đoán mới thay vì dựa vào kinh nghiệm của các kỹ thuật viên.
CHÀO MỪNG KỶ NIỆM NGÀY NHÀ GIÁO VIỆT NAM 20/11 CHẨN ĐỐN TRẠNG THÁI KĨ THUẬT ĐỘNG CƠ Ơ TƠ BẰNG DỮ LIỆU ĐÁP ỨNG VỀ NHIÊN LIỆU CỦA ĐỘNG CƠ VÀ THUẬT TOÁN K-NEAREST NEIGHBOR AUTOMOTIVE ENGINE DIAGNOSTICS USING FUEL TRIM DATA AND K-NEAREST NEIGHBOR ALGORITHM TRẦN XUÂN THẾ Viện Cơ khí, Trường Đại học Hàng hải Việt Nam Email liên hệ: thetx.vck@vimaru.edu.vn Tóm tắt Với phát triển khoa học công nghệ, hệ thống ô tô nâng cấp ngày trở lên phức tạp Cùng với đó, việc chẩn đốn sai lệch hư hỏng động hệ thống tơ đòi hỏi phương pháp chẩn đốn thay dựa vào kinh nghiệm kỹ thuật viên Bài báo xây dựng mơ hình chẩn đốn trạng thái kĩ thuật động ô tô liệu Fuel Trims 300 mẫu liệu xe thu thập được, dựa thuật toán K-nearest Neighbor (KNN) Bài báo xây dựng mơ hình tiến hành kiểm nghiệm tệp liệu kiểm tra đạt độ xác cao 87% Căn vào kết mơ hình thể mối quan hệ thông số đầu vào bao gồm độ tuổi, giới tính người điều khiển chính, khu vực xe hoạt động chính, quãng đường xe chạy với số LTFT, giá trị để đánh giá trạng thái kỹ thuật động Từ khóa: Chẩn đốn tơ, fuel trim, học có giám sát, K-nearest neighbor Abstract Technology and science have been revolutionized recently As a result, the systems on the car are increasingly complicated than it were the past Thus, it requires new methods to diagnostic the engine and automotive systems’ technical status, rather than depending on the experience of technicans In this article, I aim to build a model to diagnostic engine status based on Fuel Trims data collected from 300 car samples and using K-nearest Neighbor (KNN) to train this data The model was successfully built and got the highest accuracy is 87% The model illustrated the relationship between input data that include age, gender of drivers, the using location of the cars, the milleague of the cars and LTFT index - the index to evaluate the technical status of car engines Keywords: Vehicle diagnostic, Fuel trim, Supervised Learning, K-nearest neighbor Giới thiệu vấn đề nghiên cứu Hiện nay, hãng ô tô đầu tư phát triển nhiều phần mềm, thiết bị chẩn đoán chuyên hãng với độ xác hiệu tương đối cao Ví dụ phần mềm Techstream Toyota, Dịch vụ liệu toàn cầu (GDS) Huyndai, hay Dịch vụ liệu Honda (HDS),… ứng dụng chẩn đốn cá nhân, cài đặt điện thoại Những phần mềm này, cung cấp cho người sử dụng nhiều liệu hệ thống ô tơ, qua hỗ trợ kỹ thuật viên nhiều q trình chẩn đốn sửa chữa hư hỏng ô tô Tuy nhiên, liệu phục vụ cho kỹ thuật viên, người có kiến thức chun ngành tơ tính phức tạp chúng Với việc liệu trạng thái kỹ thuật tơ liên tục cập nhật hàng hàng triệu người dùng ô tô giới Nguồn liệu lớn cần khai phá để phục vụ rộng cho không kỹ thuật viên tơ mà người sử dụng xe toàn cầu Một số nghiên cứu áp dụng Machine Learning để phân tích liệu thu thập q trình vận hành tơ Xác định đặc điểm điều khiển ô tô người điều khiển qua phân cụm đặc tính người điều khiển đưa hệ thống tối ưu phù hợp với điều khiển người lái [1] Dựa vào từ ngữ miêu tả lỗi khách hàng, gợi ý mã chẩn đoán cố (DTC) tương ứng, dựa sử dụng thuật tốn xử lý ngơn ngữ tự nhiên [2] Xây dựng server để thu thập liệu hệ thống ô tô, sử dụng Machine Learning để đưa gợi ý bảo dưỡng theo tình trạng thực tế xe trước hư hỏng xảy [3] Chẩn đốn trạng thái động tơ phân tích âm sử dụng thuật tốn trí tuệ nhân tạo (ANN) phân loại theo phân phối xác suất Bayes (NBC) Machine Learning [4] Trong liệu quan trọng giúp chẩn đoán trạng thái kỹ thuật động tơ, Fuel Trims nói liệu quan trọng Fuel Trim điều chỉnh nhiên liệu bù thêm giảm bớt Tạp chí Khoa học Cơng nghệ Hàng hải Số 60 - 11/2019 23 CHÀO MỪNG KỶ NIỆM NGÀY NHÀ GIÁO VIỆT NAM 20/11 ECU ô tô nhằm giúp cho tỉ lệ khơng khí, nhiên liệu (tỉ lệ A/F) nạp vào động tỉ lệ lý tưởng 14,7:1 [5] Nếu tỷ lệ giảm tăng lên, gây tình trạng hao phí nhiên liệu nguy gây hư hỏng tới hệ thống liên quan tơ Qua đó, nói đáp ứng nhiên liệu động (Fuel trim - FT) thơng số phản ánh tình trạng hoạt động động định lượng hiệu Đáp ứng nhiên liệu động chất thông số ghi lại thay đổi tỉ lệ khơng khí, nhiên liệu q trình động hoạt động, tỉ lệ khơng khí nhiên liệu ln trì mức tốt 14,7:1, giá trị đáp ứng nhiên liệu động Giá trị tăng lên hỗn hợp khơng khí nhiên liệu tình trạng nghèo, tức tỉ lệ khơng khí, nhiên liệu tăng lên, có nhiều khơng khí nạp vào so với bình thường, nhiên liệu phun so với trạng thái bình thường động cơ, ngun nhân so số hư hỏng hệ thống nhiên liệu, ví dụ bơm nhiên liệu hay vòi phun,… Ngược lại, giá trị đáp ứng nhiên liệu động giảm hỗn hợp khơng khí nhiên liệu tình trạng giàu, có khơng khí nạp trạng thái bình thường động cơ, có nhiều liệu phun so với trạng thái bình thường động Có hai loại liệu đáp ứng nhiên liệu động bao gồm đáp ứng nhiên liệu động ngắn hạn (Short term fuel trim - STFT) ghi lại hiệu chỉnh nhiên liệu động ngắn hạn cập nhật liên tục theo trạng thái động sau vài giây lần STFT có khả thay đổi để đáp ứng với trạng thái động Dữ liệu đáp ứng nhiên liệu động thứ hai đáp ứng nhiên liệu động dài hạn (Long term fuel trim - LTFT) liệu theo dõi tình trạng động dài hạn, STFT thay đổi theo trạng thái động bao gồm sai lệch trình làm việc động cơ, LTFT theo dõi thay đổi STFT đưa đánh giá tình trạng thực tế động thời điểm Do đó, LTFT thường có ý nghĩa chẩn đốn động ô tô Về giá trị, giá trị đáp ứng nhiên liệu động ô tô khoảng từ -8% đến 8% bình thường, từ 8% - 20% vùng nguy cao động xuất sai lệch hoạt động, từ 20% - 25% vùng sai lệch, ECU thiết lập mã lỗi để cảnh báo sai lệch hoạt động động Hiện nay, giá trị Fuel Trims sử dụng rộng rãi công tác chẩn đốn kỹ thuật viên tơ, giá trị thu việc sử dụng phần mềm, thiết bị chẩn đoán đề cập Do đó, việc xác định nhanh chóng trạng thái kỹ thuật động người sử dụng xe khó khăn tốn thời gian người sử dụng ô tô cần đầu tư mua thiết bị chẩn đốn cần tay kết nối với thiết bị di động, điều tương đối lãng phí khơng q cần thiết người sử dụng cá nhân Do đó, nghiên cứu nhằm xây dựng phương pháp chẩn đoán mới, sử dụng thuật toán Machine Learning để xây dựng mơ hình dự đốn tình trạng kỹ thuật động ô tô dựa liệu dễ dàng xác định từ người sử dụng ô tô bao gồm thơng tin tuổi tác, giới tính, vị trí địa lý ô tô thường sử dụng, quãng đường ô tô Với hỗ trợ thiết bị, phần mềm chẩn đốn tơ nay, giá trị Long Term Fuel Trim xe điều tra liệu sử dụng để làm nhãn phân loại cho tình trạng kỹ thuật động Do liệu dùng để huấn luyện mơ hình lựa chọn LTFT làm nhãn tốn xây dựng mơ hình tốn học có giám sát (supervised learning) Machine Learning Các phần báo trình bày nội dung sau, phần báo trình bày phương pháp nghiên cứu bao gồm cách thu thập, xử lý chuẩn hóa liệu, thuật toán Machine Learning sử dụng để phân tích liệu, phần báo trình bày kết kiểm tra mơ hình xây dựng, phần đưa số bàn luận xung quanh vấn đề nghiên cứu Phương pháp xây dựng phân tích liệu Nghiên cứu thiết kế thông qua thu thập thông tin 300 chủ xe Kia Morning, loại xe phổ biến Việt Nam năm sản xuất từ 2014 2016 Dữ liệu thu thập khu vực thành thị ngoại thành Hải Phòng, thành phố lớn Việt Nam, điều kiện thời tiết không mưa, hai tháng mùa khô Việt Nam tháng 12 tháng Nhiệt độ trung bình hai tháng 20oC, nhiệt độ cao 25oC, thấp 16oC Đối tượng điều tra lựa chọn ngẫu nhiên qua chương trình chẩn đốn tơ miễn phí mà nghiên cứu cung cấp để thu thập liệu nhanh Thông qua cân đối thời gian huấn luyện liệu đặc tính thơng số chúng tơi định thu thập 300 mẫu liệu cho nghiên cứu Thiết bị sử dụng thiết bị chẩn đốn tơ Gscan, model 2.0, phiên phần mềm quốc tế 2018, nơi sản xuất Hàn Quốc 24 Tạp chí Khoa học Công nghệ Hàng hải Số 60 - 11/2019 CHÀO MỪNG KỶ NIỆM NGÀY NHÀ GIÁO VIỆT NAM 20/11 Việc đo lường tiến hành chế độ không tải (sau khởi động) sau động làm nóng năm phút Kết lần đo loại bỏ, kết cuối trung bình cộng giá trị LTFT xe hai lần đo tiếp theo, lần đo cách ba phút Giá trị LTFT giá trị hiển thị máy chẩn đoán Gscan phần kiểm tra thông số động Cơ sở xác định giá trị LTFT dựa liệu thực tế thu thập từ cảm biến tỉ lệ khơng khí nhiên liệu A/F, so với giá trị LTFT lập trình sẵn đồ sử dụng nhiên liệu tơ vòng quay tải động qua tính tốn giá trị LTFT theo đơn vị phần trăm Một câu hỏi thiết kế để thu thập liệu liên quan đến yếu tố sử dụng xe bao gồm tuổi người điều khiển xe chính, giới tính người điều khiển xe chính, khu vực sử dụng xe phổ biến, quãng đường sử dụng xe Đây liệu đơn giản, dễ xác định cho đối tượng sử dụng mơ hình chẩn đốn người sử dụng xe ô tô, kỹ thuật viên hay người có kiến thức chuyên ngành ô tô Bảng Dữ liệu quan sát tệp liệu khảo sát trước chuẩn hóa Mã số Tuổi người sử dụng xe (tuổi) Giới tính người sử dụng xe Khu vực sử dụng xe 001 002 003 004 26 40 30 33 Nam Nam Nữ Nữ Thành phố Ngoại thành Thành phố Ngoại thành Quãng đường xe chạy (Km) 27.701 20.115 21.613 21.288 Giá trị LTFT khảo sát (%) 21 1 10 Dữ liệu sau thu thập chuẩn hóa dạng số, thơng tin giới tính, giới tính Nam tương ứng với 1, nữ tương ứng với 0; thông tin khu vực sử dụng xe, khu vực thành phố quy ước 1, ngoại thành xe sử dụng hai khu vực quy ước ghi Đối với liệu LTFT xác định nhãn liệu, để phân loại tình trạng động Đối với thuật toán Classification (Phân loại) KNN, giá trị LTFT phân thành classes (nhóm) Nhóm tương ứng với giá trị tuyệt đối LTFT < 8%, đại diện cho động xe làm việc bình thường Nhóm tương ứng với giá trị tuyệt đối LTFT khoảng từ 9% đến 19%, đại diện cho động xe có sai số khả cao gặp hư hỏng Nhóm tương ứng với giá trị tuyệt đối LTFT 20%, đại diện cho tình trạng động gặp cố, làm việc không tốt không làm việc [5] Sau chuẩn hóa, liệu Bảng tương ứng với liệu Bảng sau Bảng Dữ liệu quan sát tệp liệu khảo sát sau chuẩn hóa Mã số Tuổi người sử dụng xe (tuổi) Giới tính người sử dụng xe Khu vực sử dụng xe Quãng đường xe chạy (Km) Giá trị LTFT khảo sát (%) 001 26 1 27.701 002 40 20.115 003 30 21.613 004 33 0 21.288 Tập liệu bao gồm 300 mẫu thu được, chia thành tập, tập thứ tập huấn luyện (traning set) dùng để xây dựng mơ hình bao gồm 70% liệu (210 mẫu), tập thứ tập kiểm tra dùng để kiểm tra tính xác mơ hình xây dựng bao gồm 30% liệu (90 mẫu) Với việc liệu gán nhãn thông số LTFT, thuật tốn học có giám sát (Supervised learning) Machine Learning sử dụng Sau cân nhắc đặc điểm liệu, đặc điểm thuật tốn học có giám sát, tác giả sử dụng thuật toán K-nearest Neighbor (KNN) để huấn luyện liệu tệp huấn luyện Thông số đầu vào thuật tốn thơng liệu huấn luyện bao gồm độ tuổi, giới tính người điều khiển chính, khu vực xe hoạt động chính, quảng đường xe chạy thơng số khảo sát, với đầu vào thuật tốn bao gồm liệu LTFT dùng làm nhãn để thể trạng thái động Các đầu vào tạo đầu không gian liệu mà đó, tất điểm liệu (xác định thơng số trên) thể tình trạng động bình thường, có nguy hư hỏng hay gặp hư hỏng Dựa vào không gian liệu huấn luyện này, đưa liệu cần kiểm tra (chưa có nhãn, chưa thể Tạp chí Khoa học Công nghệ Hàng hải Số 60 - 11/2019 25 CHÀO MỪNG KỶ NIỆM NGÀY NHÀ GIÁO VIỆT NAM 20/11 thơng tin tình trạng động cơ) vào, mơ hình vào k điểm gần với liệu cần kiểm tra để xác định nhãn cho liệu (số k xác định sau chạy mơ hình với nhiều giá trị k khác để xác định giá trị k phù hợp cho liệu thể Hình đây) Thuật tốn cho kết dự đốn nhóm mà liệu thuộc vào tương ứng với LTFT nhóm 0, hay Một số thuật tốn học có giám sát khác sử dụng trí tuệ nhân tạo (ANN) phân loại theo phân phối xác suất Bayes (NBC) Tuy nhiên, so với hai thuật toán thuật tốn KNN có lợi mặt tốc độ huấn luyện liệu nhanh, không tốn tài nguyên huấn luyện liệu phù hợp cho tốn có số lượng liệu nhỏ Đối với thuật toán ANN, thuật tốn thường cho độ xác cao với liệu lớn, cấu trúc mơ hình ANN tương đối phức tạp, nhiều thời gian tài ngun để huẩn luyện mơ hình Thuật tốn NBC thuật toán thiên sử dụng xác suất có tốc độ huấn luyện nhanh nên phù hợp với tốn có liệu lớn, NBC đặc biệt thích hợp với tốn xử lý ngơn ngữ tự nhiên [6] Thuật toán huấn luyện kiểm tra phần mềm Anaconda, dựa ngôn ngữ lập trình Python Bản chất thuật tốn KNN tương đối đơn giản, thuật toán xác định k điểm gần với điểm liệu xét không gian liệu đề cập tới trên, dựa theo khoảng cách Ecơ-lít khơng gian hai chiều, hay giá trị khoảng cách không gian véc tơ (được kí hiệu Norm 2) Cơng thức cụ thể sau: 2 𝑑(𝑞, 𝑝) = 𝑑(𝑝, 𝑞) = √(𝑞1 − 𝑝1 ) + (𝑞2 − 𝑝2 ) + ⋯ + (𝑞𝑛 − 𝑝𝑛 ) = √∑𝑛𝑖=1(𝑞𝑖 − 𝑝𝑖 ) (1) Trong đó: d(q,p) d(p,q) khoảng cách điểm liệu xét với điểm liệu gần khơng gian huấn luyện qi, pi giá trị tọa độ điểm thứ i mơ hình Kết xây dựng kiểm tra mơ hình xây dựng thuật tốn K-nearest Neighbor (KNN) Hình Mối liên hệ sai số dự đoán với giá trị k xây dựng mơ hình thuật tốn KNN Bảng Kết kiểm nghiệm thuật toán KNN cho 90 liệu tệp kiểm tra k = Tổng số: 90 Dự đoán Dự đoán Dự đoán Nhãn 55 (87%) (13%) (0%) Nhãn (31%) 16 (69%) (0%) Nhãn 2 (33%) (66%) (0%) Trên tập kiểm tra bao gồm 90 mẫu liệu, kết dự đoán cho nhóm có nhãn LTFT xe bình thường đạt độ xác 87%, 13% kết nhóm bị dự đốn nhầm sang nhãn Độ xác dự đốn cho nhóm có nhãn thấp với 69%, 31% kết nhóm bị dự đốn nhầm sang nhóm Kết đốn cho nhóm nhãn chưa xác, số lượng liệu dãn nhãn liệu nhỏ Đối với việc thực vòng lặp thuật tốn, 26 Tạp chí Khoa học Cơng nghệ Hàng hải Số 60 - 11/2019 CHÀO MỪNG KỶ NIỆM NGÀY NHÀ GIÁO VIỆT NAM 20/11 giá trị k số điểm liệu gần lấy làm để xác định nhóm cho dự liệu cần kiểm tra Ta nhận thấy, liệu với 300 mẫu liệu tương đối nhỏ Do thuật tốn cho kết xác giá trị k nhỏ Nếu số k lớn dẫn tới việc đan xen điểm liệu làm phân lớp cho liệu kiểm tra dẫn tới độ xác giảm xuống Kết luận Nguồn liệu trạng thái kỹ thuật ô tô động ô tô cập nhật hàng ngày Việc khai thác nguồn liệu để đưa dự đoán trạng thái kỹ thuật ô tô cấp thiết Bài báo sử dụng thuật toán K-nearest Neighbor (KNN) thuật toán phân loại đơn giản hiệu cho tốn phân loại nhiều nhóm liệu Mơ hình báo áp dụng thực tiễn cách nhanh chóng thơng qua tích hợp vào ứng dụng điện thoại cá nhân, giúp người điều khiển xe có gợi ý tình trạng kĩ thuật động tơ họ, qua đảm bảo tính an tồn q trình điều khiển sử dụng ô tô, giúp người điều khiển xe sớm có kế hoạch bảo dưỡng cho xe TÀI LIỆU THAM KHẢO [1] C Barreto, A Machine Learning Approach Based on Automotive Engine Data Clustering for Driver Usage Profiling Classification, Halmstad University Press, 2014 [2] M Yi Lu, Vehicle Fault Diagnostics Using Text Mining, Vehicle Engineering Structure and Machine Learning, International Journal of Intelligent Information Systems, 2015 [3] U Shafi, Vehicle Remote Health Monitoring and Prognostic Maintenance System, Journal of Advanced Transportation, 2018 [4] C Barreto, A Machine Learning Approach Based on Automotive Engine Data Clustering for Driver Usage Profiling Classification, Australian Information Security Management Conference, 2013 [5] Internet Resource: http://greencar.vn/dong-co-xang/fuel-trim-la-gi-hieu-ve-su-dieu-chinhnhien-lieu-cua-dong-co-o-to/ [6] H Trevo, The Elements Of Statictical Learning Second Edition, Springer, 2018 Ngày nhận bài: 09/5/2019 Ngày nhận sửa: 16/5/2019 Ngày duyệt đăng: 22/5/2019 Tạp chí Khoa học Công nghệ Hàng hải Số 60 - 11/2019 27 ... Nguồn liệu trạng thái kỹ thuật ô tô động ô tô cập nhật hàng ngày Việc khai thác nguồn liệu để đưa dự đoán trạng thái kỹ thuật ô tô cấp thiết Bài báo sử dụng thuật toán K-nearest Neighbor (KNN) thuật. .. để đáp ứng với trạng thái động Dữ liệu đáp ứng nhiên liệu động thứ hai đáp ứng nhiên liệu động dài hạn (Long term fuel trim - LTFT) liệu theo dõi tình trạng động dài hạn, STFT thay đổi theo trạng. .. nhiên liệu động giảm hỗn hợp khơng khí nhiên liệu tình trạng giàu, có khơng khí nạp trạng thái bình thường động cơ, có nhiều liệu phun so với trạng thái bình thường động Có hai loại liệu đáp ứng nhiên