Học Máy là nền tảng cho hàng loạt ứng dụng quan trọng như tìm kiếm trang web, lọc thư điện tử spam, nhận dạng giọng nói, gợi ý sản phẩm, và nhiều ứng dụng khác nữa. Nếu bạn cùng các thành viên trong nhóm đang làm một dự án học máy và rất muốn tiến triển nhanh chóng, thì quyển sách này là dành cho bạn
MỤC LỤC Giới thiệu Tại cần chiến lược Học Máy Cách sử dụng sách làm việc nhóm Kiến thức tiền đề Ký hiệu Quy mô động lực phát triển học máy Phần 1: Chuẩn bị tập phát triển tập kiểm tra Tập phát triển tập kiểm tra Tập phát triển tập kiểm tra nên có phân phối Tập phát triển/kiểm tra cần lớn đến mức nào? Thiết lập phép đo đơn trị làm mục tiêu tối ưu Phép đo tối ưu phép đo thỏa mãn 10 Xây dựng tập phát triển phép đo tăng tốc trình làm việc 11 Khi cần thay đổi tập phát triển/kiểm tra phép đo 12 Điều cần nhớ: Thiết lập tập phát triển kiểm tra Phần 2: Phân tích lỗi 13 Bạn mong muốn xây dựng hệ thống phòng chống email rác Nhóm bạn có nhiều ý tưởng: 14 Phân tích lỗi: đánh giá ý tưởng dựa tập phát triển 15 Đánh giá song song ý tưởng q trình phân tích lỗi 16 Dọn dẹp mẫu bị gán nhãn nhầm tập phát triển tập kiểm tra 17 Nếu bạn có tập phát triển lớn, chia thành hai tập phân tích tập 18 Tập phát triển Eyeball Blackbox nên lớn nào? 19 Điều cần nhớ: Phân tích lỗi Phần 3: Độ chệch Phương sai 20 Độ chệch Phương sai: Hai nguồn lớn lỗi 21 Những ví dụ Độ chệch Phương sai 22 So sánh với tỉ lệ lỗi tối ưu 23 Xử lý Độ chệch Phương sai 24 Sự đánh đổi Độ chệch Phương sai 25 Các kĩ thuật để giảm độ chệch tránh 26 Phân tích lỗi tập huấn luyện 27 Các kỹ thuật làm giảm phương sai Phần 4: Đồ thị q trình học 28 Chẩn đốn độ chệch phương sai: Đồ thị trình học 29 Vẽ đồ thị sai số huấn luyện 30 Diễn giải đồ thị trình học: Độ chệch cao 31 Giải nghĩa đồ thị trình học: Những trường hợp khác 32 Vẽ đồ thị trình học Phần 5: So sánh với chất lượng mức người 33 Tại so sánh với chất lượng mức người? 34 Cách xác định chất lượng mức người 35 Vượt qua chất lượng mức người Phần 6: Huấn luyện kiểm tra phân phối khác 36 Khi bạn nên huấn luyện kiểm tra phân phối khác 37 Làm để định có nên sử dụng tồn liệu? 38 Làm để định có nên bao gồm liệu không quán 39 Đánh trọng số liệu 40 Tổng quát hóa từ tập huấn luyện đến tập phát triển 41 Xác định lỗi độ chệch, phương sai, liệu không tương đồng 42 Xử lý liệu không tương đồng 43 Tổng hợp liệu nhân tạo Phần 7: Gỡ lỗi Thuật toán suy luận 44 Bài kiểm tra xác minh tối ưu 45 Dạng tổng quát kiểm tra xác minh tối ưu 46 Ví dụ Học tăng cường Phần 8: Học sâu đầu-cuối 47 Sự trỗi dậy học đầu-cuối 48 Thêm ví dụ học đầu-cuối 49 Ưu nhược điểm học đầu-cuối 50 Lựa chọn thành phần cho pipeline: Tính sẵn có liệu 51 Lựa chọn thành phần cho pipeline: tính đơn giản tác vụ 52 Trực tiếp học đầu phức tạp Phần 9: Phân tích lỗi phần 53 Phân tích lỗi phần 54 Quy lỗi cho thành phần 55 Trường hợp tổng quát việc quy lỗi 56 Phân tích lỗi phần so sánh với chất lượng mức người 57 Phát pipeline học máy bị lỗi Phần 10: Tổng kết 58 Xây dựng biệt đội siêu anh hùng - Hãy để đồng đội bạn đọc điều Giới thiệu Tại cần chiến lược Học Máy Học Máy tảng cho hàng loạt ứng dụng quan trọng tìm kiếm trang web, lọc thư điện tử spam, nhận dạng giọng nói, gợi ý sản phẩm, nhiều ứng dụng khác Nếu bạn thành viên nhóm làm dự án học máy muốn tiến triển nhanh chóng, sách dành cho bạn Ví dụ: Xây dựng Startup ảnh mèo Giả sử bạn xây dựng công ty khởi nghiệp cung cấp không giới hạn ảnh mèo cho người yêu thích Bạn dùng mạng nơ-ron cho hệ thống thị giác máy nhằm phát mèo ảnh Nhưng dở thuật toán bạn dùng chưa đủ độ xác Bạn chịu nhiều áp lực để tăng chất lượng phát mèo Bạn làm nào? Nhóm bạn đưa nhiều ý tưởng như: Lấy thêm liệu: Sưu tầm thêm nhiều ảnh mèo Lấy tập huấn luyện đa dạng Ví dụ như: ảnh mèo vị trí độc lạ, ảnh mèo với màu sắc khác thường, ảnh mèo chụp với cấu hình máy ảnh khác v.v Huấn luyện thuật toán lâu cách chạy thêm nhiều vòng lặp hạ gradient Thử nghiệm mạng nơ-ron lớn với nhiều tầng/nút ẩn/tham số Thử nghiệm mạng nơ-ron nhỏ Thử nghiệm kỹ thuật regularization (ví dụ L2 regularization) Thay đổi kiến trúc mạng nơ-ron (ví dụ: hàm kích hoạt, số lượng nút ẩn, v.v) Nếu chọn hướng kể trên, bạn xây dựng nên tảng ảnh mèo startup thành công Ngược lại, chọn nhầm hướng, bạn đánh tháng trời Vậy phải làm nào? Cuốn sách giúp bạn trả lời câu hỏi Phần lớn vấn đề học máy có dấu hiệu riêng ẩn chứa gợi ý phương hướng giải Việc học để phát dấu hiệu giúp bạn tiết kiệm hàng tháng hay chí hàng năm trời phát triển sản phẩm Cách sử dụng sách làm việc nhóm Sau đọc xong sách này, bạn hiểu sâu cách lựa chọn hướng giải kỹ thuật cho đề tài học máy Nhưng cộng chưa rõ bạn lại chọn hướng Ví dụ bạn muốn đội xác định dùng phép đo đơn trị, người khơng đồng tình, bạn làm để thuyết phục họ? Đó lý tơi chủ tâm viết chương ngắn Bạn dễ dàng thuyết phục quý đồng nghiệp cách chia sẻ 1-2 trang chương liên quan Chỉ với vài thay đổi nhỏ thứ tự ưu tiên tác động lớn tới suất công việc nhóm Và thay đổi đó, tơi hi vọng bạn sớm trở thành siêu nhân Học Máy đội! Kiến thức tiền đề Ký hiệu Nếu bạn học lớp Học Máy, ví dụ lớp MOOC tơi Coursera, bạn có kinh nghiệm áp dụng học có giám sát sách dễ hiểu bạn Tôi giả định bạn quen thuộc với học có giám sát: học hàm ánh xạ từ x tới y, sử dụng cặp liệu có nhãn (x,y) Các thuật tốn học có giám sát bao gồm hồi quy tuyến tính, hồi quy logistic mạng nơ-ron Học Máy có nhiều dạng nhiên phần lớn giá trị thực tiễn đến từ học có giám sát Tơi thường xun đề cập đến mạng nơ-ron (còn biết đến "học sâu") Bạn cần nắm số khái niệm mạng nơ-ron hiểu nội dung sách Nếu khái niệm nêu cịn với bạn bạn xem video ba tuần khóa học Machine Learning Coursera http://ml-class.org Quy mô động lực phát triển học máy Rất nhiều ý tưởng học sâu (mạng nơ-ron) xuất từ hàng thập kỷ trước Vậy tới chúng bùng nổ vậy? Hai nguyên nhân là: Sự sẵn có liệu Ngày nay, người dành nhiều thời gian bên thiết bị số máy tính xách tay, thiết bị di động, v.v Việc tạo nguồn liệu cực lớn dùng cho thuật tốn học máy Quy mơ lực tính tốn Chỉ tới vài năm gần ta huấn luyện mạng nơ-ron đủ lớn để tận dụng liệu khổng lồ Cho dù có thêm nhiều nhiều liệu nữa, thường chất lượng thuật toán học máy cổ điển, hồi quy logistic, không tốt Nghĩa đồ thị q trình học chững lại thuật tốn ngừng cải thiện có thêm liệu: Như thể thuật tốn cổ điển khơng biết xử lý với tất lượng liệu ta có Nếu bạn huấn luyện mạng nơ-ron nhỏ cho tác vụ học có giám sát, bạn đạt chất lượng cao chút: "Mạng neural nhỏ" có nghĩa mạng nơ-ron với nút ẩn/tầng/tham số Sau cùng, bạn cải thiện chất lượng thêm dùng mạng nơ-ron lớn [1]: Như bạn đạt chất lượng tốt (i) huấn luyện mạng nơ-ron lớn tương ứng với đường chất lượng màu xanh lục (ii) có lượng liệu lớn Nhiều chi tiết khác kiến trúc mạng nơ-ron quan trọng, có nhiều phát kiến lĩnh vực Tuy nhiên, cách đáng tin cậy để tăng chất lượng thuật toán (i) huấn luyện mạng lớn (ii) lấy thêm liệu CHÚ THÍCH: [1] Mặc dù hình vẽ thể mạng nơ-ron cho kết tốt với tập liệu nhỏ, tượng quán so với việc mạng nơ-ron hoạt động tốt với liệu lớn Với liệu nhỏ, chất lượng thuật tốn cổ điển tốt mạng nơ-ron phụ thuộc vào đặc trưng thủ cơng Nếu ta có 20 mẫu huấn luyện việc dùng hồi quy logistic hay mạng nơ-ron không khác biệt nhiều; chọn khéo đặc trưng thủ cơng giúp ích nhiều so với việc chọn thuật tốn Cịn có triệu mẫu, tơi chọn dùng mạng nơ-ron Để đạt (i) (ii) trình đặc biệt phức tạp Vấn đề thảo luận đầy đủ chi tiết sách Ta bắt đầu với chiến lược thơng thường hữu ích cho thuật tốn truyền thống lẫn mạng nơ-ron, từ hình thành chiến lược tân tiến để xây dựng hệ thống học sâu Phần 1: Chuẩn bị tập phát triển tập kiểm tra Bằng cách sử dụng pipeline này, bạn nói với thuật tốn có bước để lái xe: (1) Phát xe khác, (2) Phát người bộ, (3) Hoạch định đường cho xe bạn Ngoài ra, bước hàm số tương đối đơn giản học với liệu so với hướng tiếp cận đầu-cuối Tóm lại, lựa chọn thành phần cho pipeline, cố gắng xây dựng pipeline mà thành phần hàm số tương đối "đơn giản" cho học từ lượng liệu vừa phải CHÚ THÍCH: [16] Lý thuyết thơng tin có khái niệm "Độ phức tạp Kolmogorov", lý thuyết nói độ phức tạp hàm số học độ dài chương trình máy tính ngắn để xây dựng thuật tốn Tuy nhiên, khái niệm lý thuyết có ứng dụng thực tế AI Xem thêm https://en.wikipedia.org/wiki/Kolmogorov_complexity [17] Nếu bạn quen với thuật toán thực tế phát vật thể, bạn nhận chúng không học với ảnh có nhãn 0/1, thay vào huấn luyện với khung chứa từ liệu huấn luyện Thảo luận vấn đề nằm phạm vi chương Tham khảo khóa "Deep Learning specialization" Coursera (http://deeplearning.ai) bạn muốn học thêm thuật toán 52 Trực tiếp học đầu phức tạp Một thuật toán phân loại nhận đầu vào ảnh x trả số nguyên thể nhãn phân loại đồ vật ảnh Thay vào đó, liệu thuật tốn đưa câu mơ tả hồn chỉnh cho ảnh đó? Ví dụ: x= y = "Một xe buýt màu vàng xuống đường với xanh cỏ." Những ứng dụng truyền thống thuật tốn học có giám sát học hàmh: X→Y, đầu y thường số nguyên số thực Ví dụ: Bài toán X Y Phân loại email rác Email email rác/ không rác(0/1) Nhận dạng ảnh Ảnh Nhãn số nguyên Dự đoán giá nhà đất Đặc trưng nhà Giá theo Đô-la Gợi ý sản phẩm Đặc trưng sản phẩm người dùng Xác suất mua sản phẩm Một hướng phát triển thú vị học sâu đầu-cuối cho phép trực tiếp học kết phức tạp nhiều so với đầu việc học truyền thống Trong ví dụ thích hình ảnh trên, bạn cho hình ảnh (x) vào mạng nơ-ron trực tiếp thu câu thích miêu tả hình ảnh (y) Dưới số ví dụ khác: Bài tốn X Y Trích dẫn ví dụ Chú thích hình ảnh Ảnh Văn Mao et al., 2014 Dịch máy Văn tiếng Anh Văn tiếng Pháp Suskever et al., 2014 Văn trả lời Bordes et al., 2015 Âm Bản ghi thoại Hannun et al., 2015 Đặc trưng văn Âm Hỏi đáp Nhận dạng giọng nói Văn sang giọng nói Cặp (Văn bản, Câu hỏi) van der Oord et al., 2016 Đây xu hướng ngày phát triển học sâu Với cặp có nhãn (đầu vào, đầu ra) phù hợp, đơi bạn học đầu cuối đầu câu, hình ảnh, âm đầu khác phức tạp nhiều thay số Phần 9: Phân tích lỗi phần 53 Phân tích lỗi phần Giả sử hệ thống bạn xây dựng dựa pipeline học máy phức tạp bạn muốn cải thiện chất lượng Bạn nên cải thiện phần pipeline này? Bạn xếp thứ tự ưu tiên công việc cách quy lỗi cụ thể cho phần pipeline Hãy sử dụng ví dụ phân loại mèo Xiêm chúng ta: Phần đầu tiên, phát mèo, xác định vị trí mèo cắt chúng khỏi ảnh Phần thứ hai, phân loại giống mèo, xác định xem có phải mèo Xiêm hay khơng Việc cải thiện phận pipeline tốn tới hàng năm trời Làm để bạn định (những) phận cần tập trung cải thiện? Bằng việc thực phân tích lỗi phần, bạn cố quy trách nhiệm cho (hoặc hai) phần pipeline dự đoán sai thuật tốn Ví dụ, thuật tốn phân loại sai ảnh khơng có mèo Xiêm (y=0) nhãn xác y=1 Hãy kiểm chứng cách thủ công xem hai bước thuật tốn làm Giả sử phát mèo Xiêm phát mèo đây: Tức phận loại giống mèo đưa cho hình sau: Bộ phân loại giống mèo sau xác định xác hình khơng có mèo Xiêm Vậy nên, phân loại giống mèo khơng có lỗi: Nó đưa cho cho xem đống đá trả nhãn y=0 hợp lý Thực tế, người mà phải phân loại ảnh cắt tồn đá dự đốn y=0 mà thơi Do vậy, bạn rõ ràng quy lỗi cho phát mèo Mặt khác, giả sử phát mèo có cho kết khung chứa đây: bạn kết luận phát mèo hồn thành cơng việc nó, lỗi phân loại giống mèo mà Giả sử bạn kiểm chứng 100 ảnh bị phân loại nhầm tập phát triển nhận 90 số lỗi phát mèo, có 10 lỗi phân loại giống mèo Bạn an tồn kết luận bạn nên tập trung nhiều vào việc cải thiện phát mèo Ngoài ra, tiện bạn tìm 90 mẫu mà phát mèo trả khung chứa chưa xác Bạn sử dụng 90 mẫu để thực việc phân tích lỗi kĩ phát mèo tìm cách cải thiện Việc làm để quy lỗi cho phần pipeline mơ tả cách phi thống: bạn nhìn vào đầu phần để xem liệu định phần gây lỗi Phương pháp phi thống đủ với bạn Tuy nhiên chương sau, bạn thấy cách thống việc quy lỗi 54 Quy lỗi cho thành phần Cùng tiếp tục với ví dụ này: Giả sử phát mèo cho kết khung chứa sau: Khi phân loại giống mèo nhận ảnh bị cắt, cho kết khơng xác y=0, tức khơng có mèo hình Bộ phát mèo hoạt động khơng tốt Tuy nhiên, người có kỹ nhận dạng mèo Siamese từ ảnh bị cắt lệch Trường hợp nên quy lỗi cho phát mèo, phân loại giống mèo, hai? Có khơng rõ ràng Nếu số lượng trường hợp khơng rõ ràng nhỏ, định mà bạn lựa chọn đạt kết tương đương Tuy nhiên kiểm tra thức giúp bạn quy lỗi xác cho thành phần: a Thay đầu phát mèo khung chứa thủ công: b Nạp ảnh bị cắt tương ứng vào phân loại giống mèo Nếu phân loại giống mèo phân loại sai quy lỗi cho phân loại giống mèo Ngược lại quy lỗi cho phát mèo Nói cách khác, thực thử nghiệm mà bạn cung cấp cho phân loại giống mèo đầu vào "hồn hảo" Hai trường hợp xảy ra: Trường hợp 1: Kể với khung chứa "hoàn hảo", phân loại giống mèo đưa kết khơng xác y=0 Trong trường hợp rõ ràng phân loại giống mèo có lỗi Trường hợp 2: Với khung chứa "hoàn hảo", phân loại giống mèo đưa kết xác y=1 Điều cho thấy phát mèo đưa khung chứa xác hơn, kết tổng thể toàn hệ thống cải thiện Trong trường hợp phát mèo có lỗi Bằng cách phân tích ảnh bị phân loại sai tập phát triển, bạn quy lỗi xác cho thành phần Điều cho phép bạn ước tính tỉ lệ lỗi cho thành phần pipeline, từ định thành phần cần tập trung khắc phục 55 Trường hợp tổng quát việc quy lỗi Đây bước tổng quát cho việc quy lỗi Giả sử thiết kế pipeline có ba thành phần A, B, C A cung cấp thông tin trực tiếp cho B, B cung cấp thông tin trực tiếp cho C Với lỗi hệ thống tập phát triển: a Thử điều chỉnh thủ công kết đầu A cho "hồn hảo" (ví dụ, khung chứa hình mèo "hồn hảo"), sau tiến hành chạy thuật tốn cho pipeline gồm có B C với đầu Nếu thuật tốn trả kết cuối xác, điều rằng, thuật tốn cho kết xác A trả kết tốt Vậy ta quy lỗi cho A Nếu không, ta kiểm chứng thêm bước b Thử điều chỉnh thủ công kết đầu cơng đoạn B cho "hồn hảo" Nếu thuật tốn cho kết đầu cuối xác, ta quy lỗi cho B Ngược lại, ta tiến hành bước c Quy lỗi cho thành phần C Chúng ta tìm hiểu ví dụ phức tạp sau đây: Xe tự lái bạn sử dụng pipeline Bạn sử dụng kỹ thuật phân tích lỗi phần để định (những) thành phần cần tập trung cải thiện? Bạn gọi tên ba thành phần hệ thống A, B, C tương ứng với chức sau: A: phát xe B: phát người C: hoạch định đường cho xe Với hệ thống xe tự lái mô tả trên, giả sử bạn kiểm tra xe bạn cung đường kín xác định trường hợp xe chọn hướng bẻ lái giật nhiều so với người lái xe kinh nghiệm điều khiển Trong lĩnh vực lái xe tự động, trường hợp thường gọi "tình huống" Bạn cần thực hiện: a Thử điều chỉnh thủ công kết đầu thành phần A (phát xe hơi) cho "hồn hảo" (ví dụ, cho xe biết vị trí xe khác) Sau tiếp tục chạy phần cịn lại pipeline gồm có B, C, cho phép C (hoạch định đường đi) sử dụng đầu hồn hảo A Nếu thuật tốn hoạch định đường cho xe tốt hơn, điều cho thấy rằng, kết cuối thuật toán tự lái cải thiện mà A trả kết tốt Như vậy, bạn quy lỗi cho A Nếu không, ta tiếp tục bước b Thử điều chỉnh thủ công kết đầu công đoạn B (phát người bộ) cho "hồn hảo" Nếu thuật tốn cho kết đầu cuối xác, ta quy lỗi cho B Ngược lại, ta tiến hành bước c Quy lỗi cho thành phần C Các thành phần mơ hình học máy dạng pipeline nên xếp theo đồ thị có hướng khơng chu trình (DAG), nghĩa bạn tính tốn chúng theo thứ tự cố định từ trái sang phải đó, thành phần sau nên phụ thuộc vào đầu thành phần trước Miễn việc xâu chuỗi thành phần theo thứ tự A->B->C tuân thủ theo quy tắc DAG, việc phân tích lỗi tốt Bạn nhận kết khác hốn chuyển vị trí A B cho sau: A: Nhận dạng người (trước "Nhận dạng xe") B: Nhận dạng xe (trước "Nhận dạng người bộ") C: Hoạch định đường cho xe Nhưng kết việc phân tích lỗi hợp lệ cho ta định hướng tốt thành phần cần cải thiện 56 Phân tích lỗi phần so sánh với chất lượng mức người Thực phân tích lỗi thuật tốn học giống với việc sử dụng khoa học liệu phân tích lỗi hệ thống học máy để biết xác việc cần làm Cơ nhất, phân tích lỗi phần cho ta biết chất lượng (những) phần cần cải thiện Giả sử bạn có liệu khách hàng mua đồ trang mạng Một nhà khoa học liệu có nhiều cách khác để phân tích liệu Người đưa nhiều kết luận khác có nên tăng giá, giá trị vịng đời khách hàng đạt thơng qua chiến dịch tiếp thị khác nhau, v.v Khơng có việc phân tích liệu "chuẩn mực" nào, có nhiều kết luận hữu ích rút Tương tự, khơng có cách "chuẩn mực" cho việc thực phân tích lỗi Thơng qua chương bạn học cách phổ biến để rút nhận định xác hệ thống học máy bạn, bạn nên thử nghiệm phương pháp phân tích lỗi khác Chúng ta quay trở lại ứng dụng xe tự lái, thuật tốn phát xe đưa vị trí (có thể có thêm vận tốc) xe gần đó, thuật tốn phát người đưa vị trí người gần đó, hai đầu cuối sử dụng để hoạch định đường cho xe Để kiểm tra lỗi pipeline này, thay tuân thủ nghiêm ngặt quy trình thấy chương trước, bạn nên đặt câu hỏi như: a Cách biệt khả xác định xe thuật toán người bao xa? b Cách biệt khả phát người thuật toán người bao xa? c Cách biệt khả toàn hệ thống người tới cỡ nào? Ở đây, chất lượng người giả sử cách người tính đường cho xe dựa vào kết đầu từ hai thành phần trước pipeline (thay dựa vào hình ảnh camera) Nói cách khác, với thơng tin đầu vào, khả ước lượng đường thuật toán so với người nào? Nếu bạn thấy thành phần thua xa chất lượng mức người, bạn biết phần cần cải thiện Hãy tập trung vào việc cải thiện chất lượng phần Nhiều quy trình phân tích lỗi hoạt động tốt cố gắng tự động hóa thứ mà người làm, so sánh với người Hầu hết ví dụ trước ngầm giả định điều Nếu bạn xây dựng hệ thống học máy đầu số thành phần trung gian làm việc mà chí người khơng thể làm tốt, số quy trình không áp dụng Đây thuận lợi việc giải vấn đề mà người giải bạn có cơng cụ mạnh mẽ để phân tích lỗi, bạn ưu tiên cơng việc nhóm cách hiệu 57 Phát pipeline học máy bị lỗi Nếu thành phần đơn lẻ pipeline học máy bạn hoạt động chất lượng mức người gần mức người, pipeline tổng thể lại xa mức người sao? Điều thường có nghĩa pipeline có lỗi cần thiết kế lại Việc phân tích lỗi giúp bạn nhận định liệu bạn có cần thiết kế lại pipeline Trong chương trước, đặt câu hỏi liệu số ba thành phần có chất lượng mức người Giả sử câu trả lời cho ba câu hỏi có Điều có nghĩa là: a Thành phần Phát xe đạt chất lượng (xấp xỉ) mức người việc phát xe từ ảnh camera b Thành phần Phát người đạt chất lượng (xấp xỉ) mức người việc phát xe từ ảnh camera c So sánh với người phải lập kế hoạch đường cho xe dựa đầu hai thành phần pipeline trước (thay tiếp cận với hình ảnh từ camera), thành phần Lập kế hoạch có chất lượng mức tương đương Tuy nhiên, xe tự lái tổng thể bạn lại hoạt động chất lượng mức người cách rõ rệt Có nghĩa là, người tiếp cận hình ảnh từ camera dự tính đường tốt nhiều cho xe Bạn rút kết luận gì? Kết luận pipeline học máy bị lỗi Trong trường hợp này, thành phần Lên kế hoạch hoạt động mức tốt với đầu vào nó, đầu vào khơng chứa đủ thông tin Bạn nên tự hỏi liệu thông tin khác, đầu hai thành phần pipeline trước, cần thiết cho việc lên kế hoạch đường thật tốt cho xe tự lái Nói cách khác, thông tin mà người lái xe có kinh nghiệm cần đến? Ví dụ, giả sử bạn nhận người lái xe cần biết vị trí dấu đường Điều gợi ý bạn nên thiết kế lại pipeline sau: Cuối cùng, bạn không nghĩ pipeline chỉnh thể đạt chất lượng mức người, thành phần đơn lẻ đạt chất lượng mức người (nhớ bạn so sánh với người cung cấp đầu vào thành phần), có nghĩa pipeline có lỗi cần thiết kế lại GHI CHÚ: [18] Trong ví dụ xe tự lái trên, theo lý thuyết ta giải vấn đề cách cho hình ảnh thơ từ camera vào thành phần lên kế hoạch Tuy nhiên, điều vi phạm nguyên tắc thiết kế "Tính đơn giản tác vụ" trình bày Chương 51, thành phần lên kế hoạch đường cần có đầu vào ảnh thơ có tác vụ phức tạp để giải Thế nên thêm thành phần Phát dấu đường lựa chọn tốt giúp lấy thêm thơng tin quan trọng vốn thiếu đường cho khối lên kế hoạch đường đi, đồng thời bạn tránh việc làm module trở nên phức tạp để xây dựng/huấn luyện Phần 10: Tổng kết 58 Xây dựng biệt đội siêu anh hùng - Hãy để đồng đội bạn đọc điều Chúc mừng bạn hoàn thành sách này! Trong chương 2, nói việc sách giúp bạn trở thành siêu anh hùng nhóm bạn Điều tuyệt vời trở thành siêu anh hùng trở thành phần biệt đội siêu anh hùng Tôi hi vọng bạn giới thiệu sách cho bạn bè đồng đội bạn tạo siêu anh hùng khác