Howard (2017) đã phát triển một nh m các mô hình nhỏ được gọi là MobileNets [3] dành cho các ứng dụng tầm nhìn được nhúng trên điện thoại. Họ đã xây dựng mô hình đ với mục đích đánh đổi độ chính xác thành tốc độ huấn luyện để ph hợp với mục đích khác nhau. Kiến trúc của MobileNets dựa trên cách tính tích chập c tên là “the depth separable convolution” để giảm kích thước mô hình đồng thời c ng giảm độ phức tạp. Do đ mô hình sẽ hữu ích khi chạy các ứng dụng trên di động và các thiết bị nhúng.
Đầu tiên tích chập cổ điển với bộ lọc c kích thước cố định (ví dụ 3x3) được áp dụng với tất cả ngõ vào và tạo ra một số Feature Map đ là tích chập theo chiều sâu (the depthwise convolution). Sau đ kết hợp với các bộ lọc 1x1 được s dụng trên m i Feature Map đ là tích chập điểm. Sau khi qua lớp chập điểm giảm được một lượng đáng kể các thông số. “ Depthwise separable convolution ” [4] hay tích chập phân tách theo chiều sâu là một tích chập theo chiều sâu (depthwise convolution) theo sau b i một pointwise convolution (tích chập điểm) được mô tả trong hình 2.37.
Hình 2.37. Cấu trúc của Depthwise separable convolution
(https: dlapplications.github.io 2018-07-06-CNN Depthwise convolution: là một channel-wise
n channels ngõ vào thì chúng ta c ng c
chúng ta c
Ở hì nh 2.37. trê n ta c 5 cha nne ls ( để
thứ 2 là phân tách 5 khối hộp ra thành ma trận [m x n]
convolution c kích thước [n x n] bước thứ 4 là kết quả sau khi tích chập thứ 5 là ráp 5 kết quả của tích chập lại ) do đ chúng ta sẽ c
convolution tương ứng với 5 channels trên.
Pointwise convolution: đơn giản là một tích chập c
Với M là số lượng input channel N là số lượng output channel Dk là kernel size Df là feature map size (với dataset ImageNet thì input c kích thước là 224 do đ feature map ban đầu c Df = 224) chúng ta c thể tính được:
Chi phí tính toán của Depthwise convolution là :
Chi phí tính toán của
(2.5)
Tổng chi phí tính toán của Depthwise Separable Convolution là:
Nếu chúng ta không s dụng Depthwise Separable Convolution mà s dụng phép tích chập như bình thường chi phí tính toán là:
Do đ chi phí tính
Giả s chúng ta
nhân d n đến giảm tính toán đi rất Chúng ta thấy rằng mô hình c
Lớp 1: Convolution layer với stride bằng 2 Lớp 2: Depthwise layer [3x3]
Lớp 3: Pointwise layer [1x1]
Lớp 4: Depthwise layer với stride bằng 2 (khác với lớp 2 c stride bằng 1) Lớp 5: Pointwise layer [1x1]
So sánh kết quả giữa Depthwise Separable Convolution và phép tích chập tiêu chuẩn trên một tập dữ liệu ImageNet Dataset (bảng 2.6.). MobileNet giảm 1% độ chính xác nhưng số lượng tham số của mô hình và số lượng phép tính toán giảm đi rất rất nhiều gần xấp x 90%.
Bảng 2.6. So sánh kết quả giữa Depthwise Separable Convolution và phép tích chập
Model Conv MobileNet
MobileNet Cấu trúc của MobileNet-v1 được thể hiện hình 2.33.
Hình 2.38. Cấu trúc của MobileNet- v1 2.7.2. Single Shot Detector (SSD) (Detector)
Tương tự với mô hình YOLO W. Liu (2016) đã phát triển ra model SSD [5] để dự đoán tất cả bounding box trong 1 lần duy nhất và xác suất của đối tượng với cấu trúc mạng CNN end-to-end. Mô hình lấy ảnh ngõ vào đi qua nhiều lớp tích chập với kích thước bộ lọc khác nhau (10x10 5x5 và 3x3).
Các feature map từ các lớp tích chập những vị trí khác nhau trong mạng được lấy ra s dụng để dự đoán các bounding box. Chúng được x l b i các lớp chập cụ thể với bộ lọc 3x3 được gọi là lớp bổ sung đặc tính (extra feature layer) để tạo ra một bộ các bounding box giống với lại các anchor box của Fast R-CNN. Hình 2.39 thể hiện cấu trúc của SSD.
Hình 2.39. Cấu trúc của model SSD
Tương tự như anchor box các box đều c 4 tham số: tọa độ trung điểm chiều dài và chiều rộng. Đồng thời n c n tạo ra một véc tơ xác suất tương ứng với độ tin cậy qua từng lớp của đối tượng. Thuật toán Non-Maximum Suppression c ng được s dụng tại điểm kết thúc của model SSD để ch giữa lại các model c liên quan tức là các box của c ng 1 đối tượng sẽ gộp lại thành 1 box duy nhất.
Ngoài ra thuật toán Hard Negative Mining (HNM) c ng được s dụng do c rất nhiều box bị âm v n được dựa đoán. N bao gồm việc ch chọn các phần phụ của box trong suốt quá trình huấn luyện. Các box này được s p xếp theo độ tin cậy và phần trên đ nh sẽ được chọn t y thuộc vào t lệ giữa box dương và âm nhiều nhất là 1 3.
W. Liu (2016) phân biệt SSD300 và SSD512 là SSD300 c thêm lớp chập để cải thiện hiệu suất dự đoán. Các model SSD tốt nhất được huấn luyện với các tập dữ liệu PASCAL VOC và COCO 2015 nhằm t ng cường dữ liệu. N đã đạt được 83.2% mAP trên PASCAL VOC 2007 và 82.2% trên PASCAL VOC 2012. Trong cuộc thi của COCO 2015 n đã đạt được 48.5% mAP cho IoU = 0.5 30.3% mAP cho IoU = 0.75 và 31.5% mAP cho số liệu chính thức. Hình 2.40. thể hiện framework của SSD.
Hình 2.40. Framework của SSD
CHƯƠNG 3: THIẾT KẾ MÔ HÌNH ROBOT
3.1. Thiết kế phần cứng
3.3.1. Thiết kế mô phỏng phần cứng
Nh m thiết kế cánh tay máy bằng phần mềm SolidWorks 2015. Vật liệu được s dụng là mica đảm bảo độ cứng cáp và tính thẩm mỹ. Các chi tiết được kết nối bằng ốc vít bulông và bạc đạn thuận tiện cho việc l p ráp s a chữa.
Hình 3.1: Mô hình Robot 4 chân trên SolidWorks 2015 3.3.2. Tiến hành thi công
Sau khoảng thời gian nghiên cứu và thiết kế. Nh m đã hoàn tất công việc thi công robot. Dưới đây là một số hình ảnh robot khi hoàn thành :
Hình 3.2: Mô hình Robot 4 chân
Bảng 3.1 Thông số kỹ thuật của Module Bluetooth HC-05
Mô tả
Chiều dài chân Chiều dài cẳng chân Khớp xoay
Thân
3.2.Lựa chọn thiết bị
3.2.1. Bộ điều khiển board arduino mega 2560
Arduino Mega 2560 ( hình 3.4 ) là một vi điều khiển dựa trên nền ATmega 2560. C 54 đầu vào đầu ra số ( trong đ c 15 đầu được s dụng như đầu ra PWM ) 16
analog 4 UARTs ( cổng nối tiếp phần cứng ) một 16 MHz dao động tinh thể
USB một jack c m điện một đầu ICSP và một nút reset. Chứa tất cả mọi thứ cần thiết để h trợ các vi điều khiển ch cần kết nối với máy tính bằng cáp USB hoặc s dụng với
một bộ chuyển đổi AC -to-DC hay pin. Arduino Mega tương thích với hầu hết các shield được thiết kế cho Arduino Duemilanove hoặc Diecimila.
Hình 3.2: Board Arduino Mega 2560
Bảng 3.2 Tóm tắt thông số Arduino Mega 2560
Microcontroller Operating Voltage
Input Voltage (recommended) Input Voltage (limits)
Digital I O Pins Analog Input Pins DC Current per I O Pin DC Current for 3.3V Pin Flash Memory
SRAM EEPROM Clock Speed
3 6
3.2.2. Shield Mega Sensor V2
Arduino Mega Sensor Shiled c với cổng COM và giao tiếp I2C c
một cách đơn giản tại mọi thời điểm. Shield Mega Sensor c nguồn cấp riêng biệt từ đ dễ dàng điều khiển các thiết bị như RC Servo cảm biến các thiết bị giao tiếp ngoại vi như Bluetooth Wifi…
Hình 3.4: Arduino Mega Sensor Shield
Hình 3.5: Sơ đồ chức năng các chân của Mega Sensor Shield 3.2.3.Động cơ RC Servo
C 3 loại động cơ thường được d ng để làm các mô hình robot là động cơ DC Servo RC Servo và động cơ bước (Step motor). Đề tài sẽ s dụng động cơ RC Servo để điều khiển Robot vì động cơ RC Servo c phần hồi tiếp trạng thái bằng biến tr được tích hợp ngay bên trong động cơ việc điều khiển được đơn giản h a ch cần duy nhất một chân phát tín hiệu PWM và mô hình này sẽ gần giống với việc s dụng những động cơ Servo
trong công nghiệp dễ dàng ứng dụng thuật toán được xây dựng trong đề tài để phát triển trong công nghiệp.
Tại sao không s dụng động cơ DC Servo và Step Motor? Hai loại động cơ này đều c một điểm khác biệt chung với động cơ RC Servo đ là vị trí Home. Với Động cơ RC Servo do s dụng biến tr cho nên vị trí Home sẽ được đặt tại một mức điện tr cố định. DC Servo và Step Motor sẽ lấy vị trị ngay lúc cấp nguồn là vị trí Home như vậy muốn kiểm soát được tọa độ của cánh tay robot ta phải s dụng thêm các cảm biến công t c hành trình … Như vậy sẽ phải s dụng nhiều hơn các chân vi điều khiển và cồng kềnh trong thiết kế.
DC Servo: phần hồi tiếp trạng thái thông dụng nhất là encoder nhưng với số lượng động cơ lớn đ i hỏi vi điều khiển phải mạnh và yêu cầu về tốc độ x l cao c ng như số lượng vector ng t lớn. Nếu không đáp ứng đủ thì dễ gây tình trạng treo vi điều khiển.
Step Motor: c momen yếu hơn DC Servo và RC Servo thiết kế to và cồng kềnh hay xảy ra tình trạng mất bước và không c phần hồi tiếp tích hợp nên sẽ gây ra sai số trong điều khiển.
Cho nên RC Servo là ph hợp nhất với các mô hình robot di chuyển không bánh xe cấu tạo bên trong của động cơ RC Servo như hình 3.6:
Hình 3.6: Cấu tọa bên trong RC Servo
1. Motor (Động cơ)
2. Electronics Board (Board điện t )
3. Positive Power Wire (Red) (Dây nguồn màu đỏ)
4. Signal Wire (Yellow or White) (Dây tín hiệu thường là màu vàng hoặc màu tr ng)
5. Negative or Ground Wire (Black) (Dây GND đen)
6. Potentiometer (Biến tr )
7. Output Shaft Gear (Trục Bánh r ng đầu ra)
8. Servo Attachment Horn Wheel Arm
9. Servo Case (Vỏ Servo)
10. Integrated Control Chip (Chip điều khiển)
Trong hệ thống này Servo là đáp ứng của một dãy các xung số ổn định. Cụ thể hơn mạch điều khiển là đáp ứng của một tín hiệu số c các xung biến đổi từ 1ms – 2ms. Các xung này được g i đi 50 lần giây. Chú rằng không phải số xung trong một giây điều khiển servo mà là chiều dài của các xung. Servo đ i hỏi khoảng 30 – 60 xung giây. Nếu số này quá thấp độ chính xác và công suất để duy trì servo sẽ giảm. Với độ dài xung 1ms Servo được điều khiển quay theo một chiều (giả s là chiều kim đồng hồ). Với độ dài xung 2ms Servo quay theo chiều ngược lại.
Điều khiển vị trí của trục ra của động cơ bằng cách điều chế độ rộng xung (Hình 3.7)
Hình 3.7: Điều khiển vị trị trục ra của động cơ bằng cách điều chế độ rộng xung
Đề tài sẽ chọn động cơ RC Servo TowerPro MG946R để ph hợp với yêu cầu của cánh tay Robot. RC Servo TowerPro MG946R như hình 3.8:
Bảng 3.3 Thông số hoạt động của RC Servo TowerPro MG946R.
Weight (Trọng lượng) Dimension (Kích thước) Stall torque
Operating speed (Tốc độ hoạt động) Operating voltage (Điện áp hoạt động) Temperature range (Khoảng nhiệt độ)
3.2.4. Module Bluetooth HC- 05
Mạch thu phát Bluetooth HC-05 đã ra chân hoàn ch nh giúp dễ dàng kết nối với các bộ điều khiển hoặc các module khác để truyền phát tín hiệu.
Bảng 3.5 Thông số kỹ thuật của Module Bluetooth HC-05
Điện áp hoạt động Baudrate
Dải tần s ng hoạt động D ng điện
3.2.5. Khối cấp nguồn Adapter
Với một số thông cần thiết như sau: Điện áp đầu vào: 100-240V 50
60Hz Điện áp đầu ra: 5v-3a Kích thước chân c m: 5.5*2.5mm
\
Hình 3.9. Cấp nguồn Adapter
3.2.6. Camera Logitech C270
Bảng 3.6. Thông số kĩ thuật của Camera Logitech C270
Ta s C270 để ph hợp về giá thành kích thước c ng như là tốc độ frame hình.
4 1
Hình 3.10 Camera Logitech C270
3.3.Sơ đồ nối dây
Các động rc được kết nối vào micro controller và được cấp nguồn từ adepter. Tổng cộng c 12 động cơ rc và 1 module bluetooth HC-05 kết nối với arduino.
Hình 3.10 Sơ đồ nối dây
3.4. Thuật toán điều khiển
3.4.1. Thuật toán điều khiển robot
Việc s dụng 12 động cơ RC Servo đ i hỏi phải chọn loại vi điều khiển phải đáp ứng đủ 12 ngõ ra b m xung PWM. Arduino Mega 2560 dựa trên nền tảng chip Atmega 2560 đã đáp ứng đủ cho việc điều khiển mô hình.
Mô hình điều khiển robot
Hình 3.11 Mô hình điều khiển robot
Lưu đồ điều khiển
4 3
Hình 3.12 Lưu đồ điều khiển robot 3.4.2. Huấn luyện model nhận dạng người
Nh m huấn luyện chọn model object detect MobileNet-SSD với bộ data về người gồm 100 tấm ảnh. Model được huấn luyện trong v ng 3 tiếng và được lưu trữ trên máy tính c core-i5 2.4GHz Ram 4GB. Cấu trúc của model MobileNet-SSD được trình bày
chương 2. Do lượng data rất ít nên nh m nghiên cứu sẽ không tiến hành đánh giá quá trình huấn luyện.
CHƯƠNG 4: THỰC NGHIỆM VÀ KẾT QUẢ
4.1.Kết quả điều khiển
Sau khi đã kiểm tra động học thuận nghịch ta tiến hành điều khiển robot qua module bluetooth bằng app điện thoại hình (hình 4.1). Robot hoạt động tốt c thể di chuyển theo 2 cách và đứng vững không cần tác động bên ngoài.
Hình 4.1 App điều khiển
4 5
Hình 4.2 Hình ảnh robot lúc hoạt động 4.2.Kết quả nhận dạng người
Tuy c n hạn chế về data nhưng model sau khi đã train hoạt động khá tốt c thể nhận dạng được người trong môi trường xung từ đ làm tiền đề cho thuật toán tracking object sau này.
CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
5.1.Kết luận
5.1.1. Những công việc đã thực hiện
Sau một thời gian nghiên cứu và tìm hiểu nh m đã đã thực hiện :
Tìm hiểu tổng quan về mô hình robot c chân n i chung và mô hình robot bốn chân n i riêng.
Nghiên cứu và tính toán độ ổn định cho robot bốn chân. Đây là cơ s quan trọng nhất cho việc điều khiển chuyển động cho robot.
Nghiên cứu các loại dáng đi của robot và đưa ra mô hình hình học cho các loại dáng đi. Dựa vào động học thuận và nghịch tính toán được vị trí đặt chân cho robot để c bước đi mượt và tránh bước nhảy.
Thiết kế thành công phần cơ khí Robot 4 chân. Robot hoạt động đúng như mục tiêu mong muốn.
5.1.2. Những mặt hạn chế
Bên cạnh những nội dụng đã thực hiện được v n c n nhiều hạn chế đối với đề tài như:
Bài toán động học ch dừng lại động học vị trí chưa tính toán bài toán động học vận tốc. Bài toán động lực học s dụng các giả thiết để giảm bớt khối lượng tính toán chưa hoàn ch nh.
Việc nhận dạng chưa c chức n ng đối với mô hình robot.
Mô hình robot thực nghiệm ch đi được trên bề mặt bằng phẳng với quỹ đạo thẳng và chuyển hướng. Sai số về quỹ đạo chưa được kiểm soát. Do không s dụng các cảm biến lực bàn chân nên không kiểm soát được hiện tượng trượt gây ra sai số quỹ đạo.
Độ ổn định của mô hình thực nghiệm chưa cao.
5.2.Hướng phát triển
Dựa trên những nghiên cứu thành công của đề tài “Thiết kế thi công và lập trình điều khiển Robot 4 chân” chúng ta c thể phát triển:
Chế tạo một mô hình cơ khí với độ tin cậy cao.
Nghiên cứu các dáng di chuyển để robot c thể di chuyển trên các địa hình không bằng phẳng hoặc c vật cản.
Thiết kế cơ cấu robot để c thể tương tác với môi trường xung quanh. Xây dựng bài toán động học hoàn ch nh cho robot.
Tiến hành giải thuật tracking để tối ưu h a chức n ng của model detect object
4 8