Ví dụ minh họa

2.5.1. Vấn đề thực tiễn

Đây là số 5, nó được viết khá phức tạp và rắc rối. Hình ảnh này có độ phân giải thấp là28×28pixel. Nhưng não của bạn không có vấn đề khi nhận dạng đó là số 5. Làm thế nào bộ não có thể làm điều này dễ dàng và không bị nhầm lẫn, trong khi các hình sau cũng được nhận dạng là số 5, mặc dù giá trị các điểm ảnh lúc này là khác nhau.

2.5.2. Bài toán nhận diện chữ số viết tay Lời giải bài toán trên Python

importnumpy as np import tensorflow as t f

from matplotlib import pyplot as plt mnist = t f . keras . datasets . mnist

(training_images , training_labels ) , (test_image , test_label ) = mnist . load_data() model = t f . keras . models . Sequential ( [ t f . keras . layers . Flatten ( ) ,

t f . keras . layers . Dense(128 , activation = t f .nn. sigmoid ) , t f . keras . layers . Dense(64 , activation = t f .nn. sigmoid ) , t f . keras . layers . Dense(32 , activation = t f .nn. sigmoid ) ,

model .compile( optimizer = t f . optimizers .Adam( ) , loss = ’ sparse_categorical_crossentropy ’ , metrics = [ ’ accuracy ’ ] )

history = model . f i t (training_images , training_labels , epochs = 10)

model . evaluate (x = test_image , y = test_label )

a = 789

plt .imshow(test_image [ a ] , cmap = ’ gray ’ ) plt .show()

predict = np.argmax(model . predict (np. array ( [ test_image [ a ] ] ) ) [ 0 ] ) print("So" , predict )

Chương 3

HỒI QUY TUYẾN TÍNH

Thuật ngữ hồi quy bao gồm một loạt các kỹ thuật giải thích mối quan hệ vận chuyển giữa một biến đại diện cho kết quả của một thí nghiệm và các biến độc lập đại diện cho các tham số đầu vào của thí nghiệm. Những kỹ thuật này đã được các nhà thống kê và máy móc khám phá từ lâu, nghiên cứu và học tập nó. Các ý tưởng và thuật toán họ phát triển là hữu ích trong dự báo và phân loại.

Hồi quy tuyến tính là một cách để giải thích mối quan hệ giữa một biến phụ thuộc với một hoặc nhiều explanatory variable bằng cách sử dụng một đường thẳng. Đây là một trường hợp đặc biệt của phân tích hồi quy. Hồi quy tuyến tính là loại phần tích hồi quy đầu tiên được nghiên cứu nghiêm ngặt. Điều này là do các mô hình phụ thuộc tuyến tính vào các tham số của chúng. Hơn nữa, các thuộc tính thống kê của các ước tính kết quả là dễ dàng hơn để xác định.

Hồi quy tuyến tính có nhiều ứng dụng thực tế. Hầu hết các ứng dụng thuộc một trong hai loại sau:

− Hồi quy tuyến tính có thể được sử dụng để khớp một mô hình dự đoán với một tập hợp các giá trị quan sát (dữ liệu). Điều này rất hữu ích, nếu mục tiêu dự đoán hoặc dự báo giảm. Sau khi phát triển một mô hình như vậy, nếu một giá trị bổ sung của x được đưa ra mà không có giá trị y đi kèm, thì mô hình được trang bị có thể được sử dụng để đưa ra dự đoán về giá trị của y.

− Cho một biếny và một số biếnx1,...,xp có thể liên quan đến y, phân tích hồi quy tuyến tính có thể được áp dụng để định lượng độ mạnh của mối quan hệ giữay và xj, để đánh giá xj nào không có mối quan hệ với y hoàn toàn và để xác định tập hợp con nào của xj chứa thông tin dư thừa về y.

Các kết quả trong chương này chủ yếu được tham khảo từ các tài liệu [1], [3], [6], [8] trong: “ Danh mục tài liệu tham khảo ”.

3.1. Đặt vấn đề

Xét một bài toán ước lượng giá của một căn nhà.

Một căn nhà rộng x1 m2, cóx2 phòng ngủ, cách trung tâm thành phốx3 km, có x4 tầng, ...

Giả sử, ta có số liệu của m căn nhà như thế. Khi đó, ta có thể dự đoán được giá y của căn nhà đó dựa trên những dữ liệu đã có hay không? Và nếu có thì hàm dự đoán y=hθ(x) sẽ có dạng như thế nào ?

Một cách trực quan, ta nhận thấy rằng giá nhà càng cao nếu diện tích càng lớn, nhiều phòng ngủ, gần trung tâm, số tầng nhà càng cao, ... Từ đó, ta có thể mô hình đầu ra và giả định rằng giá của căn nhà tuân theo một cấu trúc tuyến tính và đầu ra y là một hàm tuyến tính của đầu vào, đó là

y≈yˆ=hθ(x) =θ1x1+θ2x2+θ3x3+...+θnxn.

Đặc biệt hơn, hàm dự đoán đầu ra của hồi quy tuyến tính thường có thêm một hệ số điều chỉnh (bias) θ0. Và ta có được một mô hình dự đoán đầu ra y như sau

y≈yˆ=hθ(x) = θ0+θ1x1+θ2x2+θ3x3+...+θnxn, trong đó yˆlà giá trị đầu ra dự đoán, y là giá trị thực của căn nhà.

Việc thêm hệ số điều chỉnh θ0 làm cho mô hình linh hoạt hơn. Hệ số điều chỉnh này cũng là một tham số của mô hình.

Để thuận tiện cho việc ký hiệu, đặt

x0 = 1 ; x= [x0, x1, ..., xn]∈Rn+1; θ =      θ0 θ1 .. . θn      ∈Rn+1. Hàm dự đoán được viết lại dưới dạng

hθ(x) = x0θ0+x1θ1+x2θ2+x3θ3+...+xnθn =xθ,

trong đóθ = [θ0, θ1, θ2, ..., θn]T là vector trọng số cần tìm. Mối quan hệ y≈hθ(x)

như trên là một mối quan hệ tuyến tính. Với x= [x0, x1, x2, ..., xn] là vector đặc trưng chứa dữ liệu đầu vào.

Ta xếp các vector đặc trưng theo hàng vào một ma trận X=      x1 x2 .. . xm      ∈Rm×(n+1),

ma trận này được gọi là ma trận thiết kế (design matrix).

Bài toán trên đây là một bài toán dự đoán giá trị của đầu ra dựa trên vector đặc trưng đầu vào. Ngoài ra, giá trị của đầu ra có thể nhận rất nhiều giá trị thực dương khác nhau. Vì vậy, đây là một bài toán hồi quy.

Mạng nơ-ron với một đầu ra

Nghiệm của hàm mất mát