C医u tr¿c c栄a m衣ng Vess-Net bao g欝m 4 ph亥n ch nh:
‚ Encoder gi¿p tr ch xu医t cƒe"8員e"vt逢pi"e栄a 違nh v ng m衣c m逸t. ‚ Decoder gi¿p khơi rj映e違nh v隠 kej"vj逢噂e"dcp"8亥u.
‚ Cƒc 8逢運ng d磯n ph亥p"f逢"p瓜i (internal residual skip path) cung c医p thơng tin b鵜 m医t trong quƒ tr·nh t ch ch壱p cho cƒc kh嘘i c栄a c違 encoder v decoder. ‚ Cƒc 8逢運ng d磯n ph亥p"f逢"piq衣i (outer residual skip path) k院t n嘘i thơng tin t瑛 epeqfgt"8院n fgeqfgt"8吋 cung c医p thơng tin gi¿p decoder khơi ph映c 違nh m瓜t cƒch ch nh xƒc.
Hình 3.1: Ki院n trúc c栄a m衣ng Vess-Net [14]
Mơ h·nh Vess-pgv"8逢嬰c xây d詠ni"pj逢"ucw<"6"d瓜 encoder, 4 b瓜 dgeqfgt."8"8逢運ng d磯n ph亥p"f逢"p瓜i v 6"8逢運ng d磯n ph亥p"f逢 ngo衣i. Gi違 s穎違nh v ng m衣e"8亥u v o c„ k cj"vj逢噂c l 512x512x3. Khi 違nj"8亥u v o n {"8k"swc"d瓜gpeqfgt"8亥u c„ ch泳a 2 l噂p Convolution, m厩i l噂p c„ 64 filter k ej"vj逢噂e"5z50"Vc"vjw"8逢嬰c m瓜t feature map c„ kej"vj逢噂c 512x512x64. Feature map n y s胤 8逢嬰c 8k"swc"o瓜t l噂p Pooling c„ k ch vj逢噂c 2x2 v tjw"8逢嬰c m瓜t feature map k ej"vj逢噂c 256x256x64.
Ucw"mjk"hgcvwtg"ocr"vt‒p"8k"swc"5"d瓜 encoder c”n l衣i v噂i m厩i b瓜 bao g欝m 2 l噂p Convolution 3x3 v 1 l噂p Pooling 2x2, trqpi"8„ cƒc l噂p Convolution n y c„ s嘘 filter l亥n n逢嬰t l 128, 256, 512. S詠 khƒc bi羽t c栄a 3 b瓜 encoder n y so v噂i b瓜gpeqfgt"8亥u tiên l m厩i b瓜 n y c„ thêm m瓜v"8逢運ng d磯n n瓜i b瓜0"A逢運ng d磯n ph亥p"f逢"p瓜i n y k院t n嘘k"8亥u v o c栄a m厩i b瓜 encoder v噂k"8亥u ra c栄a l噂p Convolution th泳 2 c栄a ch nh b瓜 gpeqfgt"8„. V· 8吋 cho vi羽c cung c医r"vj»pi"vkp"8逢嬰c th詠c hi羽n, trên cƒe"8逢運ng d磯n ph亥n f逢"p瓜i c„ m瓜t l噂p Convolution 1x1 c„ s嘘 filter l亥p"n逢嬰t l 128, 256, 534"8吋 chu育n h„a k cj"vj逢噂e"8亥u v o c栄a b瓜 encoder v噂k"8亥u ra c栄a l噂p Convolution th泳 2 c栄a n„. K院t qu違vjw"8逢嬰c l m瓜t feature map c„ kej"vj逢噂c 32x32x512.
Sau khi 違nh v ng m衣c m逸v"8« 8逢嬰c tr ch xu医v"8員e"vt逢pi"vj»pi"swc"6"d瓜 encoder, vi羽c th詠c hi羽n ph映c h欝i 違nh c栄c"fgeqfgt"8逢嬰c th詠c hi羽n. Feature map 32x32x512 vjw"8逢嬰c 荏 trên s胤8逢嬰e"8k"swc"n噂p Unpooling kej"vj逢噂e"4z4"8吋 feature map v隠 k ch vj逢噂c b茨ng v噂i kej"vj逢噂e"vt逢噂c khi th詠c hi羽n l噂p Pooling 荏 b瓜gpeqfgt"8嘘i x泳ng l 86z86z7340"Ucw"8„ 2 l噂p Convolution c„ ćng kej"vj逢噂c 3x3 v s嘘n逢嬰ng filter l亥n n逢嬰t l 512 v 478"8吋 tr ch xu医v"8員e"vt逢pi"e栄c"hgcvwtg"ocr"ucw"mjk"8逢嬰c ph映c h欝i
Unpooling v噂i k院t qu違 c栄a l噂p Convolution th泳 hai v 8逢運ng d磯n ph亥p"f逢"piq衣i k院t n嘘i thơng tin tr詠c ti院p t瑛 b瓜 encoder v噂i k院t qu違 c栄a l噂p Convolution th泳 nh医t *pj逢" h·nh minh h丑a). Vi羽c th詠c hi羽n khơi ph映c h·nh 違nh s胤8逢嬰c th詠c hi羽n thêm 3 l亥n n英a v噂i cƒc c員p l噂p Convolution c„ k ej"vj逢噂c l 3x3 v c„ s嘘 n逢嬰ng filter l亥p"n逢嬰t l (256,128), (128,64) v (64,2). 雲 b瓜 decoder cu嘘i ćng khƒc v噂i nh英ng b瓜 decoder khƒc l n„ khơng c„ 8逢運ng d磯n ph亥p"f逢"p瓜i. Cu嘘i ćng k院t qu違 vjw"8逢嬰c l m瓜t feature map c„ kích vj逢噂c 512x512x2.
T医t c違 cƒc l噂r"Eqpxqnwvkqp"8隠u s穎 d映ng l噂p Batch normalization v h m k ch ho衣t ReLU. L噂p Convolution cu嘘i ćng s穎 d映ng h m Softmax l m h m k ch ho衣t.