Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 51 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
51
Dung lượng
0,97 MB
Nội dung
Mụclục LỜIMỞĐẦU Chương1:Kháiquátvềxửlýảnhvàxửlýảnhytế 1.1. Xửlýảnh 1.1.1. Xửlýảnhlàgì? 1.1.2. Mộtsốvấnđềtrongxửlýảnh 1.1.2.1. Mộtsốkháiniệm a. Ảnhvàđiểmảnh b. Mứcxámmàuvàhistogram 1.1.2.2. Nắnchỉnhbiếndạnghìnhhọc 1.1.2.3. Khửnhiễu 1.1.2.4. Chỉnhmứcxám 1.1.2.5. Tríchchọnđặcđiểm 1.1.2.6. Nhậndạng 1.1.2.7. Nénảnh 1.2. Xửlýảnhtrongytế 1.2.1. Giớithiệumộtsốchuẩnápdụngtronghệthốngthôngtinytế 1.2.1.1. ChuẩndữliệuvănbảnHL7 1.2.1.2. ChuẩnIHE 1.2.2. ChuẩnảnhytếDICOM 1.2.2.1. Kháiniệm 1.2.2.2. Lịchsửpháttriển 1.2.2.3. Cấutrúc 1.2.2.4. Tínhthíchnghi 1.2.2.5. GiaothứcDICOM 1.2.2.6. ThôngđiệpDICOM–DICOMMessage 1.2.2.7. MộtsốkháiniệmtrongDICOM 1.3. MộtsốvấnđềtrongxửlýảnhytếDICOM 1.3.1. KháiniệmvàcấutrúcảnhytếDICOM 1.3.2. Tómlượchìnhảnh 1.3.3. Mãhóavàđónggóiphầntửdữliệuđiểmảnh 1.3.4. Lưutrữhìnhảnh 1.3.5. Tổchứcluồngdữliệuđiểmảnh Chương2:THUẬTTOÁNPHÂNTRONGXỬLÝẢNHYTẾ 2.1. Giớithiệumộtsốthuậttoánphâncụmdữliệu 2.1.1. Kháiniệmphâncụmdữliệu 2.1.2. Phânloạicácthuậttoánphâncụmdữliệu 2.1.3. ThuậttoánKmeans 2.1.3.1. Lịchsử 2.1.3.2. Thuậttoán 2.2. ThuậttoánKmeansứngdụngtrongphânlớpảnhytế 2.2.1. Mộtsốnhậnxét 2.2.2. ThuậttoánKmeansứngdụngtrongphânlớpảnhytế. 2.2.2.1. Đọc,chuẩnhóaảnh,lựachọnsốnhóm. 2.2.2.2. Gomnhóm,phânloạivùng 2.2.2.3. Phânloạixươngvàmạchmáu 2.2.2.4. Xuấtảnhkếtquả 2.2.3. KhókhănkhiápdụngthuậttoánKmeans 2.2.3.1. Đốivớicácbàitoánnóichung 2.2.3.2. Đốivớibàitoánphânlớpảnhytế Chương3:Chươngtrìnhthửnghiệm 3.1. Bàitoán 3.2. Phântíchbàitoán 3.3. Mộtsốkếtquảchươngtrình Phụlục:MộtsốkháiniệmtrongphầnthôngtinảnhDICOM 1. Cáckháiniệmcơbản trongthôngtinảnhDICOM 1.1. Mãđầuvào 1.2. Têntàiliệu 2. Cácnguyêntắcmãhóacơbản 2.1. Phươngphápmãhóa 2.2. CácgiátrịthểhiệnVR 3. Cáckiểugiátrị 3.1. KiểuCONTAINER 3.2. KiểuTEXT 3.3. KiểuCODE 3.4. KiểuNUM 3.5. KiểuPNAME 3.6. KiểuDATE,TIME,vàDATETIME 3.7. KiểuUIDREF 3.8. KiểuCOMPOSITE 3.9. KiểuIMAGE 3.10. KiểuWAVEFORM 3.11. KiểuSCOORD 3.12. KiểuTCOORD 3.13. Cáckiểudữliệukhác. PHẦNKẾTLUẬN TÀILIỆUTHAMKHẢO LỜIMỞĐẦU Bước vào thế kỉ XXI, Công nghệ thông tin bùng nổ vô cùng mạnh mẽ. Khoa học công nghệ cao đóng vai trò quan trọng không chỉ trong phát triển kinh tế mà còn trong việc cải thiện nâng cao chất lượng cuộc sống của người dân. Cùng với sự gia tăng dân số lên đến 8 tỉ người trên toàn thế giới, các dịch vụ y tế cũng yêu cầu phải được cải thiện và nâng cao. Trong đó, việc áp dụng khoa học công nghệ vào lĩnh vực y tế là lựa chọn tốt nhất cho mọi quốc gia, mọi nền kinh tế. Áp dụng khoa học công nghệ vào lĩnh vực y tế trước hết sẽ nâng cao chất lượng phục vụ cũng như cải thiện khả năng điều trị cho bệnh nhân. Điều này rút ngắn các thủ tục hành chính và thời gian cho bệnh nhân. Từ đây mà tiết kiệm được chi phí, giảiquyếtbàitoánkinhtếlớn.(chủngữ,vịngữ) Do đó, mục đích nghiên cứu của đề tài này là tìm cách đưa ra các chẩn đoán nhanh nhất thông qua việc phân lớp ảnh y tế tích hợp chuẩn DICOM. Ở đây, ta sẽ tìm hiểu những điều cơ bản về chuẩn DICOM, tổ chức thông tin đính kèm về ảnh và thuật toán Kmeans phân lớp ảnh. Các thông tin về chuẩn DICOM sẽ cho ta hình dung cơ bản nhất về lịch sử, các qui định được định nghĩa trong tiêu chuẩn và tính thích nghi của nó. Ta cũng sẽ tìm hiểu một số vấn đề khi thao tác với ảnh DICOM. Các thông tin được đính kèm ảnh trong định dạng tệp tin DICOM, cách tổ chức, kiểu dữ liệu, phương pháp mã hóa, cũng sẽ được đề cập đến. Ở đây, thuật toán Kmeans sẽ được áp dụng để phân lớp ảnh y tế. Tại sao lại lựa chọn thuật toán Kmeans, áp dụng như thế nào, ưu nhược điểm khi áp dụng thuật toán Kmeans cũng sẽ được làm rõ. Dựa trên cơ sở lý thuyết ở trên để đưa ra được chươngtrìnhứngdụngđọcảnhytếDICOMvàphânlớpảnhnày. Cấutrúccủakhóaluậngồm3chươngvàmộtphầnphụlục: Chương1:Kháiquátvềxửlýảnhvàxửlýảnhytế. Chương này đưa ra khái niệm những vấn đề chung nhất trong xử lý ảnh và đề cập đến các thông tin cơ bản về chuẩn DICOM. Từ đó chỉ ra các vấn đềgặpphảitrongviệcthaotácvớiảnhytế. Chương2:Thuậttoánphâncụmtrongxửlýảnhytế. Chương này giới thiệu một số thuật toán phân cụm dữ liệu và làm rõ phầnápdụngthuậttoánK–meansvàobàitoánphânlớpảnhytế. Chương3:Chươngtrìnhthửnghiệm. Chương này nêu ra bài toán, phân tích và xây dựng chương trình ứng dụng. Chương trình ứng dụng nhằm giải quyết hai yêu cầu của bài toán là đọcảnhDICOMvàphânlớpảnhđọcđược. Phụlục:MộtsốkháiniệmtrongphầnthôngtinảnhDICOM. Phần này đề cập đến một số khái niệm, phương thức mã hóa và các kiểugiátrịtrongphầnthôngtinảnhDICOM(phầntiêuđềảnh). Lờicảmơn Trong suốt quá trình thực hiện đề tài này, em đã nhận được dự giúp đỡ rất nhiềutừthầycôvàbạnbè. Em xin được gửi tới thầy PGS. TS Đỗ Năng Toàn lời cảm ơn chân thành và sâu sắc nhất. Em cảm ơn thầy đã luôn tận tình chỉ dạy, hướng dẫn và định hướngchoem. Em xin gửi lời cảm ơn đến gia đình em đã luôn tạo điều kiện tốt nhất cho em họctậpvànghiêncứu. Em xin gửi lời cảm ơn đến bạn bè em đã giúp đỡ và chia sẻ những khó khăn trongsuốtquatrìnhthựchiệnđềtài. Chương1:Kháiquátvềxửlýảnhvàxửlýảnhytế 1. Xửlýảnh 1. Xửlýảnhlàgì? 1 Xử lý ảnh là một lĩnh vực trong CNTT nhằm thao tác ảnh đầu vào và đưarakếtquảmàtamongmuốn. Ảnh là một thể hiện của một đối tượng lên máy tính càng giống tật càng tốt. Ảnh có nhiều dạng thể hiện khác nhau như đen trắng, màu, video, hình ảnh 3D, Mỗi điểm ảnh biểu diễn cường độ sáng hay một dấu hiệu nào đó tại một vị trí xác định nào đó của đối tượng trong không gian. Ta có thể hiểu,ảnhtrongxửlýảnhlàảnhn–chiều. Xử lý ảnh là vô cùng quan trọng bởi hơn 80% thông tin chúng ta cần xử lý là hình ảnh. Sự phát triển của xử lý ảnh gắn liền với nhu cầu xử lý thông tincủaconngườivàsựpháttriểncủaphầncứngmáytính. Vậy,mộthệxửlýảnhsẽnhưthếnào?Tasẽxemxétsơđồsau: 1 .PGS.TSĐỗNăngToàn,PhạmViệtBình(2007),GiáotrìnhmônXửlýảnh,Đại họcTháiNguyên. ● Thunhận:thôngquacácthiếtbịnhưcamera,scanner,sensar, ● Tiềnxửlý:thựchiệnviệcnắnchỉnh,xóanhiễu, ● Hậuxửlý:rútgọn,chínhxáchóa, 2. Mộtsốvấnđềtrongxửlýảnh 1. Mộtsốkháiniệm a. Ảnhvàđiểmảnh ● Điểm ảnh biểu diễn cường độ sáng hay một dấu hiệu nào đó tại một vị trí xácđịnhnàođócủađốitượngtrongkhônggian ● Ảnhlàtâphợpcácđiểmảnh. Hai mô hình biểu diễn ảnh cơ bản là RASTER và VECTOR, ngoài ra còncómôhìnhkếthợp3D.RASTERtốnkémbộnhớhơnVECTOR. b. Mứcxámmàuvàhistogram ● Với ba màu cơ bản là RED(R), GREEN(G), BLUE(B) (0 ≤ R, G, B ≤ 255) nếu R = G = B thì màu này được gọi là màu xám. Mức xám của một ảnhIlàsốgiátrịcóthểcócủađiểmảnhtrongảnhI. ● Histogram ( biểu đồ tần suất) của mức xám g trong ảnh I là số điểm ảnh cócủaIcógiátrịg,kíhiệulàh(g). 2. Nắnchỉnhbiếndạnghìnhhọc Ảnh thu được sau quá trình thu nhận ảnh thường không tránh được sự biến dạng bởi các thiết bị quang hoặc điện tử, đôi khi là do bản thân đối tượng. Để biến đổi ảnh thu nhận về ảnh mong muốn, cách thông thường là sử dụngcácphépchiếuđượcxâydưngtrêntậpcácđiểmđiềukhiển. Tacầntìmhàmf:P i f(P i )saocho: Giả sử ảnh bị biến đổi chỉ bao gồm bị tịnh tiến, tỉ lệ, xoay, biến dạng, bậc nhất.Khiđóhàmfcódạng: Tacó: Giải phương trình ta tìm được a 1 , b 1 , c 2 . Tương tự ta tìm được a 2 , b 2 , c 2. Xác địnhđượchàmf. 3. Khửnhiễu Ảnh thu được sau quá trình thu nhận ảnh không tránh được nhiễu bởi các thiết bị quang học hay điện tử. Có hai loại nhiễu cơ bản là nhiễu hệ thống vànhiễungẫunhiên. ● Nhiễu hệ thống là những nhiễu sinh ra có tính qui luật do thiết bị hoặc ảnh củanguồnsángngoạilai.Loạinhiễunàydễkhửbằngcácphépbiếnđổi. ● Nhiễu ngẫu nhiên là các vết “bẩn” không rõ nguyên nhân. Nhiễu này khó khử do nó không có tính qui luật nào. Tùy từng loại ảnh mà ta chọn phươngphápkhửphùhợp,phươngphápchunglàsửdụngphéplặp. 4. Chỉnhmứcxám Chỉnh mức xám nhằm khắc phục tính không đồng đều của hệ thống gây ra. Việc chỉnh mức xám bao gồm việc tăng hay giảm mức xám của ảnh cho phù hợp với nhu cầu sử dụng. Việc giảm mức xám được thực hiện để phụcvụchoviệcinấn,tăngmứcxámsửdụngchokỹthuậtnộisuy. 5. Tríchchọnđặcđiểm Các đặc điểm của đối tượng được trích chọn tùy thuộc vào yêu nhu cầu sử dụng, mục đích nhận dạng trong xử lý ảnh. Ảnh có một số đặc điểm sauđây: ● Đặc điểm không gian: phân bố mức xám, phân bố xác suất, biên độ, điểm uốn, ● Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực hiện lọc vùng (zonal filtering). Các bộ vùng được gọi là “mặt nạ đặc điểm” (feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ nhật,tamgiác,cungtrònv.v ) ● Đặc điểm biên và đường biên: (chủ ngữ)Đặc trưng cho đường biên của đối tượng và do vậy rất hữu ích trong việc trích trọn các thuộc tính bất biến được dùng khi nhận dạng đối tượng. Các đặc điểm này có thể được trích chọn nhờ toán tử gradient, toán tử la bàn, toán tử Laplace, toán tử “chéokhông”(zerocrossing)v.v Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảmxuống.(câunàyrấtcụt) 6. Nhậndạng Gồm3pha: ● Pha1:Biểudiễnđốitượng ● Pha2:Tríchchọnđặcđiểm ● Pha3:Đốisánhvàkếtluận Bốncáchtiếpcậnkhácnhautronglýthuyếtnhậndạnglà: ● Đốisánhmẫudựatrêncácđặctrưngđượctríchchọn ● Phânloạithốngkê ● Đốisánhcấutrúc ● Phânloạidựatrênmạngnơronnhântạo Rõ ràng là không thể sử dụng một phương pháp để đưa ra phân loại tối ưu, do đó trên thực tế, ta cần đồng thời áp dụng nhiều phương pháp và cáchtiếpcận. 7. Nénảnh Nén ảnh trong máy tính nhằm tiết kiệm bộ nhớ và giảm thời gian xử lý. Có thể nén ảnh bảo toàn hoặc không bảo toàn. Nén ảnh bảo toàn thì ảnh sau khi nén giống hệt ảnh ban đầu, còn đối với nén ảnh không bảo toàn thì ảnh [...]... Chương 3: Chương trình thử nghiệm 1 Bài toán Bài toán đặt ra là đọc được một ảnh y tế DICOM. Một ảnh y tế DICOM như đã trình b y ở trên gồm hai thành phần là phần thông tin đính kèm ảnh và phần ảnh. Ta cần x y dựng chương trình để hiển thị được ảnh và thông tin đính kèm ảnh đó Từ dữ liệu ảnh đọc được, ta tiến hành phân lớp ảnh y tế n y bằng thuật toán K means Phân biệt xương, thịt, mạch máu và vùng nền... 8byte, trong cấu truy vấn thì tối đa là 16byte Tối đa 16 byte DT Datetime Một chuỗi kí tự có định dạng 09, “+”, YYYYMMDDHHMMSS.FFFFFF&Z ““, “.”, ZXX trong đó YYYY= năm, MM= khoảng tháng, DD= ng y, HH= giờ, MM= trắng phút, SS= gi y, FFFFFF= mili gi y, “&”có thể là “+” hay ““ so với ZZ = giờ và XX= phút của GMT Độ chính xác của dấu ph y động đơn Không trong ... chuỗi kí tự có định dạng 09, Trong YYYYMMDD, trong đó YYYY là câu truy năm, MM là tháng, DD là ng y vấn có dấu ““, có thể sử dụng d y khoảng trắng DS Decimal là một chuỗi mô tả số có dấu 09 String ph y động và không động Trong trường hợp dấu ph y không động thì có thể sử dụng thêm “+”, ““, “.”. Trong trường hợp sử dụng dấu ph y động, sử dụng thêm “E”, ... xếp các byte trong file. Đối với d y nhị phân gồm nhiều byte thì các byte được sắp xếp theo thứ tự giảm dần của trọng số, byte có trọng số lớn nhất sẽ đứng đầu tiên. Đối với chuỗi kí tự, các kí tự sẽ xuất hiện lần lượt theo thứ tự từ trái sang phải 3 ● ● Một số vấn đề trong xử lý ảnh y tế DICOM 1 Khái niệm và cấu trúc ảnh y tế DICOM Khái niệm: Một bức ảnh y tế định ... khi nén và trước khi nén có sự sai khác trong mức cho phép. Có bốn cách tiếp cận cơ bản trong nén ảnh: ● Nén ảnh không gian ● Nén ảnh thống kê ● Nén ảnh sử dụng phép biến đổi ● Nén ảnh Fractal 2 Xử lý ảnh trong y tế 1 Giới thiệu một số chuẩn áp dụng trong hệ thống thông tin y tế 1 Chuẩn dữ liệu văn bản HL7 HL7 là một chuẩn dữ liệu văn bản. Thuật ngữ Health Level Seven được phát triển ... Lưu trữ hình ảnh Sự sắp xếp các byte dữ liệu trở nên quan trọng khi chúng ta miêu tả các dữ liệu điểm ảnh vật lý trong bộ nhớ, một tệp tin hay trên mạng Tổ chức luồng dữ liệu điểm ảnh Mỗi một dữ liệu điểm ảnh có giá trị thể hiện là OW và bao gồm các thuộc tính 8 bit phân bố, 8 bit lưu trữ và một bit cao 5 Chương 2: THUẬT TOÁN PHÂN TRONG XỬ LÝ ẢNH Y TẾ Trên thực tế, rất nhiều bài toán phân cụm( phân lớp) dữ liệu ... tế nhìn bằng mắt thường nhất. Nhưng để có thể tiến hành xử lý ảnh thì ta cần chuyển file ảnh n y sang dạng *.jpeg hoặc *.tiff để tiện cho việc xử lý. Quan sát ảnh CT ta th y hầu hết màu sắc là màu xám. Việc chuyển đổi từ ảnh RGB sang ảnh xám vẫn đảm bảo tính toàn vẹn thông tin của ảnh Quan sát ảnh y tế nói chung , ta có thể chia thành 3 vùng theo mức xám là: ● ● Vùng xương và mạch máu : mức xám cao... độ: DBSCAN, OPTICS, DENCLUDE ● Thuật toán phân cụm dữ liệu dựa trên mẫu: EM, COBWEB 3 Thuật toán K means 1 Lịch sử Thuật toán Kmean được phát triển bởi J.Macqueen (1967) và sau đó J. A. Hartigan và M. A. Wong phát triển khoảng những năm 1975 2 Thuật toán Thuật toán Kmeans là thuật toán quan trọng được sử dụng trong kĩ thuật phân cụm. Thuật toán được áp dụng nhằm tìm ... CURE, DIANA, ROCK, CHAMELEON, ANGNES ● Thuật toán phân cụm dữ liệu mờ: FCM, ɛFCM ● Thuật toán phân cụm dữ liệu dựa vào cụm trung tâm: K means, Pam, Clara, Clarans ● Thuật toán phân cụm dữ liệu dựa vào tìm kiếm: Thuật toán di truyền (GAS), thuật toán Jmeans ● Thuật toán phân cụm dữ liệu dựa vào lưới: Sting, Clique, WaveCluster ● Thuật toán phân cụm dữ liệu dựa vào mật ... tượng trong nhóm không có sự thay đổi Sơ đồ thuật toán: Đúng Sai 2 ● ● ● Thuật toán K means ứng dụng trong phân lớp ảnh y tế 1 Một số nhận xét Trước khi đi vào phân lớp ảnh y khoa, ta có vài nhận xét sau: Xương và mạch máu có mức xám cao hơn nhiều so với toàn bộ ảnh, như v y, nếu ta sử dụng phương pháp phân ngưỡng thông thường sẽ không phân biệt được vùng xương và mạch máu trong ảnh . Mụclục LỜIMỞĐẦU Chương1:Kháiquátvề xử lý ảnh và xử lý ảnh y tế 1.1. Xử lý ảnh 1.1.1. Xử lý ảnh làgì? 1.1.2. Mộtsốvấnđề trong xử lý ảnh 1.1.2.1. Mộtsốkháiniệm a. Ảnh vàđiểm ảnh b. Mứcxámmàuvàhistogram 1.1.2.2 trong suốtquatrìnhthựchiệnđềtài. Chương1:Kháiquátvề xử lý ảnh và xử lý ảnh y tế 1. Xử lý ảnh 1. Xử lý ảnh làgì? 1 Xử lý ảnh là một lĩnh vực trong CNTT nhằm thao tác ảnh đầu. đềgặpphải trong việcthaotácvới ảnh y tế. Chương2: Thuật toán phâncụm trong xử lý ảnh y tế. Chương n y giới thiệu một số thuật toán phân cụm dữ liệu và làm rõ