1.1.1 Khái niệm - SNOMED CT viết tắt của Systematized Nomenclature of Medicine - Clinical Terms - Hệ thống Danh mục Thuật ngữ Y học lâm sàng là một bộ sưu tập các thuật ngữ trong lĩnh v
Trang 1TÌM HIỂU VỀ BÁCH KHOA THUẬT NGỮ Y TẾ SNOMED-CT
VÀ ỨNG DỤNG TRONG LĨNH VỰC CẤU TRÚC RĂNG
Chuyên ngành : Công nghệ thông tin
Trang 2ii
LỜI CAM ĐOAN
Tôi xin cam đoan: Luận văn tha ̣c sĩ Công nghê ̣ thông tin “ Tìm hiểu về Bách khoa thuật ngữ y tế SNOMED-CT và ứng dụng trong lĩnh vực Cấu trúc Răng” này là công trình nghiên c ứu thực sự của cá nhân, được thực hiện trên cơ
sở nghiên cứu lý thuyết và dư ới sự hướng dẫn khoa học của Tiến sĩ Cao Tuấn Dũng
Tôi xin chi ̣u trách nhiê ̣m về lời cam đoan này
Hà Nội, ngày 12 tháng 9 năm 2012
Tác giả
Lưu Thị Thanh Thúy
Trang 3iii
LỜI CẢM ƠN
Đầu tiên cho em gửi lời cảm ơn sâu sắc nhất đến TS Cao Tuấn Dũng đã tận tình chỉ bảo cho em trong suốt thời gian thực hiện khóa luận Trong quá trình nghiên cứu em đã gặp phải nhiều khó khăn nhưng nhờ sự hướng dẫn tận tình và
động viên khích lệ của thầy, em đã dần vượt qua và hoàn thành được khóa luận
Em xin trân trọng cảm ơn quý thầy cô là chuyên gia về lĩnh vực Răng Hàm Mặt của Trường Cao đẳng Y tế Khánh Hòa, các anh chị thuộc khoa Răng Hàm Mặt – Bệnh viện đa khoa tỉnh Khánh Hòa đã góp ý và tư vấn cho luận văn của em thêm chuẩn xác về lĩnh vực y học, cho em những lời khuyên quý báu, bổ ích trong quá trình thực hiện luận văn
Em xin bày tỏ lòng biết ơn đến các thầy cô trong trường Đại Học Bách khoa Hà Nội và Đại học Nha Trang đã giảng dạy và cho em những kiến thức quý báu, làm nền tảng để hoàn thành khóa luận cũng như thành công trong nghiên cứu, làm việc trong tương lai
Và em xin cũng gởi lời cảm ơn tới các cán bộ - viên chức của Trường Cao đẳng Y tế Khánh Hòa đã tạo mọi điều kiện thuận lợi để em hoàn thành khóa luận
Cuối cùng, cho con gửi lời cảm ơn sâu sắc tới gia đình, bố, mẹ, chị và em
đã cho con nhiều tình thương cũng như sự động viên kịp thời để con vượt qua những khó khăn trong cuộc sống và hoàn thành được khóa luận
******
Trang 4iv
DANH MỤC CÁC THUẬT NGƢ̃, TƢ̀ VIẾT TẮT
STT Thuâ ̣t ngƣ̃ Diễn giải
1 SNOMED-CT Systematized Nomenclature of Medicine - Clinical Terms
2 HL7 Health Level Seven International
3 LOINC Logical Observation Identifiers Names and Codes
4 CDA Child Development Associate
5 ICD The International Classification of Diseases
6 RDF The Resource Description Framework (RDF
7 RDFS RDF Schema
8 OWL The Web Ontology Language
9 EHR Electronic Health Record
10 FSN Fully Specified Name
11 PT Preferred Term
12 CTV3 Clinical Terms Version 3
13 AI Artificial intelligence
14 IPTV Internet Protocol television
15 Semantic Web Web ngữ nghĩa
16 Concept Khái niệm
17 Description Mô tả của khái niệm
18 Relationship Mối quan hệ giữa các khái niệm
19 Individuals Các thể hiê ̣n
20 Classes Các lớp khái niệm
21 Properties Thuô ̣c tính
22 Annotation Chú thích
Trang 5v
DANH MỤC CÁC HÌNH
Hình 1.1 – Tình hình sử dụng SNOME-CT giai đoạn 2002-2008 12
Hình 1.2 – Phân nhóm cấp 1 của SNOMED-CT 14
Hình 1.3 – Mối quan hệ IS_A 18
Hình 1.4 – Mô tả một phần Ontology SNOMED-CT 20
Hình 1.5 – Cấu trúc SNOMED-CT 26
Hình 1.6 – Mô tả sử dụng khóa của Concept, Description, Relationship 27
Hình 3.1 – Giao diện của VTST (Mỹ) 41
Hình 3.2 – Giao diện của Dataline (Anh) 42
Hình 3.3 – Giao diện của NPEx (Anh) 43
Hình 3.4 – SnomedCT OWL của Tây Ban Nha 44
Hình 3.5 - Anatomical SnomedCT OWL 45
Hình 3.6 - Minh họa đánh dấu xác đi ̣nh các thuâ ̣t ngữ trong lĩnh vực răng mặt 48
Hình 3.7 – Ví dụ về xác định Subject – Predicate – Object 51
Hình 3.8 – Ontology theo cách thứ nhất: đưa thông tin vào annotation 52
Hình 3.9 – Ontology theo cách thứ hai: đưa thông tin thông qua Instance 56
Hình 3.10 – Ontology Cấu trúc Răng được biểu diễn trong Protégé (theo class) 60
Hình 3.11–Ontology Cấu trúc Răng được biểu diễn trong Protégé (theo Individiual) 61
Hình 3.6 – Mô hình Ontology Cấu trúc Răng được biểu diễn trong Protégé (cấp 1) 61
Hình 3.13 – Mô hình Ontology Cấu trúc Răng được biểu diễn trong Protégé (cấp 2) 62
Hình 3.14 – Màn hình chính 63
Hình 3.15 – Màn hình chức năng 1.1 64
Hình 3.16 – Màn hình chức năng 1.2 64
Hình 3.17 – Màn hình chức năng 1.3 65
Hình 3.18 – Màn hình chức năng 1.4 66
Hình 3.19 – Màn hình chức năng 2.1 67
Hình 3.20 – Màn hình chức năng 2.2 67
Trang 61
PHẦN MỞ ĐẦU
Trang 72
1 Lý do chọn đề tài
Trong ngành y tế Việt Nam, nhu cầu trao đổi tìm kiếm thông tin còn gặp khó khăn, việc chia sẻ và trao đổi thông tin này còn gặp nhiều vướng mắc là do ngành y tế chưa có chuẩn và danh mục dùng chung cho y tế
Hiện nay trên thế giới đã có một số chuẩn giúp trao đổi, lưu trữ thông tin, truyền thông trong y tế như HL7 (tạo ra môi trường thuận lợi cho việc trao đổi dữ liệu lâm sàng và hành chính giữa các hệ thống thông tin y tế), chuẩn SNOMED
CT (là một chuẩn danh mục các thuật ngữ y tế), chuẩn LOINC (là chuẩn danh mục liên quan đến xét nghiệm), chuẩn CDA (là chuẩn tài liệu lâm sàng), chuẩn danh mục bệnh ICD, dược ATC
Mặc dù có khá nhiều chuẩn y tế dùng trên thế giới, tuy nhiên tại Việt Nam, các chuẩn này ít thấy áp dụng tại các cơ sở y tế, đặc biệt là đối với chuẩn SNOMED-CT, theo tìm hiểu của cá nhân em thì chuẩn này ít được sử dụng tại Việt Nam Mặc dù đã có khá nhiều nghiên cứu trong nước về SNOMED-CT, tuy nhiên các nghiên cứu này chưa đi sâu vào chuyên môn ngành y
Đối với việc tra cứu thông tin y tế hiện nay tại Việt Nam, có khá nhiều công cụ trong nước dùng để tìm kiếm, tra cứu Tuy nhiên, với cách xây dựng các công cu ̣ tìm kiếm theo từ khóa hiê ̣n nay thì không đáp ứng được nhu cầu cung cấp thông tin ngày càng cao cho người dùng Do đó cần có mô ̣t phương pháp tiếp
câ ̣n tốt hơn để có thể giúp người quan tâm đến lĩnh vực y học dễ dàng hơn trong tìm kiếm thông tin Viê ̣c ứng du ̣ng Web ngữ nghĩa trong tra cứu hiện đang là xu hướng phổ biến trên thế giới do nó có khả năng giải quyết tốt các vấn đề phức tạp trong xử lý thông tin
Vì vậy, với các tiện ích của SNOMED-CT và web ngữ nghĩa, luận văn này tập trung nghiên cứu về các nội dung của SNOMED-CT, qua đó áp dụng nó vào một lĩnh vực chuyên sâu theo công nghệ web ngữ nghĩa Em tập trung vào lĩnh vực Cấu trúc Răng của SNOMED-CT do hiện nay tại đơn vị công tác của mình là Trường Cao đẳng Y tế Khánh Hòa nên em có nhiều thuận lợi khi tiếp cận với các kiến thức về y tế mà cụ thể là lĩnh vực Răng – Hàm – Mặt
Trang 83
2 Mục đích, đối tươ ̣ng, phạm vi nghiên cứu
- Khảo sát, tìm hiểu về Snomed-CT
- Khảo sát, tìm hiểu, đánh giá về web ngữ nghĩa
- Khảo sát, tìm hiểu, thu thập các tài liệu liên quan đến lĩnh vực Răng miệng hiện có tại Việt Nam
- Tìm hiểu công cụ soạn thảo ontology b ằng Protégé; Các ngôn ngữ biểu diễn ontology như RDF/RDFS, OWL; Ngôn ngữ truy vấn SPARQL ; Bô ̣ thư viê ̣n hỗ trơ ̣ quản lý ontology với ngôn ngữ java- Jena
- Xây dựng ontology tiếng Việt “Cấu trúc Răng” dựa trên Snome-CT và tài liệu Răng hàm mặt đã thu thập được, từ đó sử du ̣ng đươ ̣c ontology này để cài
đă ̣t ứng du ̣ng tìm kiếm các thu ật ngữ về lĩnh vực Răng theo chuẩn của
Snomed-CT
3 Cấu tru ́ c luâ ̣n văn
Phần nô ̣i dung chính của luâ ̣n văn được chia thành 3 chương, trong đó:
Chương 1 - Tổng quan về Snomed-CT
Trình bày sơ lược về Snomed-CT, các mục đích và lợi ích khi sử dụng Snomed-CT; Các phân cấp và cấu trúc của Snomed-CT
Chương 2 – Một số đánh giá tron g viê ̣c ứng dụng Web ngữ nghĩa và áp dụng trong SNOMED-CT
Trình bày tổng quan về Web ngữ nghĩa , sự cần thiết và các ứng dụng của Web ngữ nghĩa; Các nghiên cứu biểu diễn Snomed-CT sử du ̣ng web ngữ nghĩa
Chương 3 – Áp dụng Web ngữ nghĩ a trong việc tìm kiếm thuật ngữ về răng theo chuẩn Snomed-CT
Trình bày về hiện trạng ontology của Snomed-CT hiện nay; các hiểu biết
về các thuật ngữ Răng thông qua các tài liệu về lĩnh vực Răng đã nghiên cứu được Qua đó có những nhâ ̣n xét về cách định nghĩa thuật ngữ Răng hiện nay tại Việt Nam so với chuẩn quốc tế Cuối chương 3 là cách thức xây dựng ontology
“Cấu trúc Răng” bằng tiếng Viê ̣t dựa vào Snomed-CT và tạo phần mềm demo tra cứu ontology này
Trang 94
PHẦN NỘI DUNG
Trang 101.1 SNOMED-CT là gì?
1.1.1 Khái niệm
- SNOMED CT (viết tắt của Systematized Nomenclature of Medicine - Clinical Terms - Hệ thống Danh mục Thuật ngữ Y học lâm sàng) là một bộ sưu tập các thuật ngữ trong lĩnh vực y học được tổ chức, xử lý trên máy tính một cách
có hệ thống mà hầu hết là các thuật ngữ lâm sàng về bệnh tật, các triệu chứng, tiến trình điều trị, phương pháp điều trị, các thiết bị y tế và các loại thuốc [7] Các bác sĩ và các nhà cung cấp dịch vụ chăm sóc sức khỏe sử dụng SNOMED CT nhằm giúp cho việc trao đổi các thông tin y tế lâm sàng điện tử Cụ thể là :
+ Giữa các nhà cung cấp dịch vụ chăm sóc sức khỏe, các nhà nghiên cứu
và những người nghiên cứu về khả năng tương tác ngữ nghĩa luôn có một nhu cầu trao đổi thông tin lâm sàng liên tục; đồng thời vì thông tin y tế được ghi nhận khác nhau từ nơi này đến nơi khác (trên giấy hoặc điện tử), nên có một hệ thống thuật ngữ y tế toàn diện, thống nhất là cần thiết
+ Bác sĩ lâm sàng và các tổ chức sử dụng thuật ngữ lâm sàng khác nhau thì đều có cách định nghĩa như nhau Ví dụ, các ca bệnh về cơn đau tim, nhồi máu cơ tim, và MI thì đều có thể chỉ liên quan đến bác sĩ chuyên khoa tim, nhưng với một máy tính, tất cả chúng đều khác nhau
+ Các hình ảnh, video và các ca lâm sàng được tổ chức theo một bộ thuật ngữ SNOMED CT là một công cụ hỗ trợ thực sự mạnh mẽ cho sự hợp tác lâm sàng, cho phép người dùng tìm kiếm các ca bệnh một cách nhanh chóng bằng cách gõ một thuật ngữ liên quan đến các ca bệnh này
- SNOMED CT dựa trên sự tương tác giữa các thuật ngữ (mô hình của ý nghĩa) và mô hình thông tin của hệ thống và các ứng dụng (các mô hình sử
Trang 116
dụng) Sự phối hợp giữa mô hình thuật ngữ và mô hình thông tin rất cần thiết nhằm tránh những khoảng trống, những chồng chéo, va chạm hoặc nhầm lẫn trong ý nghĩa hoặc trao đổi thông tin lâm sàng
1.1.2 Mục đích của SNOMED CT
- Mục đích chính là hỗ trợ việc ghi lại các dữ liệu lâm sàng; giải mã, lấy mẫu và phân tích các dữ liệu lâm sàng này một cách có hiệu quả nhằm cải thiện việc chăm sóc bệnh nhân
+ SNOMED CT có thể được sử dụng để ghi lại các chi tiết lâm sàng của bệnh nhân trong hồ sơ bệnh nhân điện tử (EHR) và có thể áp dụng các chức năng
hỗ trợ, chẳng hạn như quyết định được thông tin về bệnh nhân, các cách chăm sóc lâm sàng, chia sẻ kế hoạch chăm sóc như chăm sóc hỗ trợ bệnh nhân dài hạn
+ SNOMED-CT giúp tổ chức các nội dung của hồ sơ y tế, làm giảm biến đổi trong việc mã hóa, sử dụng dữ liệu
+ SNOMED CT hỗ trợ việc chia sẻ dữ liệu đối với việc chăm sóc bệnh nhân Bác sĩ và các nhà cung cấp dịch vụ chăm sóc y tế sẽ có nhiều thông tin về lịch sử bệnh tật của bệnh nhân, tư vấn hướng điều trị và dự đoán kết quả điều trị Nhờ các ứng dụng của SNOMED CT, một nhà cung cấp dịch vụ chăm sóc y tế
có thể dễ dàng gửi và nhận thông tin điện tử từ một cơ sở chăm sóc y tế khác nhằm cung cấp chất lượng chăm sóc tốt nhất cho bệnh nhân Chia sẻ dữ liệu sẽ tăng tính chính xác của tài liệu lâm sàng, tạo điều kiện hỗ trợ quyết định lâm sàng, cải thiện tính chuẩn xác, độ an toàn trong điều trị bệnh nhân, nâng cao kết quả lâm sàng Khả năng này giảm đáng kể các sai sót y tế liên quan so với các hồ
sơ giấy truyền thống
- Mục tiêu của SNOMED CT là luôn kho dữ liệu, lấy chỉ số và các dữ liệu lâm sàng được tổng hợp qua các mô tả đặc trưng Dữ liệu cần được thu thập một lần, sau đó chia sẻ và tái sử dụng cho nhiều công dụng khác nhau của SNOMED
CT Nó có thể được tích hợp hoàn toàn với hệ thống hiện có, tạo ra các bản đồ dữ liệu và sử dụng rộng rãi trong các phiên bản dữ liệu y tế khác như ICD-9-CM,
Trang 12nó như là một phần của hồ sơ sức khỏe điện tử
- Ngoài các ứng dụng của SNOMED CT như hồ sơ y tế điện tử, giám sát ICU, hỗ trợ quyết định lâm sàng, nghiên cứu y tế, các thử nghiệm lâm sàng, SNOMED CT còn giúp bác sĩ tham gia giám sát dịch bệnh, lập chỉ mục hình ảnh
và thông tin của người sử dụng các dịch vụ y tế thông qua máy tính
1.1.3 Lợi ích [16,17]
1.1.3.1 Lợi ích chung
- SNOMED CT cung cấp một thuật ngữ phù hợp trên tất cả các lĩnh vực chăm sóc sức khỏe Điều này cho phép các bác sĩ lâm sàng giao tiếp hiệu quả và chính xác trên các lĩnh vực lâm sàng và qua một hồ sơ bệnh nhân
- SNOMED CT cho phép ghi âm chính xác của thông tin lâm sàng Bằng cách sử dụng các mô tả cho một khái niệm lâm sàng duy nhất, nó cho phép thiết
kế riêng cho các thiết lập chăm sóc cá nhân trong khi vẫn duy trì tính nhất quán
- SNOMED CT có cấu trúc Điều này cung cấp cho một mô tả rõ ràng của một khái niệm cá nhân theo cách hợp lý và cho phép thể hiện các thông tin lâm sàng logic thông qua các ứng dụng trên máy tính
- SNOMED CT có thể được mở rộng một cách có kiểm soát để tiếp tục nâng cao khả năng sử dụng và phạm vi của nó
- Ghi dữ liệu lâm sàng thông qua SNOMED CT cho phép người dùng có thể truyền dẫn dữ liệu, phục hồi dữ liệu, chọn dữ liệu phù hợp và phân tích dữ liệu từ hồ sơ bệnh nhân trên toàn hệ thống chăm sóc sức khỏe
- Trong hợp tác với các chuyên gia về vấn đề lâm sàng, SNOMED CT cũng được duy trì và cập nhật để đại diện cho kiến thức lâm sàng hiện tại
Trang 138
1.1.3.2 Lợi ích trong sử dụng Lâm sàng
- SNOMED CT cho phép nắm bắt thông tin lâm sàng ở một mức độ chi tiết thích hợp cho việc cung cấp chăm sóc sức khỏe
- SNOMED CT cho phép các dữ liệu bệnh nhân được ghi lại bởi những người khác nhau tại các địa điểm khác nhau Điều này cho phép bệnh nhân được liên tục chăm sóc thông qua các thiết lập chăm sóc khác nhau ở các địa điểm khác nhau
- Việc sử dụng nhất quán của SNOMED CT làm giảm nguy cơ chẩn đoán sai và giải thích không chính xác về dữ liệu bệnh nhân trong hồ sơ y tế (bằng cách giảm ý nghĩa ngữ cảnh tiềm ẩn khi liên kết với các dữ liệu nhập vào)
- Sử dụng hợp lý SNOMED CT có thể góp phần giảm tỷ lệ sai sót và có thể giúp đảm bảo việc ghi âm toàn diện của dữ liệu có liên quan
- Thông qua chia sẻ dữ liệu, nó có thể làm giảm đáng kể sự cần thiết phải lặp lại lịch sử y tế (thông tin bệnh nhân, tiền sử bệnh, tiền sử khám…) tại mỗi cuộc gặp gỡ mới giữa bệnh nhân với một chuyên gia chăm sóc sức khỏe
- SNOMED CT cho phép tìm kiếm hiệu quả của hồ sơ bệnh nhân và thu thập các thông tin lâm sàng có liên quan
- SNOMED CT tạo điều kiện cho hỗ trợ quyết định, nhận dạng tự động của các yếu tố nguy cơ đối với bệnh nhân, theo dõi điều trị và các đáp ứng điều trị bất lợi cũng như thuận lợi Với việc sử dụng SNOMED CT để mã hóa thông tin lâm sàng trong hồ sơ bệnh nhân, máy tính có thể hỗ trợ các quyết định được thực hiện bởi các chuyên gia chăm sóc sức khỏe, bằng cách cung cấp thông tin theo ngữ cảnh có liên quan tại các thời điểm chăm sóc, hoặc bằng cách cung cấp cảnh báo tự động, nhắc nhở hoặc kiểm tra
- SNOMED CT có thể giúp xác định các bệnh nhân phù hợp với một tập hợp các tiêu chuẩn lâm sàng Ví dụ như có thể xác định được những người có đủ điều kiện cho một chương trình kiểm tra cụ thể, và qua đó phát hiện sự phát triển bệnh lí ở bệnh nhân có nguy cơ cao
Trang 149
- SNOMED CT cải thiện hiệu quả lâm sàng bằng cách cung cấp thông tin lâm sàng có liên quan theo tiêu chuẩn thuật ngữ lâm sàng với các tài liệu hướng dẫn chăm sóc
- Cơ chế “lịch sử” của SNOMED CT cho phép thông tin lâm sàng được thu thập theo thời gian với ý nghĩa tương quan với nhau
1.1.3.3 Lợi ích về Thông tin
- SNOMED CT có thể được sử dụng cho việc phân phối chia sẻ và nhất quán trong phân tích kết quả dữ liệu
Ví dụ, SNOMED CT có thể được sử dụng để phân tích có bao nhiêu ca phẫu thuật ung thư được thực hiện, ghi lại các kết quả dữ liệu để xác định xem phẫu thuật có ảnh hưởng đến sự sống còn lâu dài và tái phát cục bộ trong điều trị ung thư Kết quả của loại phân tích này sẽ rất có giá trị, là bằng chứng cơ sở cho một bệnh lí khi được xây dựng Nếu dữ liệu kết quả này có thể được thể hiện nhất quán bằng cách sử dụng SNOMED CT, sau đó áp dụng rộng rãi hơn với nhiều dữ liệu quốc tế thì nó có thể được sử dụng để so sánh các phương pháp điều trị cả trong và giữa các quốc gia, từ đó có những cải tiến trong phẫu thuật nhằm đem lại kết quả tốt nhất cho bệnh nhân
- SNOMED CT có thể được sử dụng để thiết lập và phân phối thông tin nhằm hỗ trợ quyết định một cách nhất quán
- SNOMED CT có thể tạo điều kiện thuận lợi cho việc quản lý kiến thức thông qua thuật ngữ tiêu chuẩn của nó và các thông tin tham khảo được “nhúng” bên trong nó Hệ thống phân cấp SNOMED CT có thể được sử dụng để tổng hợp các loại kiến thức tương tự hoặc thông tin tương tự
1.1.3.4 Lợi ích đối với người tiêu dùng và bệnh nhân
- Bệnh nhân muốn được thường xuyên quan tâm chăm sóc, SNOMED CT
đã đáp ứng được điều này thông qua việc cung cấp thông tin sẵn có, đáng tin cậy, nhất quán, và có liên quan đến lịch sử sức khỏe, quá trình chăm sóc bệnh nhân
Trang 1510
- SNOMED CT góp phần cải thiện chăm sóc bệnh nhân nhờ sự phát triển của bản ghi y tế điện tử, ghi lại thông tin lâm sàng theo cách cho có ý nghĩa, dựa trên quy hồi
- Với SNOMED CT, lịch sử gia đình, thuốc, dị ứng, chứng bệnh và phương pháp điều trị đều có thể được mã hóa và chia sẻ giữa các bác sĩ lâm sàng, các trang web dịch vụ về chăm sóc y tế mà không ngại về khoảng cách địa lý Truy cập thông tin liên quan đến mỗi bệnh nhân sẽ cho kết quả chăm sóc tốt hơn,
an toàn hơn cho bệnh nhân
Với một yêu cầu đơn giản như đặt hàng và thực hiện một toa thuốc theo yêu cầu của bác sĩ, dược sĩ sẽ xem xét các loại thuốc nào là phù hợp, không gây
dị ứng và chống chỉ định đối với bệnh nhân Để đánh giá các thuốc nào là thích hợp cho căn bệnh thì đòi hỏi nhiều hơn so với tên thuốc và liều lượng của nó Đây là bước rất quan trọng để bảo đảm an toàn của bệnh nhân khi sử dụng đơn thuốc
Điều này có nghĩa là bác sĩ và dược sĩ sẽ xác định bệnh nhân dựa trên các thông tin được mã hóa nhất định trong hồ sơ của họ, sau đó có thể liên hệ với bệnh nhân để cho họ biết về quy trình điều trị mới, sử dụng loại thuốc mới, hoặc các thông tin khác có thể có lợi ích hơn cho bệnh nhân
- Bệnh nhân được hưởng lợi từ việc sử dụng các dịch vụ SNOMED CT vì
nó cải thiện việc ghi lại thông tin của EHR, tạo điều kiện giao tiếp tốt hơn, dẫn đến cải thiện chất lượng chăm sóc bệnh nhân tốt hơn
- SNOMED CT như một thành phần trung tâm trong việc cung cấp chăm sóc sức khỏe và an toàn cơ sở hạ tầng bệnh nhân, nhờ đó các bác sĩ lâm sàng có thể được hỗ trợ thường xuyên, và tại cùng một thời gian, các nhu cầu đặc biệt của bất kỳ ngày nào đều có thể được giải quyết Mỗi bác sĩ, y tá, dược sĩ và bác sĩ lâm sàng có thể diễn đạt các khái niệm ở cấp độ chi tiết thích hợp với họ
1.1.3.5 Lợi ích khác
- SNOMED CT có thể hỗ trợ giám sát y tế công cộng Việc mã hóa thông tin lâm sàng cho phép các giám sát dịch bệnh và xu hướng bệnh ở một mức độ
Trang 16- SNOMED CT cũng có thể tạo điều kiện thuận lợi cho phân tích hiệu suất SNOMED CT có thể cung cấp một cơ sở phù hợp để đánh giá
- SNOMED CT cho phép phân tích dữ liệu dễ dàng hơn, hiệu quả hơn cũng nhƣ cung cấp số lƣợng lớn các dữ liệu phù hợp cho nghiên cứu y học
1.1.4 Sử dụng SNOMED CT
- SNOMED CT làm việc thông qua thực hiện trong các ứng dụng phần mềm Các ứng dụng này đại diện cho thông tin lâm sàng liên quan một cách đáng tin cậy và có thể tái sử dụng
- SNOMED CT đƣợc thực hiện trong một loạt các ứng dụng [16,17], bao gồm:
Hồ sơ y tế điện tử (Electronic Medical Records)
Sắp xếp, tiếp nhận bệnh nhân trên máy vi tính
Thực hành Chứng thực Dựa vào Giải pháp
Áp dụng trong Công nghiệp Dƣợc phẩm
Trang 1712
Sơ đồ dưới đây cho thấy số lượng người dùng sử dụng SNOMED CT trong giai đoạn từ năm 2002-2008
Hình 1.1 – Tình hình sử dụng SNOME-CT giai đoạn 2002-2008 [12]
- Theo Tổ chức Phát triển thuật ngữ Y tế tiêu chuẩn quốc tế (IHTSDO) - đơn vị sở hữu trí tuệ SNOMED-CT, SNOMED CT hiện có hơn 311.000 khái niệm y tế, chia thành nhiều hệ thống phân cấp đa dạng như cấu trúc cơ thể người, chẩn đoán lâm sàng, vị trí địa lý và sản phẩm sinh học / dược phẩm.[12]
- Hiện nay tại Việt Nam, theo tìm hiểu của em, mặc dù có khá nhiều nghiên cứu về SNOMED CT nhưng thì vẫn chưa có tổ chức Y tế nào sử dụng SNOMED CT cho lĩnh vực cụ thể
1.2 Thành phần cơ bản của SNOMED- CT [7,8]
Mỗi khái niệm trong SNOME-CT được đại diện bởi một con số đặc trưng
và một số khái niệm có thể được sử dụng cùng một lúc để mô tả một tình trạng phức tạp Bằng cách sử dụng con số để đại diện cho các khái niệm y tế, SNOMED CT cung cấp tiêu chuẩn lâm sàng dựa vào các điều kiện y tế và các
Trang 18là lớp con (quan hệ) của các khái niệm
1.2.1 Khái niệm (Concept)
Khái niệm trong SNOMED CT phân loại và ghi lại tất cả những điểm đặc
trưng cho quá trình chăm sóc sức khỏe
Mỗi khái niệm được xác định duy nhất bởi một ID khái niệm (ConceptID), ví dụ khái niệm có mã ID 22.298.006 đề cập đến nhồi máu cơ tim
Tất cả các khái niệm CT SNOMED được tổ chức vào phân loại mạch hở
(-a) phân cấp
Ví dụ, viêm phổi truyền nhiễm IS-A Viêm phổi IS-A Một bệnh phổi.
Khái niệm được tổ chức trong hệ thống phân cấp có thứ bậc, từ tổng quát
đến cụ thể Điều này cho phép dữ liệu chi tiết lâm sàng được ghi lại và sau đó truy cập hoặc tổng hợp ở mức độ tổng quát hơn
Một khái niệm có thể có nhiều “cha mẹ”, ví dụ “viêm phổi truyền nhiễm”
cũng là một “con” của “mắc bệnh truyền nhiễm”
Các bộ Khái niệm của SNOMED CT có nhiều cấp và phân theo các bộ khái niệm như hình dưới
Trang 1914
Hình 1.2 – Phân nhóm cấp 1 của SNOMED-CT [11]
1.2.2 Mô tả khái niệm (descriptions concepts )
1.2.2.1 Định nghĩa
Mô tả khái niệm là các từ ngữ hoặc tên đƣợc gán cho một khái niệm
SNOMED CT "Từ ngữ" trong bối cảnh này có nghĩa là một cụm từ đƣợc sử dụng để đặt tên cho một khái niệm
Mỗi mô tả đƣợc xác định bởi một địa chỉ ID duy nhất (DescriptionID) Nhiều mô tả có thể đƣợc liên kết với một khái niệm đƣợc xác định bởi một
ConceptID
Ví dụ:
Một số mô tả kết hợp với ConceptID 22298006:
- Nghĩa rõ hoàn toàn: Nhồi máu cơ tim (rối loạn) DescriptionID 751689013
- Thuật ngữ ƣu tiên dùng : Nhồi máu cơ tim DescriptionID 37436014
- Từ đồng nghĩa: nhồi máu cơ tim DescriptionID 37442013
Trang 2015
Mỗi mô tả ở trên có một DescriptionID duy nhất, và tất cả các mô
tả trên có liên quan đến một khái niệm duy nhất là ConceptID 22298006
Mục đích của FSN là để xác định một khái niệm và làm rõ ý nghĩa của nó,
không nhất thiết phải trình bày các cụm từ phổ biến nhất được sử dụng hoặc các cụm từ bình thường cho khái niệm đó Mỗi FSN kết thúc với một "từ khóa ngữ nghĩa" (semantic tag) trong dấu ngoặc đơn ở cuối của khái niệm "Từ khóa ngữ
nghĩa" cho thấy khái niệm thuộc về loại ngữ nghĩa nào (ví dụ như Rối loạn, Sinh
vật, Người, vv)
Ví dụ, khối máu tụ (xét ở hình thái bất thường) là một FSN đại diện các
mô tả về những gì mà bác sĩ giải phẫu bệnh thấy ở lớp mô tế bào, trong khi tụ
máu (xét ở rối loạn) lại là một FSN cho biết khái niệm chẩn đoán lâm sàng của
khối máu tụ
1.2.2.2.2 Thuật ngữ thường dùng /ưu tiên dùng (Preferred Term- PT)
Mỗi khái niệm có một thuật ngữ ưu tiên dùng, có nghĩa là các bác sĩ lâm
sàng sử dụng, nắm bắt những từ hoặc cụm từ phổ biến để đặt tên cho khái niệm
Ví dụ, khái niệm 54987000 “ sửa chữa ống mật chủ” (thủ tục) có thuật ngữ
thường dùng là "Choledochoplasty" để đại diện cho một tên gọi phổ biến mà các
bác sĩ lâm sàng sử dụng để mô tả các thủ tục
Không giống FSNs, “Thuật ngữ ưu tiên dùng” không nhất thiết phải duy nhất Thỉnh thoảng, “Thuật ngữ ưu tiên dùng” cho một khái niệm cũng có thể là một từ đồng nghĩa hoặc là hạn ưu tiên cho một khái niệm khác
1.2.2.2.3 Từ đồng nghĩa (Synonym)
Từ đồng nghĩa đại diện cho bất kỳ điều khoản bổ sung đại diện cho cùng
một khái niệm tương tự như FSN
Trang 2116
Từ đồng nghĩa, giống nhƣ PT, không phải là duy nhất trên khái niệm Ví dụ:
Một số của từ đồng nghĩa liên quan đến nghĩa đầy đủ của chứng
“Nhồi máu cơ tim” có ConceptID 22298006 rối loạn) nhƣ sau:
- Từ đồng nghĩa: nhồi máu cơ tim DescriptionID: 37442013
-Từ đồng nghĩa: cơn đau tim DescriptionID: 37443015 -Từ đồng nghĩa: nhồi máu của tim DescriptionID: 37441018
1.2.3 Mối quan hệ giữa khái niệm (relationship)
Mối quan hệ liên kết các khái niệm trong SNOMED CT Có bốn loại của mối quan hệ giữa các khái niệm trong SNOMED CT:
- Xác định /định nghĩa
- Sát hạch
- Lịch sử
- Bổ sung
1.2.3.1 Mối quan hệ với định nghĩa khái niệm
Mỗi khái niệm trong SNOMED CT đƣợc xác định một cách hợp lý thông qua các mối quan hệ của nó với các khái niệm khác
Mỗi hoạt động của khái niệm trong SNOMED CT (trừ khái niệm gốc "
Khái niệm SNOMED CT") có ít nhất một mối quan hệ IS_A (là một) đến một
khái niệm siêu kiểu (supertype concept)
Những mối quan hệ IS_A và việc xác định thuộc tính các mối quan hệ đƣợc gọi là "đặc trƣng xác định" của các khái niệm CT SNOMED Chúng đƣợc coi là xác định bởi vì chúng đƣợc sử dụng đại diện một cách hợp lý cho một khái niệm bằng cách thiết lập các mối quan hệ của nó với các khái niệm khác Điều này đƣợc thực hiện bằng cách thiết lập các mối quan hệ IS_A với một hoặc nhiều
Trang 2217
khái niệm xác định (gọi là khái niệm siêu kiểu) và mô hình hóa sự khác biệt với
những siêu kiểu thông qua các thuộc tính xác định
Ví dụ: Khi xét trường hợp “Gãy xương cổ chân” (rối loạn) có các mối quan hệ sau:
- IS_A “gãy chân” (rối loạn)
- FINDING SITE “cấu trúc của xương cổ chân” (cấu trúc cơ thể) -ASSOCIATED MORPHOLOGY “ gãy xương” (hình thái bất thường)
Một mối quan hệ được phân công chỉ khi mối quan hệ đó là luôn luôn được biết đến là đúng
Ví dụ, khuẩn liên cầu nhóm A gây ra hầu hết các trường hợp viêm họng
do vi khuẩn Tuy nhiên, có một tỷ lệ nhỏ các trường hợp này được gây ra bởi các
loài khác của liên cầu khuẩn Do đó, khi định nghĩa khái niệm “viêm họng liên
cầu khuẩn” (rối loạn), khuẩn liên cầu nhóm A đã không được chọn là một giá trị
cho các thuộc tính tác nhân gây bệnh (CAUSATIVE AGENT) Một khái niệm
tổng quát hơn, nhóm khuẩn liên cầu (Genus Streptococcus) (sinh vật) đã được lựa chọn
1.2.3.2 Mối quan hệ IS_A
Mối quan hệ IS_A còn được gọi là " “mối quan hệ Supertype-Subtype” hoặc "mối quan hệ Parent-Child" Mối quan hệ IS_A là cơ sở của hệ thống phân cấp các SNOMED CT
Ví dụ:
Trang 2318
Một khái niệm có thể có một hoặc nhiều mối quan hệ IS_A với các khái niệm khác
Ví dụ như hình vẽ dưới đây
Hình 1.3 – Mối quan hệ IS_A
1.2.3.3 Thuộc tính của “mối quan hệ”
Các thuộc tính liên quan hai khái niệm và thiết lập kiểu “quan hệ” giữa chúng Cùng với mối quan hệ IS_A, chúng được coi là đặc điểm để xác định Chúng cho phép đại diện 1 cách hợp lý về ý nghĩa của một khái niệm bằng cách thiết lập các mối quan hệ của nó với các khái niệm khác
Một định nghĩa khái niệm hợp lý bao gồm một hoặc nhiều siêu kiểu (mô
hình với các mối quan hệ IS_A), và thiết lập một thuộc tính xác định nhằm nắm
bắt được ngữ nghĩa của một khái niệm và giúp phân biệt nó với các định nghĩa khái niệm khác, bao gồm các siêu kiểu của nó
Ví dụ , Khái niệm Viêm phổi (rối loạn) trong SNOMED CT là:
Viêm phổi (rối loạn)
FINDING SITE Cấu trúc phổi (cấu trúc cơ thể người)
Trong ví dụ này, Khái niệm Viêm phổi (rối loạn) được đặc trưng
với các thuộc tính FINDING SITE Khi ta gọi Viêm phổi là một rối loạn của phổi, FINDING SITE sẽ có giá trị là Cấu trúc phổi (cấu trúc cơ thể)
1.3 Phân cấp trong SNOMED-CT [9]
Các khái niệm trong SNOMED CT được tổ chức thành hệ thống phân cấp Khái niệm CT SNOMED là "Khái niệm gốc" Các nhóm khái niệm CT
Trang 2419
SNOMED (là siêu kiểu– supertype of) nằm ở nhóm phân cấp trên cùng và tất cả
các khái niệm khác đều phía dưới chúng
Khi hệ thống phân cấp dần xuống dưới, các khái niệm trong chúng trở nên
ngày càng cụ thể hơn
Khái niệm "con" (subtype) là những khái niệm lớp con cháu của lớp khái
niệm "Supertype" (hoặc "cha mẹ") Các khái niệm Supertype là các khái niệm
“cha ông” của khái niệm "subtype”
Nhóm phân cấp đầu tiên trong SNOMED CT gồm các khái niệm sau:
• Clinical finding • Physical force
• Procedure • Event
• Observable entity • Environment or geographical location
• Body structure • Social context
• Organism • Situation with explicit context
• Substance • Staging and scales
• Pharmaceutical/biologic product • Linkage concept
• Specimen • Qualifier value
• Special concept • Record artifact
• Physical object
Hình ảnh dưới đây biểu diễn một phần phân cấp của SNOMED-CT
Trang 2520
Hình 1.4 – Mô tả một phần phân cấp SNOMED-CT [2]
1.3.1 Cinical finding (Phát hiện lâm sàng)
Khái niệm trong hệ thống phân cấp này đại diện cho kết quả của một đánh
giá lâm sàng, quan sát hay quyết định lâm sàng, và bao gồm cả trạng thái lâm sàng bình thường và bất thường
Ví dụ về các khái niệm Phát hiện lâm sàng:
(1) Xóa đờm (Phát hiện) (2) Hơi thở bình thường (Phát hiện)
Ví dụ về các khái niệm Thủ tục:
Trang 261.3.3 Situation with explicit context (Tình trạng bối cảnh cụ thể)
Hệ thống phân cấp này được gọi là loại phụ thuộc vào ngữ cảnh SNOMED đã phát triển một mô hình ngữ cảnh để cho phép người sử dụng thực hiện để xác định bối cảnh bằng cách sử dụng thuật ngữ, mà không phụ thuộc vào một cấu trúc hồ sơ cụ thể
Ví dụ :
(1) Tiền sử gia đình: Nhồi máu cơ tim (tình hình) (2) Gia đình không có người bị tai biến mạch máu não (tình hình)
1.4.4 Observable entity (thực thể quan sát)
Các khái niệm trong hệ thống phân cấp này có thể được coi là đại diện cho
một câu hỏi hoặc thủ tục mà có thể tạo ra một câu trả lời hoặc kết quả
Ví dụ, huyết áp cuối thất trái tâm trương (quan sát thực thể) có thể được hiểu như câu hỏi "áp lực tâm thất trái cuối tâm trương là gì?" hoặc "tâm thất trái
đo cuối cùng áp suất tâm trương là gì?"
1.3.5 Body structure (Cấu trúc cơ thể)
Các khái niệm Cấu trúc cơ thể bao gồm các cấu trúc giải phẫu bình
thường cũng như bất thường Cấu trúc giải phẫu bình thường có thể được sử dụng để xác định vị trí của cơ thể liên quan đến một căn bệnh hoặc thủ tục
Trang 27Hệ thống phân cấp Chất bao gồm các khái niệm có thể được sử dụng để
ghi lại các thành phần hóa học tích cực của thuốc, chất gây dị ứng thực phẩm và hóa chất, các phản ứng bất lợi, thông tin về độc tính hoặc ngộ độc trong bảng kê đơn của các bác sĩ và điều dưỡng
Ví dụ:
(1) Chất Insulin (2) Khí mê-tan (3) Chất nhiễm sắc
1.3.8 Pharmaceutical/biologic product (Sản phẩm sinh học / dược phẩm)
Hệ thống phân cấp này đã được giới thiệu như là một hệ thống phân cấp hàng đầu để phân biệt rõ các sản phẩm thuốc (sản phẩm) thông qua các thành phần hóa học của chúng (các chất)
Ví dụ:
Thuốc Diazepam 5mg dạng viên nén(sản phẩm) (Tên, nồng độ, liều lượng)
1.3.9 Specimen (Mẫu thử)
Khái niệm Mẫu thử có thể được định nghĩa bởi các thuộc tính trong đó xác
định: cấu trúc cơ thể bình thường hay bất bình thường mà họ thu được từ vị trí lấy mẫu
Ví dụ về các khái niệm Mẫu:
(1) Mẫu vật từ tuyến tiền liệt có được bằng lấy sinh thiết (2) Mẫu sỏi thận
Trang 2823
1.3.10 Physical object (Đối tượng vật lý)
Khái niệm trong hệ thống phân cấp trong Đối tượng vật lý bao gồm các
đối tượng tự nhiên và nhân tạo
Ví dụ về các khái niệm đối tượng vật lý:
(1) Thận nhân tạo, thiết bị (2) Găng tay cao su Latex (3) Máy hỗ trợ thở áp lực
Các khái niệm trong hệ thống phân cấp vật lý lực lượng chủ yếu ở các đại
diện cho các lực lượng vật lý
Ví dụ về các khái niệm lực lượng vật lý:
(1) Đốt tự nhiên (vật lý có hiệu lực) (2) Dòng điện xoay chiều (vật lý lực lượng) (3) Tán, nghiền(lực lượng vật lý)
1.3.11 Physical force (Lực lượng vật lý)
Các khái niệm trong hệ thống phân cấp Lực lượng vật lý được trực tiếp đại
diện cho các lực lượng vật lý có thể đóng một vai trò như là một cơ chế gây tổ thương
Ví dụ về các khái niệm lực lượng vật lý:
(1)Cháy tự phát (lực lượng vật lý) (2)Ma sát (lực lượng vật lý) (3)Dòng điện xoay chiều (lực lượng vật lý) (4)Tán, nghiền (lực lượng vật lý)
1.3.12 Event (Sự kiện)
Các hệ thống phân cấp tổ chức Sự kiện bao gồm các khái niệm đại diện
xuất hiện (không bao gồm các thủ tục và biện pháp can thiệp)
Ví dụ về các khái niệm sự kiện:
(1)Lũ lụt (sự kiện) (2)Trận động đất (sự kiện)
Trang 2924
1.3.13 Environments and geographic locations (Môi trường và hệ thống phân cấp vị trí địa lý)
Môi trường và hệ thống phân cấp vị trí địa lý bao gồm các loại của môi
trường cũng như vị trí đặt tên chẳng hạn như các quốc gia, tiểu bang, và khu vực
Ví dụ của Môi trường và vị trí địa lý khái niệm:
(1)Hòn đảo Canary (vị trí địa lý)
1.3.14 Social context (Bối cảnh xã hội)
Hệ thống phân cấp bối cảnh xã hội có điều kiện và hoàn cảnh xã hội rất quan trọng đến việc chăm sóc sức khoẻ Nội dung bao gồm các lĩnh vực như tình trạng gia đình, tình trạng kinh tế, dân tộc, tôn giáo, phong cách cuộc sống và nghề nghiệp Những khái niệm đại diện cho khía cạnh xã hội ảnh hưởng đến sức khỏe và điều trị bệnh nhân
Ví dụ của Bối cảnh xã hội:
(1)Dân tộc (dân tộc): Người Estonia (2)Nghề nghiệp: Nhân viên ngân hàng (3)Nhóm người: sử dụng lao động (Employer), chăm sóc (Caregiver)
(4)Tôn giáo / triết lý : Ấn Độ giáo (5)Tình trạng kinh tế : trung bình
1.3.15 Staging and scales (Dàn dựng và quy mô)
Hệ thống phân cấp này có chứa các phân cấp con như quy mô đánh giá (đánh giá quy mô), đặt tên quy mô đánh giá và tình trạng, đặt tên cho hệ thống dàn dựng
Ví dụ thang đánh giá (đánh giá quy mô) khái niệm:
(1)Tình trạng hôn mê Glasgow (đánh giá quy mô)
1.3.16 Linkage concept (liên kết khái niệm)
Hệ thống phân cấp này bao gồm các khái niệm được sử dụng cho liên kết
Hệ thống phân cấp Liên kết khái niệm có chứa các phân cấp con sau :
1.3.16.1 Link assertion (Liên kết khẳng định)
Trang 30Ví dụ các thuộc tính xác định:
- IS_A (thuộc tính)
- Tay thuận (thuộc tính)
1.3.17 Qualifier value (Giá trị hạn định)
Hệ thống phân cấp Giá trị hạn định có chứa một số các khái niệm được sử
dụng như các giá trị thuộc tính của SNOMED CT Tuy nhiên, các giá trị cho các thuộc tính không giới hạn trong hệ thống phân cấp này và cũng được tìm thấy
trong hệ thống thứ bậc khác của Giá trị hạn định
Ví dụ, giá trị cho các thuộc tính LATERALITY (Tay thuận) trong khái
niệm được hiển thị dưới đây được lấy từ hệ thống phân cấp Giá trị hạn định:
- Cấu trúc thận trái (cấu trúc cơ thể) LATERALITY Trái (giá trị hạn định)
1.3.18 Record Artifact (bản ghi giả)
Một bản ghi giả là một thực thể được tạo ra bởi một người hoặc nhiều
người với mục đích cung cấp cho những người khác với thông tin về các sự kiện hoặc những trạng thái của vấn đề
Ví dụ, một hồ sơ sức khỏe đầy đủ là một hồ sơ giả có thể chứa các bản ghi giả khác nhau đưới hình thức văn bản cá nhân hoặc báo cáo cá nhân, do đó có thể chứa các thông tin cụ thể hơn chẳng hạn như các chủ đề và thậm chí cả tiêu đề của nó
Trang 3126
1.4 Cấu trúc SNOMED-CT [9]
Cấu trúc và công nghệ đằng sau SNOMED CT cho phép tổ chức thực hiện
và tích hợp vào trong chính quá trình của các ứng dụng lâm sàng và kinh doanh
SNOMED CT cung cấp khả năng bổ sung để tạo điều kiện tuỳ biến thực hiện
nhằm đáp ứng yêu cầu duy nhất của một tổ chức
Dưới đây là mô hình tổng quan về cấu trúc dữ liệu SNOMED CT
Hình 1.5 – Cấu trúc SNOMED-CT [9]
1.4.1 Core Tables (Bảng “nhân”)
SNOMED CT được phân phối như là một tập hợp các tập tin văn bản có
thể được nhập từ một cơ sở dữ liệu quan hệ Ba bảng hiển thị bên dưới đây
thường được gọi là bảng “nhân” của SNOMED CT
Sự kết hợp giữa các bảng bằng cách sử dụng các conceptID như khóa
chính hoặc khóa ngoài của các bảng
Trang 3227
Hình 1.6 – Mô tả sử dụng khóa của Concept, Description, Relationship[9]
1.4.1.1 Concept table (Bảng khái niệm)
Bảng khái niệm có chứa tất cả các khái niệm trong SNOMED CT Mỗi khái niệm được đại diện bởi một hàng của bảng Mỗi hàng của bảng khái niệm bao gồm các lĩnh vực sau đây:
- ConceptID : Khái niệm trong SNOMED CT được xác định bởi các ConceptID ConceptID là khóa chính của Bảng khái niệm
- SNOMED RT và CTV3 : nguồn gốc ban đầu cho mỗi khái niệm bất kỳ trong SNOMED CT Khi một khái niệm mới được tạo ra trong SNOMED CTthì
nó được chỉ định một định danh SNOMED RT và một định danh CTV3 Điều này cho phép người sử dụng SNOMED CT có thể làm việc với dữ liệu được mã hóa với SNOMED RT hoặc CTV3
-FullySpecifiedName : xuất hiện trong cả Bảng Khái niệm và Bảng Mô tả Trong Bảng khái niệm, nó dùng để đọc tên cho từng khái niệm
- ConceptStatus : chỉ ra một khái niệm được sử dụng có đang hoạt động hay không
- IsPrimitive : cho biết một khái niệm có phải là khái niệm gốc hay
1.4.1.2 Descriptions Table (Bảng Mô tả)
Bảng Mô tả thể hiện các thuật ngữ khác nhau cho 1 khái niệm Bảng mô tả bao gồm:
- DescriptionID: Mỗi mô tả có một DescriptionID duy nhất và được xem như là khóa chính của bảng này
Trang 33+ Từ đồng nghĩa (Synonyms): Nhiều thuật ngữ khác có thể được sử dụng để đặt tên cho một khái niệm
- LanguageCode: mô tả với một ngôn ngữ hoặc phương ngữ cụ thể, chẳng hạn như Tiếng Anh, tiếng Tây Ban Nha, vv…
1.4.1.3 Relationships Table (Bảng mối quan hệ)
Bảng này chứa các mối quan hệ giữa các khái niệm SNOMED CT Một mối quan hệ trong bảng được lưu giữ như một sự kết hợp của ba khái niệm theo thứ tự: ConceptID1 - RelationshipType – ConceptI D2
Điều này được thể hiện trong bảng bằng cách các lĩnh vực sau đây:
- RelationshipID: xác định duy nhất mỗi bộ ba khái niệm trong một mối quan hệ, và là chìa khóa chính của bảng này
- ConceptID1: Khái niệm đầu tiên trong mối quan hệ
- RelationshipType: Đây là kiểu quan hệ (hoặc mối quan hệ IS_A hoặc thuộc tính hoặc một mối quan hệ lịch sử hoặc bổ sung) tồn tại giữa hai khái niệm
- ConceptID2: khái niệm "mục tiêu" trong mối quan hệ : Hoặc là khái niệm cha trong một mối quan hệ IS_A; hoặc là khái niệm đại diện cho giá trị được giao trong một thuộc tính mối quan hệ
1.4.2 History (Bảng Lịch sử)
Nội dung của SNOMED CT phát triển với mỗi bản phát hành Các loại thay đổi được thực hiện bao gồm các khái niệm mới, mô tả mới, các mối quan hệ giữa các khái niệm mới, và phân nhóm mới, cũng như cập nhật các thành phần hoặc hủy bỏ các thành phần không còn sử dụng
Cơ chế lịch sử liên quan đến các bảng sau đây:[9]
Trang 3429
- Bảng các thành phần lịch sử : bao gồm bất kỳ thay đổi cho thành phần SNOMED CT (khái niệm, mô tả, phân nhóm), kể các các thành phần cần bổ sung mới hoặc thành phần cũ không sử dụng đều được ghi lại trong các hồ sơ lịch sử
- Bảng các thành phần tham khảo lịch sử : cung cấp một tài liệu tham khảo
từ một thành phần không hoạt động trong SNOMED CT đến một thành phần hiện hành Các loại tài liệu tham khảo cho thấy bản chất của mối quan hệ giữa hai thành phần Điều này là tương tự như các thông tin mà các mối quan hệ lịch
sử cung cấp cho những khái niệm không hoạt động
1.4.3 SNOMED CT Subsets (tập hợp con)
Một tập hợp con dùng để chỉ một tập hợp các khái niệm, mô tả, hoặc mối quan hệ phù hợp với ngôn ngữ , phương ngữ riêng của từng quốc gia hay phù hợp với người dùng, tổ chức, bối cảnh cụ thể
Tập hợp con sử dụng 2 bảng :
+ Bảng tập hợp:
- Mỗi hàng trong bảng này mô tả một bản phát hành của tập hợp con
- Bảng này bao gồm các phân nhóm SNOMED CT được đóng gói chung trong Bảng thành viên tập hợp con
+ Bảng thành viên tập hợp con:
- Mỗi hàng trong bảng này đại diện cho một thành viên của tập hợp con
- Các thành viên có thể là một khái niệm hoặc mô tả
- Một hoặc nhiều phân nhóm có thể được đóng gói cùng nhau trong bảng này
1.4.4 Cross Mappings (Bản đồ chéo)
Các Bản đồ chéo cho phép SNOMED CT tham khảo có hiệu quả các
thuật ngữ và phân loại khác nhau Mỗi bản đồ phù hợp với SNOMED CT khái niệm thông qua một chương trình mã hóa được gọi là cơ chế “target scheme”
(Chương trình mục tiêu)
Cấu trúc Bản đồ chéo cho phép:
Trang 3530
- Tự động lập bản đồ từ một khái niệm SNOMED CT đến một mã duy
nhất phù hợp thích hợp trong Chương trình mục tiêu
- Tự động lập bản đồ từ một khái niệm SNOMED CT đến một bộ tập hợp
đơn mã số trong Chương trình mục tiêu cùng đại diện của các Khái niệm tương
tự
- Trong tương lai có thể hướng dẫn lựa chọn một tập hợp các tùy chọn để
lập bản đồ từ một khái niệm SNOMED CT đến một Chương trình mục tiêu với
nhiều cách khác nhau
Bản đồ chéo bao gồm ba bảng:
- Bảng thiết lập bản đồ: Mỗi hàng trong bảng này đại diện cho một
Chương trình mục tiêu đối với việc tạo bản đồ chéo
- Bảng Bản đồ chéo: Mỗi hàng trong bảng này đại diện cho một trong những lựa chọn để lập bản đồ cho một SNOMED CT Concept với một mã số mục tiêu, hoặc thiết lập mã số trong Chương trình mục tiêu
- Bảng Mục tiêu Bản đồ chéo: Mỗi hàng trong bảng này đại diện cho một
mã số, hoặc thiết lập mã số trong Chương trình mục tiêu, nhằm cung cấp một bản
đồ cho một hoặc nhiều khái niệm SNOMED CT
Tổng kết chương
Trong chương này, em đã trình bày sơ lược về Snomed-CT, các mục đích
và lợi ích khi sử dụng Snomed-CT Đồng thời cũng nêu rõ các thành phần cơ bản, sự phân cấp và cấu trúc của Snomed-CT Qua bước đầu nhận thức và hiểu
về SNOMED-CT, em nhận thấy cấu trúc của SNOMED-CT rất phù hợp trong việc tạo ra các ứng dụng mang tính ngữ nghĩa, phù hợp với cấu trúc ontology trong web ngữ nghĩa Vì vậy chương tiếp theo, em xin trình bày về một số đánh giá về các ứng dụng của web ngữ nghĩa và áp dụng trong Snomed-CT
Trang 3631
CHƯƠNG 2 – MỘT SỐ ĐÁNH GIÁ VỀ CÁC ỨNG DỤNG CỦA WEB
NGỮ NGHĨA VÀ ÁP DỤNG TRONG SNOMED-CT
Mở đầu :
Nội dung Chương 2 trình bày sơ lược về web ngữ nghĩa Tiếp theo là trình bày về một số nội dung cho thấy sự cần thiết của web ngữ nghĩa Sau đó là phần trình bày một số ứng dụng phổ biến hiện nay của web ngữ nghĩa Các nghiên cứu biểu diễn SNOMED CT dựa vào kiến trúc web ngữ nghĩa sẽ được trình bày vào cuối chương này
2.1 Web ngư ̃ nghi ̃a là gì?
Theo định nghĩa của Tổ chức World Wide Web [18] thì web ngữ nghĩa đươ ̣c đi ̣nh nghĩa như sau: “Web ngữ nghĩa là mô ̣t cách nhìn về cách thức tổ chức dữ liê ̣u: đó là ý tưởng về dữ liê ̣u trên web được đi ̣nh nghĩa và liên kết mô ̣t cách
nó có thể sử dụng được bởi máy tính với mục đích không chỉ cho hiển thị mà còn tự đô ̣ng hóa, tích hợp và sử dụng lại dữ liệu qua các ứng dụng khác nhau”
Web ngữ nghĩa (hay Web có ngữ nghĩa) là thế hệ mở rộng của Web hiện tại được đưa ra bởi Tim Berners-Lee vào khoảng năm 1998 [1] Mục tiêu ban đầu của Web ngữ nghĩa là để hỗ trợ người dùng tìm kiếm thông tin trên mạng một cách nhanh chóng, chuẩn xác và thông minh hơn so với các công cụ tìm kiếm truyền thống
Kể từ đó đến nay, các kỹ thuật liên quan đến Web ngữ nghĩa không ngừng được hoàn thiện, các ứng dụng liên quan đến Web ngữ nghĩa cũng được mở rộng như: Phát triển các chuẩn công nghệ chung để biểu diễn thông tin và cho phép máy tính có thể hiểu được một số thông tin trên Web, hỗ trợ tìm kiếm thông minh hơn, hỗ trợ việc khám phá, tách chiết thông tin, tích hợp dữ liệu và tự động hóa một số công việc thay cho con người
Xét về mặt bản chất, Web ngữ nghĩa chỉ là một công cụ để con người cũng như máy tính sử dụng để biểu diễn thông tin, hay nói chính xác hơn thì Web ngữ nghĩa chỉ là một dạng dữ liệu trên Web Khác với các dạng thức dữ liệu được trình bày trong HTML, dữ liệu trong Web ngữ nghĩa được đánh dấu, phân lớp,
Trang 37Bản thân Web ngữ nghĩa chỉ là một dạng dữ liệu, vì vậy cần phải có các chương trình máy tính chuyên biệt để xử lý nó Đó chính là các công cụ cho phép thu hổi, tách chiết, tìm kiếm, biểu diễn thông tin… trong không gian của Web ngữ nghĩa Hiện nay, cùng với việc đề xuất ra các chuẩn ngôn ngữ biểu diễn Web ngữ nghĩa, các chương trình xử lý Web ngữ nghĩa cũng đang được gấp rút nghiên cứu và phát triển
Mô hình của Web ngữ nghĩa được cấu thành từ nhiều tầng khác nhau Hiện nay, đã có một số nhà nghiên cứu đưa ra những mô hình khác nhau về Web ngữ nghĩa dựa trên những cách nhìn nhận khác nhau Mô hình dưới đây lấy từ trang web của tổ chức W3C:
Hình 2.1 Kiến trúc phân tầng của web ngữ nghĩa được đưa ra năm 2001[19]
Trang 3833
Trong đó :
- URI (Uniform Resource Identifier) : là 1 chuỗi kí tự dùng để định danh
hoặc để đặt tên cho một tài nguyên URL( Uniform Resource Locator) - tham chiếu tới tài nguyên trên Internet (v.d : http://www.semanticfocus.com) là 1 ví dụ của URI
- Unicode : là bộ mã chuẩn quốc tế được thiết kế để dùng làm bộ mã duy
nhất cho tất cả các ngôn ngữ khác nhau trên thế giới
- XML (Extensible Makeup Language) : là ngôn ngữ đánh dấu với mục
đích chung do W3C đề nghị, để tạo ra các ngôn ngữ đánh dấu khác, có khả năng
mô tả nhiều loại dữ liệu khác nhau Mục đích chính của XML là đơn giản hóa việc chia sẻ dữ liệu giữa các hệ thống khác nhau, đặc biệt là các hệ thống được kết nối với Internet
- XML Schema : dùng mô tả 1 loại tài liệu XML
- RDF (Resource Description Framework) : dùng để mô tả khái niệm hoặc
mô hình hóa các thông tin trên mạng
- RDF Schema : cung cấp các phần tử để mô tả các ontology (hay các từ
vựng RDF), nhằm xây dựng các tài nguyên RDF Các tài nguyên này có thể được lấy ra bởi ngôn ngữ truy vấn SPARQL
- Ontology : dùng để định nghĩa các từ vựng và thiết lập cách sử dụng của
các từ và các điều kiện cho 1 từ vựng nhất định
- Logic : các suy luận logic được dùng để thiết lập độ chặt chẽ và sự chính
xác của các bộ dữ liệu và để suy luận ra sự kết quả mà không cần trình bày rõ ràng
- Proof : các bằng chứng theo vết hoặc giải thích các bước của suy luận
logic
- Trust : một cách thức cung cấp sự xác nhận của tính đồng nhất, tính rõ
ràng và tính đáng tin cậy của các dữ liệu, các dịch vụ và các tác tử
Trang 3934
2.2 Sự cần thiết của Web ngữ nghĩa
Ý tưởng trọng tâm của web ngữ nghĩa là tạo ra những "metadata": chuỗi các cơ sở dữ liệu nối tiếp nhau, có nhiệm vụ bổ sung cho thông tin trên web để các máy tính có thể hiểu và giải quyết những vấn đề ngữ nghĩa phức tạp
Đối với một người dùng, web là một nơi đầy hứng thú: lưu trữ một tập hợp tài nguyên gắn kết nhau và các nối kết liên quan Người dùng thường chỉ có thể nắm bắt được ý nghĩa của một tài liệu và quyết định mức độ phù hợp của nó chỉ khi họ xem toàn bộ tài liệu đó Tuy nhiên, một công cụ tìm kiếm không thể sẵn sàng biên dịch được thông tin rằng tài liệu đó có phù hợp hay không; vậy một quy trình tự động hoặc vận hành bằng máy cho phép dễ dàng truy cập tới một khối lượng tài nguyên thông tin quá lớn trên Web là rất cần thiết
Web ngữ nghĩa giờ đây đang được phát triển để giải quyết vấn đề này và mang đến triển vọng cho phép các lớp ý nghĩa rõ ràng được gán cho thông tin để giúp việc xử lý và tích hợp thông tin chuyển giao trên Web dễ dàng hơn đối với công cụ tìm kiếm tự động: “Web ngữ nghĩa không phải là một trang Web riêng
rẽ, mà là một sự mở rộng của trang web hiện hành, trong đó ý nghĩa được xác định rõ ràng, cho phép các máy tính và con người làm việc theo hình thức hợp tác” [5]
Web ngữ nghĩa đang xây dựng trên các công nghệ Web hiện có, như sử dụng khả năng trình bày dữ liệu của XML để định nghĩa các lược đồ gán thẻ tùy biến và tận dụng cách tiếp cận linh hoạt bởi tiêu chuẩn RDF để trình bày dữ liệu RDF sẽ cung cấp một khổ mẫu chung để trình bày siêu dữ liệu trên khắp mọi ứng dụng
Yếu tố kế tiếp đòi hỏi để thực hiện Web ngữ nghĩa đó là ngôn ngữ thể hiện các lớp ngữ nghĩa đối tượng của Web dùng để mô tả một cách hình thức ngữ nghĩa của các lớp trong những vùng thông tin quan tâm và ngữ nghĩa của đặc tính (hay thuộc tính) được sử dụng trong tài liệu Web Ngôn ngữ mô tả ngữ nghĩa đối tượng (dùng để phát hiện đối tượng) cung cấp sự tích hợp và vận hành liên kết của dữ liệu và cho phép phát triển các ứng dụng tìm kiếm trên nhiều tài nguyên
Trang 4035
thông tin đa dạng hay tích hợp thông tin từ chúng Thông qua việc sử dụng ngôn ngữ mô tả ngữ nghĩa, các ứng dụng trong tương lai sẽ “thông minh”: chúng sẽ làm việc chính xác hơn theo ý muốn của con người Người ta sẽ sử dụng ngôn ngữ mô tả lớp ngữ nghĩa (ontologies) để cải tiến các ứng dụng trên Web và đồng thời sẽ đem đến nhiều cách sử dụng Web mới
Một vài nỗ lực đầu tiên hướng tới phát triển ngôn ngữ mô tả các lớp ngữ nghĩa đang diễn ra trong môi trường cổng Web; ví dụ, dự án OntoWeb [4] của trường đại học Amsterdam (Free University of Amsterdam) Dự án OntoWeb phục vụ cả cộng động học thuật và cộng đồng phát triển sản phẩm công nghiệp quan tâm đến nghiên cứu ngôn ngữ mô tả lớp ngữ nghĩa đối tượng trên Web
2.3 Web ngư ̃ nghi ̃a và các ứng dụng
2.3.1 Semantic Search engine
Cải thiện tìm kiếm là một trong rất nhiều những lợi ích tiềm năng của web ngữ nghĩa Hầu hết các cơ chế tìm kiếm hiện nay trên World Wide Web thường
là một trong ba cách tiếp cận sau:
+ Đánh chỉ mục cho các từ khoá
Không có một cách tiếp cận nào trong số những cách tiếp cận ở trên (trừ cách tiếp cận cuối cùng nếu xét trong một miền ứng dụng cụ thể) cho phép suy