Sử dụng phần mềm DRAGON 6.0 để tính toán các tham số phân tử cho mỗi hợp chất trong dữ liệu. Các tham số phân tử này còn được gọi là đặc trưng của dữ liệu hay nhãn của dữ liệu.
DRAGON cho phép tính toán các mô tả phân tử đơn giản bằng cách đếm một số loại nguyên tử hoặc các mảnh cấu trúc trong phân tử, mô tả cấu trúc liên kết của phân tử còn được gọi là mô tả 2 chiều (2D), và có các mô tả phân tử có nguồn gốc từ hình học được gọi là mô tả hình học hoặc 3 chiều (3D) [2].
Tất cả các mô tả phân tử nên chứa thông tin hóa học, phải đáp ứng một số yêu cầu chung, đồng thời phải được lấy từ các quy trình đã được thiết lập, cho phép tính toán mô tả phân tử cho bất kỳ tập hợp phân tử nào.
Đối với việc sử dụng các mô tả phân tử bằng DRAGON, kiến thức về thống kê, hóa học là cần thiết bên cạnh kiến thức cụ thể về vấn đề. Phần mềm DRAGON đã được hình thành để cung cấp cho người dùng nhiều mô tả phân tử có nguồn gốc từ các biểu diễn phân tử khác nhau, cho phép người dùng chọn những mô tả phân tử phù hợp hơn cho nghiên cứu cụ thể của mình.
DRAGON cung cấp hơn 4000 mô tả phân tử được chia thành 29 khối logic (Bảng 2-2) để giúp người dùng quản lý rất nhiều mô tả.
Bảng 2-2. Khối mô tả phân tử của phần mềm DRAGON
Số thứ tự Khối mô tả
1 Mô tả các nguyên tố hợp thành (constitutional descriptors)
2 Mô tả cấu trúc liên kết (topological descriptors) 3 Đếm số lượng liên kết (walk and path counts) 4 Chỉ số kết nối (connectivity indices)
5 Chỉ số thông tin (information indices) 6 Tự động chỉnh sửa 2D (2D autocorrections) 7 Chỉ số cạnh kề (edge adjacency indices) 8 Giá trị gánh nặng riêng (Burden eigenvalues) 9 Chỉ số cấu trúc liên kết tích điện (topological
charge indices)
10 Chỉ số phụ thuộc vào giá trị riêng (eigenvalue- based indices)
11 Hồ sơ phân tử Randic (Randic molecular profiles) 12 Mô tả hình học (geometrical descriptors)
13 Mô tả RDF (RDF descriptors)
14 Mô tả 3D-MoRSE (3D-MoRSE descriptors) 15 Mô tả WHIM (WHIM descriptors)
16 Mô tả GETAWAY (GETAWAY descriptors)
17 Đếm số nhóm chức (functional group counts) 18 Mảnh trung tâm nguyên tử (atom-centred
fragments)
19 Mô tả tích điện (charge descriptors) 20 Tính chất phân tử (molecular properties) 21 Tự động chỉnh sửa 3D (3D autocorrelations) 22 Mô tả dựa vào ma trận 3D (3D matrix-based
23 Chỉ số ETA ()
24 Mô tả tương tự P-VSA ()
25 Chỉ số trạng thái electron dạng nguyên tử (Atom- type E-state indices)
26 CATS 2D
27 Nối đôi nguyên tử 2D (2D Atom Pairs) 28 Nối đôi nguyên tử 3D (3D Atom Pairs) 29 Chỉ số giống thuốc (Drug-like indices)