Bài giảng Ứng dụng tin học trong công nghệ sinh học ppsx

94 785 5
Bài giảng Ứng dụng tin học trong công nghệ sinh học ppsx

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

1 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHỆ TP.HCM KHOA MÔI TRƯỜNG & CÔNG NGHỆ SINH HỌC          BÀI GIẢNG: ỨNG DỤNG TIN HỌC TRONG CÔNG NGHỆ SINH HỌC GVGD: BÙI VĂN THẾ VINH Tài liệu lưu hành nội bộ TP.HCM, Tháng 01/2008 2 I. GIỚI THIỆU CHUNG VỀ STATGRAPHICS CENTURION (HOẶC STATGRAPHICS PLUS) 1. Hướng dẫn cài đặt Statgraphics Centurion XVI và đăng ký bản quyền Chạy file “setup.exe” trong đĩa chương trình Một loạt hộp thoại hiện ra, nhấp chọn “Next” đến khi xuất hiện hộp thoại: Nhấp chọn “I accept the terms in the license agreement”  Chọn “Next”  Điền thông tin vào hộp thoại: Chạy file “KeyGen.exe” trong đĩa chương trình xuất hiện hộp thoại: 3 Nhấp chọn “Generate Serial” sẽ xuất hiện một dãy ký tự trong box “Serial Number”  Nhấp chọn “(1) Copy”  Paste “Serial Number” vào hộp thoại: Tiếp tục chọn “Next” liên tục và chọn “Install” để bắt đầu cài đặt, chờ đợi cài đặt xong và chọn “Finish” để hoàn tất. Khởi động Statgraphics, xuất hiện hộp thoại: Click bỏ chọn mục “Show the StatWizard at Startup” ở góc dưới bên trái rồi Chọn “Cancel”  “Yes” để bỏ hộp thoại trở về màn hình chính Chọn menu “Help”  Chọn “License Manager” 4 Copy “Product key” và Paste vào hộp thoại của keygen: Nhấp chọn “Generate Activation Code”  Copy “Activation code” và paste vào hộp thoại của License Manager: Nhấp chọn “UPGRADE” để hoàn tất đăng ký bản quyền. * Đối với Statgraphics Plus, chỉ cần chạy file “SGWIN.EXE”. 5 2. Thiết lập các thông số hệ thống ban đầu Phần mềm Statgraphics Centurion có 2 hệ thống Menu có thể được sử dụng là “Classic menu” với các heading lần lượt là File, Edit, Plot, Describe, Compare,… và “Six sigma menu” với các heading lần lượt là File, Edit, Define, Measure, Analyze,… Để chuyển đổi giữa 2 hệ thống Menu chọn Edit  Preferences xuất hiện hộp thoại: Chọn tab “General”, trong box “System Options” click chọn hoặc bỏ chọn mục “Use Six Sigma Menu”. Thông thường, để dễ sử dụng nên chọn hệ thống “Classic menu” (tương tự như hệ thống menu được sử dụng trong Statgraphics Plus). 3. Nhập dữ liệu và quản lý dữ liệu: Dữ liệu phải được nhập vào “DataBook”, một “DataBook” chuNn gồm 10 “datasheet” được ký hiệu bằng các chữ cái từ A đến J. Trong mỗi “datasheet” có các cột và hàng: mỗi hàng chứa thông tin về một mẫu, một trường hợp hay một quan sát đơn lẻ còn mỗi cột đại diện cho một biến. Có 2 cách để nhập dữ liệu vào “DataBook”: - Cách 1: Nhập trực tiếp vào “DataBook” - Cách 2: Nhập dữ liệu vào một phần mềm khác như Excel, sau đó copy hay load vào phần mềm Statgraphics. Trước khi nhập dữ liệu vào “DataBook”, cần phải định nghĩa biến trong mỗi cột bằng cách click phải chuột vào cột muốn định nghĩa biến  Chọn “Modify column” xuất hiện hộp thoại: 6 Nhập tên biến vào mục “Name”, nhập phần chú thích vào mục “Comment” và lựa chọn dạng dữ liệu trong mục “Type” (3 dạng dữ liệu thường gặp là: dạng số “Numeric”, dạng ký tự “Character” và dạng công thức tính toán “Formula”). Sau khi định nghĩa biến đầy đủ, click chọn OK để kết thúc và bắt đầu nhập dữ liệu vào cột 1, sau đó tiếp tục lần lượt định nghĩa biến và nhập dữ liệu vào các cột tiếp theo. Ví dụ: nhập bảng số liệu: Sau khi nhập vào “DataBook” cho kết quả sau: 7 Để lưu bảng số liệu: chọn File  Save  Save Data File (file dữ liệu được lưu dưới dạng .sf6 và chỉ được đọc bằng phần mềm Statgraphics). Để mở một file dữ liệu đã lưu: chọn File  Open  Open Data Source. Một khi dữ liệu đã được nhập vào Datasheet, có một số thao tác quan trọng có thể được thực hiện như: - Cut, Copy, Paste, Insert và Delete dữ liệu: khi tiến hành các lệnh trên cần lưu ý rằng mỗi cột có một kiểu định dạng khác nhau, nếu copy cột có định dạng Character và paste và cột có định dạng Numeric thì sẽ không thực hiện được  Cần phải định dạng lại cột dữ liệu. - Tạo thêm một biến mới từ các cột dữ liệu có sẵn: Click phải chuột vào một cột mới, chọn “Modify Column”  Chọn định dạng “Formula” và nhập công thức tính toán giữa các cột dữ liệu có sẵn. - Sort dữ liệu: Chọn cột dữ liệu được xác định để làm cơ sở sắp xếp  Menu Edit  Sort data. Khi một phép phân tích được thực hiện, chỉ có một vài bảng kết quả hay đồ thị được trình bày. Để hiển thị thêm những output khác, cần phải chọn button thích hợp trên thanh công cụ “Analysis Toolbar” xuất hiện ngay trên tiêu đề của phép phân tích. Các button trên thanh công cụ phân tích rất quan trọng và được tổng kết trong bảng sau: Cen Plus Tên Chức năng Input dialog Hiển thị một hộp thoại nhập dữ liệu để thay đổi cột dữ liệu Tables Hiển thị danh sách các bảng khác có thể được tạo lập Graphs Hiển thị danh sách các dạng đồ thị khác có thể được tạo lập Save results Cho phép các phân tích đã tính toán được lưu vào các cột của datasheet 8 Analysis options Chọn những options khác nhau áp dụng cho phép phân tích đang tiến hành Pane options Chọn những options khác nhau áp dụng cho bảng biểu hay đồ thị đang sử dụng Graphics options Cho phép thay đổi tiêu đề, thang trục và các đặc tính khác trên đồ thị đang sử dụng 4. Xuất kết quả: Khi một phép phân tích được tiến hành, các kết quả được xuất ra theo nhiều cách khác nhau: Copy output sang một ứng dụng khác Click chọn một bảng biểu hay đồ thị và chọn menu Edit  Copy sau đó khởi động một ứng dụng khác (Ví dụ như MS Word) để paste vào. Lưu kết quả phân tích vào một report Click phải chuột và chọn “Copy Analysis to StatReporter”, sau đó vào File  Save  Save StatReporter để lưu thành file .rtf (có thể import vào các ứng dụng khác như MS Word). Lưu đồ thị dưới dạng file ảnh Phóng cực đại cửa sổ đồ thị muốn lưu, click phải chuột và chọn Save Graph. 5. Lưu công việc đang tiến hành: Phép phân tích đang tiến hành có thể được lưu tại bất kỳ thời điểm nào bằng cách chọn menu File  Save StatFolio (dạng file .sgp). Sau khi mở file đã lưu thì những dữ liệu và phép phân tích đang tiến hành sẽ được tự động khôi phục (Lưu ý: file data và file StatFolio phải được lưu trữ dưới nhiều file khác nhau, nếu muốn chuyển file StatFolio từ máy này sang máy khác để tiếp tục phân tích thì phải chuyển kèm file data). 9 II. TIẾN HÀNH MỘT PHÉP PHÂN TÍCH THỐNG KÊ Có hơn 150 phép phân tích thống kê trên Menu chính của chương trình Statgraphics Centurion tuy nhiên các phép phân tích khác nhau đều có cùng một cách tiến hành: 1. Khi một phép phân tích được lựa chọn từ menu chính, một hộp hội thoại nhập dữ liệu (data input dialog box) được hiển thị, hộp thoại này cho phép lựa chọn biến cần phân tích. 2. Dữ liệu sau đó được đọc và phân tích, một cửa sổ phân tích (analysis window) mới được tạo ra với các bảng biểu và đồ thị kết quả mặc định. 3. Các kết quả xuất hiện lần đầu tiên được tính toán dựa trên những thông số chuNn, các thông số mặc định này có thể được thay đổi bằng cách chọn phím “Analysis Options” trên thanh công cụ analysis; các thông số mới được thay đổi sẽ làm thay đổi kết quả trên các bảng biểu và đồ thị. 4. Các bảng kết quả và đồ thị mới có thể được thêm vào hoặc bỏ bớt bằng cách chọn phím “Tables” hay “Graphs” trên thanh công cụ phân tích. 5. Các bảng kết quả và đồ thị có thể được thay đổi bằng cách phóng đại cửa sổ tương ứng và chọn “Pane options” trên thanh công cụ phân tích. 6. Đối với các đồ thị, có thể thay đổi phần tiêu đề, trục số, điểm số, font chữ,… bằng cách phóng đại cửa sổ tương ứng và chọn “Graphics options” trên thanh công cụ phân tích. 7. Các bảng kết quả và đồ thị có thể được in, chuyển thành file HTML hay copy sang các chương trình ứng dụng khác như MS Word, Power Point,… 8. Các kết quả dạng số có thể được lưu thành các cột kết quả trong một data sheet bất kỳ bằng cách chọn “Save results” trên thanh công cụ phân tích. 9. Toàn bộ phép phân tích có thể được lưu lại thành file StatFolio để tiện sử dụng những lần sau. 10 1. Hộp thoại nhập dữ liệu: Hộp thoại nhập dữ liệu thường gồm 2 phần: phần bên trái liệt kê tất cả các cột dữ liệu trong datasheet, phần bên phải là nơi nhập dữ liệu cần phân tích. Muốn phân tích cột dữ liệu nào thì lựa chọn ở phần bên trái rồi click vào biểu tượng để chuyển dữ liệu sang vùng phân tích. Có thể chọn lọc lại dữ liệu cần phân tích bằng các toán tử như FIRST(k), LAST(k), ROWS(start,end), RANDOM(k), >, <, =, & (and), / (or),… trong mục “Select”. Khi điều kiện chọn lọc không phải là dạng số thì giá trị điều kiện phải được đặt trong dấu ngoặc kép. 2. Cửa sổ phân tích: Khi phép phân tích được tiến hành, một cửa sổ phân tích được hiển thị: Đối với phần mềm Statgraphics Centurion, kết quả phân tích sẽ được hiển thị gồm 4 pane (cửa sổ): 2 pane bên trái là output dạng bảng và 2 pane bên phải là output dạng đồ thị. Đối với phần mềm Statgraphics Plus, kết quả được hiển thị chỉ gồm 2 pane: pane bên trái là output dạng bảng và pane bên phải là output dạng đồ thị. Nếu click đôi vào một pane bất kỳ thì pane sẽ được phóng lớn ở kích thước cực đại để dễ dàng quan sát và đọc kết quả, click đôi tiếp tục vào pane để trở về màn hình ban đầu. [...]... hiện như sau: Trong phần “Input”, có 2 cách lựa chọn nhập dữ liệu: “Two Data Columns” được sử dụng khi dữ liệu 2 mẫu được trình bày trên 2 cột khác nhau; “Data and Code Columns” được sử dụng khi 2 mẫu khác nhau được mã hóa trong cùng một cột 21 Trong ví dụ trên, dữ liệu thân nhiệt được trình bày chung trong một cột “Temperature”, thân nhiệt riêng của Nam và Nữ được mã hóa và trình bày trong cột “Gender”... MỘT MẪU Một vấn đề thường gặp trong thống kê là phân tích một mẫu với n giá trị quan sát từ một tổng thể Ví dụ: đo thân nhiệt của n=130 người được kết quả sau: Dữ liệu thân nhiệt trong ví dụ trên được lưu trong file bodytemp.sf3 trong thư mục Data 1 Chọn menu File Open Open Data Source 2 Trong hộp thoại “Data Source” chọn “STATGRAPHICS Data File” 3 Chọn file bodytemp.sf3 trong thư mục Data (C:\Program... người có thể suy ra thân nhiệt trung bình nằm trong khoảng [98,11-98,35] độ F Kết luận đó có độ chính xác là 95% (mức ý nghĩa α=0,05) Có thể thay đổi mức ý nghĩa cho phép ước lượng bằng cách chọn “Pane Options” và thay đổi thông số trong mục “Confidence Level” 20 IV SO SÁNH 2 MẪU Trong ví dụ trước, thân nhiệt được đo từ 130 người, trong đó có 65 nam và 65 nữ Trong phần này, thân nhiệt của nam và nữ sẽ... Cặp so sánh nào có giá trị trong cột “Difference” lớn hơn giá trị trong cột “+/- Limits” sẽ được tô đỏ và đánh dấu * tương ứng trong cột “Sig.” Điều này có nghĩa là cặp nghiệm thức so sánh có sự khác biệt về mặt thống kê ở mức ý nghĩa 5% Bảng kết quả bên trên sắp xếp các mẫu theo thứ tự tăng dần của các giá trị trung bình Và mức độ khác biệt giữa các nghiệm thức được trình bày trong cột “Homogeneous groups”:... hiện một phản ứng tổng hợp Các hiệu suất của phản ứng (%) được trình bày trong bảng sau: Thời gian (ph) X1 15 30 60 15 30 60 15 Nhiệt độ (oC) X2 105 105 105 120 120 120 135 Hiệu suất (%) Y 1.87 2.02 3.28 3.05 4.07 5.54 5.03 29 30 135 6.45 60 135 7.26 Hãy cho biết yếu tố nhiệt độ và/hoặc thời gian có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp? Nếu có thì ở nhiệt độ 1150C trong 50 phút... hiệu suất phản ứng + Phương trình hồi quy hiệu suất-thời gian: Y=-11.14 + 0.128X2 31 ta=3.417>t0.05=2.365 (P2=0.011 Hệ số a có nghĩa (với độ tin cậy thống kê 95%) tb=4.757>t0.05=2.365 (P2=0.021 Hệ số b có nghĩa (với độ tin cậy thống kê 95%) F=22.63>F0.05=5.590 Vậy phương trình hồi quy có ý nghĩa thống kê Yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất phản ứng Trong mục này ta... bảng sau: Thân nhiệt được trình bày trong cột bên trái với đơn vị đo là độ F Phép phân tích một biến được tiến hành bằng cách: 1 chọn Menu Describe Numeric Data One-Variable Analysis 2 Trong hộp thoại nhập dữ liệu, chọn cột dữ liệu cần phân tích 11 3 Kết quả phân tích sẽ được trình bày trong 4 cửa sổ: Cửa sổ trên cùng bên trái cho biết dung lượng mẫu n=130 giá trị nằm trong khoảng từ 96,3 đến 100,8 độ... quan đến sự phân tán của số liệu Đối với một phân bố chuNn, khoảng 68% số liệu nằm trong khoảng X ± SD, 95% số liệu nằm trong khoảng X ± 2SD và 99,73% số liệu nằm trong khoảng X ± 3SD Hai giá trị trung bình mẫu và độ lệch chuNn chỉ có giá trị đại diện cho mẫu khi mẫu có phân bố chuNn Hai kết quả thống kê khác có thể được sử dụng để kiểm tra lại giả định mẫu có phân bố chuNn hay không là độ lệch (Standardized... trung bình: - Giả thiết H0: µ1 = µ2 - Đối thiết H1: µ1 ≠ µ2 Để tiến hành so sánh 2 giá trị trung bình, chọn phím “Tables” từ thanh công cụ phân tích và click chọn “Comparision of Means”: Giá trị P-value cũng được sử dụng trong t-test để so sánh 2 giá trị trung bình tương tự như trong so sánh phương sai Vì P-value = 0,0408 ( . ĐÀO TẠO TRƯỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHỆ TP.HCM KHOA MÔI TRƯỜNG & CÔNG NGHỆ SINH HỌC          BÀI GIẢNG: ỨNG DỤNG TIN HỌC TRONG CÔNG NGHỆ SINH HỌC GVGD: BÙI. “General”, trong box “System Options” click chọn hoặc bỏ chọn mục “Use Six Sigma Menu”. Thông thường, để dễ sử dụng nên chọn hệ thống “Classic menu” (tương tự như hệ thống menu được sử dụng trong. cửa sổ tương ứng và chọn “Graphics options” trên thanh công cụ phân tích. 7. Các bảng kết quả và đồ thị có thể được in, chuyển thành file HTML hay copy sang các chương trình ứng dụng khác như

Ngày đăng: 07/07/2014, 05:20

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan