1. Trang chủ
  2. » Luận Văn - Báo Cáo

(Luận văn) nghiên cứu phương pháp dự đoán lỗi phần mềm liên dự án

76 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 76
Dung lượng 2,11 MB

Nội dung

1 HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - lu an n va ĐỖ ĐỨC TRUNG p ie gh tn to d oa nl w LUẬN VĂN THẠC SỸ KĨ THUẬT ll u nf va an lu oi m z at nh z @ m co l gm HÀ NỘI – 2016 an Lu n va ac th si HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - lu an va n ĐỖ ĐỨC TRUNG p ie gh tn to NGHIÊN CỨU PHƯƠNG PHÁP DỰ ĐOÁN LỖI PHẦN MỀM LIÊN DỰ ÁN d oa nl w CHUYÊN NGÀNH : KHOA HỌC MÁY TÍNH MÃ SỐ: 60.48.01 u nf va an lu LUẬN VĂN THẠC SĨ KỸ THUẬT NGƯỜI HƯỚNG DẪN KHOA HỌC ll m oi PGS.TS TỪ MINH PHƯƠNG z at nh z m co l gm @ HÀ NỘI – 2016 an Lu n va ac th si LỜI CAM ĐOAN Tôi cam đoan cơng trình nghiên cứu riêng tơi Các số liệu, kết nêu luận văn trung thực chưa cơng bố cơng trình khác lu TÁC GIẢ LUẬN VĂN an n va to p ie gh tn ĐỖ ĐỨC TRUNG d oa nl w ll u nf va an lu oi m z at nh z m co l gm @ an Lu n va ac th si LỜI CẢM ƠN Trong suốt trình học tập thực luận văn, nhân nhiều quan tâm giúp đỡ, hướng dẫn tận tình thầy với lời động viên khuyến khích từ phía gia đình, bạn bè Tơi xin bày tỏ lời cảm ơn chân thành đến tất người Tơi xin tỏ lịng biết ơn sâu sắc đến thầy Từ Minh Phương tận tình hướng dẫn, định hướng cho tơi q trình thực đề tài Thầy cho lời khuyên, dẫn, truyền đạt cho kiến thức, kinh nghiệm việc thực lu luận văn an n va Tôi xin cảm ơn thầy cô khoa Quốc tế đào tạo sau đại học, học tn to viện Cơng nghệ Bưu Viễn thơng tận tình dạy dỗ cho tơi kiến gh thức bổ ích suốt q trình hai năm học tập, giúp tơi nâng cao chuyên p ie môn, làm tảng để tơi hồn thành luận văn, tự tin phát triển công nl w việc sau d oa Cuối cùng, muốn gửi lời cảm ơn tới gia đình bạn bè, người thân an lu bên, cảm thông, hỗ trợ, giúp đỡ tơi khó khăn cơng việc, sống trình học tập ll u nf va m oi Hà Nội tháng 11 năm 2016 z at nh Đỗ Đức Trung z m co l gm @ an Lu n va ac th si MỤC LỤC LỜI CAM ĐOAN LỜI CẢM ƠN MỤC LỤC DANH MỤC BẢNG BIỂU DANH MỤC HÌNH VẼ VÀ SƠ ĐỒ lu an MỞ ĐẦU n va p ie gh tn to Chương 1: Tổng quan về dự đoán lỗi liên dự án trong các phần mềm 11 1.1 Bài toán dự đoán lỗi phần mềm 14 1.2 Các cách tiếp cận trong bài toán dự đoán lỗi 15 1.2.1 Tiếp cận dựa trên change log 16 1.2.2 Tiếp cận kiểu single-version 17 1.2.3 Các cách tiếp cận khác 18 1.3 Tổng quan về dự đoán lỗi phần mềm sử dụng học máy 18 1.4 Giới thiệu vấn đề dự đoán lỗi liên dự án 20 1.5 Các phương pháp gần đây đã được nghiên cứu để giải quyết vấn đề 21 1.6 Kết luận chương 22 d oa nl w an lu ll u nf va Chương 2: Phương pháp CCA và áp dụng giải quyết vấn đề dự đoán lỗi liên dự án 24 2.1 Các vấn đề phát sinh khi thực hiện dự đoán lỗi liên dự án 24 2.2 Trích xuất các đặc trưng từ mã nguồn dự án 25 2.3 Giới thiệu phương pháp CCA 29 2.3.1 Tổng quan về phân tích tương quan chính tắc (Canonical Correlation Analysis) 29 oi m z at nh 2.3.2 Ứng dụng của phân tích tương quan chính tắc trong việc giải quyết các vấn đề thực tế 38 z 2.4 Xây dựng các bộ dữ liệu chung cho dự án nguồn và đích 41 @ 2.5 Áp dụng phương pháp CCA cho dự đoán lỗi liên dự án 44 gm 2.5.1 Áp dụng phương pháp CCA 44 m co l 2.5.2 Tổng quan về phân loại knn với khoảng cách Euclidean 47 an Lu n va ac th si 2.6 Kết luận chương 52 Chương 3: Thử nghiệm và đánh giá 53 3.1 Thu thập dữ liệu từ các dự án khác nhau 53 3.2 Các phép đánh giá 57 3.3 So sánh với phương pháp TCA 64 3.3.1 Tổng quan về phương pháp TCA 65 3.3.2 So sánh TCA với CCA 65 3.4 Độ phức tạp và thời gian thực hiện 67 3.5 Kết luận chương 68 KẾT LUẬN 69 DANH MỤC TÀI LIỆU THAM KHẢO 70 lu an n va p ie gh tn to d oa nl w ll u nf va an lu oi m z at nh z m co l gm @ an Lu n va ac th si DANH MỤC BẢNG BIỂU Bảng Bảng tổng quan liệu dự án sử dụng kiểm thử 54 Bảng Số đặc trưng tương đương công ti 56 Bảng Kết chạy cho trường hợp 1-1 62 Bảng Kết chạy cho trường hợp 1-n 63 Bảng So sánh phương pháp CCA TCA 66 Bảng So sánh kết thực nghiệm phương pháp CCA TCA 67 lu an n va p ie gh tn to d oa nl w ll u nf va an lu oi m z at nh z m co l gm @ an Lu n va ac th si DANH MỤC HÌNH VẼ VÀ SƠ ĐỒ Hình Tam giác dự án 11 Hình Biểu đồ biểu thị quan hệ tỉ lệ thành công quy mơ dự án [1] 12 Hình Mơ hình dự đốn lỗi [28] 15 Hình Tiếp cận dựa change log [29] 17 Hình Các bước xây dựng mơ hình dự đốn lỗi sử dụng học máy 20 Hình Ví dụ tìm hình ảnh [30] 39 Hình Ví dụ computer vision [30] 40 lu Hình Ví dụ phân đoạn hình ảnh [30] 40 Hình Xây dựng cách biểu diễn thống 44 an n va p ie gh tn to Hình 10 Áp dụng CCA tạo khơng gian chung cho liệu nguồn đích [31] 47 Hình 11 Ví dụ tốn k-nn [32] 49 Hình 12 Minh họa cho toán phân loại k-nn [32] 50 Hình 13.Minh họa với giá trị k [32] 51 Hình 14 Minh họa kết chạy thực nghiệm 61 d oa nl w ll u nf va an lu oi m z at nh z m co l gm @ an Lu n va ac th si MỞ ĐẦU Xây dựng dự án phần mềm thành công mối quan tâm hàng đầu tổ chức doanh nghiệp, doanh nghiệp công nghiệp công nghệ thơng tin Đặc biệt quan trọng q trình quản lý, kiểm soát tiến độ đảm bảo chất lượng dự án Lỗi phần phát sinh tất yếu phát triển vận hành phần lu mềm hệ thống Phần mềm hệ thống phức tạp xuất an nhiều lỗi Lỗi tác động tới phần mềm hệ thống xây dựng vận va n hành theo nhiều cách khác nhau, nhẹ hệ thống hoạt động bình thường lỗi tn to tồn tại, nặng hệ thống ngừng hoạt động xuất lỗi Do để giảm thiểu ie gh hậu lỗi gây tiết kiệm chi phí người ta cố gắng phát p lỗi giai đoạn phát triển phần mềm phát sớm tốt, từ xuất phương pháp dự đoán lỗi phần mềm nl w d oa Một phương pháp dự đoán lỗi phần mềm quan tâm nhiều an lu phương pháp dự đoán lỗi sử dụng học máy có giám sát sở mã nguồn va liệu có trình phát triển phần mềm Cụ thể, file mã nguồn u nf biểu diễn đặc trưng, sau huấn luyện mơ hình phân lớp ll (classification) hồi quy (regrestion) liệu huấn luyện file m oi kiểm thử lỗi dùng mơ hình để dự đoán lỗi cho file chưa kiểm z at nh thử z Việc xây dựng liệu huấn luyện dễ dàng liệu xây @ gm dựng dựa mã nguồn xác định lỗi dự án thực trước có tính m co l đồng với mã nguồn dự án đích.Vấn đề đặt mã nguồn đồng với mã an Lu n va ac th si nguồn dự án đích có số lượng khơng nhiều dẫn tới việc mơ hình xây dựng nên hoạt động thiếu xác Chính vậy, việc đưa phương pháp cho phép xây dựng tập liệu tận dụng liệu sẵn có dự án với mã nguồn không đồng với mã nguồn dự án đích quan trọng Một cách tiếp cận với vấn đề phương pháp CCA (canonical correlation analysis) Đề tài em tập trung vào tìm hiểu cách tiếp cận nhằm nâng cao khả dự đoán lỗi phần mềm Hiện nay, có số cách tiếp cận cho phép trích xuất kiến thức chung từ dự án chuyển sang dự án khác kiến thức dùng để lu huấn luyện cho mơ hình dự đốn lỗi như: TCA (Transfer Component Analyst), an TCA+, … Do tốn có ý nghĩa thực tiễn cao cá nhân, tổ chức va n thực dự án phát triển phần mềm, hệ thống nên phương pháp tn to dùng liệu dự án để huấn luyện cho dự án khác tiếp tục nghiên ie gh cứu Trong luận văn em nghiên cứu phương pháp CCA so sánh với phương pháp p TCA đề cập nl w Phương pháp nghiên cứu luận văn phương pháp học d oa chuyển đổi với mục đích làm cho liệu cơng ti đích giống với công ti nguồn CCA an lu phương pháp hiệu tối đa hóa tương quan liệu nguồn đích Đối tượng: Phương pháp tiếp cận CCA dự đoán lỗi, mã nguồn ll - u nf va giúp nâng cao xác suất dự đoán lỗi dự án oi Phạm vi nghiên cứu: Dự đoán lỗi mã nguồn dự án sử dụng liệu dự án khác z at nh - m dự án z gm Tìm hiểu vấn đề dự đốn lỗi dự án liên dự án, khó m co l - @ Phương pháp nghiên cứu: an Lu n va ac th si 60 - Tiến hành xây dựng cách biểu diễn thống cho dự án nguồn đích - Áp dụng phân tích tương quan tắc cách biểu diễn thống xây dựng để lấy vector chuyển đổi, từ xây dựng nên ma trận chuyển đổi - Áp dụng phân loại nn để xác định nhãn cho module dự án đích, so sánh với nhãn gốc để tính thông số: recall, false positive, F-measure Bên minh họa kết chạy cho trường hợp Apache -> ar3: lu an n va p ie gh tn to d oa nl w ll u nf va an lu oi m z at nh z m co l gm @ an Lu n va ac th si 61 lu an n va p ie gh tn to w Hình 14 Minh họa kết chạy thực nghiệm d oa nl Dưới chi tiết thực nghiệm kết thu được: an lu Bảng bên cho thấy giá trị Recall, F-Measure False positive liệu nguồn đích ll u nf va trường hợp dự đoán lỗi liên dự án kiểu - với 28 số liệu thông thường tồn oi m z at nh SOURCE=>TA RECALL MEASURE POSITIVE 0.48 0.25 m co l gm 0.88 @ Apache -> ar3 FALSE z RGET F- an Lu n va ac th si 62 ar3 -> Apache 0.40 0.53 0.10 CM1 -> 0.54 0.68 0.06 -> 0.76 0.42 0.26 AR3 -> CM1 0.33 0.33 0.10 CM1 -> AR3 0.38 0.43 0.05 EQ -> AR3 0.25 0.40 0.10 AR3 -> EQ 0.58 0.53 0.41 Apache Apache CM1 lu an n va p ie gh tn to w Bảng Kết chạy cho trường hợp 1-1 d - nhiều oa nl Bảng thực nghiệm dự đoán lỗi liên dự án trường hợp an lu RECALL va SOURCE=>TARG FALSE MEASURE POSITIVE ll u nf ET F- 0.36 0.08 0.62 0.02 m co l gm @ > AR3 0.50 z {CM1,PC1,MW1} - z at nh {CM1,PC1,MW1} 0.38 oi -> m AR3 an Lu n va ac th si 63 AR4 -> 0.52 0.31 0.19 {CM1,PC1,MW1} - 0.35 0.39 0.10 AR5 -> 0.60 0.30 0.26 {CM1,PC1,MW1} - 0.50 0.67 0.01 {AR3, AR4, AR5} -> 0.38 0.36 0.10 CM1 -> {AR3, AR4, 0.42 0.53 0.04 0.33 0.38 0.05 0.33 0.42 0.05 0.46 0.39 0.08 0.48 0.01 {CM1,PC1,MW1} > AR4 {CM1,PC1,MW1} lu > AR5 an n va AR5} p ie gh tn to CM1 w oa nl {AR3, AR4, AR5} -> d MW1 {AR3, ll u nf va AR4, AR5} -> an lu MW1 oi m {AR3, AR4, AR5} -> PC1 -> {AR3, AR4, z at nh PC1 0.33 z gm @ AR5} m co l Bảng Kết chạy cho trường hợp 1-n an Lu n va ac th si 64 Từ hai bảng trên, thấy lượng liệu đầu vào tăng F-Measure tăng theo, ví dụ lấy từ là: ar3 => cm1: 0.33 xuống ar3 => {cm1, pc1, mw1} tăng lên 0.36 cm1 => ar3: 0.43 xuống {cm1, pc1, mw1} => ar3 tăng lên 0.62 Đi kèm với việc độ xác dự đốn tăng nhẹ gộp nhiều dự lu liệu dự án công ti làm thành liệu để huấn luyện an n va 3.3 So sánh với phương pháp TCA tn to Hầu hết kỹ thuật học tập chuyển đổi xây dựng nhằm mục đích ie gh để giải nén kiến thức chung từ miền chuyển đến miền khác, p kiến thức chuyển đổi sử dụng để huấn luyện mơ hình dự đoán Phương pháp w CCA đề xuất dựa sở trên, bên cạnh có phương pháp khác oa nl hướng tới mục tiêu học chuyển đổi, TCA [13] Phương pháp TCA d phương pháp đề xuất cho kết tốt toán dự đoán lỗi chéo lu u nf va luận văn an miền Chính vậy, TCA lựa chọn để so sánh với phương pháp CCA trình bày ll TCA phương pháp nhằm tìm khơng gian đặc trưng tiềm ẩn cho m oi liệu dự án nguồn đích cách giảm thiểu khoảng cách liệu z at nh bảo tồn thuộc tính liệu gốc Khi có khơng gian tiềm ẩn này, z chiếu liệu dự án nguồn đích vào Bằng cách này, TCA cố gắng gm @ khám phá tính cho liệu dự án nguồn đích, để biến đổi liệu m co l dựa vào biểu diễn tính Kết là, khác biệt phân phối liệu an Lu n va ac th si 65 giảm Đây khía cạnh giống TCA CCA 3.3.1 Tổng quan phương pháp TCA Về mặt toán học, TCA cố gắng học biến đổi φ để chuyển đổi liệu gốc nguồn đích đến khơng gian tiềm ẩn nơi khác biệt miền Dist(φ (2" ), φ (2$ )) nhỏ phương sai liệu sau chuyển đổi Var ( { φ (2" ), φ (2$ )}) lớn Giả sử chuyển đổi φ định nghĩa: ú ^ ú { chuyển đổi vector tính ban đầu vào khơng gian d-chiều Khi đó, mục tiêu TCA mức cao viết sau: lu an 1\ù [ûü Dist(φ (2" ), φ (2$ )) + λ R(φ) (3.2) φ n va φ học cách giảm thiểu khác biệt domain thỏa p ie gh tn to với ràng buộc φ (2" ) φ (2$ ) mãn số ràng buộc để bảo toàn liệu sau chuyển đổi, R (φ) thuật ngữ nl w quy φ để tránh overfitting, λ ≥ tham số cân để kiểm soát d oa ảnh hưởng R (φ) hàm mục tiêu lu an Nói tóm lại mục tiêu TCA là: xây dựng nên không gian chung cho u nf va liệu dự án nguồn đích, làm giảm khác biệt phân bố liệu hai dự án ll 3.3.2 So sánh TCA với CCA oi m z at nh Trong phần trước luận văn trình bày nét phương pháp TCA, phần so sánh TCA với cách tiếp cận luận văn CCA TCA m co l gm @ CCA z lý thuyết thực nghiệm an Lu n va ac th si 66 Mụ Làm cho phân bố liệu nguồn đích giống có c đích thể Ý Chiếu liệu nguồn đích vào khơng gian khác thấp chiều tưởng để giảm thiểu khác biệt Th Áp dụng CCA để học ực thi Giảm khoảng cách cặp chuyển đổi tương ứng với phân bố liệu bảo hai tập biến cho biến sau tồn thuộc tính gốc chuyển đổi có độ tương quan lu an lớn va n Inp Các dự án đầu vào khác metric, điều xây dựng tn to ut Dữ liệu nguồn đích phải ie gh có nghĩa metric nguồn metric p đích khác hồn toàn, w giống hoàn toàn, oa nl tồn vài metric tương đương d Các cặp vector chuyển đổi Ma trận chuyển đổi giúp va cho liệu nguồn đích: å" , å$ chuyển vector m chiều sang d ll u nf put an lu Out oi m chiều (d < m) z at nh z Bảng So sánh phương pháp CCA TCA @ gm Nói tóm lại, TCA CCA có chung mục đích ý tưởng, khác mặt m co l thực thi, đầu vào đầu ra, qua bảng so sánh trên, thấy CCA có an Lu n va ac th si 67 điểm TCA việc đồng liệu nguồn đích khác metric sử dụng Tiếp theo số so sánh thực nghiệm, thông số bảng bên độ đo F-Measure, kết TCA+ tham chiếu [], kết CCA lấy từ thực nghiệm thực tế: lu an n va TCA+ CM1=>Apache 0.68 0.61 Apache=>CM1 0.42 0.24 AR3=>Apache 0.48 0.27 Apache=>AR3 0.53 0.31 p ie gh tn to CCA Bảng So sánh kết thực nghiệm phương pháp CCA TCA nl w Có thể thấy CCA thực thi tốt TCA hầu hết trường hợp, nguyên d oa nhân kể đến CCA sử dụng tất số liệu có dự án an lu không sử dụng số liệu chung TCA u nf va 3.4 Độ phức tạp thời gian thực ll Với hỗ trợ matlab cộng với việc số lượng file thu thập chưa phải lớn z at nh Đối với trường hợp dự đoán kiểu - một, thời gian trung bình chạy z 0.35s / lần thực nghiệm @ Đối với trường hợp dự đoán kiểu - nhiều, thời gian trung bình chạy m co l 0.43s / lần thực nghiệm gm - oi - m nên thời gian thực thi nhanh an Lu n va ac th si 68 - Với việc chạy 20 trường hợp kiểm thử bao gồm hai kiểu thời gian chạy là: 7.22s 3.5 Kết luận chương Chương ba đồ án trình bày trình thực nghiệm đánh giá kết quả, so sánh cách tiếp cận CCA đề xuất với cách tiếp cận TCA Quá trình thực nghiệm cho kết tích cực phương pháp CCA cho kết tốt tất độ đo Điều giúp luận văn khẳng định tính khả thi cách tiếp cận đề tính đắn vấn đề lý thuyết trình bày chương hai lu an n va p ie gh tn to d oa nl w ll u nf va an lu oi m z at nh z m co l gm @ an Lu n va ac th si 69 KẾT LUẬN Dự đốn lỗi nói chung dự đốn lỗi liên dự án nói riêng vấn đề nhiều nhà nghiên cứu quan tâm thời gian gần Giải vấn đề giải phần tốn chi phí thực phát triển dự án Dự đoán lỗi thực sớm đủ tốt góp phần giảm chi phí bảo trì phát sinh sau này, đồng thời giúp cải thiện tốt chất lượng hệ thống phần mềm Luận văn nêu tổng quan vấn đề liên quan đến toán dự đoán lỗi nói chung, dự đốn lỗi liên dự án nói riêng, cách tiếp cận Đặc biệt luận văn trọng lu trình bày vấn đề lý thuyết, giải thuật phương pháp CCA chi tiết an va bước để thực thi phương pháp Phương pháp cho thấy kết tích n cực, điều trình bày chương cuối luận văn p ie gh tn to d oa nl w ll u nf va an lu oi m z at nh z m co l gm @ an Lu n va ac th si 70 DANH MỤC TÀI LIỆU THAM KHẢO [1] Humphrey, W., “Why big software projects fail: The 12 key questions.”, The Journal of Defense Software Engineering, Vol 18, pp 25–29, 2005 [2] The Standish Group, “Chaos Report”, 1995, http://www.cs.nmt.edu/ cs328/reading/Standish.pdf – last visited 15th of June, 2008 [3] Jones, C., “Patterns of Large Software Systems: Failure and Success”, lu an Computer , Vol 28, No 3, pp 86–87, 1995 va n [4] Brooks, F P., Jr., The mythical man-month (anniversary ed.), Addison-Wesley gh tn to Longman Publishing Co., Inc., Boston, MA, USA, 1995 p ie [5] Verner, J., J Sampson, and N Cerpa, “What factors lead to software project w failure?”, Research Challenges in Information Science, 2008 RCIS 2008 Second oa nl International Conference on, pp 71 –80, june 2008 d [6] N Nagappan and T Ball, “Use of relative code churn measures to predict lu u nf va an system defect density,” in Proceedings of ICSE 2005 ACM, 2005, pp 284–292 [7] A E Hassan, “Predicting faults using the complexity of code changes,” in ll oi m Proceedings of ICSE 2009, 2009, pp 78–88 z at nh [8] N Nagappan and T Ball, “Static analysis tools as early indicators of pre-release defect density,” in Proceedings of ICSE 2005 ACM, 2005, pp 580–586 z @ gm [9] T Zimmermann and N Nagappan, “Predicting defects using network analysis m co l on dependency graphs,” in Proceedings of ICSE 2008, 2008 an Lu n va ac th si 71 [10] A Marcus, D Poshyvanyk, and R Ferenc, “Using the conceptual cohesion of classes for fault prediction in objectoriented systems,” IEEE Trans Software Eng., vol 34, no 2, pp 287–300, 2008 [11] Y Shi, Z Lan, W Liu, W Bi, Extending semi-supervised learning methods for inductive transfer learning, In: Ninth IEEE International Conference on Data Mining, 2009, pp 483–492 [12] T Kamishima, M Hamasaki, S Akaho, TrBagg:A Simple Transfer Learning Method and Its Application to Personalization in Collaborative Tagging, in: lu an Proceedings of the IEEE International Conference on Data Mining (ICDM), 2009, n va pp 219–228 Kim Department of Computer Science and Engineering, The Hong Kong ie gh tn to [13] Transfer Defect Learning Jaechang Nam , Sinno Jialin Pan†, and Sunghun p University of Science and Technology, China w d oa nl [14] Jaechang Nam, Sinno Jialin Pan, and Sunghun Kim Transfer defect learning an lu [15] Thomas Zimmermann, Nachiappan Nagappan, Harald Gall, Emanuel Giger, Brendan Murphy Cross-project Defect Prediction, 2009 u nf va [16] G Canfora, A De Lucia, M Di Penta, R Oliveto, A Panichella, and S ll oi m Panichella Multi-objective cross-project defect prediction In IEEE 6th pages 252-261, 2013 z at nh International Conference on Software Testing, Verification and Validation (ICST), z gm @ [17] S Herbold Training data selection for cross-project defect prediction In m co l Proceedings of the 9th International Conference on Predictive Models in Software an Lu n va ac th si 72 Engineering (PROMISE), pages 6-16, 2013 [18] B Zhang and Z Z Shi Classification of big velocity data via cross-domain canonical correlation analysis In International Conference on Big Data, pages 493498, 2013 [19] B Turhan, A T Mısırlı, and A Bener Empirical evaluation of the effects of mixed project data on learning defect predictors Information and Software Technology, 55(6):1101-1118, 2013 lu [20] X.Y.Jing,R.M.Hu,Y.P.Zhu,S.S.Wu,C.Liang,andJ Y Yang Intra-view and an va inter-view supervised correlation analysis for multi-view feature learning In 28th n AAAI Conference on Artificial Intelligence (AAAI), pages 1882- 1889, 2014 ie gh tn to [21] P Baldi, S Brunak, Y Chauvin, C A Andersen, and H Nielsen Assessing accuracy of p the prediction algorithms for classification: an overview oa nl w Bioinformatics, 16(5):412-424, 2000 d [22] W Li, L Duan, D Xu, and I W Tsang Learning with augmented features for semi-supervised an and lu supervised heterogeneous domain adaptation IEEE 2014 ll u nf va Transactions on Pattern Analysis and Machine Intelligence, 36(6):1134-1148, m oi [23] F Peters, T Menzies, and A Marcus Better cross company defect prediction z at nh In 10th IEEE Working Conference on Mining Software Repositories (MSR), pages 409-418, 2013 z @ m co l gm [24] WeiFoo HDP Dataset https://github.com/ai-se/HDP/tree/master/dataset an Lu n va ac th si 73 [25] M Shepperd, Q Song, Z Sun, and C Mair Data quality: some comments on the NASA software defect datasets IEEE Transactions on Software Engineering, 39(9):1208-1215, 2013 [26] R Wu, H Zhang, S Kim, and S C Cheung Relink: recovering links between bugs and changes In Proceedings of the 19th ACM SIGSOFT Symposium and the 13th European Conference on Foundations of Software Engineering (ESEC/FSE), pages 15-25, 2011 [27] M D’Ambros, M Lanza, and R Robbes An extensive comparison of bug lu an prediction approaches In 7th IEEE Working Conference on Mining Software n va Repositories (MSR), pages 31-41, 2010 gh tn to [28] Personal Defect Prediction Link: p ie http://www.slideshare.net/hunkim/personalized-defect-prediction-conference-1 oa nl w [29] Proposed software defect prediction framework Link: d https://www.researchgate.net/figure/220069857_fig1_Fig-1-Proposed-software- lu va an defect-prediction-framework ll oi m applications u nf [30] Chen Songcan In Canonical Correlation Analysis (CCA), íts variants with z at nh [31] Ming Cheng, Guoqing Wu, Min Jiang, Hongyan Wan , Guoan You and Mengting Yuan In Heterogeneous Defect Prediction via Exploiting Correlation m co l gm @ [32] Data mining lecture 10B Link: z Subspace an Lu n va ac th si 74 http://slideplayer.com/slide/9474616/ lu an n va p ie gh tn to d oa nl w ll u nf va an lu oi m z at nh z m co l gm @ an Lu n va ac th si

Ngày đăng: 12/07/2023, 17:30

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w