Nội dung của bài viết trình bày khả năng dự báo của mô hình ARGO; hạn chế và các bƣớc tiếp theo; dữ liệu và phƣơng pháp; dữ liệu của Google; xây dựng mô hình ARGO; dữ liệu dịch cúm của CDC; biến tham số dự báo của mô hình ARGO; số liệu chính xác.
THỐNG KÊ VÀ CUỘC SỐNG DỰ BÁO CHÍNH XÁC DỊCH CÚM TỒN CẦU THƠNG QUA MƠ HÌNH THỐNG KÊ SỬ DỤNG DỮ LIỆU LỚN CỦA GOOGLE Shihao Yang, Mauricio Santillana, Samuel Kou, Đại học Harvard, Mỹ (tiếp theo) Thảo luận Khả dự báo mơ hình ARGO: Từ kết trình bày cho thấy khả dự báo mơ hình ARGO có độ xác cao so với tất mơ hình thử nghiệm khác Kết dự báo xác nhóm nghiên cứu tiếp cận với biến tham số đầu vào Google sử dụng tính tốn phục vụ dự báo, nhóm thực nghiệm dự báo với biến đầu vào dựa liệu chất lượng thấp Google Sự kết hợp thơng tin tìm kiếm dịch cúm theo mùa với quyền số linh hoạt yếu tố quan trọng tính xác nâng cao mơ hình ARGO Vì thông tin mức độ hoạt động dịch cúm tuần trước thường có tác động đáng kể vào mức độ thông tin cách nửa năm hay năm cung cấp thêm thơng tin, thể Hình 1, phản ánh tương quan mạnh mẽ thời gian, hệ số tương quan dương có nghĩa thơng tin dịch cúm có mối liên quan với Bên cạnh đó, việc tính tốn tích hợp thơng tin mơ hình chuỗi thời gian đưa mơ hình đường cong liên tục, giúp ngăn ngừa điểm phát sinh đột biến không mong muốn Việc thực thêm điều khoản tham chiếu mơ hình chuỗi thời gian vào mơ hình GFT ban đầu để trở thành mơ hình tối ưu (mơ hình ARGO) Để thực điều nhóm 36 nghiên cứu coi tồn mơ hình GFT ban đầu biến tham số độc lập không cho phép thay đổi thơng tin biến mơ hình chuỗi thời gian mức độ khác truy vấn Như vậy, thơng tin mơ hình chuỗi thời gian kết hợp thêm điều khoản nhiều điều khoản áp dụng mơ hình GFT ban đầu khơng giúp ích cung cấp thêm thông tin Tuy nhiên, thực tế thông tin mơ hình chuỗi thời gian chứa thuật ngữ truy vấn đơn lẻ giúp ích cung cấp thơng tin có giá trị dịch cúm Ví dụ, số 100 thuật ngữ truy vấn liệu có tương quan với Google lựa chọn, mơ hình ARGO lựa chọn 14 điều khoản kết hợp, mơ hình Santillana et al mơ hình GFT lựa chọn tương ứng 38 45 điều khoản kết hợp Do kết tìm kiếm mơ hình ARGO mở rộng phạm vi Ngoài ra, kết hợp độ trơn (làm cho mơ hình dự báo mịn hơn) độ thưa (làm giảm vùng có điểm liệu điểm quan sát mơ hình) giúp cho mơ hình ARGO giảm đáng kể lỗi tính tốn so với mơ hình khác, Bảng Bảng cho thấy mơ hình ARGO cải thiện hiệu suất đánh giá số liệu khoảng thời gian nghiên cứu gấp đôi hiệu mơ hình GFT + AR(3) Thơng qua mơ hình ARGO thấy cách bổ sung hỗ trợ lẫn thông SỐ 04– 2016 18 Thống kê Cuộc sống Dự báo xác dịch cúm… tin nguồn liệu tìm kiếm từ Google Trends nguồn liệu có tương quan với Google mơ hình chuỗi thời gian (Hình1) Đối với mơ hình chuỗi thời gian thường có xu hướng thay đổi chậm để đáp ứng với thay đổi đột ngột quan sát mức độ hoạt động dịch cúm CDC Điều thấy rõ thơng qua “độ trễ” mơ hình chuỗi thời gian linh hoạt AR(3) Mặc dù, mơ hình AR(3) có hệ số tương quan tốt Đối với mơ hình ARGO ngược lại, xử lý hiệu với trường hợp phát thay đổi hoạt động đột ngột dịch cúm, nhạy cảm với hoạt động hành vi tăng đột biến người dân tìm kiếm thơng tin dịch cúm Để hiểu rõ mối quan hệ biến tham số có ảnh hưởng đến độ xác dự báo dịch cúm mơ hình ARGO, nhóm nghiên cứu tính tốn lượng tăng/giảm hệ số tương quan so sánh với mơ hình dự báo GFT Lượng tăng/giảm hệ số tương quan hai mơ hình theo chuỗi thời gian at bt định nghĩa Corr(at −at−1, bt −bt−1) Trong Bảng 1, Mơ hình ARGO (Corr(ARGO) = 0.758) có giá trị tương tự mơ hình GFT mơ hình Santillana et al có nghĩa mơ hình có khả mơ hình GFT việc nắm bắt mức độ thay đổi hoạt động dịch cúm, nhanh mơ hình AR(3) Thơng tin chuỗi thời gian (mùa dịch) có xu hướng làm cho dự báo mơ hình ARGO thay đổi q khứ Điều thấy rõ bắt đầu bùng phát mùa dịch cúm H1N1 năm 2009, mơ hình ARGO đưa dự báo kết thấp (Hình đường màu đỏ thấp nhất) Mơ hình ARGO tự động điều chỉnh sửa lỗi hiệu cách chuyển phần quyền số giá trị tìm kiếm từ miền mơ hình theo chuỗi thời gian (dữ liệu báo cáo q khứ) sang miền liệu mơ hình truy vấn tìm kiếm Google tuần sau Ngược lại, SỐ 04 – 2016 mùa dịch cúm 2012-2013 (10/2012 - 04/2013), mơ hình ARGO, GFT, Santillana et al vượt giới hạn theo dõi dịch cúm (mất đỉnh) (Hình 1) Điều thay đổi đột ngột chưa có khứ hoạt động tìm kiếm thơng tin dịch cúm Nhưng mơ hình ARGO xử lý nhanh cách tự động điều chỉnh quyền số toàn điều khoản truy vấn tìm kiếm thơng tin Google tồn chuỗi thời gian theo dõi, nên việc tích giới hạn theo dõi dịch cúm xảy tuần Trái lại, mơ hình Santillana et al diễn tuần mơ hình GFT diễn khoảng tuần Điều quan trọng, thấy quan y tế Hoa kỳ sử dụng liệu báo cáo dịch cúm CDC thông tin tiêu chuẩn đảm bảo cho hoạt động dự báo mức độ tình trạng dịch cúm, mà liệu có mối tương quan với Google Google Trends coi biến tham số độc lập Qua đó, thấy mơ hình ARGO tự xử lý điều chỉnh nhanh để thích nghi phù hợp tình hình thực tế dịch cúm với tiêu chuẩn khác biến tham số, biến tham số độc lập Hạn chế bƣớc tiếp theo: Mặc dù mơ hình ARGO thể khả vượt trội so với mơ hình khác, khơng có nghĩa mơ hình hồn hảo, cách thức tính tốn mơ hình dựa liệu hành vi tìm kiếm thơng tin dịch cúm của người dân Nếu có thay đổi đột ngột cấu trúc công cụ tìm kiếm phương thức truy vấn tìm kiếm thơng tin ảnh hưởng đến kết độ xác mơ hình dự báo Nhóm nghiên cứu hy vọng mơ hình ARGO nhanh chóng tự điều chỉnh có thay đổi xảy tương lai Ngoài ra, với mơ hình dự báo chất lượng hoạt động tốt khứ không đảm bảo hoạt động 37 19 Dự báo xác dịch cúm… Thống kê Cuộc sống tốt tương lai Do vậy, viết nhóm nghiên cứu cố định bảng thuật ngữ truy vấn từ trước năm 2010 so sánh với bảng kết thuật ngữ từ năm 2010 trở với điều khoản truy vấn tương tự mơ hình dự báo Trong tương lai, ứng dụng mơ hình ARGO tiếp tục cập nhật thường xuyên dễ sử dụng để nắm bắt mức độ hoạt động bệnh dịch kiện xã hội theo dõi thơng qua hình thức truy vấn tìm kiếm thông tin trực tuyến với quy mô không gian thời gian Bên cạnh đó, cải thiện hoạt động dự báo dịch cúm cách kết hợp nhiều yếu tố dự báo từ nguồn liệu khác Ngay sau nhóm nghiên cứu GFT gửi báo cáo ban đầu tháng 05/2015, đưa đề xuất mơ hình chuỗi thời gian theo dõi dịch cúm dựa mơ hình GFT Thì Google thơng báo cho phép nhà khoa học nghiên cứu GFT tiếp cận với liệu thô họ Đề xuất đóng góp kịp thời có ích việc cung cấp phương pháp minh bạch cho việc theo dõi dịch bệnh tương lai Dữ liệu phƣơng pháp Dữ liệu Google Để tránh thông tin truy vấn khoảng thời gian nghiên cứu trước năm 2009, liệu đưa mẫu nghiên cứu Cách tiếp cận phù hợp với nội dung nghiên cứu mơ hình GFT Ngay sau phát sinh đại dịch H1N1 năm 2009, nhóm nghiên cứu thu thập liệu có mối tương quan với Google tốt CDC cho hai giai đoạn khác (tại www.google.com/trends/correlate) thông qua hình thức truy vấn tìm kiếm thơng tin trực tuyến Giai đoạn đầu (giai đoạn trước xảy 38 H1N1), nhóm nghiên cứu chèn liệu dịch … cúm từ báo cáo CDC giai đoạn 1/2004 đến 28/3/2009 (dữ liệu trước xảy đại dịch cúm) vào với liệu mà nhóm thu được, sử dụng thuật ngữ tìm kiếm có tương quan tốt coi biến tham số độc lập để giúp cho nhóm nghiên cứu dự đoán dịch cúm khoảng thời gian nghiên cứu dịch cúm 04/4/2009 đến 22/5/2010 Trong giai đoạn thứ hai (giai đoạn xảy dịch cúm H1N1), nhóm nghiên cứu chèn liệu dịch cúm từ báo cáo CDC từ 01/2004 đến 22/5/2010 với điều khoản tham chiếu tìm kiếm dịch cúm áp dụng cho tồn gói liệu mà nhóm thu Các thuật ngữ tìm kiếm cuối sử dụng biến độc lập cho tất dự đốn q trình nghiên cứu có khơng kèm thêm điều kiện Ví dụ thuật ngữ flu.fever (trong cụm từ tìm kiếm cụm từ fever (cơn sốt) coi biến tham số độc lập, bên cạnh đó, có thêm điều kiện giả định flu (cúm); Nhưng thuật ngữ fevers tìm kiếm không kèm theo điều kiện nào) Đối với giai đoạn trước xảy dịch cúm H1N1, giả thiết có liệu có tương quan với Google bao gồm điều khoản giả định (điều kiện xảy q trình nghiên cứu khơng thể xảy thực tế) Tuy nhiên, giả định khơng mơ hình ARGO lựa chọn, nghĩa mơ hình ARGO lựa chọn liệu giả định với quyền số không Qua thể khả phân loại thơng tin mạnh mẽ mơ hình Đối với khoảng thời gian sau dịch cúm H1N1, thuật ngữ truy vấn cập nhật từ liệu có tương quan với Google với điều khoản chủ yếu liên quan đến cúm, có nghĩa giả định nhóm nghiên cứu đưa vào “lọc ra” khỏi liệu Lazer D, Kennedy R, King G, Vespignani A (2014) Big data The parable of Google Flu: Traps in big data analysis Science 343(6176):1203–1205 SỐ 04– 2016 20 Thống kê Cuộc sống Dự báo xác dịch cúm… mùa dịch cúm năm sau Trong khoảng thời gian 28/03/2015 đến ngày gửi báo cáo này, nhóm nghiên cứu tổng hợp tần suất tìm kiếm thuật ngữ truy vấn từ Google Trends (tại www.google.com/trends; cập nhật 11/7/2015), Vì lý ban đầu, nhóm nghiên cứu thu thập liệu có tương quan với Google đến ngày 28/3/2015 Nhóm nghiên cứu thu thập liệu có tương quan với Google dựa tiêu chuẩn khối lượng tìm kiếm thơng tin truy vấn phải có (Sai số trung bình Mean = độ lệch chuẩn SD = 1) xem xét giai đoạn từ 01/2004 đến 03/2015 Trong trình chuyển đổi nguồn liệu để dự báo dịch cúm, nhóm nghiên cứu nhận thấy vấn đề làm hai nguồn liệu phù hợp với Để giải nhóm nghiên cứu thực chuyển đổi liệu có tương quan với Google thu thành hàm tuyến tính với quy mơ [0,100] tương tự liệu mà nhóm nghiên cứu phân tích, nguồn liệu sẵn có Sau chuyển sang nguồn liệu Google Trends Điều thể rõ Hình màu khác nguồn liệu sử dụng cho dự báo Nhóm nghiên cứu sử dụng liệu GFT (phiên 4, 05/2014) Và liệu dịch cúm GFT có www.google.org/ flutrends /(cập nhật 11/7/2015) Dữ liệu dịch cúm CDC Nhóm nghiên cứu sử dụng phiên liệu dự báo dịch cúm có quyền số CDC (tại gis.cdc.gov/grasp/fluview/fluportaldashboard html; cập nhật 11/7/2015) Các phiên dự báo hàng tuần ILI CDC có sẵn trang web CDC có tất thơng tin mùa dịch cúm (từ tuần 40 năm trước tuần 20 năm tiếp theo) Ví dụ, báo cáo dự báo tình hình dịch cúm vào tuần thứ 50 mùa dịch 2012-2013 có sẵn www.cdc.gov/flu/ SỐ 04 – 2016 weekly/ weeklyarchives2012-2013 /data /senAllregt50.htm; báo cáo sửa đổi tuần 50 có vào tuần thứ mùa dịch cúm 2014-2015 (www.cdc.gov/flu/weekly/ weeklyarchives 2014-2015 / data / senAllregt09.html) Xây dựng mơ hình ARGO Như đề cập phần giới thiệu, mơ hình ARGO xây dựng dựa mơ hình Markov kết hợp với liệu báo cáo dịch cúm CDC chuyển đổi logit thành chuỗi {yt} (là mơ hình chuỗi thời gian tạo thành, chuyển đổi hai nguồn liệu dự báo, nguyên nhân nội ảnh hưởng đến chất lượng hoạt động dự báo dịch cúm) Nhóm nghiên cứu áp dụng mơ hình tự hồi quy với độ trễ N, nhằm giải nhược điểm độ trễ mơ hình chuỗi thời gian, tập hợp thông tin chuỗi {y(t − N+1):t}t≥N chuỗi Markov (điều chứng tỏ thực tế bệnh cúm kéo dài khoảng thời gian thành đợt, kéo dài mãi) Trong công thức 1, thấy chiều hướng chuyển đổi log khối lượng liệu truy vấn tìm kiếm Google thời điểm t, Xt phụ thuộc vào hoạt động dịch cúm thời điểm đó, liệu chuỗi yt thu nhận thơng qua truy vấn tìm kiếm thơng tin dịch cúm người dân từ Google (theo trực giác dịch cúm xảy khiến cho người dân phải tìm kiếm thơng tin liên quan đến dịch cúm mạng trực tuyến) Do vậy, thông tin chuỗi Markov khối lượng liệu thu y(t - N + 1): hàm có cấu trúc mơ hình ẩn cơng thức (1) y1:N →y2:(N+1)→⋯→y(t−N+1):T ↓ ↓ XN XN+1 (1) ↓ XT 39 21 Dự báo xác dịch cúm… Thống kê Cuộc sống Các giả thuyết đưa ra: Giả thuyết 1: 𝑁 𝑗 =1 𝑦𝑡 = 𝜇𝑦 + ∝𝑗 𝑦𝑡−1 +∈𝑡 , ∈𝑡 𝑖𝑖𝑑 𝑁 (0, 𝜎 ) ~ Giả thuyết 2: Xt|yt ∼ N K(μx + ytβ,Q) Giả thuyết 3: yt, Xt biến độc lập {yl, Xl : l ≠ t} β=(β1, β2, , β k)⊺, μx , , μxK)⊺, Q ma trận hiệp Trong đó: =(μx1 , μx2 phương sai iid: (independent and identically distributed): Lấy mẫu độc lập có phân phối chuẩn Trong mơ hình phân tích liệu R biến tham số đơn giản, nhóm nghiên cứu thực chuyển đổi log hóa tồn liệu dịch cúm thu CDC mức gốc pt thành quy mô [0,1] phần mềm R để thu chuỗi yt, chuyển đổi log hóa tồn khối lượng liệu có tương quan với Google mức i thành quy mô [0,100] phần mềm R để thu chuỗi Xt Nhóm nghiên cứu sử dụng hàm log phù hợp, tần suất truy vấn tìm kiếm thơng tin Google thường có tốc độ tăng theo cấp số nhân ln có xu hướng tiến sát tới giới hạn biên mà nhóm nghiên cứu cố gắng thu nhỏ để phù hợp với quy mô [0,100] cách chia tối đa đoạn liệu để xử lý Mặt khác, liệu Google Trends sử dụng số nguyên từ đến 100, nên thêm số lượng nhỏ δ=0,5 trước chuyển đổi log để tránh giá trị log trường hợp không xác định Trong đó, f(yt|y1:(t−1),X1:t) hàm giản đơn mơ tả phân phối ước tính, với trung bình y(t−N):(t−1) Xt; ; có phương sai khơng đổi (xem cơng thức 2, xác định mơ hình ARGO) Mơ hình ARGO xác định mơ hình chuỗi thời gian hàm yt = logit(pt); 40 Trong yt hàm chuyển đổi logit … liệu thông tin thu dịch cúm CDC có quyền số, hoạt động dịch cúm mức pt thời điểm t, Xi, t hàm chuyển đổi log có liệu tương quan với Google mức i thời điểm t Mơ hình ARGO xác định bởi: 𝐾 𝑦𝑡 = 𝜇𝑦 + 𝑁 𝑗 =1 ∝𝑗 𝑦𝑡−𝑗 + 𝑖=1 𝛽𝑖 𝑿𝒊,𝒕 + 𝑖𝑖𝑑 ∈𝑡 , ∈𝑡 𝑁 0, 𝜎 (2) ~ Với Xt coi biến ngoại sinh chuỗi thời gian {yt} Biến tham số dự báo mơ hình ARGO: Nhóm nghiên cứu lựa chọn quan sát hoạt động dịch cúm khoảng thời gian năm (N = 52 tuần), lựa chọn 100 thuật ngữ (được coi biến tham số độc lập) có tần suất truy vấn tìm kiếm từ liệu có mối tương quan với google (K = 100) Vì có số lượng biến độc lập nhiều so với số biến lượng quan sát (K=100 >N=52), nên phương pháp ước lượng thường sử dụng phương pháp bình phương nhỏ khơng giải Do đó, nhóm nghiên cứu phải áp dụng hình thức xử lý cho biến tham số ước lượng Nhóm nghiên cứu đưa hình thức xử lý, hình thức xử lý phổ biến L1, hình thức xử lý đặc biệt L2, hình thức xử lý kết hợp L1 L2 Tất thông số điều chỉnh tự động tuần quan sát lưu lại bảng liệu với cột liệu chứa thông tin năm dịch cúm (104 tuần) Trong tuần bất kỳ, mục tiêu tìm tham số μy, α=(α1, , α52), β=(β1, , β100) nhỏ 𝑡 (𝑦𝑡 100 𝑖=1 − µ𝑦 − 52 𝑗 =1 ∝𝑗 𝑦𝑡−𝑗 − 𝛽𝑖 𝑋𝑖,𝑡 )2 + λ∝ 𝛼 λ𝛽 𝛽 + η𝛽 𝛽 2 + η∝ ∝ 2 + (3) SỐ 04– 2016 22 Thống kê Cuộc sống Dự báo xác dịch cúm… Với λα, λβ, ηα, ηβ tham số thượng tầng ảnh hưởng tới kết mơ hình dự báo Ý tưởng nhóm nghiên cứu sử dụng phương pháp thống kê kiểm tra chéo để chọn lựa tham số Tuy nhiên, qua bảng liệu kết thấy kết tuần rõ ràng, có 104 điểm liệu (tương ứng liệu năm dịch cúm cột liệu) Như vậy, cần phải xác định trước số tham số công thức (3) để làm gốc so sánh kết dự báo Xuất phát từ mơ hình giản đơn theo công thức kết hợp với liệu quan sát trực giác từ phương pháp kiểm tra chéo, nhóm nghiên cứu đưa giả thuyết λα = λβ = 0, từ đề xuất hình thức xử lý L1 áp dụng tồn mơ hình thử nghiệm Với λα # λβ, kết nhận có sai số đáng kể Tiếp tục, nhóm nghiên cứu xem xét giải thiết λα = λβ đó, mơ hình ARGO xác định cơng thức (3) Với giả thuyết ηα = ηβ = λα = λβ Số liệu xác: Các số RMSE, MAE, MAPE ước tính 𝒑 theo mục tiêu dự báo mức độ hoạt động p xác định, tương ứng, sau: 𝑅𝑀𝑆𝐸 𝑝𝑡 , 𝑝𝑡 = ( 𝑀𝐴𝐸 𝑝𝑡 , 𝑝𝑡 = 𝑀𝐴𝑃𝐸 𝑝𝑡 , 𝑝𝑡 𝑛 𝑛 (𝑝 𝑛 𝑡=1 𝑡 𝑛 − 𝑝𝑡 )2 )1/2 𝑝𝑡 − 𝑝𝑡 𝑡=1 𝑛 = 𝑛 Mức độ hiệu tương đối ước tính 𝑝 so với 𝑝 (2) (1) (1) e( 𝑝 , 𝑝 (2) ) = 𝑀𝑆𝐸đú𝑛𝑔 /𝑀𝑆𝐸đú𝑛𝑔 , (𝑖) với điều kiện 𝑀𝑆𝐸đú𝑛𝑔 = 𝐸 𝑝 𝑖 −𝑝 xác định công thức sau: (1) (2) e(𝑝 ,𝑝 ) = 𝑀𝑆𝐸𝑜𝑏𝑠 𝑀𝑆𝐸𝑜𝑏𝑠 , Trong đó: (𝑖) 𝑀𝑆𝐸𝑜𝑏𝑠 = 𝑛 (𝑖) 𝑛 𝑡=1(𝑝𝑡 − 𝑝𝑡 )2 (4) Khoảng tin cậy 95% xây dựng, tính tốn thơng qua phương pháp Bootstrap áp dụng cho mơ hình chuỗi thời gian, với giả thiết chuỗi thời gian nhân rộng có lỗi sai số sử dụng khối ngẫu nhiên phân bố hình học với độ dài trung bình quan sát 52 tuần (tương ứng với năm quan sát) Khi tính xác định khoảng tin cậy phương pháp Bootstrap có giá trị log{e(𝑝(1) , 𝑝(2) )} Sau đó, tiến hành lũy thừa để khơi phục lại quy mơ xem xét ban đầu có tham số Vì khoảng tin cậy theo phương pháp Bootstrap khơng có tham số làm tính tự tương quan tương quan chéo lỗi liệu quan sát, khơng xác số sai số trung bình dãy Ghi chú: Để tìm hiểu chi tiết thêm phương pháp luận, xem thêm Phụ lục, http://arxiv.org/pdf/1505.00864v2.pdf 𝑝𝑡 − 𝑝𝑡 /𝑝𝑡 𝑡=1 Hệ số tương quan mẫu xác định hệ số tương quan ước tính 𝑝 theo mục tiêu dự báo mức hoạt động p Ngoài ra, lượng tăng/giảm hệ số tương quan 𝑝𝑡 pt xác định sau: Lượng tăng/giảm hệ số tương quan Corr (𝑝𝑡 , pt) = Corr (𝑝𝑡 − 𝑃t-1, pt − pt−1) SỐ 04 – 2016 Công Hoan (dịch) Nguồn: Hội thảo khoa học quốc tế IASCARS2015, Hiệp hội Toán Thống kê Quốc tế, ngày 17-19/12/2015 Singapore với chủ đề Toán thống kê: Cơ hội thách thức kỷ nguyên Dữ liệu lớn 41 23 ... kỳ sử dụng liệu báo cáo dịch cúm CDC thông tin tiêu chuẩn đảm bảo cho hoạt động dự báo mức độ tình trạng dịch cúm, mà liệu có mối tương quan với Google Google Trends coi biến tham số độc lập Qua. . .Thống kê Cuộc sống Dự báo xác dịch cúm tin nguồn liệu tìm kiếm từ Google Trends nguồn liệu có tương quan với Google mơ hình chuỗi thời gian (Hình1 ) Đối với mơ hình chuỗi thời... liệu GFT (phiên 4, 05/2014) Và liệu dịch cúm GFT có www .google. org/ flutrends /(cập nhật 11/7/2015) Dữ liệu dịch cúm CDC Nhóm nghiên cứu sử dụng phiên liệu dự báo dịch cúm có quyền số CDC (tại gis.cdc.gov/grasp/fluview/fluportaldashboard