1. Trang chủ
  2. » Luận Văn - Báo Cáo

PYTHON TRONG PHÂN TÍCH DỮ LIỆU

32 21 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Python rất dễ học, song lại có thể được sử dụng cho nhiều công việc khác nhau nhờ có các thư viện của nó. Tìm hiểu tổng quan về ngôn ngữ lập trình Python, những ưu điểm của việc sử dụng Python trong phân tích dữ liệu cũng như một số ví dụ thực tế.

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC PYTHON TRONG PHÂN TÍCH DỮ LIỆU ĐỒ ÁN I Chuyên ngành: TOÁN TIN Giảng viên hướng dẫn: ThS NGUYỄN TUẤN DŨNG Sinh viên thực hiện: TRẦN HẢI PHONG Lớp: Toán Tin – K63 Mã số sinh viên: 20185393 HÀ NỘI – 2021 TRANG NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN Mục đích nội dung đồ án: Kết đạt được: Ý thức làm việc sinh viên: Hà Nội, ngày tháng năm 2021 Giảng viên hướng dẫn (Ký ghi rõ họ tên) MỤC LỤC MỞ ĐẦU NỘI DUNG CHÍNH Tổng quan Python Phân tích liệu 1.1 Python 1.1.1 Lịch sử 1.1.2 Đặc điểm 1.1.3 Ứng dụng 1.1.4 Một số ví dụ 1.2 Phân tích liệu 12 1.2.1 Định nghĩa 12 1.2.2 Q trình phân tích liệu 14 1.2.3 Ứng dụng phân tích liệu 17 Sử dụng Python phân tích liệu 18 2.1 Đặc điểm 18 2.2 Ứng dụng: Trực quan hóa liệu (data visualization) 20 2.2.1 Biểu đồ đường (line chart) 21 2.2.2 Biểu đồ cột (bar chart) 22 2.2.3 Biểu đồ tròn (pie chart) 23 2.3 Ví dụ: Xây dựng biểu đồ phân tích chứng khốn 24 KẾT LUẬN 30 TÀI LIỆU THAM KHẢO 31 MỞ ĐẦU Theo dự đoán International Data Corporation, doanh thu tồn cầu giải pháp phân tích liệu lớn đạt 274,3 tỷ USD vào năm 2022, giữ mức tăng trưởng 13,2% vòng năm tới Phân tích liệu giúp doanh nghiệp dự đốn nhu cầu, đưa định nhằm phòng tránh rủi ro tối ưu hóa lợi nhuận,… Những lợi ích khiến giải pháp phân tích liệu ngày trở nên phổ biến: năm 2015 có 17% cơng ty sử dụng phân tích liệu lớn, năm 2017 tỉ lệ tăng lên 53% Một công cụ cần thiết để sử dụng phân tích liệu ngơn ngữ lập trình, ngơn ngữ phổ biến kể đến Python, JavaScript, SQL, R,… Trong số đó, em ý tới ngơn ngữ Python đơn giản phổ biến Theo khảo sát năm 2013, 40% nhà khoa học liệu chọn Python ngơn ngữ họ sử dụng cơng việc Lý có lẽ ngơn ngữ dễ học, song lại sử dụng cho nhiều cơng việc khác nhờ có thư viện Do đó, em định lấy “Python Phân tích liệu” đề tài cho Đồ án I Trong em tập trung tìm hiểu tổng quan ngơn ngữ lập trình Python, ưu điểm việc sử dụng Python phân tích liệu số ví dụ thực tế Trong trình thực đề tài, em nhận nhiều bảo, giúp đỡ góp ý thầy Nguyễn Tuấn Dũng Thầy giúp đỡ em nhiều việc hoàn thành đề tài Mặc dù em cố gắng hết sức, song khơng tránh khỏi thiếu sót Em mong đóng góp thầy để báo cáo đồ án em hồn thiện NỘI DUNG CHÍNH Tổng quan Python Phân tích liệu 1.1 Python 1.1.1 Lịch sử Python ngôn ngữ lập trình thơng dịch (interpreted), hướng đối tượng (object-oriented) bậc cao (high-level) sử dụng cho nhiều mục đích đa dạng Ngôn ngữ xếp hạng ngơn ngữ lập trình phổ biến nhất, sử dụng từ người học lập trình lập trình viên kinh nghiệm Điều có nhờ dễ học, cú pháp dễ hiểu rõ ràng với khả thực nhiều tác vụ khác Python phát triển vào cuối năm 1980 Guido Van Rossum Viện Nghiên cứu Quốc gia Tốn học Khoa học máy tính Hà Lan Đây ngôn ngữ kế thừa ngơn ngữ ABC, có cú pháp dễ hiểu Python lần đầu mắt vào năm 1991 mang tên Python 0.9.0 Từ đến Python mắt phiên 1, 3, với phiên mang tên Python 3.9.5 Python dần trở thành ngơn ngữ lập trình phổ biến vào năm 2010, vượt lên ngôn ngữ khác JavaScript hay Java nhờ phát triển ngành phân tích liệu, máy học, liệu lớn… với tăng trưởng số lượng lập trình viên, với số lượng lớn số chọn Python ngơn ngữ Hình 1: Sự tăng trưởng ngơn ngữ lập trình phổ biến 1.1.2 Đặc điểm Triết lý thiết kế Python bao gồm 19 điều, đọc sử dụng đoạn mã import this Một số số là: • Đẹp đẽ tốt xấu xí • Minh bạch tốt che đậy • Đơn giản tốt phức tạp • Phức tạp tốt rắc rối • Dễ đọc • … Có thể thấy ngơn ngữ Python thiết kế với ý tưởng trở thành ngôn ngữ dễ học, dễ đọc với người bắt đầu lập trình Các đặc điểm Python là: • Dễ học, dễ đọc So với ngơn ngữ lập trình phổ biến khác Java, C++ hay C#, Python dễ sử dụng nhiều nhờ cú pháp rõ ràng, dễ hiểu Python thường sử dụng từ khóa tiếng Anh thay kí hiệu cấu trúc cú pháp phức tạp số ngôn ngữ khác Hình 2: In "Hello World" Java Python • Miễn phí, mã nguồn mở Python ngơn ngữ lập trình miễn phí với mã nguồn mở, sử dụng thay đổi mã nguồn Nhờ ngơn ngữ có cộng đồng người dùng lớn • Có tính mở rộng Người dùng tích hợp vào Python nhiều hàm sử dụng C, C++,… liên kết trình thơng dịch với ứng dụng C để sử dụng phần mở rộng • Khả di chuyển Các chương trình viết Python chạy nhiều tảng Windows, Linux, MacOS,… cách liền mạch mà không gặp vấn đề • Là ngơn ngữ lập trình thơng dịch (interpreted) bậc cao Một ngơn ngữ lập trình thơng dịch loại ngơn ngữ thực thi lệnh trực tiếp tự mà không cần biên dịch (compile) trước chương trình chuyển sang ngơn ngữ máy Là ngôn ngữ thông dịch, Python thực thi trực tiếp chương trình, tiến hành dịch câu lệnh sang chuỗi chương trình chuyển sang mã máy Điều giúp ngôn ngữ Python trở nên dễ thực hiện, tiết kiệm thời gian, cho phép hỗ trợ sử dụng nhiều tảng khác • Là ngơn ngữ lập trình hướng đối tượng (object-oriented) Ngơn ngữ Python hỗ trợ tính kỹ thuật lập trình hướng đối tượng, giúp người sử dụng giải vấn đề phức tạp cách trực quan Nhờ có lập trình hướng đối tượng, dự án Python dược mở rộng cách dễ dàng, có tính bảo mật tái sử dụng cao Ngoài chúng cịn giúp việc sửa lỗi (nếu có) trở nên dễ dàng so với lập trình hướng cấu trúc, đồng thời rút ngắn thời gian xây dựng, tiết kiệm tài nguyên hệ thống tăng suất thực • Thư viện tiêu chuẩn lớn Một thư viện tập hợp đoạn mã soạn sẵn sử dụng nhiều lần để giảm bớt thời gian lập trình cho người sử dụng Đây coi mạnh lớn Python Hiện Python có 100.000 thư viện khơng ngừng tăng thêm, với đa dạng tính từ tự động hóa, sở liệu xử lý văn bản,… Dù thư viện lõi xây dựng ngôn ngữ Python, thư viện cộng đồng người dùng tạo nên, thường ln có thư viện cho nhu cầu lập trình viên Python 1.1.3 Ứng dụng Python ngơn ngữ lập trình linh hoạt có nhiều ứng dụng sống, phần nhờ số lượng thư viện lớn không ngừng tăng lên Các ứng dụng Python kể đến như: • Lập trình Web Các framework Python Django hay Flask giúp cho việc xây dựng web Python trở nên dễ dàng Các nhà phát triển đưa ý tưởng trở thành thực thời gian ngắn nhờ công cụ cung cấp đầy đủ Python • Trí tuệ nhân tạo Máy học Các dự án Trí tuệ nhân tạo Máy học cần ngôn ngữ lập trình ổn định, linh động, bảo mật có công cụ cần thiết cho tác vụ đặc biệt Với nhu cầu kể trên, Python lựa chọn tốt • Phát triển ngơn ngữ lập trình khác Các ưu điểm Python nguồn cảm hứng đằng sau phát triển nhiều ngôn ngữ lập trình phổ biến khác Swift, Nim,… • Khoa học liệu Trực quan hóa liệu Dữ liệu mỏ vàng thời đại Python sử dụng để lấy lượng lớn liệu, trích xuất thơng tin quan trọng từ liệu trực quan hóa chúng để dự báo rủi ro, tăng lợi nhuận • Internet vạn vật (IoT) IoT ngày trở nên phổ biến, với nhiều ứng dụng khác từ đời sống hàng ngày tới doanh nghiệp Hầu hết thiết bị IoT điều khiển dòng code Python • Tính tốn khoa học Python cơng cụ quan trọng tính tốn khoa học, cung cấp khung cho ứng dụng tính tốn xử lý liệu khoa học • … 1.1.4 Một số ví dụ • Chuyển đổi từ giây sang def chuyển_đổi(giây): giây = giây % (24 * 3600) = giây // 3600 giây %= 3600 phút = giây // 60 giây %= 60 return "%d:%02d:%02d" % (giờ, phút, giây) #Ví dụ n = 654321 print(chuyển_đổi(n)) Output: 13:45:21 • Tính tiền lãi ngân hàng def tiền_lãi(gốc, lãi_suất, tháng): gốc_và_lãi = gốc * (pow((1 + lãi_suất / 100), tháng)) lãi = round(gốc_và_lãi - gốc,2) print("Tiền lãi sau", tháng, "tháng là", lãi) #Ví dụ tiền_lãi(10000, 10, 6) Output: Tiền lãi sau tháng 7715.61 1.2.3 Ứng dụng phân tích liệu Sử dụng phân tích liệu, ta rút thông tin quan trọng từ liệu thơ mà phương pháp khác khơng thể tìm Một vài ứng dụng phân tích liệu thực tế là: • Internet Băng thơng cấp phát tới khu vực dựa liệu lưu lượng sử dụng khoảng thời gian ngày • Phát rủi ro Các doanh nghiệp sử dụng phân tích liệu để đề phịng rủi ro lừa đảo, thị trường xuống,… • An ninh Phép phân tích dự đốn nhiều nơi sử dụng để dự đoán tỉ lệ tội phạm khu vực dựa liệu q khứ • Giao thơng cơng cộng Dựa liệu số người sử dụng khoảng thời gian để cung cấp đủ số lượng phương tiện, đảm bảo giao thơng thơng suốt • Logistics vận chuyển Các cơng ty sử dụng phân tích liệu để tìm tuyến đường vận chuyển tốt nhất, thời gian giao hàng dự kiến, định vị vị trí trực tiếp chuyến hàng để đảm bảo không bị thất lạc hàng hóa • … 17 Sử dụng Python phân tích liệu 2.1 Đặc điểm Có nhiều cơng cụ sử dụng phân tích liệu R, Tableau Public, Excel,… Song báo cáo em sử dụng Python một ngôn ngữ dễ sử dụng nhiều người sử dụng Python công cụ hữu hiệu phân tích liệu nhờ ưu điểm sau: • Đơn giản Python tập trung vào đơn giản, dễ đọc, cú pháp rõ ràng Do đó, lựa chọn tốt cho người bắt đầu so với công cụ khác Với yêu cầu ta viết chương trình cho Python nhanh nhiều so với sử dụng C++ hay Java • Được hỗ trợ đầy đủ Tuy đơn giản song Python có nhiều thư viện để sử dụng phân tích liệu SciPy, NumPy, Pandas, Matplotlib,… Số lượng thư viện không ngừng tăng lên với số lượng người dùng, đảm bảo Python đáp ứng nhu cầu trình sử dụng Một số kể đến như: o NumPy: thư viện ứng dụng phân tích liệu Đây thư viện toán học phổ biến mạnh mẽ cho phép làm việc hiệu với ma trận mảng với tốc độ xử lý nhanh nhiều lần o Pandas: xây dựng dựa NumPy, dùng cho nhiều tác vụ, từ nhập liệu từ bảng tính Excel tới xử lý liệu theo thời gian o Matplotlib: thư viện vẽ biểu đồ, dựa thư viện SciPy để phân tích liệu khoa học o … 18 • Hỗ trợ đa mơ hình lập trình Nhờ mà Python hỗ trợ lập trình hướng đối tượng lẫn lập trình hướng khía cạnh Ví dụ với chương trình “Hello World”, Java ta phải lập class riêng, cịn Python khơng cần thiết • Tích hợp ứng dụng doanh nghiệp (EAI) Python nhúng nhiều ứng dụng khác nhau, dù viết ngôn ngữ lập trình khác, dó cơng cụ tốt cho EAI • Mã nguồn mở Python chạy đa dạng môi trường, từ Windows tới Linux Jupyter Notebook công cụ phổ biến người lập trình Python, giúp trình bày code, văn bản, hình ảnh, cơng thức,… theo cách trực quan Ngoài ra, dựa Jupyter Notebook, ta cịn có Google Colaboratory (hay Google Colab) với khả điện toán đám mây, cho phép chạy Jupyter Notebook xử lý hiệu suất cao Google lưu trữ chúng Google Drive Tất phần mềm miễn phí • Tính mềm dẻo, khả mở rộng Python sử dụng để giải nhiều vấn đề nhiều lĩnh vực khác nhau, với tốc độ nhanh công cụ khác Tuy nhiên Python khơng phải khơng có nhược điểm Nó sử dụng tương đối nhiều nhớ tạo nhiều thư mục rác Python ngơn ngữ dynamic typing, làm chậm q trình tìm kiểu lỗi liệu liên quan tới việc đặt liệu khác vào kiểu biến 19 2.2 Ứng dụng: Trực quan hóa liệu (data visualization) Để thực phép phân tích liệu đưa dự đoán, đề xuất, việc trực quan hóa liệu cần thiết để hình dung mối quan hệ liệu Sử dụng biểu đồ, đồ thị để trực quan hóa liệu giúp liệu phức tạp trở nên dễ hiểu dễ tiếp cận Vitaly Friedman cho mục đích việc trực quan hóa liệu để truyền đạt thông tin cách rõ ràng thông qua biểu đồ, để đạt điều biểu đồ cần phải vừa có tính thẩm mỹ vừa có hiệu cao Python cung cấp nhiều thư viện giúp trực quan hóa đa dạng loại liệu khác tùy theo nhu cầu người sử dụng: bokeh, ggplot, seaborn,… Tuy nhiên thư viện sử dụng phổ biến matplotlib Đây thư viện vẽ đồ thị mạnh mẽ hữu ích Nó cung cấp giao diện lập trình ứng dụng (API) hướng đối tượng để nhung biểu đồ vào ứng dụng Được đời từ năm 2003, matplotlib coi thư viện trực quan hóa liệu Python Hiện nay, dựa matplotlib, nhiều thư viện khác xây dựng để hỗ trợ tốt cho nhu cầu người sử dụng Hình 3: Một số biểu đồ dựng matplotlib Sau em sử dụng matplotlib để vẽ số biểu đồ đơn giản 20 2.2.1 Biểu đồ đường (line chart) Biểu đồ sau diễn tả giá cổ phiếu Apple Inc (mã chứng khoán: AAPL) tháng đầu năm 2021 import matplotlib.pyplot as plt from pandas_datareader import data import datetime start_date = datetime.datetime(2021,1,1) end_date = datetime.datetime(2021,6,1) df = data.DataReader(name="AAPL", data_source="yahoo", start=start _date, end=end_date) plt.plot(df['Close'].tail(100)) plt.ylabel('Giá') plt.xlabel('Thời gian') plt.title('Giá chứng khốn Apple Inc tháng đầu năm 2021') Hình 4: Biểu đồ đường Từ biểu đồ ta dễ dàng thấy giá cổ phiếu Apple Inc năm 2021 cao vào khoảng cuối tháng thấp vào tháng Hiện giá cổ phiếu dao động khoảng mức 120-130$ 21 2.2.2 Biểu đồ cột (bar chart) Biểu đồ sau so sánh giá cổ phiếu Microsoft (mã chứng khoán: MSFT) Facebook (mã chứng khoán: FB) ngày từ 21-25/06/2021 import pandas import datetime from pandas_datareader import data from pandas import Series, DataFrame start = datetime.datetime(2021, 6,21) end = datetime.datetime(2021, 6, 25) df = data.DataReader(["MSFT", "FB"], 'yahoo', start, end) df = df['Close'] ax = df.plot( kind='bar') ax.set_xticklabels(df.index.format(), rotation=30, size=10) plt.locator_params(axis='x', nbins=30) plt.legend(bbox_to_anchor=(1.05, 1)) Hình 5: Biểu đồ cột 22 2.2.3 Biểu đồ tròn (pie chart) Biểu đồ sau thể ngơn ngữ lập trình sử dụng phổ biến giới, số liệu lấy vào tháng 05/2021 import matplotlib.pyplot as plt import numpy as np x = np.array([13.38, 11.87, 11.74, 7.81, 4.41, 50.79]) mylabels = ["C", "Python", "Java", "C++", "C#", "Khác"] myexplode = [0, 0.3, 0, 0, 0, 0] plt.pie(x, labels = mylabels, autopct = '%1.1f%%', explode = myexplode) plt.show() Hình 6: Biểu đồ trịn Từ biểu đồ thấy Python ngơn ngữ lập trình phổ biến thứ hai giới, sau ngơn ngữ C Ngồi ngơn ngữ C, Python, Java, C++ C# chiếm tỉ lệ gần với tất ngôn ngữ lập trình khác 23 2.3 Ví dụ: Xây dựng biểu đồ phân tích chứng khốn Để tìm hiểu thị trường chứng khoán, trước hết ta phải biết cách đọc biểu đồ chứng khoán Ở em sử dụng biểu đồ hình nến Đây loại biểu đồ mơ tả chuyển động giá chứng khốn khứ Biểu đồ biểu diễn giá đóng cửa, mở cửa, giá cao thấp theo ngày chứng khốn Hình 7: Một biểu đồ dạng hình nến Hình 8: Diễn giải biểu đồ hình nến 24 Trong biểu đồ nến, nến kết hợp thân nến bóng nến Khối lớn (thân nến) thể biên độ giá mở cửa giá đóng cửa Nếu khối có màu xanh nghĩa giá mở cửa thấp giá đóng cửa, ngược lại khối có màu đỏ nghĩa giá mở cửa cao giá đóng cửa Bóng nến thể giá cao bóng nến thể giá thấp phiên giao dịch Loại biểu đồ có ưu điểm dễ đọc hình dung Sau em sử dụng Python để xây dựng biểu đồ hình nến dựa liệu chứng khoán thực tế Dữ liệu sử dụng cơng ty Alphabet (mã chứng khốn: GOOG) khoảng thời gian từ ngày 01/01/2021 đến ngày 01/06/2021 Dữ liệu lấy nguồn từ Yahoo, phần lập trình sử dụng Jupyter Lab Các bước tiến hành sau: • Nhập thư viện pandas_datareader, datetime, bokeh.plotting from pandas_datareader import data import datetime from bokeh.plotting import figure, show, output_file • Đặt ngày bắt đầu ngày kết thúc việc lấy liệu start_date = datetime.datetime(2021,1,1) end_date = datetime.datetime(2021,6,1) • Lập bảng df với mã chứng khoán GOOG, nguồn liệu Yahoo df = data.DataReader(name="GOOG", data_source="yahoo", start=start_date, end=end_date) 25 Hình 9: Bảng liệu df • Tạo hàm tính biên độ giá mở cửa đóng cửa def inc_dec(c, o): if c > o: value="Increase" elif c < o: value="Decrease" else: value="Equal" return value • Xây hệ trục tọa độ cho biểu đồ hàm figure p = figure(x_axis_type='datetime', width=1000, height=300) p.title.text = " Biểu đồ hình nến" 26 • Dựng bóng nến p.segment(df.index, df.High, df.index, df.Low, color="Black") • Dựng thân nến: trục x ngày, trục y giá trị trung bình giá mở cửa đóng cửa (Middle), chiều cao nến biên độ giá (Height) df["Middle"] = (df.Open+df.Close)/2 df["Height"] = abs(df.Close-df.Open) • Đặt màu cho nến df["Status"]=[inc_dec(c,o) for c, o in zip(df.Close,df.Open)] #tăng p.rect(df.index[df.Status=="Increase"],df.Middle[df.Status=="Incre ase"],hours_12, df.Height[df.Status=="Increase"],fill_color="#3FFF 0A", line_color="black") #giảm p.rect(df.index[df.Status=="Decrease"],df.Middle[df.Status=="Decre ase"],hours_12, df.Height[df.Status=="Decrease"],fill_color="#FF33 33", line_color="black") Hình 10: Kết 27 Tồn đoạn code: from pandas_datareader import data import datetime from bokeh.plotting import figure, show, output_file start_date = datetime.datetime(2021,1,1) end_date = datetime.datetime(2021,6,1) df = data.DataReader(name="GOOG", data_source="yahoo", start= start_date, end=end_date) def inc_dec(c, o): if c > o: value="Increase" elif c < o: value="Decrease" else: value="Equal" return value df["Status"]=[inc_dec(c,o) for c, o in zip(df.Close,df.Open)] df["Middle"] = (df.Open+df.Close)/2 df["Height"] = abs(df.Close-df.Open) p = figure(x_axis_type='datetime', width=1000, height=300) p.title.text = "Biểu đồ hình nến" 28 hours_12=12*60*60*1000 p.segment(df.index, df.High, df.index, df.Low, color="Black") #tăng p.rect(df.index[df.Status=="Increase"],df.Middle[df.Status==" Increase"],hours_12, df.Height[df.Status=="Increase"],fill_co lor="#3FFF0A", line_color="black") #giảm p.rect(df.index[df.Status=="Decrease"],df.Middle[df.Status==" Decrease"],hours_12, df.Height[df.Status=="Decrease"],fill_co lor="#FF3333", line_color="black") output_file("chart.html") show(p) 29 KẾT LUẬN Qua thời gian thực nghiên cứu, tìm hiểu chủ đề “Python Phân tích liệu”, nhìn chung em hiểu ngành phân tích liệu nói chung, ngơn ngữ Python ứng dụng phân tích liệu nói riêng Đây lĩnh vực khơng mới, song tiềm khai thác cịn nhiều Phân tích liệu ngày đóng vai trị quan trọng thời đại này, Python công cụ đắc lực cho việc Ngơn ngữ tiếp tục phát triển, cung cấp thêm giải pháp nhanh hơn, hiệu cho người sử dụng, hứa hẹn ngày ứng dụng rộng rãi nhiều lĩnh vực khác 30 TÀI LIỆU THAM KHẢO Alvaro Fuentes, Become a Python Data Analyst, Packt Publishing, US, 2018 Vitaly Friedman, “Data Visualization and Infographics”, Smashing Magazine, January 14, 2008 Yves Hilpisch, Python for Finance: Analyze Big Financial Data, O'Reilly Media, US, 2015 Jeff Leek, The Elements of Data Analytic Style, Lulu, US, 2015 Michael Lewis-Beck, Data Analysis: An Introduction, SAGE, US, 1995 31 ... ? ?Python Phân tích liệu? ??, nhìn chung em hiểu ngành phân tích liệu nói chung, ngơn ngữ Python ứng dụng phân tích liệu nói riêng Đây lĩnh vực khơng mới, song tiềm khai thác cịn nhiều Phân tích liệu. .. Xử lý liệu quan trọng, chiếm 60% tồn việc phân tích liệu Bước Phân tích liệu Với liệu qua xử lý, ta sử dụng kỹ thuật phân tích liệu để đưa nhận xét, đánh dự đốn Có thể kể đến kỹ thuật phân tích. .. liệu giải nghĩa Phân tích liệu chia thành dạng sau: • Phân tích mơ tả: Đây tảng cho việc tìm hiểu liệu, ứng dụng phổ biến phân tích liệu Đúng tên gọi, phân tích mô tả tổng kết liệu khứ để mô tả

Ngày đăng: 07/06/2022, 11:00

Xem thêm:

HÌNH ẢNH LIÊN QUAN

Hình 1: Sự tăng trưởng của các ngôn ngữ lập trình phổ biến - PYTHON TRONG PHÂN TÍCH DỮ LIỆU
Hình 1 Sự tăng trưởng của các ngôn ngữ lập trình phổ biến (Trang 6)
Hình 2: In &#34;Hello World&#34; trong Java và Python - PYTHON TRONG PHÂN TÍCH DỮ LIỆU
Hình 2 In &#34;Hello World&#34; trong Java và Python (Trang 7)
Hình 3: Một số biểu đồ được dựng bằng matplotlib - PYTHON TRONG PHÂN TÍCH DỮ LIỆU
Hình 3 Một số biểu đồ được dựng bằng matplotlib (Trang 21)
Hình 4: Biểu đồ đường - PYTHON TRONG PHÂN TÍCH DỮ LIỆU
Hình 4 Biểu đồ đường (Trang 22)
Hình 5: Biểu đồ cột - PYTHON TRONG PHÂN TÍCH DỮ LIỆU
Hình 5 Biểu đồ cột (Trang 23)
Hình 6: Biểu đồ tròn - PYTHON TRONG PHÂN TÍCH DỮ LIỆU
Hình 6 Biểu đồ tròn (Trang 24)
Hình 7: Một biểu đồ dạng hình nến - PYTHON TRONG PHÂN TÍCH DỮ LIỆU
Hình 7 Một biểu đồ dạng hình nến (Trang 25)
Hình 8: Diễn giải một biểu đồ hình nến - PYTHON TRONG PHÂN TÍCH DỮ LIỆU
Hình 8 Diễn giải một biểu đồ hình nến (Trang 25)
Hình 9: Bảng dữ liệu df - PYTHON TRONG PHÂN TÍCH DỮ LIỆU
Hình 9 Bảng dữ liệu df (Trang 27)
Hình 10: Kết quả - PYTHON TRONG PHÂN TÍCH DỮ LIỆU
Hình 10 Kết quả (Trang 28)

TỪ KHÓA LIÊN QUAN