Microsoft PowerPoint PYB L2 Python in Data Analytics pptx PYTHON IN DATA ANALYTICS LESSON 2 PANDAS Pandas là gì? Thư viện pandas trong python là một thư viện mã nguồn mở, hỗ trợ đắc lực trong thao t.
PYTHON IN DATA ANALYTICS LESSON PANDAS Pandas gì? Thư viện pandas python thư viện mã nguồn mở, hỗ trợ đắc lực thao tác liệu Đây công cụ phân tích xử lý liệu mạnh mẽ ngơn ngữ lập trình python Thư viện sử dụng rộng rãi nghiên cứu lẫn phát triển ứng dụng khoa học liệu Pandas sử dụng cấu trúc liệu riêng Series Dataframe Pandas cung cấp nhiều phương thức, toán tử xử lý làm việc cấu trúc liệu Dữ liệu kiểu series Series xem cấu trúc liệu với hai mảng: lưu mục, lại lưu liệu Được tạo cách sử dụng phương thức: pandas.Series( data=None, index=None, dtype=None, copy=False) Trong đó: data list, dictionary số index tập giá trị mục băm độ dài len(index) với len(data) dtype kiểu liệu đối số data copy có giá trị True/False, mặc định False Copy input data Có thể khởi tạo Series từ List Array Khi khơng gán mục cho đối tượng Serries pandas tự gán cho giá trị mặc định Thực cộng hai đối tượng Series S1 S2, giá trị mục giống cộng cho Nếu mục không tồn hai Series, giá trị cho Series NaN Truy xuất giá trị đơn nhiều giá trị Series qua số list số 10 So sánh chuỗi trả dataframe 20 Lấy giá trị cột trả dạng numpy array thư viện pandas python, sử dụng thuộc tính values 21 Thêm, sửa, xóa liệu dataframe Thêm cột từ liệu Thêm cột dựa vào liệu có 22 Khởi tạo cột có giá trị rỗng Xóa cột dataframe 23 Xóa ghi (dòng) theo số 24 Phương thức dataframe Sử dụng hàm describe() để lấy phương thức thống kê 25 Xem chi tiết theo cột 26 Thực hành (1) Cho file liệu: cars_dataset.csv Câu 1: Đọc in liệu 10 dòng Câu 2: In loại xe có price lớn Câu 3: In tất dòng xe hãng Toyota Câu 4: Đếm in tổng số dòng xe hãng Câu 5: Tìm in dịng xe có giá (price) cao hãng xe Câu 6: Tìm in average-mileage trung bình hãng xe 27 Tạo dataframe Tạo dataframe từ dict: peoples = {… } df = pd.DataFrame(peoples) print(df) 28 Tạo dataframe từ list: txts = [… ] labels = [……] df = pd.DataFrame() df['txt'] = txts df['label'] = labels print(df) 29 Sắp xếp dataframe 30 Nối data frame 31 Xáo trộn ghi 32 Lưu dataframe file csv Các tham số hàm to_csv tương tự với hàm read_csv 33 Thực hành (2) Câu 1: Cho dict sau: EuroCars = {'Company': [‘Land Rover', ‘BMW', ‘Audi', ‘Merc'], 'Price': [56845, 261963, 314722 , 431611]} AsiaCars= {'Company': [‘Huyndai', ‘Toyota', ‘Kia', ‘Vinfast'], 'Price': [36595, 43718, 26530 , 8900]} Hãy viết lệnh python dùng pandas file *.csv có kết sau: 34 ... pandas.Series( data= None, index=None, dtype=None, copy=False) Trong đó: data list, dictionary số index tập giá trị mục băm độ dài len(index) với len (data) dtype kiểu liệu đối số data copy... 1: Đọc in liệu 10 dịng Câu 2: In loại xe có price lớn Câu 3: In tất dòng xe hãng Toyota Câu 4: Đếm in tổng số dòng xe hãng Câu 5: Tìm in dịng xe có giá (price) cao hãng xe Câu 6: Tìm in average-mileage... trung bình hãng xe 27 Tạo dataframe Tạo dataframe từ dict: peoples = {… } df = pd.DataFrame(peoples) print(df) 28 Tạo dataframe từ list: txts = [… ] labels = [……] df = pd.DataFrame() df['txt']