1. Trang chủ
  2. » Luận Văn - Báo Cáo

group project data visualization

124 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Group Project Data Visualization
Tác giả Nguyen Duc Cong, Nguyen Trung Hieu, Nguyen Thi Ngoc Minh
Người hướng dẫn Nguyen Van Chuc
Chuyên ngành Software Engineering
Thể loại Group Project
Định dạng
Số trang 124
Dung lượng 38,82 MB

Cấu trúc

  • I. Giới thi u v ệ ề Ta bleau và Data Visualization (0)
    • 1. Data Visualization (5)
    • 2. Công cụ trực quan hóa dữ liệu: Tableau (6)
  • II. Tableau Desktop Installation (9)
    • 1. Cài đặt Tableau (9)
    • 2. Tìm hiều về Tableau (9)
  • III. Data Visualization using Tableau (13)
    • 1. Tableau – Visualization (13)
    • 2. Tableau – Applying Visualization (14)
    • 3. Các hàm trong Tableau (14)
  • IV. Components of Tableau (21)
    • 1. Tableau Product Family (21)
    • 2. Ưu điểm của Tableau (22)
    • 3. Thành tựu của Tableau (0)
  • V. Demo- US Crime Dataset (24)
  • V. Charts & Graphs (36)
    • 1. Generated Fields in Tableau & Used Cases of Generated Fields (36)
    • 2. Building Charts in Tableau (39)
  • VI. Features of Tableau (45)
  • VII. Dashboarding in Tableau (46)
  • VIII. Functions (70)
    • 1. Number Function (70)
    • 2. String Function (80)
    • 3. Data Function (86)
    • 4. Type Conversion Functions (92)
    • 5. Aggregation Functions (94)
    • 6. Logical Functions (98)
  • IX. Level of Detail (103)
    • 1. Introduction to Level of Detail (LOD) (103)
    • 2. Include Calculation (104)
    • 3. Exclude Calculation (108)
    • 4. Fixed Calculation (109)
  • X. Parameters (111)
    • 1. What are Parameters in Tableau? (111)
    • 2. Getting Started on the Desktop (112)
    • 3. Creating a parameter in Tableau (112)
    • 1. Objective of Data Blending (118)
    • 2. Introduction to Data Blending (118)
    • 3. Joining vs Blending in Tableau (118)
    • 4. Blending Data in Tableau (121)
    • 5. Limitations of Data Blending (123)

Nội dung

- Data Visualization được d ch là trị ực quan hóa dữ liệu, là cách bi u di n d ệu dưới các hình ảnh, ể ễ ữlibiểu đồ, bảng đồ trực quan.. ẽ ể ố- Sau khi biểu diễn những điểm đó lên trụ ọa

Giới thi u v ệ ề Ta bleau và Data Visualization

Data Visualization

a Data Visualization - Trực quan hóa dữ liệu là gì?

- Data Visualization được d ch là trị ực quan hóa dữ liệu, là cách bi u di n d ể ễ ữliệu dưới các hình ảnh, biểu đồ, bảng đồ trực quan T ừ đó, truyền t i thông ả tin đến người xem một cách sinh động hơn, dễ hiểu hơn

- Có thể hiểu đơn giản, Data Visualization là dùng các biểu đồ, bảng đồ, đồ thị để bi u th s ể ị ốliệu thay vì s d ng các con sử ụ ố Giúp người xem, người đọc có th hiể ểu được nội dung được truyền đạt, nắm bắt thông tin, khai thác tối ưu dữliệu b Tầm quan trọng c a Data Visualization ủ

(*) Bây gi chúng ta hãy l y m t ví dờ ấ ộ ụ:

Ở Hình 1, chúng ta có một tập dữ liệu tọa độ XY các góc phần tư của Anscombe Khi nhìn vào tọa độ của các điểm này bạn sẽ thấy rằng hầu như không có nhiều sự khác biệt trong các giá trị này Và khi biểu diễn các điểm này lên trên một hệ trục tọa độ thì sự giống nhau của chúng sẽ càng thể hiện rõ hơn.

- Sau khi biểu diễn những điểm đó lên trụ ọa độ thì ta thu được đồ thị như trong hình sốc t (2), nhìn bằng mắt thường ta có thể hoàn toàn thấy được chúng khác nhau như thế nào, m c dù các ặ con s trông khá gi ng nhau ố ố Đó là lý do vì sao bạn c n ph i trầ ả ực quan hóa để hiểu nó Bạn sẽ không thể đánh giá đúng được toàn b b c tranh nộ ứ ếu như bạn ch nhìn vào nh ng con s ỉ ữ ố Nhưng khi bạn vẽ nó ra, bạn có thể thấy chúng khác nhau như thế nào

➔ Đó là lý do tại sao tr c quan hóa d ự ữliệu l i quan trạ ọng và đượ ử ục s d ng nhi u ề

- Với Data Visualization, b n có th : ạ ể

+ D dàng phân tích các d ễ ữliệ ớu l n c a công ty ủ

+ Xác định trước các xu hướng trong tương lai

+ Xác định các mối tương quan

+ Tăng khả năng truyề ải thông điện t p tới những đối tượng khác

+ Đưa ra các quyết định dựa trên dữ liệu

+ Đánh giá bằng con số các kết quả của nỗ lực của bạn c Data Visualization hoạt động như thế nào?

- Dữ liệu là m t dataset, nó có th ộ ể ở dạng tệp văn bản, trang tính Excel, cũng có thể ế ố k t n i với b t kì máy ch ho c b t ấ ủ ặ ấ kì cơ sở dữ liệu nào, có thể kết hợp và kết nối các tập dữ liệu v i nhau ớ

- Sau đó phân tích dữ ệu đó theo các li tham s , th c hi n visualization v cách ố ự ệ ề thể ệ hi n những gì đã phân tích

- Analyzing sử dụng các công thức, thuật toán khác nhau để phân tích và để trực quan hóa d ữliệu

- Bạn có thể chọn các charts hoặc maps graphs khác nhau, hoặc bất cứ thứ gì bạn muốn, tùy thuộc vào sự phù h p v i t p d ợ ớ ậ ữliệu đang sử dụng.

Công cụ trực quan hóa dữ liệu: Tableau

a Tại sao nên sử dụng Tableau?

- Tableau được công nh n là TOP 1 trong Gartner Magic Quadrant* v BI Tool bậ ề ảy năm liên tiế ừp t

2012 đến 2019 Tableau mang đến đầy đủ ứng dụng phục vụ nhu cầu phân tích & tr c quan hóa d ự ữ liệu:

(*) Xem xét các chức năng của Tableau:

- Thứ nh t Tableau r t linh ho t (Flexibility): có ấ ấ ạ thể k t n i v i b t k ế ố ớ ấ ỳloại d ữliệu nào Nó bao gồm số lượng k t n i dế ố ữ liệu tối ưu hóa cho cơ sở ữ d liệu

- Tableau cung cấp cho người dùng m t n n t ng ộ ề ả rất trực quan (Intuitive platform)

- Tableau th c s ự ự được coi là tiêu chu n vàng cho ẩ phân tích hình ảnh tương tác trực quan

- Quick production time: ch mỉ ất vài giây để Tableau cho ra visualization khi đưa dữliệu vào

➔ T t c nh ng thao tác vấ ả ữ ới các tính năng trên Tableau phầ ớn đền l u th c hi n b ng thao tác ự ệ ằ kéo th ả đơn giản, nhanh chóng b Tableau là gì?

- Tableau là một phần mềm được tạo b i mở ột công ty cùng tên ở

Washington, M Ph n mỹ ầ ềm này liên quan đến data visualization

(trực quan hóa dữ liệu) - Nó được thiết kế để giúp người dùng tạo hình ảnh và đồ họa mà không c n s ầ ựtrợ giúp c a bủ ất kỳ l p trình viên ậ nào ho c b t k ki n ặ ấ ỳ ế thức nào trước đây về lập trình Bằng cách này, nó giúp cho quá trình nghiên c u d ứ ữliệu s , gi i quy t vố ả ế ấn đề ừ đó , t giúp mọi người và các t ổchức khai thác tối đa dữ liệu c a h ủ ọ

- Tableau cung cấp năm sản phẩm chính: Tableau Desktop, Server, Reader, Online và Public Mỗi sản ph m nhẩ ắm vào đối tượng khách hàng m c tiêu khác nhau và th c hi n các chụ ự ệ ức năng khác nhau để hiển thị dữ liệu tốt hơn. c Kiến trúc của Tableau

Tableau có th ể được phân loại thành ba phân đoạn chính, bao gồm:

- Tableau Desktop and the clients

(*) Data source là nơi người dùng có th trích xu t d ể ấ ữliệu t các tùy ch n ngu n d ừ ọ ồ ữliệu có sẵn như tệp SAP, Oracle, SalesForce, Excel, MySQL, Teradata, v.v Một người dùng có th thi t l p k t nể ế ậ ế ối dữ liệu theo hai cách; M t k t n i d ộ ế ố ữliệu tr c ti p s g i các truy v n live ự ế ẽ ử ấ đến ngu n d ồ ữliệu và nh n ậ được k t qu ngay l p tức M t cách khác là trích xu t d li u t ngu n d li u và có m t b n sao ế ả ậ ộ ấ ữ ệ ừ ồ ữ ệ ộ ả cục bộ của nó dướ ạng cơ ở ữ liệu tạm thời Dữ liệu có thể được tìm nạp thông qua kết nối trực i d s d tiếp ho c khai thác vào c Tableau Desktop và Tableau Server ặ ả

(*) Tableau Desktop là n n tề ảng mà qua đó người dùng gets the ball rolling để thực hi n các hành ệ động ti p theo Bởi vì tùy thu c vào yêu c u cế ộ ầ ủa người dùng, các hành động cho tấ ảt c các thành phần kiến trúc khác được gán Tableau Desktop hoạt động như một công cụ tác giả, nơi người dùng tạo visualizations, workbooks, and dashboards b ng cách s d ng d ằ ử ụ ữliệu t data source in Tableauừ Các workbooks ho c visualizations này có thặ ể được chia sẻ cho người dùng theo nhi u cách Nó có ề thể được chia s cho static users (chẻ ỉ để xem), cho web ho c mobile client Workbook packages có ặ thể được chia s cho Tableau Reader ẻ nơi người dùng có thể xem cũng như chỉnh sửa trực quan hóa Ngoài ra, tr c quan hóa có th ự ể được xu t b n ho c t i vào Tableau Server ấ ả ặ ả

(*) Tableau Server có nhi u components làm vi c cùng nhau khi nó qu n lý m t lo t các quá trình ề ệ ả ộ ạ quan tr ng Nó có các component ọ chăm sóc người dùng và b o m t dả ậ ữ liệu, một kho lưu trữ lưu trữ tất c các visualization ả được xu t bấ ản đến Server, b nh ộ ớ cache để cả ếi ti n hi u suệ ất, người qu n lý / ả tự động hóa để quản lý tải dữ liệu và c p nh t l ch trình, m t l p trình bày ch u trách nhi m cho tậ ậ ị ộ ớ ị ệ ất cả các hoạt động liên quan đến visualization/presentation Tableau Server chủ yếu phục vụ cơ sở dynamic user c a web và mobile customer ủ tương tác vớ ữi d liệu trên Tableau platforms

End users interact primarily with Tableau Server to access workbooks or visualizations The server components then work on the client's behalf to retrieve and process the results.

Tableau Desktop Installation

Cài đặt Tableau

B1: Truy c p vào Tableau ậ website và t i xu ng file exe ả ố

B2: Chạy file exe và cài đặt

- Sau khi cài đặt Tableau Desktop, phiên b n m i nhả ớ ất là 2021.4.4

- Sau đó, ứng d ng s yêu cụ ẽ ầu đăng ký để kích hoạt ứng dụng

- B n phạ ải có license key để kích ho t, n u b n là sinh viên thì có th s d ng email vạ ế ạ ể ử ụ ới đuôi edu để được kích ho t mi n phí trong vòng mạ ễ ột năm.

Tìm hiều về Tableau

Cách để kết nối các Datasource khác nhau với Tableau

- Khi b n mạ ở Tableau, điều đầu tiên b n nhìn th y là ạ ấ các tùy ch n connection, ọ bạn có th k t n i v i b t kì ể ế ố ớ ấ file, b t k server nào ấ ỳ

- Nếu bạn đã có sẵn Dataset trong máy, b n ch c n duyạ ỉ ầ ệt đến v trí t p và m tị ệ ở ệp đó

Ví d : Chúng ta có mụ ột dataset “Sample -

- Sau khi k t n i thành công ế ố với dataset, thì ta có th ểthấy tên c a ủ dataset trong dashboard và chúng ta cũng có thể đổi tên cho dataset này n u b n mu n ế ạ ố

- B n có thạ ể thấy b n xem ả trước của các trường và thuộc tính khác nhau c a dataset ủ b Tableau Datatypes

- Tableau cũng có các kiểu dữ liệu khác nhau, dưới đây là những ki u d ể ữliệu s x lý: ẽ ử

- Tableau có cái hay là nó tự động phát hiện và điền kiểu dữ liệu khi bạn nh p dataset vào ậ c Tableau Desktop UI

Khi b n m worksheet, s xu t hi n mạ ở ẽ ấ ệ ột dashboard như hình dưới: d Tableau UI - Dimensions & Measures

Khi k t n i vế ố ới data source trong Tableau, các cột được chia thành Dimensions và Measures

- Dimensions là một trường v i biớ ến độ ậc l p

+ Ki u d ể ữliệu có th là string, geographic locations, number, ể daytime, …

+ Dimensions đượ ử ụng đểc s d trình bày chi ti t d ế ữliệu c a b n ủ ạ

- Measures là một trường với phụ thu c và giá tr c a nó là m t hàm ộ ị ủ ộ của một hoặc nhiều Dimensions

+ Trong Measures, t t c các ki u d ấ ả ể ữliệu đều là s ố + Để đại di n cho m t Measures, luôn luôn c n Dimension ệ ộ ầ

- Đểthấy s liên k t gi a Measures và Dimension, chúng ta hãy l y ự ế ữ ấ một ví d v doanh s bán hàng sales ụ ề ố –

+ Giả ử ạ s b n thấy được doanh s ố bán hàng 10.000$ nhưng chỉ ới v con s ố như này thì bạn không th ể nào hình dung ra được b c tranh toàn ứ cảnh về bất cứ điều gì

+ Nhưng khi bạn nhóm doanh s bán hàng theo Region (khu v c) ho c sales theo Product ID thì ố ự ặ nó s giúp b n thêm chi ti t trong ph n trình bày d ẽ ạ ế ầ ữliệu

→Đó là cách bạn có được bức tranh rõ ràng về dữ liệu của mình khi được đại diện bởi các

Dimension khác nhau Đây cũng là những gì đượ ử ụng đểc s d phân tích dữ liệu e Tableau UI - Show me data

- Show Me in Tableau hi n th tể ị ất cả các hình ảnh trực quan có thể có cho dataset của bạn

Khi b n ch n m t dataset, nó s t+ ạ ọ ộ ẽ ự động đánh dấu dữ liệu mà bạn có th s dể ử ụng để đại di n cho nó ệ

- Các hình ảnh trực quan được đánh dấu là những hình ảnh hiện có s n cho vi c l a ch n dimensions và measures hi n tẵ ệ ự ọ ệ ại.

Trong hình bên, bộ dataset hiển đồ mờ và bộ dataset khác thì không Nếu bộ dataset của bạn hiển thị mờ thì điều này có thể hiểu rằng dataset của bạn không tương thích để sử dụng những loại biểu đồ đó.

Data Visualization using Tableau

Tableau – Visualization

Trong mô-đun phần m m Tableau này, chúng ta s tìm hi u m t trong nh ng menu quan tr ng nhề ẽ ể ộ ữ ọ ất của Tableau Show Me Menu.

Tableau – Applying Visualization

Dưới đây là bảng phân tích về những hình ảnh trực quan hóa phù hợp với các loại dataset nào nhất:

Các hàm trong Tableau

Hàm Join và Union được sử dụng để thực hiện các thao tác kết hợp các data lại với nhau

Hàm Joins cho phép liên kết các cột trong SQL để truy xuất dữ liệu từ nhiều bảng Có các loại Join phổ biến như inner join, full outer join, left join, right join Mỗi loại Join có mục đích khác nhau trong việc kết hợp các hàng dữ liệu giữa các bảng.

- Union dùng để kết h p dợ ữ liệu bằng cách nối các dòng c a m t b ng vào m t b ng khác Vủ ộ ả ộ ả ới điều kiện là bảng mà bạn union có cùng số fie , cùng tênld field v các field có cùng ki u d à ể ữliệu b Sort

- Bạn có th s p x p các m c trong b ng dể ắ ế ụ ả ựa trên một measure đượ ử ục s d ng trong ch ế độ xem Sort cho phép b n ki m soát th t mà các dimension members ạ ể ứ ự được li t kê trong b ng và ệ ả thường có th ti t l m i quan h giể ế ộ ố ệ ữa các trường

- Khi xem trực quan hóa, d ữliệu có th ể đượ ắc s p x p t các tùy ế ừ chọn nh p chu t t axis, header ấ ộ ừ hoặc field lable Trong môi trường aothoring, các tùy ch n b sung bao gọ ổ ồm sắp x p th công ế ủ trong các headers và legends, s d ng các bi u tử ụ ể ượng s p x p t thanh toolbar hoắ ế ừ ăc sắp xếp từ sort menu

(*) Quickly sort t axis, header, ho c field label ừ ặ

Có nhiều cách để s p x p m t hình ắ ế ộ ảnh tr c ự quan v i các nút s p x p nh p chu t duy ớ ắ ế ấ ộ nhất

Trong mọi trường h p, ợ một l n nhầ ấp sắp xếp tăng dần, hai l n nhầ ấp sắp xếp giảm dần và ba l n nhầ ấp xóa sắp xếp

Sắp x p s c p nh t chính xác n u d ế ẽ ậ ậ ế ữ liệu cơ bản thay đổi

B1: Di chu t qua m t tr c sộ ộ ụ ố để ể hi n th bi u ị ể tượng s p x p ắ ế

B2: Nhấn vào biểu tượng để ắ s p x p ế

- Trong ví dụ này, sắp xếp được áp dụng cho Color (sắp x p các hàng) d a trên các giá ế ự trị cho Metric A

B1: Di chu t qua mộ ột tiêu đề để hi n ể thị biểu tượng s p x p ắ ế

B2: Nhấn vào biểu tượng để s p x p ắ ế

- Trong ví dụ này, sort được áp dụng cho Materi (sal ắp xếp thứ tự c a các củ ột Paint, Fabric, Paper gi m d n) d a trên giá tr c a Green ả ầ ự ị ủ

(3) Sắp x p theo field lab ế el

B1: Di chu t qua field label ộ để ệ hi n bi u tể ượng s p x p ắ ế

- Biểu tượng s p x p cắ ế ủa field label hơi khác so v i header ớ và axis Mặc định là s p x p theo th t ắ ế ứ ựchữ cái, nhưng cũng có một menu nơi bạn có th ểchọn s p x p theo m t field trong d ng ắ ế ộ ạ xem

B2: Nh p vào bi u tấ ể ượng A-Z để ắ s p x p ế theo th t b ng ch cáo ho c m menu ứ ự ả ữ ặ ở để xem danh sách các field có th s p x p ể ắ ế theo sau đó chọn một field Biểu tượng chuyển sang biểu tượng thanh và bạn có thể nhấp để sắp x p ế

- Trong ví dụ này, cách sắp x p ế được áp d ng cho dimension ngoài cùng (Hue) d a trên Metric B (Metric ụ ự B được tổng hợp cho t t c các màu trong mấ ả ỗi màu và Hue được s p xắ ếp Do đó, màu tím trước tiên là màu xanh lục, sau đó là màu xanh lam.)

(1) Sort buttons on the toolbar

(tăng hoặc giảm dần) ên thanh tr công c ụ

(2) Sort theo cách kéo thả field lable trong m t c t ộ ộ Để ắ s p x p theo cách th công, hãy ch n mế ủ ọ ột tiêu đề trong một viz ho c trên m t legend và kéo ặ ộ nó đến đúng vị trí, một line màu đen đậm cho biết nơi nó sẽ đi

(3) Sort theo các tr ng c ườ ụ thể trong viz

- Để Sort các field theo các th công, các bủ ước th c hi n nhự ệ ư sau:

B1: Nh n chu t ph i vào field b n mu n s p x p và ch n Sort H p thoấ ộ ả ạ ố ắ ế ọ ộ ại sắp x p s m ế ẽ ởra B2: Ch n tùy ch n Sort: ọ ọ

- Data source order: Chọn tăng dần hoặc giảm dần

+ S p x p d ắ ế ữliệu d a trên cách s p x p d ự ắ ế ữliệu trong ngu n d ồ ữliệu Nói chung đố ới i v các ngu n d ồ ữliệu quan hệ, điều này có xu hướng là th t s p x p t nhiên Th t s p ứ ự ắ ế ự ứ ự ắ xếp tự nhiên là một loại chữ cái trong đó các số có nhiều chữ số được coi là một ký tự

Ví d , s p x p t ụ ắ ế ự nhiên đặt 2 trước 19 vì 2 nh ỏ hơn 19, trong khi s p x p ch ắ ế ữ cái đặt 19 trước 2 vì 1 nh hơn 2 ỏ

+ Nếu bạn đang sử ụng một khối, thứ tự nguồn dữ liệu là thứ tự phân c d ấp được xác định c a các thành viên trong m t dimension ủ ộ

- Alphabetic: Chọn tăng dần hoặc giảm dần

+ S p x p d ắ ế ữliệu theo th t abc Lo i này phân bi t ch hoa ch ứ ự ạ ệ ữ ữ thường và s p x p ắ ế [A-Z] trước [a- z]

+ Để t o m t lo i s p x p không phân bi t ch hoa ch ạ ộ ạ ắ ế ệ ữ ữ thường, hãy tạo trường được tính toán b ng cách s d ng các hàm UPPER () hoằ ử ụ ặc LOWER () để xóa bi n th viế ể ết hoa

+ Chọn tăng dần hoặc giảm dần

+ Chọn field có giá tr sị ẽ đượ ử ụng để xác địc s d nh th t s p x p Field không c n ứ ự ắ ế ầ phải được sử dụng trong hình dung

+ Chọn m t t p h p cho field s p x p Các tùy ch n t ng h p có s n tùy thu c vào loộ ậ ợ ắ ế ọ ổ ợ ẵ ộ ại field

+ Chọn m t giá tr và di chuyộ ị ển nó đến v trí mong mu n, b ng cách kéo nó vào danh ị ố ằ sách ho c s dặ ử ụng các mũi tên ở bên ph i ả

+ Chọn tăng dần hoặc giảm dần

+ Chọn field có giá tr sị ẽ đượ ử ụng để xác địc s d nh th t s p x p Field không c n ứ ự ắ ế ầ phải được sử dụng trong hình dung

+ Chọn m t t p h p cho field s p x p Các tùy ch n t ng h p có s n tùy thu c vào loộ ậ ợ ắ ế ọ ổ ợ ẵ ộ ại field c Set

- Set là một loại b lộ ọc mà chúng ta có thể đặt điều kiện để ển th các giá tr hi ị ị

Tạo tập dữ liệu tùy chỉnh trong Tableau Desktop bằng cách sử dụng các trường tùy chỉnh được gọi là Set Set sẽ trả về một tập hợp con dữ liệu dựa trên một điều kiện cụ thể Các phép tính SET có thể tạo Set từ một Dimension hoặc Measure, xác định nội dung sẽ được bao gồm hoặc loại trừ khỏi Set bằng cách sử dụng logic có điều kiện.

- Forecasting được sử dụng để ự d đoán xu hướng trong tương lai dựa trên các giá tr hiị ện tại của đồ thị

- Khi bạn có một tập h p các xu hợ ướng đang diễn ra, bạn có thể biểu diễn nó bằng các biểu đồ đường đại di n cho m t xu hệ ộ ướng, b n có th ạ ểđưa ra dựđoán trong tương lai e Highlighting

- Highlighting được sử dụng để đánh dấu các danh mục phụ cụ thể trong số tất cả các danh mục khác

- Highlighting cho phép bạn gọi sự chú ý đến các điểm quan tâm bằng cách tô màu các dấu cụ thể và làm mờ t t c ấ ảcác điểm khác f Device Designer

- Device Designer được sử dụng để tạo hình ảnh trực quan t t nh t cho các thi t b c ố ấ ế ị ụthể.

Components of Tableau

Tableau Product Family

- Tableau có các phiên b n ả khác nhau mà b n có th s d ng, ạ ể ử ụ được th hi n ở hình bên trái ể ệ (*) Tableau Desktop: bao gồm hai phiên b n chính là: ả Personal (dành cho người dùng cá nhân) và Professional(dành cho người dùng chuyên nghi p) Thành ệ phần này cung cấp công c phân ụ tích dữ liệu hi u qu Nhệ ả ờ đó, bạn có thể lập trình và tùy ch nh ỉ các báo cáo

+ Tableau Desktop phiên bản Personal: Có tính năng hạn chế và không th xu t bản báo ể ấ cáo tr c tuy n ự ế

+ Tableau Desktop phiên b n Professional: ả Thông qua Tableau Server, người dùng được phép báo cáo tr c tuy n Ngoài ra, v i phiên b n này, b n có th truy c p mự ế ớ ả ạ ể ậ ọi định d ng d ạ ữ liệu

- Đố ới v i mọi người dùng, đây được xem là phiên b n có m c giá h p d n nh t Khi s d ng ả ứ ấ ẫ ấ ử ụ Tableau Public, các dữ liệu phân tích sẽ không lưu trữ trên máy tính cá nhân Chúng sẽ được đăng trên các đám mây công cộng của Tableau Do đó, mọi người dùng đều có quy n truy c p ề ậ

Tableau Server là phiên bản không thích hợp với các doanh nghiệp Nó cho phép người dùng chia sẻ báo cáo và mô hình đã xuất bản trong Tableau Desktop Do đó, doanh nghiệp có thể cấp quyền truy cập cho toàn bộ nhân viên của mình Bên cạnh đó, ban quản trị được phép kiểm soát Tableau Server cho doanh nghiệp.

(*) Tableau Online: S n ph m này có chả ẩ ức năng khá tương đồng với Tableau Server, tr viừ ệc dữ liệu của Tableau Online sẽ được lưu trữ trên đám mây của Tableau thay vì máy chủ Bên cạnh đó, đây còn là công cụ cho phép người dùng chia sẻ dữ liệu trực tuyến không giới hạn

(*) Tableau Reader: Phiên bản này dành riêng cho người có nhu c u xem báo cáo và không ầ can thi p tr c ti p vào quá trình phân tích, x lý d ệ ự ế ử ữliệu Tableau Reader ch bao g m các tính ỉ ồ năng đơn giản Tuy nhiên, chúng vẫn hiển thị đầy đủ tất cả định dạng báo cáo của Tableau.

Ưu điểm của Tableau

- Một trong những điểm nổi trội nhất của Tableau đó chính là sự ễ dàng tiếp cận và s d d ử ụng Với nhiều phiên bản khác nhau, đặc biệt là phiên bản web, khi bạn có thể làm việc ngay trên trình duy t web mà không c n ph i cài ệ ầ ả đặt ph n m m V a gi m thiầ ề ừ ả ểu được khối lượng công việc, vừa bớt đi sự ắ ối cài đặ r c r t và còn giảm tải được công việc cho b ộphận IT

- Ngoài ra Tableau còn có những ưu điểm mạnh m sau: ẽ

+ Dễ dàng thao tác và xây dựng các Dashboard và cá bản phân tích bắt mắt

+ Có th s d ng cho m i phòng ban và m i nhân viên trong b t c ngành ngh nào ể ử ụ ọ ọ ấ ứ ề

+ Tốc độ xử lý dữ liệu cực kỳ nhanh với công nghệ In-memory

+ Khả năng mở rộng cơ sở d ữliệu và mức độ ph c t p cho doanh nghiứ ạ ệp đang phát triển nhanh + Có kh ả năng quản lý toàn b các công tác, chia s và mộ ẻ ức độ ả b o m t cao ậ

+ Khả năng kế ốt n i và làm vi c v i nhi u lo i d ệ ớ ề ạ ữliệu cùng lúc

+ Đáp ứng được các công nghệ mạnh mẽ như Big Data, AI và khả năng tích hợp cao

+ Dữ liệu có thể được chia s vẻ ới nhau và đưa đến tay ngườ ần để ọ ự ửi c h t x lý

+ Tạo ra một môi trường làm việc dựa trên dữ liệu và phân tích dữ liệu

+ Luôn có d ữliệu và phân tích m i lúc mọ ọi nơi

Thành tựu của Tableau

(*) Gi i thi u dataset: Demo- US Crime Dataset ớ ệ Đây là dataset được tổng hợp bởi cục tình báo Mỹ Nó thông kê các vụ giết người từ thời gian đối tượng gây án cũng như thông tin về dụng cụ gây án cũng như tình trạng đã được bắt hay chưa

Demo- US Crime Dataset

(*) Gi i thi u dataset: Demo- US Crime Dataset ớ ệ Đây là dataset được tổng hợp bởi cục tình báo Mỹ Nó thông kê các vụ giết người từ thời gian đối tượng gây án cũng như thông tin về dụng cụ gây án cũng như tình trạng đã được bắt hay chưa

- Chọn file đang chứa dataset c a bủ ạn (1), sau đó nhấn vào open (2)

- Sau khi m file dataset và ch cho dở ờ ử liệu được load xong sẽ hiện lên như trên với (1) là data được lưu trong file excel

Step2: Làm việc với workSheet

- Nhấn vào sheet1 để ắt đầ b u làm việc với wordsheet (1)

Giao diện cơ bản của bảng tính bao gồm các thông tin: dữ liệu chia thành hai phần là chiều (Dimensions) và số liệu (Measures); tùy chọn hiển thị cho từng kiểu dữ liệu; lựa chọn kiểu dữ liệu cho hàng và cột; và chức năng hiển thị biểu đồ.

- Lần lượt kéo data đến các điểm theo các bước (1) (2) (3) (4)

- Khi nhìn vào biểu đồ ện lên như trên (1) thì bạ hi n có thể thấy nó đã đượ ự ọn kiểu hiển th c t c ị phù hợp như tại (2) và kiểu được ch n t i (3) ọ ạ

- Kéo time vào filters để có thể lọc data theo thời gian

- Môt cửa sỗ sẽ hiện lên như trên với (1) là cách s p xắ ếp dữ liệu ở đây mình sẽchọn hiện th ị trong m t kho ng (range in values) và nh n ch n kho ng d ộ ả ấ ọ ả ữthời gian b n mu n (2) rạ ố ồi ấn ok (3)

- Và đây là hình ảnh nhận được

- Nhưng với một số thông tin không có tính thống nhất cúng ta có th ể nhấn vào dấu mũi tên ở (1) và chọn vào mục discrete (2)

- Một màn hinh phụ hiện lên liệt kê các lựa chọn các dử liệu nào hiện lên( có thể chọn nhiều hơn 1) ở đây mình chọn là năm 2000 (1) vào nhấn oke (2)

- Đây là biểu đồ được lấy từ dữ liệu trong năm 2000

Step3: Chọn ki u b ng hi n thị ể ả ễ

- Ở đây mình tạo ra một sheet m i vào them mớ ột data weapon để tăng số lượng dữ li

- Ở đây bạn có thế thấy sự thay đổi ở (1) và (2) và khi quan sát (3) sở ẽ thấy các ki u hi n th ể ệ ịCác ki u b làm m là các ki u không th ể ị ờ ể ểchọn và các ki u có th ể ểchọn

- ở đây mình tôi sẽ đưa ra 2 mẩu hiển th khị ắc lần lượt khi nhấn vào packed bubbles vs treemap

- Với packed bubbles khi nhấn vào (1) thì bạn có thể biểu đồ ại (2) đã có sự thay đổ t i

Treemap tương tự như packed bubbles, khi nhấn vào một phần (1) thì biểu đồ sẽ thay đổi (2) Ngoài ra, còn có hai tùy chọn mở rộng màu (3) được sử dụng độc lập để phù hợp với các cách trình bày khác nhau.

Step4: m vilà ệc với DashBoard

- Nhấn vào phần (1) để ạo m i m t ớ ột dashboard

- Ở đây sao khi tạo ra dashboard thì chúng ta có như sau Để ắt đầ b u làm việc chúng ta ch n ị tiled tại (1) để ự độ t ng chỉnh kích thước sau đó lần lượt kéo các sheet t i (2) vào (3) m t cách ạ ộ hợp lí

- Sau khi thao tác bạn sẽ có được bảng thiển thị như sau với 2 phần chính (1) (2) như hình với (1) là các b ng hi n th và (2) các m nh d ả ể ị ả ữliệu khắc.

- Ở đây khi nhấn chuột trái vào bang (1) và chọn filters (2) chọn year (3)

- Với cách đó bạn có thể bỏ sung các thành phần nhỏ vào dashboard của mình.

Charts & Graphs

Generated Fields in Tableau & Used Cases of Generated Fields

- Là 2 bộ lọc đượ ạo ra b tableau c t ở khi dataset được thêm vào tableau với Measure Names chứ ấ ảa t t c thước đô của bạn được tập hợp vào một ch , còn Measure Values ổ chứ ấ ả ốa t t c s đo của bạn

- VD: Ở đây bạn có th ểthấy 2 giá trị được tự động them vào để quan s chúng ta sát ẽ đứa nó vào col vs row để có th ể quan sát

- Ở đây khi nhìn vào phần (2) b n có th ạ ểthấy cách các giá tr ị được liệt kê cũng như tên của nó

- Ngoài ra bạn có thể nhấn vào (1) chọn edit aliases (2) để tùi ch nh tên c a các giá tr ỉ ủ ị được lưu trong Measure Names

- Sau khi nhấn vào edit aliases sẽ hiện lên cửa sổ b n sạ ẽ thấy 2 phần chính là member và value tương ứng là member là giá trị nó lấy và value là giá trị bạn muốn nó hiển thị b Number of Records

- Nó giống như một biến đếm cũng đượ ạo ra b c t ở tableau để xác tính s ố lượng bản ghi khi gộp nhiều bảng lại v i nhau ớ c Latitude & Longitude

- Nó được tạo ra khi có các khiểu dữ liệu liên quan đến địa chỉ được sử dụng

- Như then khi thêm Latitude & Longitude vào thì các v ị trí địa lí được thêm vào

- Và khi thêm data city vào các giá tr ị đượ ự độc t ng map vào nhau.

Building Charts in Tableau

- Có thể so sánh d ữliệu giữa các danh mục khác nhau b Line Chart:

- So sánh dữ liệu qua các th i kờ ỳ khác nhau c Pareto Chart

- Bao g m c biồ ả ểu đồ thanh và biểu đồ đường (1:11) d Bullet Chart:

- Có thể được sử dụng như một thước đo để ển th hi hi ị ệu suất của các biện pháp e Text Chart :

- Được sử dụng để ển th giá tr chính xác c a các s hi ị ị ủ ố đo trên các thứ nguyên khác nhau f Heat Map :

- Trực quan hóa d ữliệu dướ ạng kích thước cũng như màu sắc trên các thước đo khác nhau.i d g Waterfall Chart :

- Hình dung tác động tích lũy của một số đo so với kích thước h Gantt Chart:

- Có thể được sử dụng để xác định th i gian ờ thực hiện cho các danh m c khác nhau ụ i Pie Chart :

- Sự đóng góp của thước đo so với các thành viên khác nhau trong m t th nguyên ộ ứ j Scatter Plot :

- Cho thấy xu hướng hoặc mối quan hệ giữa các bi n pháp khác nhau ệ k Area Chart :

- Có thể đại diện cho bất kỳ số đo nào trong các khoảng th i gian khác nhau ờ l Dual Axis Chart:

- Có thể được sử dụng để hình dung hai số đo khác nhau trong hai loại biểu đồ khác nhau m Bubble Chart:

- Hình dung các biện pháp và kích thước dướ ạng bong i d bóng n Histogram:

- Có thể hiển th phân phị ối dữ liệu số và t n su t c a nó ầ ấ ủ

Features of Tableau

Các tính năng quan trọng nhất của Tableau như sau.

Tableau BI nổi tiếng với khả năng trực quan hóa dữ liệu hàng đầu, dễ dàng dẫn đầu thị trường Người dùng có thể dễ dàng thực hiện trực quan hóa dữ liệu phức tạp bằng tính năng kéo và thả, tận dụng giao diện trực quan, mượt mà, nhanh chóng để tạo nên các hình ảnh trực quan tùy chỉnh Tableau trở thành lựa chọn ưu tiên của các doanh nghiệp vì bất kỳ người dùng nào cũng có thể dễ dàng tạo các trang tổng quan tùy chỉnh bằng dữ liệu và nguồn dữ liệu phức tạp.

Được đánh giá cao về chất lượng hỗ trợ khách hàng, Tableau luôn đặt sự hài lòng của người dùng lên hàng đầu Theo khảo sát của Gartner, phần lớn người dùng Tableau đều hài lòng với sản phẩm và dịch vụ hỗ trợ kỹ thuật đi kèm Hơn nữa, Tableau được xếp hạng trong số những công ty hàng đầu về sự hài lòng của khách hàng, chứng tỏ đây là một yếu tố vô cùng quan trọng đối với công ty này.

Easy Implementation: Tính năng phong phú dễ dàng tri n khai và nâng c p vì theo khể ấ ảo sát được thực hiện hơn 90% người dùng Tableau đã cài đặt phiên bản mới nhất và đang chạy nó cho thấy rõ ràng s d s d ng và nâng c p ti p theo ự ễ ử ụ ấ ế

Data Source Integration: Tableau cung c p m t giấ ộ ải pháp đơn giản để tích hợp với các nguồn d li u và ngôn ng phân tích ph bi n nhữ ệ ữ ổ ế ất, như python Họ cũng liên tục bổ sung hỗ trợ cho các nguồn dữ liệu m i và khi có nhu cớ ầu, họ cũng hỗtrợ Hadoop và API bigquery của Google để phân tích d ữliệu m nh m ạ ẽ

Mobile Support: Tableau đã hiểu rõ yêu c u cầ ủa người dùng di động và đã phát triển một ứng d ng ụ di động mạnh mẽ, có giao diện người dùng rất phong phú Nhiệm vụ khó khăn là phải Hiển thị các biểu đồ và hình ảnh phức tạp trên một màn hình Di động nhỏ, nhưng Tableau đã thành thạo nghệ thuật này và các hình ảnh trực quan tự điều ch nh dỉ ựa trên kích thước màn hình của thiết b ị

Cộng đồng trực tuyến phong phú này cho phép người dùng tìm hiểu và thành thạo Tableau dễ dàng Hiện cộng đồng này rất sôi động và tràn ngập các ý tưởng và giải pháp đến từ nhiều nguồn khác nhau, bao gồm cả một cơ sở nhà cung cấp mạnh mẽ, những người cũng cung cấp các dịch vụ cài đặt và tùy chỉnh.

Tôi mu n nói r ng Tableau là m t công c ố ằ ộ ụ bi đang thay đổi cách chúng ta nghĩ về ữ d liệu B n khai ạ thác s c m nh c a d ứ ạ ủ ữliệu c a mình và gi i phóng tiủ ả ềm năng của nó, vì v y ch c chậ ắ ắn đây là một trong nh ng n n t ng ữ ề ả BI t t nhố ất để ự l a ch n ọ

Dashboarding in Tableau

Dataset: Indian Premier League Đây là bảng dataset về giải Ngoại hạng Ấn Độ (IPL), với những đội như sau:

Thông qua Tableau, chúng ta s ẽ tìm ra độ ối t t nh t b ng cách th c hi n phân tích ấ ằ ự ệ

- Tìm ra nh ng v n ữ ậ động viên ném bóng có s l n ch y nhi u nh t (Orange cap) ố ầ ạ ề ấ

- Tìm ra nh ng vữ ận động viên ném bóng nhi u bàn th ng nh t (Purple cap) ề ắ ấ

- Tìm ra nh ng vữ ận động viên xu t s c nh t c a t ng trấ ắ ấ ủ ừ ận đấu và c a lo t trủ ạ ận đấu qua t t c các ấ ả mùa giải.

- Tìm ra 5 c u th ầ ủ đã thể ệ ố hi n t t nh t trong t t c các mùa giấ ấ ả ải.

- Tìm ra các độ ối t t nh t trong mùa giấ ải.

1 Team Table - IPL (Indian Premier League) Dataset

2 Player Table - IPL (Indian Premier League) Dataset

3 Match Table - IPL (Indian Premier League) Dataset

4 Player Match Table - IPL (Indian Premier League) Dataset

5 Season Table - IPL (Indian Premier League) Dataset

1 Mở Tableau trên màn hình desktop bằng cách click icon:

2 Trên màn hình giao diện Tableau, click More… (1) → Chọn dataset Team.csv (2) → click Open

3 Sau khi dataset Team.csv m ở ra, các dataset khác cùng folder lưu trữ ớ v i Team.csv sẽ được hiển thị phía bên trái (1), và d ở ữliệu c a data Team.csv hi n th m c s (2) ủ ể ị ở ụ ố Để ử ụ s d ng dataset khác, ta chỉ c n kéo th các ngu n d li u khác mà ta mu n tích hợp vào giao ầ ả ồ ữ ệ ố diện làm việc

4 Kéo thả Match.csv vào (1) và chọn Team id từ Team.csv mapping v i Team id tớ ừ Match.csv, operator là “=” (2)

Tiế ụp t c thực hi n kéo th Match.csv vào (1) và ch n Opponent id t Team.csv mapping v i Team id ệ ả ọ ừ ớ từ Match.csv, operator là “=”

Tương tự như trên, thực hiện kéo thả lần lượt Player_Match.csv, Season.csv và Player.csv như sau:

5, Click vào Sheet 1 ở thanh dưới cùng để chuyển đến b ng tính, thả ực hiện như sau:

5 Thực hiện kéo thả Seasion Year và Orange Year từ Dimensions tương ứng vào Columns và Rows

6 Thực hiện lấy tên vận động viên ném bóng có số lần chạy nhiều nhất (Orange cap) bằng cách:

Nhấn chu t ph i vào DOB thu c b ng ộ ả ộ ả Player.csv (1) →click vào Create (2) → click vào

Calculated Fied… (3) → đặt tên cho calculate (4) → Gõ code tương ứng như sau (5)→ click vào

Sau khi th c hiự ện bước trên, chúng ta s ẽ thấy calculation đượ ạo như sau:c t

Và kéo thả orange cap calc vào Rows như sau:

Click Shape (1) → More Shapes… (2)→ Lựa ch n ọ Shape Palette là KPI (3)→ Chọn icon như sau (4) → Click OK

Và đây là kết quả, từ biểu đồ này, chúng ta sẽ thấy được các vận động viên ném bóng có số lần chạy nhi u nh t (Orange cap) ề ấ

A) Tương tự như trên, ta thực hiện lấy thông tin vận động viên ném bóng nhiều bàn thắng nhất (purple cap):

B) Đến với m c tiêu thứ 3 c a vi c phân tích dataset này, chúng ta s tìm hiểu cách để tìm ra những ụ ủ ệ ẽ vận động viên xuất sắc nhất của từng trận đấu cụ thể và của loạt trận đấu qua tất cả các mùa giải

1 Đầu tiên, tạo một sheet mới và đặt tên “Man of the Series”.

Vì mỗi mùa, IPL đượ ổc t chức ở các thành ph khác nhau, nên chúng ta s bi u di n trố ẽ ể ễ ực quan dưới dạng bản đồ địa lý thế giới, để ạo b t ản đồ, ta thực hiện kéo thả 2 thành ph n làầ Longitude và Latitude như sau:

2 Thực hiện các bước như hình bên dưới: u tiên, nh n chu t ph i vào Country Đầ ấ ộ ả và click chu t vào ộ Create →tiế ụp t c th c hiự ện các bước theo th t (1) ứ ự → (6)

3 Kéo thả City Name Host Country, vào m c Detail tại công cụụ Marks để hiển thị các qu c gia, ố nước ch nhà ủ

4 Thả Man of the Series vào Color để hiển thị thông tin v về ận động biên xu t s c qua các ấ ắ mùa gi i, c ả ụthể hơn, chúng ta sẽtiế ụ ửp t c s dụng bộ lọc

→ ThảMan of the Series Id vào Filters để tạo b lộ ọc

6 Kéo Man of the series calc vào Filters → click All để chọn tất cả (1), uncheck tại mục Null (2)

Tương tự thực hiện với Season Year:

Từ bản đồ địa lí, ta có thể xem thông tin về thành phố, nước chủ nhà, vận động viên xuất sắc nhất giải đấu năm đó (2) bằng cách sử dụng bộ lọc từ Season Year (1) Đố ới v i Man of the match, ta th c hiự ện như sau:

1 Create a new sheet named "Man of the Match" and drag and drop Match ID into the Rows section.2 Right-click on Data → Create… → Calculation Field… → Name the field and enter the code provided.3 Click OK to complete the process.

2 Lần lượt théo thả Man of the match (1) vào Rows

Sau đó, chúng ta thực hiện Filters để loại bỏ các giá trị Null

3 Filter loại bỏ giá tr null: ị

Kéo th Man of the match vào ô ả Filters(1) →Loạ ỏi b giá tr ịNull (2) → Click OK(3)để ế k t thúc

Và đây là kết quả:

Tại đây, chúng ta có thể sử dụng thêm các bộ lọc khác bằng cách kéo thả vào (1) và lựa chọn giá trị Theo dõi giá tr t các c t, các dòng bị ừ ộ ằng cách đưa con trỏ chuột đến v trí dòng c a t ng trị ủ ừ ận đấu, thông tin được thể hiện ở (2) với các giá trị như (Player Name, City Name, Match ID và Win Type)

C) Mục tiêu: Tìm ra đội tốt nhất thể hiện qua các mùa giải

1 Mở Tableau trên màn hình desktop bằng cách click icon:

2 Trên màn hình giao diện Tableau, click More… (1) → Chọn dataset Team.csv (2) → click Open

3 Sau khi dataset Team.csv m ở ra, các dataset khác cùng folder lưu trữ ớ v i Team.csv sẽ được hiển thị phía bên trái (1), và d ở ữliệu c a data Team.csv hi n th m c s (2) ủ ể ị ở ụ ố Để ử ụ s d ng dataset khác, ta chỉ c n kéo th các ngu n d li u khác mà ta mu n tích hợp vào giao ầ ả ồ ữ ệ ố diện làm việc

4 Kéo thả Match.csv vào (1) và chọn Team id từ Team.csv mapping v i Team id tớ ừ Match.csv, operator là “=” (2)

5 Tiếp tục thực hiện với Match.csv và Team.csv như sau:

6 Tạo sheet m i v i tên ớ ớ Best team và

Lần lu t kéo thợ ả v i các thành phớ ần từ (1) đến (5) vào Rows

Kéo Opponent ID vào Column

Team Name vào Color để hiển thị trực quan hơn.

Và cu i cùng, ch n d ng hi n th là Fit Weight và k t qu ố ọ ạ ệ ị ế ả như sau:

Thông qua biểu đồ trên, chúng ta có th ểthấy được đội th hi n t t nh t qua các mùa giể ệ ố ấ ải.

D) Với Indian Premier League dataset, ta sẽ thực hiện các bước như bên dưới để tìm ra 5 cầu thủ đã thểhiện t t nh t trong t t c các mùa gi ố ấ ấ ả ải.

Bước 1: Thực hi n t o mệ ạ ới project tương tự như ở trên

Bước 2: Kéo thả lần lượt các demension như sau:

Bước 3: Kéo thả các thành phần vào Columns, Rows Filters, Color như sau:

Click chu t ph i vào isResult (1) ộ ả

→ thực hiện đặt tên cho Calculation (2)

→ viết code như (3) để ấy đượ l c Batsman Scored t mùa gi i th 8 (2015) ừ ả ứ k t thúc

Click chu t vào ộ Player Name (1) → Chọn tab Top (2) → Chọn top 5 (3) →

Chọn top 5 Calc từ bước 4 → Click OKđể ế k t thúc

Và đây là kết quả cuối cùng:

Top 5 vận động hàng đầu trong mùa giải năm 2015 Đối chi u với thông tin trên Internet, ta biế ết được đó là kết quả đúng:

Functions

Number Function

Number functions cho phép chúng ta th c hi n các phép tính trên các giá tr d ự ệ ị ữliệu c a mình trong ủ các trường dữ liệu Vì vậy, hàm này chỉ có th ể đượ ử ục s d ng với các trường ch a các giá tr s ứ ị ố

B1 Click vào Analysis (1) →chọn Create Calculated Field …(2) →Nhập tên Cal là Absolute (3)

→ Gõ ABS(-5) (4) → Click OKđể ế k t thúc

B2 Kéo th Absolute vào giao di n làm vi c, và k t qu hi n th ả ệ ệ ế ả ể ị như sau:

Thay vì nh p ABS(-5), ta l y d ậ ấ ữliệ ừu t Sales:

Thả thêm trường State và Country vào, ta được như sau:

Từ đây, ta có thể ễ d dàng theo dõi, vì nước có doanh số bán hàng nhỏ thì s có màu xanh nhẽ ạt, ngượ ạc l i thì s ẽcó màu xanh đậm.

String Function

String functions cho phép chúng ta thao tác trên d ữliệu ki u chu i kí t Chúng ta có th ể ỗ ự ểthực hi n ệ các việc như kéo tấ ảt c các tên chính t b ng khách hàng vào mừ ả ột trường m i b ng cách s d ng ớ ằ ử ụ chức năng này

Thực hiện như hình minh họa sau:

Data Function

Date functions allow you to manipulate Dates in your data source such as year, montn, date, day and/or time

Thực hiện như hình bên dưới:

Type Conversion Functions

Conversion functions allow you to convert fields from one data type to another So basically you can convert numbers to Strings such as age.

Aggregation Functions

Aggregation Functions allow you to summarize or change the granularity of your data.

Logical Functions

Logical calculations allow you to determine if a certain condition is true or false (Boolean logic).

Level of Detail

Introduction to Level of Detail (LOD)

Level of Detail is a syntax that simplifies and extends Tableau's calculation by making it possible to address detailed queries directly

Level Of Detail Expressions represent an powerful way to answer questions involving multiple levels of granularity in a single visualization.

Include Calculation

Biểu th c INCLUDE tính toán các giá trị s dứ ử ụng các dimensions được chỉ nh và thêm b t k đị ấ ỳ dimensions nào có trong view

Biểu th c INCLUDE khá h u ích khi b n mu n tính toán ở mứ ữ ạ ố ức độ chi tiết nh ỏtrong cơ sở dữ ệ li u và sau đó tổng hợp lại để hiển thị ở mức độ chi tiết thô hơn trong view Các trường dựa trên biểu thức INCLUDE s ẽthay đổi khi bạn thêm ho c xóa các dimensions kh i view ặ ỏ

Ví d 1: ụ u th c INCLUDE d ng doanh s trên m i khách hàng:

Biể ứ ưới đây tính toán tổ ố ỗ

{ INCLUDE [Customer Name] : SUM([Sales]) }

Khi phép tính AVG (trung bình) được đặt trên ngăn Rows và dimension [Region] được đặt trên ngăn Columns, bảng báo cáo sẽ hiển thị doanh số bán hàng trung bình của khách hàng cho từng khu vực.

Nếu measures [Sales] sau đó được kéo vào ngăn Rows, kết quả minh họa sự khác nhau giữa tổng doanh s m i vùng và doanh s trung bình c a khách hàng m i vùng: ố ỗ ố ủ ở ỗ

Biểu th c INCLUDE ứ dưới đây tính tổng doanh s bán hàng trên m i b ng: ố ỗ ả

Phép tính được đặt trên ngăn Rows và lấy trung bình Hình ảnh trực quan kết quả trung bình tổng doanh s bán hàng theo ti u bang trên các danh mố ể ục.

Khi Segment được thêm vào ngăn Columns và phép toán được di chuyển đến ô Label, biểu thức LOD sẽ ậ c p nh t l i k t qu Giờ ậ ạ ế ả đây, bạn có thể ấ ổ th y t ng doanh s trung bình trên m i ti u bang ố ỗ ể khác nhau như thế nào giữa các danh mục và phân khúc.

Exclude Calculation

Biểu th c EXCLUDE khai báo các ứ dimensionsđể ỏ b qua mức độ chi ti t c a view Bi u th c này ế ủ ể ứ khá tốt khi đượ ử ục s d ng cho việc tìm “percent of total” (phần trăm tổng) hoặc “difference from overall average” (sự khác biệt so với mức trung bình chung)

Biểu thức EXCLUDE có thể được sử dụng để loại trừ dimension khỏi một số biểu thức LOD trong phép tính cấp view Tuy nhiên, biểu thức EXCLUDE không được sử dụng trong biểu thức có chứa cấp độ hàng (không có dimension nào để loại trừ).

Biểu th c sau lo i [Region] từ ộứ ạ m t phép tính c a tổng [Sales]: ủ

Biểu thức được lưu dưới dạng [ExcludeRegion] Để minh h a bi u th c này khá h u dọ ể ứ ữ ụng, đầu tiên xét view dưới đây, view đã chia tổng doanh số theo vùng và tháng:

Thả [ExcludeRegion] vào ô Color trong th Marks, view s mờ ẻ ẽ đi các thanh và hiển thị t ng doanh ổ số theo tháng mà không có thành ph n vùng (region) ầ

Fixed Calculation

Biểu th c FIXED tính toán m t giá tr s d ng cácứ ộ ị ử ụ dimensionsđược chỉ nh mà không c n tham đị ầ chiếu đến các dimensions trong view

Biểu th c FIXED tính t ng doanh s cho m i vùng: ứ ổ ố ỗ

Biểu thức này được đặt tên là [Sales by Region], được đặt trên ô Text đểhi n thị t ng doanh s ể ổ ố mỗi vùng

Cấp độ chi tiết là [Region] c ngộ [State]nhưng vì biểu thức FIXED không xem xét cấm độ chi tiết view Phép tính chỉ s dử ụng dimension được tham chiếu trong phép tính, trong trường hợp này là Region Vì th , b n có th ế ạ ểthấy các giá tr cho m i bang khị ỗ ác nhau là như nhau.

Nếu từ khóa INCLUDEđược sử dụng trong biểu thức LOD thay vì FIXED, giá tr sị ẽ khác cho mỗi bang B i vì, Tableau s thêm dimension trong bi u th c (ở ẽ ể ứ [Region]) v i b t k dimensions khác ớ ấ ỳ trong view ([State]), khi xác định các giá tr bi u th c K t qu ị ể ứ ế ả thu đượ ẽ như sau:c s

Parameters

What are Parameters in Tableau?

Bất k giá tr ỳ ị nào được truy n vào mề ột chương trình để tùy chỉnh chương trình cho m t mộ ục đích cụ thể được gọi là một tham số (parameter)

- Ví dụ trong một trường h p bợ ạn cần một thành phần mà nó không chính xác là thứ trong dataset Paeameter s cho phép b n t ng h p và t o ra nh ng th không có s n trong dataset ẽ ạ ổ ợ ạ ữ ứ ẵ và đưa vào dashboards và đưa báo cao lên một cách trực tiếp Từ đó người dung có thể kiểm soát khi có d ữliệu nh p thêm s có ậ ẽ ảnh hưởng như thế nào B n có th thêm m i th mạ ể ọ ứ ột chuỗi văn bản, một giá trị, hoạc một lượng tiền Việc được phép lựa chọn tùy chĩnh sẽ giúp bạn đưa ra một cách nhìn tốt nhất

Getting Started on the Desktop

Có 3 cách để bạn co thể thể ệ hi n parameters

- Calculation: bạn có thể dung các calculated fields

- User control: Bạn có thể đển hiện điều ch nh tham sỉ ố trong chế độ xem để người dùng trực tiếp điều chỉnh

- Visualization: Bạn sử dụng chúng trong biểu để xem sự ảnh hưởng của nó đố ớ ữ liệu i v i d

Creating a parameter in Tableau

- Ở đây chúng ta sẽ đưa ra một ví dụ bạn mu n giá tr saố ị le thay đổi

- Để làm việc v i parameter chung ta cớ ần:

Nhấn vào mũi tên ở (1) và nhấn vào create parameter (2)

Sau khi nh n vào creact parameter thì m t c a s s hiấ ộ ủ ổ ẽ ện lên như (1) ở đay bạn s ẽthấy 2 ph n thông ầ tin chính là tên c a parameter (2) và cá thông s c a nó (3) ủ ố ủ Đầu tiên chúng ta tùi chỉnh tên m t cách phù hợp cho parameter (1) sau đó đưa ra các thông số cơ ộ bản (2) sau đó ở (3) bạn có thể thấy các lựa chọn Allowable values All, List, Range Ở đây để giới hạn luồng dữ liệu tôi ch n ranger thì thêm mọ ột mục như (4) xuất hi n nó s hi n ra mệ ẽ ệ ục để ạn điề b n cá thông tin t o ra chu i d ạ ổ ứliệu sau khi điền hoàn thành hãy nh n vào OK ấ

Và đây là kết quả một data dử liệu If_sele đã được tạo ra

- Using the parameter in a calculation

- Sau khi tạo xong parameter chúng ta đến bước tiếp theo là tạo Calculated

+ Có 2 cách để tạo Calculated Field

Nhấn vào analysis tại t kbar (1) ras ồi chọn Create Calculated Field (2)

Nhấn vào mũi tên tại (1) rồi chọn Create Calculated Field (2)

Sau khi nh n vào Create Calculated Field ấ ta được c a s ử ổ như sau Để khởi t o Calculated Field ạ chúng ta đưa câu lệnh vào Ởđây câu lệnh của tôi là l y d li u t ấ ữ ệ ừ If_sele (lỗi tiếng anh khi đặt tên đáng lẽ là sale) và bắt đầu quá trình tính toán Sau đó ấn oke để hoàn thành

Và đây là kết quả:

- Để sử dung parameter trong calculation chúng ta làm như sau: Ấn vào hình mũi tên của parameter bạn muốn sử dụng, ở đây tôi chọn if_sele (1) và chọn Show Parameter Control (2) b n s ạ ẽ được m t c a s ộ ử ổ như (3) Lúc đó bạn có th ểtùy chỉnh parameter Using Parameters in your Visualization Ởđây mình tạo một bi u ể đồ với hàng bi n Measure Values (1) với 2 giá trị còn l i là t ng c a sale ế ạ ổ ủ và t ng c a if_sale (3), c t là nh ng ổ ủ ộ ữ ngày được nh n order (2) v i b l c là Measure Names ậ ớ ộ ọ

Bạn có th so sánh và th y rõ sể ấ ựu thay đổ ủa bii c ểu đồ (2) so với hình trên khi thay đổi giá trị if_sale từ 0 => 30

Objective of Data Blending

Lúc nào dung Data Blending

- Khi bạn muốn kết h p dợ ữ liệu từ các cơ sở dữ liệu khác nhau

- không được hỗ trợ bởi kết hợp cơ sở dữ liệu chéo

- Khi dữ liệu các mở ức độ chi tiết khác nhau

- Khi bạn xử lý một lượng l n Dớ ữ liệu

- Khi dữ liệu của bạn cần được làm sạch

Introduction to Data Blending

Là k t h p d ế ợ ữliệu là phương pháp kế ợt h p d ữliệu b sung b ng d ổ ả ữliệ ừ ộu t m t ngu n d ồ ữliệu với các cột dữ liệu từ nguồn dữ liệu khác

Joining vs Blending in Tableau

Data joining: Khi b n s dạ ử ụng left join để ế ợ k t h p d ữliệu, m t truy v n sộ ấ ẽ được gửi đến cơ sở d ữliệu nơi phép nối được thực hiệnleft join trả về tất cả các hàng từ bảng bên trái và bất kỳ hàng nào từ bảng bên phải có khớp hàng tương ứng trong bảng bên trái Kết quả sau đó được gửi đến Tableau để tổng hợp

Pha trộn dữ liệu: Khi bạn sử dụng kỹ thuật pha trộn dữ liệu để kết hợp dữ liệu, một truy vấn sẽ được gửi đến cơ sở dữ liệu cho từng nguồn dữ liệu mà bạn đang sử dụng Kết quả của những truy vấn này bao gồm một tập dữ liệu kết hợp Trường hợp này được gọi là liên kết và kết hợp dữ liệu trong Tableau Bạn có các bảng sau đây là những bảng giống nhau nếu các trường liên kết như ID người dùng của chúng tôi trên mỗi bảng kết hợp dữ liệu của bạn Bạn lưu trữ dữ liệu của bạn trên bảng bên trái và bổ sung cho bảng bên trái với dữ liệu từ bảng bên phải Trong chế độ xem, bạn sử dụng các hàng từ nguồn dữ liệu chính là bảng bên trái và tổng hợp giá trị từ nguồn dữ liệu phụ, bên phải Việc này có thể thực hiện và nó phụ thuộc vào kích thước của các trường liên kết Nếu có nhiều giá trị cho một hàng và dấu hoa thị (*) được hiển thị, các giá trị cho phép đo lường được tổng hợp theo cách phù hợp trong trường hợp sử dụng chế độ trường tổng hợp Các trường hợp không phải tất cả các giá trị đều có thể là một phần của kết quả vì hai lý do Đầu tiên, một hàng trong bảng bên trái không có hàng tương ứng trong bảng bên phải như được biểu thị bằng giá trị NULL và thứ hai, có nhiều giá trị trong các hàng trong bảng bên phải như được biểu thị bằng dấu hoa thị hoặc dấu sao Giả sử bạn có các bảng tương tự như trước nhưng nguồn dữ liệu phụ chứa một trường mới được gọi là Tiền phạt Nếu bạn liên kết cùng một ID người dùng của chúng tôi, bạn sẽ lưu trữ dữ liệu của bạn trên bảng bên trái và bổ sung cho nó với dữ liệu từ bảng bên phải Trong trường hợp này, bạn sẽ có cùng một giá trị NULL và ngoài hai điều kiện trên, vì trường Tiền phạt là thước đo, bạn có thể tổng hợp trước các giá trị hàng cho trường Tiền phạt trước khi dữ liệu trong bảng bên phải được kết hợp Giống như ví dụ trước đó, một hàng trong bảng bên trái không có hàng tương ứng cho Tiền phạt và đó là lý do tại sao nó được biểu thị bằng giá trị rỗng.

Blending Data in Tableau

Ởđây mình có dataset từ 2 nguồn m t là của excel cái còn l i t Mongodb ộ ạ ừ

Nhấn double click vào (1) để vào CoffeeChain Query

Sau đó bạn có thể tạo sự liên kết dữa cắc bảng trong CoffeeChain Query

Sau đó thêm một dataset nữa là Sample – Superstore vào (vì 2 dataset này có thể liên kết với nhau) Đầu ti n vào Sample Superstore vào kéo 2 giá trị sales và profit ề – vào col row như sau.

Và khi qua CoffeeChain Query dataset thì chúng ta có th ểthấy dấu đỏ ở sales nó nh m ch ra ầ ỉ sự kh c nhau d a sales d a 2 ngu n d ắ ữ ữ ồ ữliệu Sample Superstore và CoffeeChain Query –

Limitations of Data Blending

- Không thể tổng h p tợ ừ các nguồn không được hổ trợ

- Khi kết n i v i dố ớ ữ liệt có độ chi tiết cao nó sẽ b ịchậm l i ạ

Ngày đăng: 13/05/2024, 14:54