1. Trang chủ
  2. » Kỹ Năng Mềm

33 CÂU HỎI THƯỜNG GẶP KHI PHỎNG VẤN DATA ANALYST

8 1,7K 29

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 8
Dung lượng 302,65 KB

Nội dung

câu hỏi thường gặp khi phỏng vấn×data analyst×phỏng vấn data analyst×câu hỏi phỏng vấn×nghiên cứu dữ liệu×phân tích dữ liệu×Từ khóa10 câu hỏi thường gặp khi phỏng vấnnhững câu hỏi thường gặp khi phỏng vấn ngân hàngnhững câu hỏi thường gặp khi phỏng vấn visa mỹnhững câu hỏi thường gặp khi phỏng vấn tiếng anhnhững câu hỏi thường gặp khi phỏng vấn kế toánnhững câu hỏi thường gặp khi phỏng vấn xin việcnhững câu hỏi thường gặp khi phỏng vấn kết hônnhững câu hỏi thường gặp khi phỏng vấn học bổngnhững câu hỏi thường gặp khi phỏng vấn lễ tân

NHỮNG CÂU HỎI THƯỜNG GẶP KHI PHỎNG VẤN DATA ANALYST Trong viết, Morning Japan chia sẻ yêu cầu ngành Data analytics hội việc làm chế độ đãi ngộ Vậy, vấn nhà tuyển dụng thường hỏi câu hỏi chuyên môn nào? Dưới Morning Japan xin chia sẻ 33 câu hỏi thường gặp vấn Data analyst nhà tuyển dụng ngành nói chung nhà tuyển dụng Nhật Bản nói riêng Trách nhiệm Data Analyst gì? Trách nhiệm Data Analyst bao gồm - Hỗ trợ cung cấp tất liệu phân tích phối hợp làm việc với khách hàng nhân viên Giải vấn đề liên quan tới kinh doanh cho khách hàng thực kiểm tra liệu Phân tích kết giải thích số liệu qua việc sử dụng kỹ thuật thống kê cung cấp báo cáo liên tục Ưu tiên nhu cầu kinh doanh làm việc cẩn thận với nhu cầu quản lý thơng tin Xác định quy trình lĩnh vực để có hội cải thiện Phân tích, xác định giải thích xu hướng mẫu liệu phức tạp Thu thông tin từ nguồn thông tin sơ cấp thứ cấp trì sở liệu/ hệ thống liệu Lọc “dọn” diêu, đánh giá báo cáo Xác định số hoạt động để tìm sửa vấn đề code Bảo mật sở liệu cách phát triển hệ thống truy cập thông qua xác dịnh mức truy cập người dùng Yêu cầu để trở thành Data Analyst gì? Để trở thành Data Analyst, bạn cần - Kiến thức gói báo cáo ( lĩnh vực kinh doanh), ngơn ngữ lập trình (XML, Javascrip, or ETL frameworks), sở liệu (SQL, SQLite, etc ) Khả phân tích, tổ chức, thu thập phổ biến liệu lớn với độ xác cao Kiến thức kĩ thuật thiết kế sở liệu, mơ hình liệu, khai thác liệu kỹ phân đoạn Kiến thức thơng kế để phân tích tập liệu lớn (SAS, Excel, SPSS, etc…) Các bước khác dự án phân tích gì? Các bước dự án phân tích bao gồm - Định nghĩa vấn đề - Thăm dò liệu - Chuẩn bị liệu - Mô - Xác nhận liệu - Thực theo dõi Làm liệu gì? Dọn dẹp liệu gọi làm liệu, đề cập đến việc xác định loại bỏ lỗi không quán từ liệu nhằm nâng cao chất lượng liệu Liệt kê số phương pháp hay để làm liệu? Một số phương pháp hay để làm liệu bao gồm, - - Sắp xếp liệu theo thuộc tính khác Đối với tập liệu lớn, làm bước cải thiện liệu với bước bạn đạt chất lượng liệu tốt Đối với tập liệu lớn, chia chúng thành liệu nhỏ Làm việc với liệu tăng tốc độ bạn Để xử lý công việc làm thông thường, tạo tập hợp chức tiện ích / cơng cụ / tập lệnh Nó bao gồm, sửa đổi giá trị dựa tệp tin CSV sở liệu SQL hoặc, tìm kiếm thay regex, tẩy hết giá trị không khớp với regex Nếu bạn có vấn đề liệu, xếp chúng theo tần số ước tính bắt đầu với vấn đề phổ biến Phân tích số liệu thống kê tóm tắt cho cột (độ lệch chuẩn, trung bình, số lượng giá trị bị thiếu Theo dõi hoạt động làm ngày, từ bạn sửa lại thay đổi loại bỏ hoạt động cần Giải thích hồi quy logistic Hồi quy logistic phương pháp thống kê để kiểm tra tập liệu có nhiều biến độc lập xác định kết Danh sách số công cụ tốt hữu ích cho việc phân tích liệu? - Tableau - RapidMiner OpenRefine KNIME Tốn tử Tìm kiếm Google Solver NodeXL Io Wolfram Alpha Bảng Google Fusion Sự khác khai thách liệu lập hồ sơ liệu Lập hồ sơ liệu: tập trung vào việc phân tích thuộc tính cá nhân Nó cung cấp thơng tin thuộc tính khác phạm vi giá trị, giá trị rời rạc tần số chúng, xuất giá trị null, loại liệu, chiều dài, vv Khai thác liệu: Nó tập trung vào phân tích cụm, phát ghi bất thường, phụ thuộc, chuỗi phát hiện, quan hệ trì thuộc tính, v.v Liệt kê số vấn đề thường gặp nhà phân tích liệu? Một số vấn đề thường gặp nhà phân tích liệu - Lỗi tả phổ biến Mục trùng lặp Giá trị bị Giá trị bất hợp pháp Thay đổi giá trị đại diện Xác định liệu chồng chéo 10 Tên khuôn khổ phát triển Apache để xử lý liệu lớn cho ứng dụng mơi trường điện tốn phân tán? Hadoop MapReduce khn khổ lập trình phát triển Apache để xử lý liệu lớn cho ứng dụng mơi trường điện tốn phân tán 11 Những mơ hình bị thiếu thường thấy gì? Các mơ hình bị thiếu thường thấy - Thiếu hoàn toàn ngẫu nhiên Thiếu ngẫu nhiên Thiếu phụ thuộc vào giá trị thiếu chúng - Thiếu phụ thuộc vào biến đầu vào không quan sát 12 Giải thích phương pháp tính KNN gì? Trong tính KNN, giá trị thuộc tính bị thiếu tính cách sử dụng giá trị thuộc tính tương tự với thuộc tính có giá trị bị thiếu Bằng cách sử dụng hàm khoảng cách, tương tự hai thuộc tính xác định 13 Các phương pháp xác nhận liệu sử dụng nhà phân tích liệu gì? Thơng thường, phương pháp sử dụng nhà phân tích liệu để xác nhận liệu Kiểm tra liệu - Xác minh liệu 14 Những nên làm với liệu nghi ngờ tích? - - - Chuẩn bị báo cáo cung cấp thông tin tất liệu nghi ngờ Nó cung cấp thơng tin tiêu chuẩn xác nhận khơng thành cơng, ngày thời gian xảy Nhân viên có kinh nghiệm nên kiểm tra liệu đáng ngờ để xác định tính chấp nhận chúng Dữ liệu khơng hợp lệ phải chuyển nhượng thay code hợp lệ Để làm việc với liệu bị thiếu, sử dụng chiến lược phân tích tốt phương pháp xóa, phương pháp tính đơn, phương pháp dựa mơ hình, v.v 15 Làm để giải vấn đề đa nguồn? Để giải vấn đề đa nguồn, ta cần - Tái cấu lược đồ để hoàn thành lược đồ tích hợp Xác định ghi tương tự hợp chúng vào ghi chứa tất thuộc tính có liên quan mà khơng có thừa 16 Giải thích Outlier gì? Outlier thuật ngữ sử dụng phổ biến nhà phân tích đề cập đến giá trị xuất xa tách rời khỏi mẫu tổng thể mẫu Có hai loại Outliers - Đơn giản Đa biến 17 Giải thích thuật Clustering Phân cấp bậc gì? Thuật tốn phân cụm theo bậc (Hierarchical clustering algorithm) kết hợp phân chia nhóm có, tạo cấu trúc phân cấp thể thứ tự mà nhóm chia hợp 18 Giải thích Thuật tốn K-mean gì? K-mean phương pháp phân chia tiếng Các đối tượng phân loại thuộc nhóm K, k chọn trước Trong thuật toán K-mean, - Các cụm có hình cầu: điểm liệu cụm tập trung quanh cụm Sự khác biệt / lan rộng cụm giống nhau: Mỗi điểm liệu thuộc cụm gần 19 Các kỹ cần thiết cho Nhà phân tích liệu gì? Nhà khoa học liệu phải có kỹ sau Kiến thức sở liệu - Quản lý sở liệu - Trộn liệu - Truy vấn - Thao tác liệu Tiên đốn phân tích - Thống kê mơ tả - Mơ dự đốn - Phân tích nâng cao Kiến thức liệu - Phân tích liệu lớn - Phân tích liệu phi cấu trúc - Học máy Kỹ trình bày - Hình dung liệu - Bài thuyết trình Insight - Thiết kế báo cáo 20 Giải thích lọc cộng tác gì? Lọc cộng tác thuật tốn đơn giản để tạo hệ thống khuyến nghị dựa liệu hành vi người dùng Các thành phần quan trọng lọc cộng tác người dùngchuyên mục-sở thích Ví dụ lọc cộng tác bạn thấy dòng "được đề xuất cho bạn" trang web mua sắm trực tuyến xuất dựa lịch sử duyệt web bạn 21 Giải thích cơng cụ sử dụng liệu lớn gì? Cơng cụ sử dụng liệu lớn bao gồm - Hadoop Hive Pig Flume Mahout Sqoop 22 Giải thích KPI, thiết kế thí nghiệm quy tắc 80/20 gì? KPI : Là viết tắt Chỉ số Hoạt động chính, số bao gồm kết hợp bảng tính, báo cáo biểu đồ quy trình kinh doanh Thiết kế thí nghiệm : Đây q trình ban đầu sử dụng để chia liệu bạn, lấy mẫu thiết lập liệu để phân tích thống kê Quy tắc 80/20 : Có nghĩa 80% thu nhập bạn đến từ 20% khách hàng bạn 23 Giải thích Map reduce gì? Map-reduce khn khổ để xử lý liệu lớn, tách chúng thành tập con, xử lý tập hợp máy chủ khác sau kết hợp kết thu 24 Giải thích Clustering gì? Các thuộc tính cho thuật tốn phân cụm gì? Clustering phương pháp phân loại áp dụng cho liệu Thuật toán phân cụm chia tập liệu thành nhóm tự nhiên nhóm tự nhiên Thuộc tính cho thuật tốn phân cụm - Phân cấp phẳng Lặp lại Cứng mềm Phân biệt 25 Một số phương pháp thống kê hữu ích cho nhà phân tích liệu gì? Các phương pháp thống kê hữu ích cho nhà khoa học liệu - Phương pháp Bayesian Chu trình Markov Các quy trình khơng gian cụm Thống kê xếp hạng, phần trăm, phát bên Kỹ thuật vấn Thuật tốn đơn giản Tối ưu hóa tốn học 26 Phân tích chuỗi thời gian gì? Phân tích chuỗi thời gian thực hai lĩnh vực, miền tần số miền thời gian Trong phân tích chuỗi thời gian, đầu q trình cụ thể dự báo cách phân tích liệu trước với trợ giúp phương pháp khác làm mờ mũ, phương pháp hồi quy tuyến tính, vv 27 Giải thích phân tích correlogram gì? Một phân tích correlogram dạng phổ biến phân tích khơng gian địa lý Nó bao gồm loạt hệ số tự tương quan tính tốn tính cho mối quan hệ khơng gian khác Nó sử dụng để xây dựng correlogram cho liệu dựa khoảng cách, liệu thô biểu diễn khoảng cách giá trị điểm riêng lẻ 28 Bảng băm gì? Trong tính tốn, bảng băm đồ phím giá trị Nó cấu trúc liệu sử dụng để thực mảng kết hợp Nó sử dụng hàm băm để tính mục vào khe, từ lấy giá trị mong muốn 29 Va chạm bảng băm gì? Làm tránh được? Một vụ va chạm bảng băm xảy hai phím khác băm với giá trị Hai liệu lưu trữ khe mảng Để tránh va chạm bảng băm có nhiều kỹ thuật, liệt kê hai cách - Tách riêng : Nó sử dụng cấu trúc liệu để lưu nhiều mục băm cho khe Mở địa : Nó tìm kiếm khe khác sử dụng chức thứ hai lưu trữ mục khe rỗng tìm thấy 30 Giải thích điều thay thế? Liệt kê loại kỹ thuật thay khác nhau? Trong trình thay thế, thay liệu bị thiếu giá trị thay Các loại kỹ thuật gắn kết bao gồm  Thay đơn - Thay Hot-deck: Một giá trị bị thiếu tính từ ghi ngẫu nhiên lựa chọn ngẫu nhiên trợ giúp thẻ punch - Thay cold deck: Hoạt động giống thay Hot deck, nâng cao chọn donors từ liệu khác - Thay trung bình: Nó liên quan đến việc thay giá trị thiếu giá trị trung bình biến cho tất trường hợp khác - Thay hồi quy: Nó bao gồm việc thay giá trị thiếu giá trị dự đoán biến dựa biến khác - Stochastic hồi quy: Nó giống thay hồi quy, cho biết thêm chênh lệch hồi quy trung bình với thay hồi quy Thay lặp Không giống thay đơn, thay lặp ước tính giá trị nhiều lần  31 Phương pháp thay thê thuận lợi hơn? Mặc dù thay đơn sử dụng rộng rãi, khơng phản ánh khơng chắn tạo liệu bị cách ngẫu nhiên Vì vậy, thay lặp thuận lợi thay đơn trường hợp liệu bị ngẫu nhiên 32 Giải thích N-gram gì? N-gram: Một n-gram dãy liên tiếp n mục từ chuỗi văn hay phát biểu định Nó kiểu mơ hình ngơn ngữ xác suất để dự đoán mục theo thứ tự dạng (n-1) 33 Các tiêu chí cho mơ hình liệu tốt gì? Các tiêu chí cho mơ hình liệu tốt bao gồm - Có thể dễ dàng tiêu thụ Thay đổi liệu lớn mơ hình tốt nên mở rộng Cung cấp hiệu suất dự đốn Một mơ hình tốt thích ứng với thay đổi yêu cầu ... tìm kiếm thay regex, tẩy hết giá trị khơng khớp với regex Nếu bạn có vấn đề liệu, xếp chúng theo tần số ước tính bắt đầu với vấn đề phổ biến Phân tích số liệu thống kê tóm tắt cho cột (độ lệch... thường, phụ thuộc, chuỗi phát hiện, quan hệ trì thuộc tính, v.v Liệt kê số vấn đề thường gặp nhà phân tích liệu? Một số vấn đề thường gặp nhà phân tích liệu - Lỗi tả phổ biến Mục trùng lặp Giá... phương pháp xóa, phương pháp tính đơn, phương pháp dựa mơ hình, v.v 15 Làm để giải vấn đề đa nguồn? Để giải vấn đề đa nguồn, ta cần - Tái cấu lược đồ để hồn thành lược đồ tích hợp Xác định ghi

Ngày đăng: 09/02/2018, 09:39

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w