Ngày nay, dữ liệu là một trong những yếu tố quan trọng trong kinh doanh vì dữ liệu giúpchúng ta hiểu các vấn đề mà tổ chức đang gặp phải và việc sử dụng dữ liệu hiệu quả sẽ giúpdoanh nghiệp cải thiện kết quả kinh doanh, đưa ra chiến lược thị trường tốt hơn, giảm chi phí,giúp doanh nghiệp ra quyết định nhanh và chính xác hơn.
Việc phân tích dữ liệu tác động lớn đến đa dạng ngành khác nhau như bán lẻ (Retail),hàng tiêu dùng (Consumer Goods), dịch vụ tài chính (FSI), sản xuất (Manufacturing), bảo hiểm(Insurance)
Lấy thực tế từ việc các nhà bán lẻ có thể quan sát được đầy đủ hành vi, thói quen muasắm để điều chỉnh hoạt động của doanh nghiệp, từ tiếp thị đến những dịch vụ khách hàng saocho phù hợp nhất bằng cách thu thập dữ liệu từ nhiều kênh, chẳng hạn như mạng xã hội, nhật kýcuộc gọi, lượt khách hàng ghé thăm, Bên cạnh việc sử dụng dữ liệu để đưa ra kế hoạch kinhdoanh phù hợp, phân tích dữ liệu còn giúp doanh nghiệp tìm kiếm tệp khách hàng mới, thuậnlợi củng cố lợi thế cạnh tranh, bứt phá dẫn đầu
Sau ba năm rưỡi học tập trên trường, mong muốn có thêm kinh nghiệm thực tế, cũng nhưmuốn được tham gia xử lý dữ liệu, em có dự định là sẽ thực tập trong kì này Vì vậy, em quyếtđịnh chọn Robert Bosch RBVH - một môi trường lý tưởng, hiện đại, chuyên nghiệp - là nơi sẽgiúp em thực hiện được dự định này.
Trang 3Đặc biệt cảm ơn chị Hạnh, anh Tú đã hướng dẫn, giúp đỡ cho chúng em tận tình nhữngkhó khăn việc làm quen với môi trường mới; cảm ơn anh Hùng đã training cho chúng em về cấutrúc của REDLake, cũng như giải đáp những khó khăn, thắc mắc trong quá trình làm việc
Cũng xin cảm ơn thầy cô trong khoa Công nghệ phần mềm đã nhiệt tình hỗ trợ, tạo điềukiện em làm bài báo cáo này.
NamTpHCM, ngày 15 tháng 6 năm 2022
Trang 5Mục lục
CHƯƠNG 1: GIỚI THIỆU CÔNG TY THỰC TẬP 6
1 Giới thiệu công ty RBVH 6
2 Sản phẩm của công ty 6
CHƯƠNG 2: NỘI DUNG THỰC TẬP 7
1 Tìm hiểu công ty và các kỹ năng cơ bản trong công ty 7
2 Nghiên cứu kỹ thuật 7
Trang 6CHƯƠNG 1: GIỚI THIỆU CÔNG TY THỰC TẬP
1 Giới thiệu công ty RBVH
Công ty TNHH Robert Bosch Engineering and Business Solutions Việt làNam(RBVH) là công ty con 100% thuộc tập toàn Robert Bosch GmbH – một trong nhữngtập đoàn công nghệ hàng đầu thế giới RBVH là một trong những trung tâm phát triểnphần mêm đầu tiên của Bosch tại khu vực Đông Nam Á Nơi
Trang 7CHƯƠNG 2: NỘI DUNG THỰC TẬP
Đợt thực tập với chủ đề “Database Developer” nhằm mục đích giúp sinh viên thực tậpđược đào tạo toàn diện về Database, đồng thời rèn luyện những kỹ năng mềm như làm việcnhóm, thuyết trình, giao tiếp Tại công ty, sinh viên có cơ hội được học tập, khám phá và làmviệc trong một môi trường chuyên nghiệp.
1 Tìm hiểu công ty và các kỹ năng cơ bản trong công ty
Thời gian : 1 ngày
Nội dung : Giới thiệu về công ty, cách tổ chức của công ty
Được nghe người phụ trách giới thiệu về công ty, quá trình thành lập và phát triên(như đã nhắc đến ở trên), quy trình làm việc từ cao xuống thấp, cách thức tổ chức củacông ty.
Ngoài ra, thực tập sinh còn được giới thiệu về cách thức làm việc trong công tynhư thời gian đi làm, các quy định cần phải tuân thủ, cách sử dụng email trong côngviệc…
Kết quả : Hiểu thêm về công ty RBVH, quá trình thành lập và phát triển Có thêm các kỹ
năng về việc sử dụng email trong công việc, làm việc có kế hoạch, có kỷ luật, có tráchnhiệm hơn.
2 Nghiên cứu kỹ thuật2.1. Các công cụ làm việc
Thời gian : 4 ngày
Nội dung : Tìm hiểu về các công cụ sẽ được sử dụng trong quá trình làm việc.
Trong thời gian này, supervisor đã hướng dẫn thực tập sinh tìm hiểu về các côngcụ sẽ giúp ích cho trong công việc sau này Một số phần mềm trong số đó nhưMicrosoft Teams, Skype - ứng dụng để trao đổi về công việc cũng như giao tiếp trongcông ty, Source Tree – quản lý source code, Notepad ++ -một chương trình soạn thảovăn bản rất hữu ích và phổ biến với lập trình viên.
Thực hiện : Thực hành sử dụng các phần mềm đã nêu trên.
Kết quả : Lập trình sử dụng các công cụ miễn phí, giúp dễ dàng kết hợp các công cụ
với nhau, so với việc dung các IDE.
Trang 8- Trigger:
Thực tập sinh được dướng dẫn về việc hiện thực và sử dụng Triggers, đây là mộttrong những phần rất quan trọng khi làm việc trên database, vì cần đảm bảo tínhđúng đắn của dữ liệu trong relational database.
- Procedures/ Functions:
Cung cấp cách tạo ra các procedures, functions và cách gọi chúng Bên cạnh đó lànhững điểm tương đồng và khác biệt giữa procedures và functions, hiểu thêm vềmột số thành phần parameter và return phổ biến được sử dụng trong các chươngtrình con PL/SQL
- Ôn lại các kiến thức về SQL
- Biết thêm những định nghĩa, kiến thức mới về PL/SQL
- Ngoài ra còn được biết thêm một số quy tắc trong việc viết code sao cho đúngchuẩn, dễ đọc, dễ hiểu.
2.3. Tìm hiểu về Data Warehouse – Data Lake – Data Modelling
Nội dung: Các kiến thức cơ bản về Data Warehouse, Data Lake, Data Modelling
- Data warehouse architecture:
Nắm được các loại kiến trúc cơ bản có trong Data warehouse như centralized,component-based, cùng với đó là ưu, nhược điểm của từng loại để ứng dụng trongtừng trường hợp cụ thể
- Data Integration:
Hiểu được khái niệm cơ bản của Data Integration, biết được các tools được sửdụng cho từng loại source systems cụ thể Hiểu được các khái niệm quan trọngbao gồm ETL, ELT
- Data Mart:
Trang 9- Data Lake
Phân biệt sự khác nhau giữa Data Lake và Data Warehouse, cấu trúc cơ bản củaData Lake, những điều cần tránh khi thiết kế Data Lake để Data Lake không trởthành Data Swamp
- Data Vault Modelling
Nắm được các loại table cơ bản trong Data Vault Modelling như HUB, LINK,SATELLITE Ngoài ra, biết thêm về các loại bảng nâng cao hơn như Point-In_time, Bridge.
Thực hiện :
- Tham gia đầy đủ các buổi trainning.
- Tìm kiếm tài liệu trên mạng để tìm hiểu thêm.
Trang 10tảng kỹ thuật và một khuôn khổ (các khái niệm tích hợp)- Cấu trúc của REDLake:
REDLake là sự kết hợp giữa Data Warehouse và Data Lake, nắm rõ được các tầngtrong REDLake, các quy tắc làm việc trên REDLake
Thực hiện :
- Tham gia đầy đủ các buổi training.
- Thực hiện một số task mô phỏng trên hệ thống REDLake
Chi tiết sẽ được nói ở phần sau.
4. Lịch làm việc
Mức độhoànthành
Nhận xét củangười hướng
Anh Lâm QuốcVinh
Anh Ngô MạnhDuy
Anh Huỳnh QuốcHùng
Anh Đinh Ngọc Hạ
Trang 11- Thực hành các bài tập liên
Anh Huỳnh QuốcHùng
Anh Đinh Ngọc HạLong
4 Tìm hiểu về các khái niệmtrong Data Warehouse
Anh Huỳnh QuốcHùng
5 Tìm hiểu về Data Modeling:Data Vault Modeling,Dimensional Modeling
Anh Huỳnh QuốcHùng
6 Tìm hiểu về cấu trúc cơ bảncủa REDLake Anh Huỳnh QuốcHùng7
Tìm hiểu về quy tắc làmviệc, cách làm việc trênREDLake
Anh Huỳnh QuốcHùng
8 Thực hiện một số task trênREDLake Anh Huỳnh QuốcHùng
Trang 12CHƯƠNG 3: CHI TIẾT VỀ PROJECT1 Giới thiệu
- Là một task thật để làm quen với REDLake- Tự tìm hiểu tài liệu
2 Thực hiện
- Làm theo cá nhân dưới sự giám sát của mentor
- Dựa theo tài liệu được cung cấp để thực hiện đúng kết quả được giao
3 Kết quả
- Hoàn thành yêu cầu được giao trước kỳ hạn quy định
Trang 14TÀI LIỆU THAM KHẢO
[1] REDLake:
[2] https://bosch-etm.udemy.com/course/data-warehouse-fundamentals-for-beginners
[3] Building a scalable data warehouse with data vault 2.0, author: Daniel Linstedt,Michael Olschimke