Cùng với sự bùng nổ và phát triển của internet thì Internet Marketing cũng chính là một trong các công cụ hữu hiệu để cho các doanh nghiệp tiếp cận trực tiếp, giới thiệu sản phẩm của mìn
Trang 1LỜI CÁM ƠN Trong cuộc sống, bất cứ thành quả nào chúng ta đạt được thì cũng không thể thiếu bóng dáng và giúp đỡ từ mọi người trong hành trình đi đến thành quả
đó Và trong quá trình thực hiện đề tài luận văn tốt nghiệp “Tìm hiểu hệ thống
internet marketing, công nghệ big data và demo trên website
“deptuthiennhien.net” chúng tôi đã nhận được sự giúp đỡ rất nhiều từ gia đình,
thầy cô , bạn bè Không biết nói gì hơn với lòng biết ơn sâu sắc và cảm tạ nhất, trước tiên chúng tôi xin gửi lời cảm ơn ThS Nguyễn Văn Diêu là người đã hưỡng dẫn cũng như đã tận tình giúp đỡ, truyền đạt những kinh nghiệm quý báu cho chúng tôi để hoàn thành luận văn tốt nghiệp này
Tiếp theo, chúng tôi xin gửi lời cảm ơn đến các thầy cô trong Khoa cũng như xin gửi lời cảm ơn đến bạn bè đã không quản ngại giúp đỡ, giới thiệu, tư vấn, hỗ trợ để chúng tôi có thêm kiến thức trong quá trình hoàn thành luận văn
Mặc dù cố gắng hoàn thành luận văn trong phạm vi và khả năng cho phép, bài luận văn của chúng tôi chắc chắn sẽ không tránh khỏi những thiếu sót Chúng tôi rất mong nhận được sự thông cảm góp ý và tận tình chỉ bảo của quý thầy cô
và các bạn để bài luận văn tốt nghiệp của chúng tôi được hoàn thiện hơn
Nhóm sinh viênTrần Thị Hồng
Đặng Ngọc Thất
Trang 2LỜI CAM ĐOANLuận văn tốt nghiệp này đã được chúng tôi hoàn thành đúng thời gian quy định và đáp ứng được yêu cầu đề ra nhờ sự cố gắng nghiên cứu, tìm tòi và phát triển dưới sự hướng dẫn trực tiếp của Th.s Nguyễn Diêu Chúng tôi đã tham khảo một số tài liệu trong phần “Tài liệu tham khảo“ Chúng tôi cam đoan không hề sao chép nội dung từ bất kỳ đồ án nào khác Mọi sao chép sai quy định,
vi phạm quy chế đào tạo, chúng tôi xin chịu hoàn toàn trách nhiệm trước hội đồng
Nhóm sinh viênTrần Thị Hồng
Đặng Ngọc Thất
Trang 3MỤC LỤC
MỤC LỤC iii
LỜI MỞ ĐẦU 1
CHƯƠNG 1: TÌM HIỂU VỀ CÔNG NGHỆ BIG DATA 5
CHƯƠNG 2: XÂY DỰNG HỆ THỐNG INTERNET MARKETING 21
HIỆU QUẢ 21
CHƯƠNG 3: DEMO TRÊN WEBSITE DEPTUTHIENNHIEN.NET 73
3.2 Xây dựng website 74
3.4 Tối ưu offpage 78
TÀI LIỆU THAM KHẢO 84
Trang 4DANH MỤC HÌNH
Hình 1: Các thành phần của Big Data 12
Hình 2 Sơ đồ hệ thống Internet marketing 24
Hình 3 Sơ đồ các kênh Internet Marketing 27
Hình 4 Quy trình SEO 35
Hình 5 Hành vi tìm kiếm của khách hàng 37
Hình 6 Hành vi tìm kiếm của người dùng trên mobile 38
Hình 7 Hành vi của người dùng trên mạng xã hội 40
Hình 8 Số lượng đối thủ 45
Hình 9 Phân tích đối thủ cạnh tranh 45
Hình 10 Tìm key word của đối thủ 46
Hình 11 Thành phần hiển trị trên trang tìm kiếm 61
Hình 12 Từ khóa chủ quan 73
Hình 13 Từ khóa khách quan 74
Hình 14: Giao diện website chính 74
Hình 15 Giao diện bài viết 75
Hình 16 Tối ưu onpage 77
Hình 17 Quảng bá trên Facebook.com 79
Hình 18 Quảng bá trên Youtube.com 80
Hình 19 Quảng bá trên Google place 81
Hình 20 Kết quả SEO 82
Hình 21 Kết quả search từ khóa 83
DANH MỤC CÁC TỪ VIẾT TẮT
Trang 5MPP Massively Parallel Processing
Trang 6LỜI MỞ ĐẦU
“Trong năm đến mười năm nữa, bạn chỉ có hai sự lựa chọn hoặc là kinh doanh cùng internet hoặc không nên kinh doanh gì nữa” Câu nói nổi tiếng đó
của Bill Gates đã làm cho cả thế giới nhận ra làm kinh doanh trực tuyến chính là
xu hướng của thời đại
Theo trung tâm Internet Việt Nam, tính tới tháng 10/2012, Việt Nam đã có hơn 31 triệu người dùng internet, chiếm 35,4% dân số cả nước, với 66% sử dụng internet hàng ngày Internet tác động rất lớn tới khả năng tiếp cận thông tin cũng như hành vi mua hàng của hơn 35% dân số Việt Nam Cùng với sự bùng nổ và
phát triển của internet thì Internet Marketing cũng chính là một trong các công cụ hữu hiệu để cho các doanh nghiệp tiếp cận trực tiếp, giới thiệu sản phẩm của mình đến khách hàng một cách rộng rãi.
Cũng trong năm 2012, cụm từ "Big Data" là một trong những từ khoá tìm kiếm nhiều nhất trên Internet Việc sử dụng Big Data ngày càng phổ biến hơn trong năm 2013, khi mà các doanh nghiệp từ lớn tới nhỏ đều sử dụng Big Data để phân tích các thông số dữ liệu, tạo ra lợi thế cạnh tranh đáng kể so với thị trường chung Việc đầu tư vào Big Data sẽ mang lại doanh thu xứng đáng cho doanh nghiệp Các dữ liệu và các phân tích từ Big Data sẽ giúp đưa ra được những quyết định chính xác hơn, mang lại lợi nhuận cao hơn cho doanh nghiệp
Bắt nhịp được xu hướng phát triển này của thế giới, chúng tôi đã chọn
đề tài “Tìm hiểu hệ thống Internet Marketing, công nghệ Big Data và demo
Trang 7thống Internet Marketing, cũng như là tính cấp thiết của việc nghiên cứu
và ứng dụng Big Data trong chiến dịch marketing của doanh nghiệp.
1 Tính cấp thiết của đề tài
Như chúng ta đều biết hoạt động marketing chính là hoạt động xương sống đo lường sức khỏe của doanh nghiệp trong môi trường kinh doanh đầy cạnh tranh Với tình hình và tốc độ phát triển của internet ngày nay thì Internet Marketing trở nên vô cùng quan trọng và trở thành cuộc đua sống còn của hoạt động kinh doanh
Đồng thời, với việc kết hợp công nghệ Big Data trong chiến lược Internet Marketing sẽ giúp cho doanh nghiệp tận dụng được nguồn dữ liệu dồi dào hiện
có, và đưa ra các quyết định sáng suốt trong marketing
2 Tình hình nghiên cứu
- Đã hệ thống được về lý thuyết, cơ sở cũng như các công nghệ sử dụng và
xu hướng phát triển của Big Data và Internet Marketing, điểm nhấn mạnh cần tập trung và chú trọng
- Đưa được website deptuthiennhien.net từ một website mới lập lên được top 10 google sau khi lên kế hoạch và chiến lược hợp lý
- Tiếp tục phát triển các ứng dụng công nghệ Big Data cho thực trạng phát triển kinh doanh về sản phẩm và khách hàng, các giải pháp Đồng thời triển khai
hệ thống Internet Marketing trên quy mô đa kênh để khai thác tối đa hiệu quả
Trang 8- Tăng thứ hạng trên công cụ tìm kiếm hàng đầu Google cho website Deptuthiennhien.net.
4 Nhiệm vụ nghiên cứu.
- Công nghệ mới Big Data về khái niệm, cách hoạt động và công nghệ hỗ trợ, ứng dụng to lớn của Big Data
- Hệ thống hóa cơ sở lý luận về Internet Marketing và triển khai các kênh Internet Marketing :
• Nắm được cơ sở lý thuyết chung về quảng cáo trực tuyến và các vấn
đề trong quảng bá website
• Tìm hiểu công cụ tìm kiếm và nghiên cứu những tiêu chí của việc nâng cao thứ hạng trên công cụ tìm kiếm Google (SEO)
- Đánh giá thực trạng, hiệu quả Internet Marketing của deptuthiennhien.net trên các khía cạnh:
Trang 9• Tìm hiểu thực trạng tình hình quảng bá website của deptuthiennhien.net
• Ưu điểm, thành tựu, hạn chế và nguyên nhân của những hạn chế
• Lập kế hoạch Internet Marketing cho website
- Đề xuất những giải pháp để nâng cao hiệu quả Internet Marketing của Deptuthiennhien.net:
• Hướng tới việc hoàn thiện hơn cho website
• Có những đề xuất và hướng phát triển lâu dài một cách tiềm năng cho website deptuthiennhien.net về chất lượng sản phẩm, chất lượng phục
vụ, việc nắm bắt nhu cầu thị trường
Phương pháp nghiên cứu.
Nghiên cứu, tìm hiểu lý thuyết chung của vấn đề Tiếp đến xem xét thực trạng của vấn đề, các ưu, khuyết, hạn chế, nguồn lực và công nghệ hiện tại để lên kế hoạch và chiến lược cụ thể Sáng tạo và kiên nhẫn và trong quá trình đưa lý
thuyết ra thực tế để phù hợp với thực tại của vấn đề
Kết quả đạt được
Nghiên cứu tổng quan về công nghệ Big Data
Nghiên cứu và xây dựng hệ thống quy trình cũng như các kỹ thuật làm Internet Marketing, đưa được website lên top 10 google từ một website mới thành lập
Kết cấu của luận văn tốt nghiệp
Chương 1: Tìm hiểu về công nghệ Big Data
Chương 2: Tìm hiểu và xây dựng hệ thống Internet Marketing hiệu quả
Chương 3: Demo trên website Deptuthiennhien.net
Trang 10CHƯƠNG 1: TÌM HIỂU VỀ CÔNG NGHỆ BIG DATA
1.1 Tổng quan về Big Data
1.1.1 Định nghĩa
Big Data là thuật ngữ dùng để chỉ một tập hợp dữ liệu rất lớn và rất phức tạp đến nỗi những công cụ, ứng dụng xử lí dữ liệu truyền thống không thể nào đảm đương được Kích cỡ của Big Data đang từng ngày tăng lên, và tính đến năm 2012 thì nó có thể nằm trong khoảng vài chục terabyte cho đến nhiều petabyte (1 petabyte = 1024 terabyte) chỉ trong một tập hợp dữ liệu mà thôi
Tuy nhiên, Big Data lại chứa trong mình rất nhiều thông tin quý giá mà nếu trích xuất thành công, nó sẽ giúp rất nhiều cho việc kinh doanh, nghiên cứu khoa học, dự đoán các dịch bệnh sắp phát sinh và thậm chí là cả việc xác định điều kiện giao thông theo thời gian thực Vì thế, những dữ liệu này phải được thu thập, tổ chức, lưu trữ, tìm kiếm, chia sẻ theo một cách khác so với bình thường
Vào năm 2001, nhà phân tích Doug Laney của hãng META Group (bây giờ chính là công ty nghiên cứu Gartner) đã nói rằng những thách thức và cơ hội nằm trong việc tăng trưởng dữ liệu có thể được mô tả bằng ba chiều: tăng về lượng (volume), tăng về vận tốc (velocity) và tăng về chủng loại (variety) Giờ đây, Gartner cùng với nhiều công ty và tổ chức khác trong lĩnh vực công nghệ thông tin tiếp tục sử dụng mô hình “3V” này để định nghĩa nên Big Data Đến năm 2012, Gartner bổ sung thêm rằng Big Data ngoài ba tính chất trên thì còn phải cần đến các dạng xử lí mới để giúp đỡ việc đưa ra quyết định, khám phá sâu
Trang 11Ví dụ về Big Data ta có thể kể đến công tác giải mã di truyền của con người chẳng hạn Trước đây công việc này mất đến 10 năm để xử lí, còn bây giờ người
ta chỉ cần một tuần là đã hoàn thành Còn Trung tâm giả lập khí hậu của NASA thì đang chứa 32 petabyte dữ liệu về quan trắc thời tiết và giả lập trong siêu máy tính của họ Việc lưu trữ hình ảnh, văn bản và các nội dung đa phương tiện khác trên Wikipedia cũng như ghi nhận hành vi chỉnh sửa của người dùng cũng cấu thành một tập hợp Big Data lớn
Hoạt động của người dùng Wikipedia được mô hình hóa và với kích thước hàng terabyte, đây cũng có thể được xem là một dạng Big Data
1.1.2 Vài thông tin về tình hình Big Data hiện nay
Theo tài liệu của Intel vào tháng 9/2013, hiện nay thế giới đang tạo ra 1 petabyte dữ liệu trong mỗi 11 giây và nó tương đương với một đoạn video HD dài 13 năm Bản thân các công ty, doanh nghiệp cũng đang sở hữu Big Data của riêng mình, chẳng hạn như trang bán hàng trực tuyến eBay thì sử dụng hai trung tâm dữ liệu với dung lượng lên đến 40 petabyte để chứa những truy vấn, tìm kiếm, đề xuất cho khách hàng cũng như thông tin về hàng hóa của mình
Nhà bán lẻ online Amazon.com thì phải xử lí hàng triệu hoạt động mỗi ngày cũng như những yêu cầu từ khoảng nửa triệu đối tác bán hàng Amazon sử dụng một hệ thống Linux và hồi năm 2005, họ từng sở hữu ba cơ sở dữ liệu Linux lớn nhất thế giới với dung lượng là 7,8TB, 18,5TB và 24,7TB
Tương tự, Facebook cũng phải quản lí 50 tỉ bức ảnh từ người dùng tải lên, YouTube hay Google thì phải lưu lại hết các lượt truy vấn và video của người
Trang 12Theo tập đoàn SAS, chúng ta có một vài số liệu thú vị về Big Data như sau:
• Các hệ thống RFID (một dạng kết nối tầm gần, như kiểu NFC nhưng có tầm hoạt động xa hơn và cũng là thứ dùng trong thẻ mở cửa khách sạn) tạo ra lượng dữ liệu lớn hơn 1.000 lần so với mã vạch truyền thống
• Chỉ trong vòng 4 giờ của ngày “Black Friday” năm 2012, cửa hàng Walmart đã phải xử lí hơn 10 triệu giao dịch tiền mặt, tức là khoản 5.000 giao diện mỗi giây
• Dịch vụ chuyển phát UPS nhận khoảng 39,5 triệu yêu cầu từ khách hàng của mình mỗi ngày
• Dịch vụ thẻ VISA xử lí hơn 172.800.000 giao dịch thẻ chỉ trong vòng một ngày mà thôi
• Trên Twitter có 500 triệu dòng tweet mới mỗi ngày, Facebook thì có 1,15
tỉ thành viên tạo ra một mớ khổng lồ dữ liệu văn bản, tập tin, video…
1.1.3 Công nghệ dùng trong Big Data
Big Data là nhu cầu đang tăng trưởng lớn đến nỗi Software AG, Oracle, IBM, Microsoft, SAP, EMC, HP và Dell đã chi hơn 15 tỉ USD cho các công ty chuyên về quản lí và phân tích dữ liệu Năm 2010, ngành công nghiệp Big Data
có giá trị hơn 100 tỉ USD và đang tăng nhanh với tốc độ 10% mỗi năm, nhanh gấp đôi so với tổng ngành phần mềm nói chung
Như đã nói ở trên, Big Data cần đến các kĩ thuật khai thác thông tin rất đặc biệt do tính chất khổng lồ và phức tạp của nó Năm 2011, tập đoàn phân tích
Trang 13crowsourcing (tận dụng nguồn lực từ nhiều thiết bị điện toán trên toàn cầu để cùng nhau xử lí dữ liệu), các thuật toán về gen và di truyền, những biện pháp machine learning (ý chỉ các hệ thống có khả năng học hỏi từ dữ liệu, một nhánh của trí tuệ nhân tạo), xử lí ngôn ngữ tự nhiên (giống như Siri hay Google Voice Search, nhưng cao cấp hơn), xử lí tín hiệu, mô phỏng, phân tích chuỗi thời gian,
mô hình hóa, kết hợp các server mạnh lại với nhau
Ngoài ra, các cơ sở dữ liệu hỗ trợ xử lí dữ liệu song song, ứng dụng hoạt động dựa trên hoạt động tìm kiếm, file system dạng rời rạc, các hệ thống điện toán đám mây (bao gồm ứng dụng, nguồn lực tính toán cũng như không gian lưu trữ) và bản thân internet cũng là những công cụ đắc lực phục vụ cho công tác nghiên cứu và trích xuất thông tin từ Big Data Hiện nay cũng có vài cơ sở dữ liệu theo dạng quan hệ (bảng) có khả năng chứa hàng petabyte dữ liệu, chúng cũng có thể tải, quản lí, sao lưu và tối ưu hóa cách sử dụng Big Data nữa
Những người làm việc với Big Data thường cảm thấy khó chịu với các hệ thống lưu trữ dữ liệu vì tốc độ chậm, do đó họ thích những loại ổ lưu trữ nào có thể gắn trực tiếp vào máy tính (cũng như ổ cứng gắn trong máy tính của chúng ta vậy) Ổ đó có thể là SSD cho đến các đĩa SATA nằm trong một lưới lưu trữ cỡ lớn Những người này nhìn vào ổ NAS hay hệ thống lưu trữ mạng SAN với góc nhìn rằng những thứ này quá phức tạp, đắt và chậm Những tính chất nói trên không phù hợp cho hệ thống dùng để phân tích Big Data vốn nhắm đến hiệu năng cao, tận dụng hạ tầng thông dụng và chi phí thấp Ngoài ra, việc phân tích Big Data cũng cần phải được áp dụng theo thời gian thực hoặc cận thời gian thực, thế nên độ trễ cần phải được loại bỏ bất kì khi nào và bất kì nơi nào có thể
Trang 141.1.4 Khó khăn khi nghiên cứu về Big Data
Big Data là những dữ liệu cực kì lớn, vượt ngoài khả năng xử lý truyền thống Do đó, để nghiên cứu về Big Data phải có lượng dữ liệu cực kì lớn, hơn thế nữa phải có chỗ để lưu trữ Hiện tại, chỉ có hạ tầng về công nghệ thông tin tại các công ty lớn trong nước mới đáp ứng được về mặt lưu trữ cũng như lượng dữ liệu, ví dụ: FPT, VCCorp, CoopMart… Hạ tầng công nghệ thông tin tại các trường đại học hầu như không đủ mạnh để nghiên cứu về Big Data Xuất hiện một nghịch lý ở đây, các đơn vị nghiên cứu như trường đại học thì không có dữ liệu thực để nghiên cứu, trong khi đó các đơn vị có dữ liệu lại không có đủ chuyên gia
1.1.5 Những ý kiến về công nghệ Big Data
Có hai hướng chỉ trích chính đối với Big Data, một là về cách mà người ta
sử dụng Big Data, cái còn lại thì liên quan đến việc tiến hành lấy thông tin từ Big Data mà thế giới đang làm
Ngoài ra, còn có chỉ trích rằng Big Data chỉ có thể miêu tả thế giới trong quá khứ bởi nó dựa trên các dữ liệu đã sinh ra từ trước, và nếu tốt lắm thì chỉ
Trang 15phải kết hợp thêm với các phương pháp mô hình, mô phỏng hay nghiên cứu về
sự chuyển động của thế giới thì mới đưa ra dự đoán chính xác được
Bên cạnh đó, người ta còn lo lắng về vấn đề quyền riêng tư của người dùng Việc thu thập Big Data có thể sẽ đi kèm thông tin có khả năng định dạng người dùng mà không được sự đồng ý của họ, và điều đó vi phạm luật ở một số quốc gia Nhiều chuyên gia từ nhiều lĩnh vực khác nhau hiện đang thúc đẩy việc bảo vệ quyền riêng tư khi sử dụng Big Data
- Chỉ trích về việc lấy thông tin từ Big Data:
Nhà nghiên cứu Danah Boyd đã đưa ra quan ngại của mình rằng việc sử dụng Big Data trong việc chọn mẫu thống kê có thể gây ra sự chủ quan, và dù ít hay nhiều thì nó cũng có thể ảnh hưởng đến kết quả cuối cùng Việc khai thác dữ liệu từ một số nguồn là Big Data, trong khi những nguồn khác không phải là “dữ liệu lớn” thì đặt ra những thách thức khi phân tích dữ liệu
1.1.6 Tương lai của Big Data
Erik Swan, đồng sáng lập kiêm giám đốc công nghệ của công ty Spunk,
dự đoán rằng sự thay đổi lớn nhất trong Big Data chính là thái độ của mọi người đối với nó Việc tiêu thụ một lượng dữ liệu lớn sẽ dần phổ biến hơn với mọi người, từ những người nông dân cho đến các anh kĩ sư Mọi người sẽ mặc định
sử dụng dữ liệu để phân tích mọi thứ trong vòng 10 năm tới Tất nhiên là kĩ thuật
và công nghệ cũng cần phải phát triển theo thì điều này mới có thể trở thành hiện thực trong tương lai được
Còn theo Ankur Jain, nhà sáng lập và CEO của Humin, ngữ cảnh phát sinh
ra dữ liệu sẽ trở nên quan trọng hơn “Chúng ta sẽ bắt đầu định tuyến dữ liệu vào
Trang 16các đối tượng, sự vật, sự việc trong đời thực và chuyện đó giúp chúng ta xử lí công việc tốt hơn”.
Trong khi đó, Daniel Kaufman, giám đốc đổi mới về thông tin của cơ quan nghiên cứu thuộc Bộ quốc phòng Mỹ thì cho rằng dữ liệu sinh học sẽ ngày càng được quan tâm hơn, và rồi người ta sẽ dùng dữ liệu này để đưa ra những lời khuyên có ảnh hưởng lớn đến lối sống và cuộc đời của con người Ví dụ, ta có nên ăn thêm một dĩa cơm tấm sườn nữa không, hay là nên ăn thêm một dĩa cơm gà? Bộ quốc phòng Mỹ muốn sử dụng kiểu suy nghĩ như thế (thay cơm bằng pizza nhé) để áp dụng cho binh lính của mình và hiện họ đang thử nghiệm trên chuột
Giám đốc Swan còn suy nghĩ thêm rằng các công ty chuyên cung cấp giải pháp Big Data sẽ không còn bán dữ liệu và phân tích cho từng doanh nghiệp hay công ty riêng lẻ để phục vụ cho những mục đích quá chuyên biệt Thay vào đó,
họ sẽ mở rộng nó và áp dụng Big Data nhằm giải quyết những vấn đề trong đời thường và trả lời cho các nhu cầu cơ bản của con người Đó sẽ là sự thay đổi về tính ứng dụng của Big Data
Trong tương lai, chúng ta sẽ còn tiếp tục chứng kiến sự tăng trưởng của Big Data Hiện nay có thể ta cũng đã nghe đến khái niệm Internet of Things, tức
là mang Internet đến với mọi thứ trong đời sống hằng ngày Dữ liệu từ Internet
of Things thực chất cũng là được thu thập từ một mạng lưới rất nhiều các cảm biến và thiết bị điện tử, và nó cũng là một trong những nguồn của Big Data Lượng dữ liệu khổng lồ này có thể cho các nhà nghiên cứu biết được hành vi tiêu dùng của khách hàng, từ đó tinh chỉnh những thiết bị Internet of Things cho phù hợp hơn, bắt chúng phục vụ đời sống hằng ngày của chúng ta một cách hiệu quả
Trang 17hơn Nó cũng có thể được dùng cho việc sản xuất, từ đó giảm sự liên quan của con người Như lời của Daniel Kaufman dự đoán thì “con người sẽ làm ít hơn” nhờ Big Data.
1.2 Các thành phần của Big Data
Hình 1: Các thành phần của Big Data
Big Data bao gồm các thành phần sau đây:
- Quản lý dữ liệu: đối với hệ dữ liệu có cấu trúc sẽ được lưu trữ và thao tác trong hệ thống quản lý cơ sở dữ liệu quan hệ (RDBMS) Hệ thống MPP có khả năng tập hợp dữ liệu đồ sộ ngày càng lớn thêm và tăng cường dữ liệu tăng trưởng Kho dữ liệu là nơi tập hợp và lưu trữ dữ liệu cho các báo cáo sau này Hệ dữ liệu không cấu trúc được lấy từ nhiều
Trang 18nguồn với kích cỡ khác nhau Điều này đòi hỏi cần phải có một công
cụ để đáp ứng nhu cầu trên, ví dụ như là Apache Hadoop
- Phân tích dữ liệu: là nơi mà các công ty bắt đầu trích xuất giá trị của Big Data, liên quan tới việc phát triển các ứng dụng và sử dụng các ứng dụng để đạt được cái nhìn sâu sắc vào dữ liệu lớn Đồng thời xây dựng các tool để phân tích dữ liệu
- Sử dụng dữ liệu: đưa Big Data đã phân tích để phục vụ trong kinh doanh thông minh và các ứng dụng của người dùng cuối
1.3 Tổng quan về Hadoop
1.3.1 Khái niệm
Dưới đây là một vài định nghĩa về Hadoop, mỗi định nghĩa nhắm vào một nhóm đối tượng khác nhau trong doanh nghiệp:
- Đối với các giám đốc điều hành: Hadoop là một dự án phần mềm nguồn
mở của Apache để thu được giá trị từ khối lượng/tốc độ/tính đa dạng đáng kinh ngạc của dữ liệu về tổ chức
- Đối với các giám đốc kỹ thuật: Hadoop là một bộ phần mềm nguồn mở để khai phá Big Data có cấu trúc và không có cấu trúc về công ty đó Nó tích hợp với hệ sinh thái Business Intelligence của công ty
- Đối với các kỹ sư: Hadoop là một môi trường song song thực thi MapReduce dựa trên Java, không chia sẻ gì cả Hãy nghĩ đến hàng trăm, hàng ngàn máy tính đang làm việc để giải quyết cùng một vấn đề, có khả năng khôi phục lỗi dựng sẵn Các dự án trong hệ sinh thái Hadoop cung cấp khả năng tải dữ liệu, hỗ trợ ngôn ngữ cấp cao, triển khai trên đám mây
tự động và các khả năng khác
Trang 191.3.2 Các thành phần của Hadoop
Dự án Hadoop của Apache có hai thành phần cốt lõi, kho lưu trữ tệp gọi là Hadoop Distributed File System (HDFS – Hệ thống tệp phân tán Hadoop) và khung công tác lập trình gọi là MapReduce Có một số dự án hỗ trợ để sử dụng HDFS và MapReduce
1.3.2.1 HDFS
Nếu ta muốn có hơn 4000 máy tính làm việc với dữ liệu của mình, thì tốt hơn ta nên phổ biến dữ liệu của mình trên hơn 4000 máy tính đó HDFS thực hiện điều này cho chúng ta HDFS có một vài bộ phận dịch chuyển Các Datanode (nút dữ liệu) lưu trữ dữ liệu của mình và Namenode (nút tên) theo dõi nơi lưu trữ các thứ
1.3.2.2 MapReduce
MapReduce là một phương thức thực thi để giúp các ứng dụng có thể xử lý nhanh một lượng dữ liệu lớn Các dữ liệu này được đặt tại các máy tính phân tán Các máy tính này sẽ hoạt động song song độc lập với nhau Điều này làm rút ngắn thời gian xử lý toàn bộ dữ liệu Một đặc điểm đáng chú ý của MapReduce
là dữ liệu đầu vào có thể là dữ liệu có cấu trúc (dữ liệu lưu trữ dạng bảng quan
hệ 2 chiều) hoặc dữ liệu không cấu trúc (dữ liệu dạng tập tin hệ thống).
1.3.2.3 Hive và Hue
Ta có thể viết SQL và yêu cầu Hive chuyển đổi nó thành một tác vụ MapReduce Đúng là ta chưa có một môi trường ANSI-SQL đầy đủ, nhưng ta có
4000 ghi chép và khả năng mở rộng quy mô ra nhiều Petabyte Hue cung cấp cho
ta một giao diện đồ họa dựa trên trình duyệt để làm công việc Hive của mình
Trang 201.3.2.4 Pig
Một môi trường lập trình mức cao hơn để viết mã MapReduce Ngôn ngữ Pig được gọi là Pig Latin Ta có thể thấy các quy ước đặt tên hơi khác thường một chút, nhưng ta sẽ có tỷ số giá - hiệu năng đáng kinh ngạc và tính sẵn sàng cao
1.3.2.5 Hbase
Một kho lưu trữ key-value có thể mở rộng quy mô rất lớn Nó hoạt động rất giống như một hash-map để lưu trữ lâu bền (với những người hâm mộ python, hãy nghĩ đến một từ điển) Đây không phải là một cơ sở dữ liệu quan hệ, mặc dù
có tên là HBase
1.4 Ứng dụng Big Data trong Internet Marketing
1.4.1 Big Data có thể giúp gì được cho marketing?
Tập đoàn SAS nói vấn đề thật sự không nằm ở việc ta thu thập dữ liệu, mà thay vào đó, là ta dùng Big Data để làm gì Nhìn chung, có bốn lợi ích mà Big Data có thể mang lại: cắt giảm chi phí, giảm thời gian, tăng thời gian phát triển
và tối ưu hóa sản phẩm, đồng thời hỗ trợ con người đưa ra những quyết định đúng và hợp lý hơn
Nếu để ý một chút, ta sẽ thấy khi mua sắm online trên eBay, Amazon hoặc những trang tương tự, trang này cũng sẽ đưa ra những sản phẩm gợi ý tiếp theo cho ta, ví dụ khi xem điện thoại, nó sẽ gợi ý cho ta mua thêm ốp lưng, pin dự phòng; hoặc khi mua áo thun thì sẽ có thêm gợi ý quần jean, dây nịt Do đó, nghiên cứu được sở thích, thói quen của khách hàng cũng gián tiếp giúp doanh nghiệp bán được nhiều hàng hóa hơn
Trang 21Vậy những thông tin về thói quen, sở thích này có được từ đâu? Chính là
từ lượng dữ liệu khổng lồ mà các doanh nghiệp thu thập trong lúc khách hàng ghé thăm và tương tác với trang web của mình Chỉ cần doanh nghiệp biết khai thác một cách có hiệu quả Big Data thì nó không chỉ giúp tăng lợi nhuận cho chính họ mà còn tăng trải nghiệm mua sắm của người dùng, chúng ta có thể tiết kiệm thời gian hơn nhờ những lời gợi ý so với việc phải tự mình tìm kiếm
Người dùng cuối như mình và các ta sẽ được hưởng lợi cũng từ việc tối ưu hóa như thế, chứ bản thân chúng ta thì khó mà tự mình phát triển hay mua các giải pháp để khai thác Big Data bởi giá thành của chúng quá đắt, có thể đến cả trăm nghìn đôla Ngoài ra, lượng dữ liệu mà chúng ta có được cũng khó có thể xem là “Big” nếu chỉ có vài Terabyte sinh ra trong một thời gian dài
Xa hơi một chút, ứng dụng được Big Data có thể giúp các tổ chức, chính phủ dự đoán được tỉ lệ thất nghiệp, xu hướng nghề nghiệp của tương lai để đầu
tư cho những hạng mục đó, hoặc cắt giảm chi tiêu, kích thích tăng trưởng kinh
tế, vv thậm chí là ra phương án phòng ngừa trước một dịch bệnh nào đó, giống như trong phim World War Z, nước Israel đã biết trước có dịch zombie nên đã nhanh chóng xây tường thành ngăn cách với thế giới bên ngoài
Bia Data đề cập đến việc ngày càng tăng khối lượng, vận tốc, đa dạng, biến đổi và phức tạp của thông tin Đối với các tổ chức tiếp thị, Big Data là nền tảng cơ bản của tiếp thị hiện đại, sinh ra từ thế giới kỹ thuật số chúng ta đang sống bây giờ Thuật ngữ "Big Data" không chỉ đề cập đến các dữ liệu của chính
nó, mà nó cũng đề cập đến những thách thức, khả năng và năng lực liên quan đến lưu trữ và phân tích dữ liệu lớn như vậy đặt ra để hỗ trợ mức độ đưa ra quyết
Trang 22định đó là chính xác hơn và kịp thời hơn so với bất cứ điều gì cố gắng trước đó - đưa ra quyết định lớn dữ liệu.
Có Big Data không tự động dẫn đến việc tiếp thị sẽ tốt hơn, nhưng điều đó
có nghĩa là ta đang sở hữu một tiềm năng to lớn Hãy suy nghĩ về Big Data như thành phần bí mật, nguyên liệu, yếu tố cần thiết của mình.Vì thế những hiểu biết bắt nguồn từ Big Data, các quyết định ta thực hiện và hành động của chúng ta
mà sẽ làm nên sự khác biệt rất lớn trong chiến dịch marketing
Bằng cách kết hợp Big Data với một chiến lược quản lý tiếp thị tích hợp,
tổ chức tiếp thị có thể làm cho một tác động đáng kể trong các lĩnh vực chính:
- Sự ràng buộc với khách hàng: Big Data có thể cung cấp cái nhìn sâu sắc không chỉ về việc khách hàng của mình là ai, mà còn về những gì họ đang có, những gì họ muốn, họ muốn được liên lạc như thế nào và khi nào thì thích hợp
- Duy trì khách hàng và lòng trung thành: Big Data có thể giúp ta khám phá những yếu tố nào ảnh hưởng đến lòng trung thành của khách hàng và những nhân tố nào sẽ giữ họ quay trở lại một lần nữa và một lần nữa
- Tối ưu hóa marketing: Với Big Data, ta có thể giúp tối ưu việc chi tiêu cho marketing trên nhiều kênh khác nhau, cũng như liên tục tối ưu hóa các chương trình marketing thông qua thử nghiệm, đo lường và phân tích
Bên cạnh đó, những thách thức liên quan đến việc sử dụng hiệu quả Big Data có thể đặc biệt khó khăn để tiếp thị Đó là bởi vì hầu hết các hệ thống phân tích không phù hợp với dữ liệu, quy trình tổ chức tiếp thị và quyết định Để tiếp thị, ba trong số những thách thức lớn nhất là:
Trang 23- Biết dữ liệu nào cần được thu thập Ta có khối lượng khách hàng rất lớn,
dữ liệu hoạt động và dữ liệu tài chính cần phải đối mặt Điều quan trọng nó phải
là dữ liệu đúng
- Biết được các công cụ phân tích để sử dụng Khi khối lượng dữ liệu lớn phát triển, thì thời gian dành cho việc ra quyết định và hành động trên chúng bị thu hẹp lại Công cụ phân tích có thể giúp ta tổng hợp và phân tích dữ liệu, cũng như phân bổ những hiểu biết và quyết định có liên quan một cách thích hợp và
có tổ chức
- Biết làm thế nào để đi từ dữ liệu đến cái nhìn sâu sắc về nó Một khi ta
có dữ liệu, làm thế nào để ta có cái nhìn sâu sắc từ những dữ liệu đó? Và làm thế nào để ta sử dụng cái nhìn sâu sắc ấy để thực hiện những tác động tích cực vào các chương trình tiếp thị của mình? Mức độ hiểu biết có thể giúp ta phát triển chiến lược và hành động để thúc đẩy tăng trưởng cụ thể
1.4.2 Ba loại dữ liệu Big Data dùng trong marketing
- Khách hàng: Các loại dữ liệu lớn quen thuộc nhất để tiếp thị có thể bao gồm các số liệu hành vi, thái độ và giao dịch từ các nguồn như các chiến dịch tiếp thị, điểm bán hàng, các trang web, các cuộc khảo sát khách hàng, phương tiện truyền thông xã hội, cộng đồng trực tuyến
- Hoạt động: Loại này Big Data thường bao gồm các số liệu khách quan để
đo lường chất lượng của quá trình tiếp thị liên quan đến hoạt động tiếp thị, phân
bổ nguồn lực, quản lý tài sản, kiểm soát ngân sách,…
Trang 24- Tài chính: Thông thường nằm trong hệ thống tài chính của một tổ chức, loại này Big Data có thể bao gồm bán hàng, doanh thu, lợi nhuận và các kiểu dữ liệu khách quan khác để đo lường tình trạng tài chính của tổ chức.
1.4.3 Giải pháp Big Data mang lại trong Internet Marketing
1.4.3.1 Phân tích dữ liệu để xác định cơ hội có giá trị
Để phát hiện ra những cơ hội thành công, đòi hỏi phải xây dựng một lợi thế về dữ liệu, bằng cách tập hợp các dữ liệu có liên quan từ cả bên trong và bên ngoài công ty Dựa trên việc phân tích khối lượng dữ liệu khổng lồ, những nhà lãnh đạo dành thời gian để phát triển “tư duy điểm đến”, bằng cách việc ra những vấn đề kinh doanh họ muốn giải quyết, hoặc những câu hỏi họ muốn được trả lời Nhưng cần phải đặt ra những câu hỏi có tầm nhìn xa và rộng lớn hơn để
có thể nhận được những câu trả lời có ý nghĩa đặc biệt
Cách tiếp cận này có nghĩa là phải thoát khỏi lối suy nghĩ thông thường trong công việc Hầu hết các nhà lãnh đạo triển khai các nguồn lực dựa trên cơ
sở hiệu suất hiện tại hoặc trong quá khứ của một khu vực bán hàng nhất định Sử dụng Big Data đòi hỏi phải xem xét dữ liệu theo một cách mới rộng lớn hơn
1.4.3.2 Tìm hiểu về quá trình ra quyết định của người tiêu dùng
Người tiêu dùng giờ đây được thoải mái lựa chọn những thiết bị, công cụ, công nghệ theo nhu cầu của họ Vì vậy hiểu biết về quá trình ra quyết định của khách hàng là rất quan trọng, để có thể giành được sự lựa chọn của những khách hàng mới hoặc giữ chân những khách hàng truyền thống Khoảng 35% khách hàng B2B (khách hàng doanh nghiệp) tìm hiểu các sản phẩm của nhiều nhà cung cấp khác nhau trước khi quyết định mua chúng Vì vậy các doanh nghiệp cần đầu
Trang 25tư vào website và các kênh giao tiếp khách hàng, SEO web để đảm bảo sản phẩm của mình xuất hiện khi khách hàng tiềm năng tìm kiếm dòng sản phẩm đó.
Các nhà quản lí tiếp thị và bán hàng cần phải tạo được bức tranh hoàn chỉnh về khách hàng của họ, để có thể quảng cáo, giới thiệu những sản phẩm có liên quan tới nhu cầu của khách hàng Và với sự phát triển của Big Data, đó sẽ là
sự kết thúc của thư “rác”, quảng cáo “rác”
1.4.3.3 Giữ cho hệ thống nhanh chóng và đơn giản
Dữ liệu trên toàn thế giới đang gia tăng 40% mỗi năm, tốc độ tăng trưởng
đó là thách thức với bất kỳ nhà quản lí tiếp thị và bán hàng nào Công ty cần phải đầu tư vào một phương pháp “tiếp thị tự động”, một thuật toán cho phép xử lí một lượng dữ liệu lớn qua một quá trình “tự học” để hệ thống có thể tự thay đổi
để tạo ra những phương pháp tương tác với người dùng tốt hơn Đó là một sự kết hợp của dự báo, học máy, và xử lý ngôn ngữ tự nhiên
Tuy nhiên tự động hóa không có nghĩa là tách rời khỏi sự kiểm soát của con người Phương pháp phân tích tiên tiến là để phục vụ cho hoạt động của người bán hàng đạt hiệu quả cao hơn Để thành công, các công ty cần phải xây dựng hệ thống phân tích dữ rộng lớn với liệu phức tạp, và từ đó đưa ra những đề nghị hấp dẫn, những hướng dẫn đơn giản tới khách hàng
“Mỏ vàng dữ liệu” ngày nay là bệ phóng để Marketing và bán hàng có thể cất cánh Những người có khả năng phát triển là những người có thể khai thác được mỏ vàng này
Trang 26CHƯƠNG 2: XÂY DỰNG HỆ THỐNG INTERNET MARKETING
HIỆU QUẢ 2.1 Tìm hiểu tổng quan về Internet Marketing
2.1.1 Khái niệm
Internet Marketing, còn được gọi là Online Marketing, quảng cáo trên Internet, e Marketing (hoặc e-Marketing), là quảng bá sản phẩm và dịch vụ qua Internet Mạng internet phát triển đã mang lại nhiều lợi ích đặc biệt trong tiếp thị, một trong số đó là giảm chi phí cho việc phân phối thông tin và phương tiện truyền thông cho đối tượng khách hàng trên toàn cầu
Các hoạt động Internet Marketing có thể bao gồm các chiến dịch email tiếp cận đến khách hàng, tối ưu hóa công cụ tìm kiếm và các nguyên tắc tiếp thị nói chung Internet marketing sử dụng các khả năng trao đổi web sẵn có để tạo ra sự tương tác với khách hàng tiềm năng bằng cách kết nối họ với nội dung tốt về công ty của ta cũng như các sản phẩm và dịch vụ
2.1.2 So sánh Internet Marketing với Marketing truyền thống
- Marketing truyền thống:
Marketing truyền thống sử dụng các chiến lược như bán hàng trực tiếp, truyền hình, phát thanh, thư từ, quảng cáo in ấn (tạp chí, sách phiếu giảm giá, bảng, biển…vv) và in tài liệu quảng cáo như danh mục sản phẩm hoặc tờ rơi
Ưu điểm của Marketing truyền thống:
Trang 27• Phương pháp truyền thống có thể là phương tiện duy nhất để tiếp cận với một số nhóm người tiêu dùng cụ thể Ví dụ, nếu ta quan tâm đến đối tượng khách hàng nghỉ hưu, nhiều người trong nhóm này không được sử dụng các kênh Internet hoặc phương tiện truyền thông xã hội.
• Bán hàng trực tiếp được sử dụng nhiều trong các chiến lược tiếp thị truyền thống Việc chắc chắn về một thời gian và địa điểm khi bán hàng trực tiếp
là cách hiệu quả nhất để tiếp thị một sản phẩm hay dịch vụ
• Một ưu điểm nữa đó là tính hữu hình Tiếp thị truyền thống cung cấp các bản tài liệu Như vậy người tiêu dùng có thể xem lại các tài liệu này trong lúc rảnh rỗi
Nhược điểm của Marketing truyền thống:
• Tốn kém và chi phí cao: Mua quảng cáo trên kênh truyền hình, phát thanh,
in ấn tài liệu quảng cáo, danh thiếp và bưu phẩm có thể rất tốn kém đối với hầu hết các doanh nghiệp nhỏ
• Khó khăn để theo dõi kết quả: tiếp thị truyền thống giống như việc ném một đồ vật vào tường và hy vọng nó dính vào Đây là khó khăn để theo dõi kết quả định lượng thực sự trong tiếp thị truyền thống
• Thường yêu cầu sự trợ giúp bên ngoài: in ấn tài liệu, mua phương tiện truyền thông và quảng cáo trên đài phát thanh đều yêu cầu thuê thêm sự trợ giúp bên ngoài
- Internet Marketing:
Ưu điểm của Internet Marketing:
Trang 28• Quyết định có thể được thực hiện bằng cách sử dụng cả dữ liệu thực tế và kết quả định tính.
• Khả năng tiếp cận với khách hàng tiềm năng của mình để xác định chính xác thị trường mục tiêu
• Phương tiện truyền thông xã hội, mà chủ yếu là tiếp thị truyền miệng, cho phép ta trực tiếp liên lạc với các nhóm hoặc người tiêu dùng thậm chí từng
cá nhân
• Dữ liệu và kết quả có ngay lập tức
• Phù hợp với bất kỳ doanh nghiệp nào, từ nhỏ đến vừa và lớn
• Ít tốn kém
• Khả năng xây dựng mối quan hệ trực tiếp với khách hàng của ta thông qua phương tiện truyền thông xã hội và cộng đồng
Nhược điểm của Internet Marketing:
• Phụ thuộc vào các khách hàng tương tác cao trên internet
• Ta phải dành nhiều thời gian của mình trong chiến dịch quảng cáo Nội dung phải được tạo ra liên tục, chỉnh sửa, phê duyệt và công bố; ý kiến phản hồi từ khách hàng phải được đáp ứng; các trang trên website phải được duy trì
• Khả năng quản lý kém hoặc không phù hợp trên diễn đàn, blog, mạng xã hội… có thể ảnh hưởng đến thương hiệu của ta
Cả hai phương pháp Marketing truyền thống và Internet Marketing trên đều
Trang 29biết cân bằng giữa hai phương pháp trên Vì khả năng chi trả và hiệu quả của Internet Marketing, các chuyên gia đã đề nghị áp dụng luật 80/20 để kết hợp vào chiến dịch tiếp thị Đầu tư 80% thời gian tiếp thị và tiền vào Internet marketing, 20% vào marketing truyền thống.
2.1.3 Sơ đồ hệ thống internet marketing
Hình 2 Sơ đồ hệ thống Internet marketing 2.1.4 Sơ đồ các kênh Internet Marketing
Marketing là hoạt động không thể thiếu đối với bất kỳ doanh nghiệp nào, nó
là con đường để rút ngắn khoảng cách giữa doanh nghiệp với khách hàng tiềm năng Nhưng càng ngày các phương pháp Marketing truyền thống càng bị bão hoà đối với khách hàng, chi phí cao nhưng hiệu quả lại giảm sút Nhất là trong giai đoạn khủng hoảng hiện nay, khi mà hiệu quả marketing phải được đặt lên hàng đầu
Trang 30Và khi internet bắt đầu bùng nổ cũng là lúc các doanh nghiệp nhìn thấy tiềm năng và hiệu quả của thị trường quảng cáo trực tuyến bên cạnh các kênh quảng cáo truyền thống như truyền hình, radio hay báo giấy… Thì Internet Marketing gần như đã trở thành lựa chọn số một cho các hoạt động marketing
Số lượng doanh nghiệp sử dụng các công cụ tiếp thị online ngày càng tăng, ngân sách dành cho Internet Marketing cũng ngày càng cao
Sau đây là các kênh Internet Marketing:
+ Tiếp thị qua hình thức Affiliate, đại lý, đa cấp online (CPA)
+ Tiếp thị Online Mass Media display ads (Top hit)
+ Tiếp thị bằng các kênh quảng cáo CPM/CPC (Ad network)
+ Tiếp thị bằng các hình thức quảng cáo sponsor chuyên ngành (Niche sites) + Tiếp thị bằng SMM/SMO bằng các kỹ thuật Buzz marketing, viral marketing, trên Mạng xã hội, tạo cộng đồng Online trên mạng xã hội (Group, Fanpage)
+Tiếp thị bằng PR trực tuyến (Forum seeding, Online seeding) Editorial and Advertorial Publicity
+ Sử dụng Email Marketing chuyên ngành và bản tin đặc biệt
+ SEO/SEM/LBM/VSM – Search Engine Marketing, Local Base Marketing, Vertical Search Marketing
+ Tiếp thị bán hàng thông qua các gian hàng trực tuyến hay hệ thống bán hàng trực tuyến của những hệ thống lớn như Groupon on, B2B, B2C sites, Agoda (Web thương mại điện tử)
Trang 31+ Co – Marketing.
+ SMS Marketing, SMS brand
+ Mobile web App – game marketing
+ IVR (Interactive Voice Response)
+ QR code marketing
+ Local base marketing (GG map, Facebook checkin)
+ Thương hiệu cá nhân
+ Blog marketing, content marketing
+ Video Marketing, VVC
Online Marketing Channels
QR Code
Marketing
Mass Media Display
Buzz/Vira
l Marketin g
Forum Seeding
Email Marketing
Ad Netwwork Blog
Marketing
Search Enginer Marketing
Trang 32Hình 3 Sơ đồ các kênh Internet Marketing
2.2 Tìm hiểu về kênh SEO trong Internet Marketing
2.2.1 Khái niệm SEO
Tối ưu hóa công cụ tìm kiếm (SEO - Search Engine Optimization) là một quá trình tối ưu nội dung văn bản và cấu trúc website để các công cụ tìm kiếm chọn lựa trang web phù hợp nhất phục vụ người tìm kiếm trên Internet Có thể hiểu đơn giản SEO là một tập hợp các phương pháp nhằm đưa website lên vị trí trang đầu tiên trong các trang kết quả của các công cụ tìm kiếm
2.2.2 Tìm hiểu về công cụ tìm kiếm
Một sự thật cơ bản đầu tiên mà ta cần biết đó là công cụ tìm kiếm của Google không phải là con người Chính vì thế sẽ có sự khác nhau giữa con người và công cụ tìm kiếm trong việc đánh giá nội dung của một trang web Không giống như con người, công cụ tìm kiếm nội dung theo định hướng Mặc
dù công cụ tìm kiếm được trang bị các công nghệ rất hiện đại tuy nhiên nó vẫn không đủ thông minh để có thể cảm nhận được vẻ đẹp của một mẫu thiết kế, thưởng thức âm thanh hoặc thấy được chuyển động của một video nào đó Vì vậy khi công cụ tìm kiếm thu thập dữ liệu của trang web nó chỉ nhìn vào các văn bản cụ thể để cố gắng hiểu được trang web này đang muốn nói về vấn đề gì
2.2.2.1 Các thành phần của công cụ tìm kiếm
2.2.2.1.1 Bộ phận thu thập dữ liệu
Trang 33Bộ phận thu thập dữ liệu hay còn có tên gọi thân thiện là Google Spider, Google Bot hoặc con nhện Một cách đơn giản có thể hiểu rằng đây là một quá trình mà Google Spider sẽ đi từ trang này sang trang khác
để khám phá nội dung và các liên kết trong trang web của mình Trong quá trình này Google Spider đang cố gắng tìm các trang web mới và cập nhật thêm vào chỉ mục của Google Chính vì thế, Google Bot có thể coi là một chương trình thu thập dữ liệu và phát hiện ra các trang web mới, thay đổi các trang web hiện có và truy tìm các liên kết không tồn tại, các dữ liệu này được sử dụng để cập nhật cho các chỉ mục của Google
2.2.2.2 Cơ chế hoạt động của công cụ tìm kiếm
- Đầu tiên Google Spider sẽ lấy danh sách các máy chủ và trang web phổ biến Sau đó nó sẽ bắt đầu tìm kiếm với một site bất kỳ, nó đánh chỉ mục các từ khóa trên trang và theo các liên kết (link) tìm thấy bên trong trang web này
Trang 34Khi Spider xem xét các trang web (định dạng HTML), nó lưu ý: Các từ bên trong trang web và nơi nó tìm thấy các từ đó.
Ví dụ: Các từ xuất hiện trong các thẻ tiêu đề, thẻ miêu tả… nó nhận định đây là phần quan trọng có liên quan đến sự tìm kiếm của người dùng sau này
Vì thế đối với mỗi website Google nó sẽ có nhiều phương pháp để index lại chỉ mục, liệt kê lại các từ khóa chính Nhưng dù dùng cách nào thì Google cũng luôn cố gắng làm cho hệ thống tìm kiếm diễn ra nhanh hơn để người dùng
có thể tìm kiếm hiệu quả hơn hoặc cả hai
- Kế đó Google sẽ xây dựng chỉ mục:
Xây dựng chỉ mục sẽ giúp cho các thông tin được tìm thấy một cách nhanh chóng Sau khi tìm thông tin trên trang web, Google Spider nhận ra rằng việc tìm kếm thông tin trên website là một quá trình không bao giờ kết thúc… bởi vì các quản trị trang web luôn thay đổi thông tin, cập nhật thông tin trên website và điều đó có nghĩa rằng Spider sẽ luôn phải thực hiện nhiệm vụ thu thập dữ liệu
Ví dụ: Giả sử website làm về ngành du lịch… nó sẽ lưu các chỉ mục trên website đó vào ngành du lịch… Nếu site làm về ca nhạc, nó sẽ lưu các chỉ mục trên web vào ngành ca nhạc
- Xử lý và tính toán:
Sau khi lập chỉ mục Google sẽ xử lý, tính toán và mã hóa thông tin để lưu trữ trong cơ sở dữ liệu Và khi có một truy vấn tìm kiếm thì hệ thống sẽ trả về các kết quả có chứa nội dung hữu ích tương ứng với các truy vấn tìm Việc hiểu
rõ cơ chế tìm kiếm của Google sẽ giúp cho các người SEO có thêm nhiều kỹ
Trang 35năng để có thể tối ưu website thân thiện với Google nhằm mục đích đưa trang web có thứ hạng cao hơn.
2.2.2.3 Sự khác nhau giữa các công cụ tìm kiếm
Mặc dù nguyên tắc hoạt động cơ bản của tất cả các công cụ tìm kiếm là như nhau, sự khác biệt nhỏ giữa chúng dẫn đến những thay đổi lớn trong các kết quả liên quan Đối với các công cụ tìm kiếm khác nhau, các yếu tố khác nhau rất quan trọng Có những lúc, khi các chuyên gia SEO nói đùa rằng các thuật toán của Bing được cố ý làm chỉ với mục đích đối nghịch với những người của Google
Có rất nhiều ví dụ về sự khác biệt giữa các công cụ tìm kiếm Ví dụ, đối với Yahoo! và Bing, các yếu tố từ khóa trên trang quan trọng hàng đầu, trong khi đó đối với Google thì các liên kết và nội dung lại rất quan trọng Ngoài ra có một sự khác biệt rất lớn giữa các công cụ tìm kiếm đó là về khả năng lập chỉ mục, đối với Yahoo hoặc Bing ta sẽ cần rất nhiều thời gian để một trang web được lập chỉ mục trong kết quả tìm kiếm, tuy nhiên đối với Google ta chỉ cần vài tiếng Điều này chứng tỏ khả năng lập của Google nhanh hơn rất nhiều lần so với Yahoo và các công cụ khác
2.2.3 Công cụ hỗ trợ SEO
2.2.3.1 Keywords Tools
- Google Keyword Planner (Keyword Research)
http://adwords.google.com/keywordplanner
Trang 36Công cụ này là công cụ thay thế Google Keyword Tools mới được Google thay thế, trong quá trình dùng thử thì chúng ta sẽ thấy được nó thật sự có những thay đổi tuyệt vời và hiệu quả.
- Google Trends (Keyword Research)
- Google Webmaster (Tools Suite)
http://www.google.com/webmasters/
Google Webmaster Tools thực sự là một bác sỹ Google dành cho website của mình, mọi tình hình sức khỏe của website đều được công cụ này thông báo
- MozBar (Tools Suite, Toolbar, Moz)
http://moz.com/tools/seo-toolbar
Là thanh công cụ SEO chuẩn mực cho các nhà tiếp thị, MozBar cho phép thực hiện hơn 50 tác vụ quan trọng ngay từ trình duyệt của mình Đây là
Trang 37- Ahrefs (Link Research, Link Building)
https://ahrefs.com/
Là một trong những công cụ khảo sát liên kết phổ biến, Ahrefs cung cấp một số lượng lớn số liệu, văn bản và đồ thị đẹp Chủ yếu ở dạng thu phí, nhưng họ có cung cấp một số dữ liệu miễn phí
Trang 38- Open Site Explorer (Link Research, Moz, Competitive Intelligence, Link Building)
http://www.opensiteexplorer.org/
Khi Google và Yahoo bắt đầu loại bỏ những dữ liệu backlink của công chúng, Moz đã xây dựng Open Site Explorer để phục vụ cho nhu cầu lớn này Có thể tìm thấy các backlink, anchor text, các số liệu phổ biến, nhiều thứ khác ở đây
- Scraper for Chrome (Productivity)
Trang 39Trong các công cụ phổ biến nhất hiện nay, thanh công cụ SEO này cho ta rất nhiều thông tin bao gồm backlink và các cuộc khảo sát cạnh tranh.
- SeoQuake (Toolbar, Tools Suite, Technical SEO)
http://www.seoquake.com/
Có nhiều dữ liệu cơ bản hơn bất kì công cụ SEO nào khác
- Yoast WordPress SEO Plugin (Technical SEO)
http://yoast.com/wordpress/seo/
Nếu ta chỉ có thể chọn một chức năng WordPress cho trang web của mình, lựa chọn đầu tiên sẽ là Yoast, và lựa chọn thứ 2 cũng vậy Công cụ này đã trở thành các chuẩn mực rồi
- XML Sitemaps.com (Sitemaps)
http://www.xml-sitemaps.com/
Có lẽ công cụ này là giải pháp đơn giản, gọn nhẹ nhất cho việc tạo lập sơ
đồ trang web Đây là lựa chọn tuyện vời cho các trang web quy mô nhỏ khi cần phải tạo sơ đồ trang web trong vài phút tại bất kì địa điểm nào
2.2.4 Quy trình SEO
Để làm SEO tốt đòi hỏi người làm SEO phải có quy trình SEO chuẩn, việc này giúp SEOer dễ dàng hơn với công việc của mình, giúp website phát triển một cách tốt và bền vững nhất, dưới đây là quy trình SEO website chuẩn hóa thuộc bản quyền của Olapo :
Trang 40Hình 4 Quy trình SEO
Bước 1: Nghiên cứu thị trường, xu hướng tìm kiếm
Bước 2: Phân tích các đối thủ cạnh tranh
Bước 3: Tối ưu, lựa chọn từ khóa
Bước 4: Xây dựng website, tối ưu cấu trúc
Bước 5: Submit website lên các công cụ tìm kiếm và các website directory.Bước 6: Xây dựng nội dung, tối ưu nội dung (SEO-Onpage)
Bước 7: Bắt đầu xây dựng backlink, SEO (SEO-Offpage)