HCM Chuyên ngành: Hệ thống thông tin quản lý MSHV: 09320846 I-TÊN ĐỀ TÀI: Áp dụng khai phá dữ liệu trong quảng cáo trên truyền hình II-NHIỆM VỤ VÀ NỘI DUNG: Nhiệm vụ: Khai thác cơ sở d
PHẦN MỞ ĐẦU
Lý do chọn đề tài
Trongcác doanh nghiệpviệc tổchức lưu trữvà khai thác hợp lýcác dữliệu liên quan đến toàn bộ hoạt động kinh doanh là một vấn đề hết sức quan trọng Các dữ liệu này nếu được quản lý tốt sẽ giúp nhà quản lý năm bắt được rõ hơn tình trạng hoạt động bên trong cũng như các diễn biến của môi trường bên ngoài công ty Từ đó họ có khả năng đề ra được các chiến lược kinh doanh phù hợp và tạo lợi thếcạnh tranh cho công ty mình.
Khi công nghệ thông tin đượcứng dụng phổ biến thì việc lưu trữ thông tin càng trởnên thuận tiện và gọn nhẹ hơn rất nhiều Những chồng hồ sơ giấy tờbáo cáo dần mất đi và thay bằng các cơ sởdữliệu lưu trữ trong máy tính Tuy nhiên, cũng chính vì việc lưu trữthông tin khá dễdàng thuận tiện và ít tốn kém nêncơ sở dữ liệu của doanh nghiệp ngày càng trở nên to lớn, cồng kềnh và khó khai thác Nhưng may mắn thay công nghệ khai phá dữ liệu (Datamining), một dạng tiến hóa của công nghệ cơ sở dữ liệu, đã ra đời nhằm giải quyết tình trạng “ngập tràn thông tin mà thiếu thốn tri thức” này.
Tuy nhiên, mặc dù ra dời từ những năm cuối của thập kỷ 80 của thế kỷ XX nhưng công nghệ Dataming không phải là một giải pháp tổng thể giúp giải quyết mọi vấn đềcủa doanh nghiệp Dataming thật sựchỉ là một công cụkhai thác dữliệu giúp đưa ra những giải pháp mang tính khoa học dựa trên những thuật toán có sẵn giúp giải quyết những bài toán liên quan đến từng mục tiêu kinh doanh riêng lẽcủa doanh nghiệp mà thôi Và hiện tại các thuật toán và các cách mô hình hóa để giải quyết các bài toán thực tếvẫn không ngừng được tìm tòi và nghiên cứu phát triển.
Bước sang thập kỷ thứ hai của thế kỷ XXI nhiều doanh nghiệp lớn của Việt Nam thuộc các lĩnh vực viễn thông và ngân hàng cũng đã bắt đầu xây dựng và triển khai các hệ thống thông tin (ERP, CRM,…) trong đó kết hợp công nghệ Dataming.
Việcứng dụng công nghệ nàyở từng lĩnh vực là không hoàn toàn giống nhau Mỗi lĩnh vực cụ thểcó một đặc thù riêng và các mô hình khai phá cần được nghiên cứu điều chỉnh cho phù hợp Cho nên nghiên cứu ứng dụng Datamining trong quản lý
- 15 - kinh doanh quảng cáo của các đài truyền hình là cần thiết Đó chính là lý do hình thành hướng nghiên cứu của đềtài này.
Xác định vấn đề nghiên cứu
Sự phát triển công nghệ truyền hình dẫn đến sự bùng nổ các kênh truyền hình với đa dạng chương trình đáp ứng nhu cầu người xem Với lượng khán giả ổn định, truyền hình trở thành phương thức quảng cáo hiệu quả Các đài truyền hình dành thời lượng nhất định (slot) để bán cho các doanh nghiệp hoặc công ty môi giới quảng cáo Chi phí quảng cáo tùy thuộc vào thời lượng, rating và vị trí của slot trong block.
Các khách hàng thường phải tự lập cho mình kế hoạch đăng ký phát sóng các mẫu quảng cáo trong chương trình nào với tầng suất bao nhiêu dựa vào chiến lược tiếp thị của nhà sản xuất sản phẩm cần quảng cáo và rating của các chương trình truyền hình do Đài truyền hình cung cấp.Thực tế ở Việt Nam chỉ có duy nhất công ty nước ngoài chuyên về khảo sát thị trường là TNS cung cấp dựa vào những thống kê riêng của họ Như vậy, ngoài thông tin về rating của TNS chưa có nguồn thông tin nào khác để giúp việc lập kế hoạch quảng cáo của các khách hàng cần quảng cáo và việc đưa ra các chính sách bán hàng của các Đài truyền hình Mặc khác,hầu hết các Đài truyền hình đều lưu trữ khá nhiều dữ liệu liên quan đến giao dịch của mình.
Việc làm thế nào khai thác cơ sở dữ liệu có sẵn để tìm kiếm những thông tin hữu ích hỗ trợ việc ra quyết định của khách hàng và người quản lý Đài truyền hình chính là vấn đề cần nghiên cứu của luận văn này.
Mục tiêu nghiên cứu
Để đạt được mục tiêu nghiên cứu, cần trả lời các câu hỏi nghiên cứu sau: tìm mối tương quan giữa nhóm sản phẩm quảng cáo và nhóm chương trình truyền hình, nhận dạng xu hướng quảng cáo của nhóm sản phẩm theo năm Các câu hỏi nghiên cứu khác liên quan đến những thách thức trước khi áp dụng kỹ thuật khai phá dữ liệu, cách phân nhóm sản phẩm quảng cáo và chương trình truyền hình, độ tin cậy của dữ liệu mẫu, các kỹ thuật khai phá dữ liệu thích hợp và kết quả khai phá dữ liệu đem lại kiến thức gì cho doanh nghiệp.
Đối tượng và phạm vi nghiên cứu
- Đối tượng nghiên cứu: dữ liệu về các sản phẩm quảng cáo phổ biến và các chương trình truyền hình có quảng cáo (trên kênh HTV7 và HTV9) trong ba năm từ tháng01/2008đến tháng 12/2010.
- Phạm vi nghiên cứu:xung quanh hoạt động quảng cáo tại Trung tâm dịch vụ truyền hình – Đài truyền hình Tp.Hồ Chí Minh(TTDV–HTV).
Phương pháp nghiên cứu
Quá trình nghiên cứu gồm ba giai đoạn tương ứng với những công việc phải làm nhưsau:
• Thực hiện tiền xửlý tập dữliệu mẫu (lọc, giản lược ).
• Lựa chọn mô hình khai phá tập dữliệu.
• Chọn phần mềm và tiến hành xử lýtập dữliệu.
• Phân tích kết quả thu được để đánh giá độtin cậy của mô hình. Đánh giá/Kết luận
• Đánh giá kết quả nghiên cứu so với mục tiêu nghiên cứu đã đề ra và khả năng ứng dụng mô hình vào thực tếkinh doanh.
• Đềxuất hướng phát triển của đềtài.
• Phỏng vấn/Nghiên cứu tài liệu để khảo sát quy trình hoạt động doanh nghiệp.
• Rút trích thông tin từ cơ sởdữliệu đểtạo tập dữliệu mẫu.
Ý nghĩa khoa học và thực tiễn của đề tài
Ứng dụng thành công mô hình khai phá dữ liệu trong quảng cáo truyền hình là một đóng góp khoa học có ý nghĩa, mở ra hướng nghiên cứu mới ứng dụng khai phá dữ liệu vào thực tiễn tại Việt Nam Điều này khẳng định tiềm năng ứng dụng rộng rãi của khai phá dữ liệu, thể hiện sự cần thiết của việc nghiên cứu và ứng dụng phương pháp này trong nhiều lĩnh vực khác nhau.
Các kết quả đạt được từ nghiên cứu sẽ giúp người khách hàng của HTV có thêm thông tin lựa chọn chương trình truyền hình để quảng cáo và HTV có các chính sách giá và kế hoạch sản xuất chương trình hợp lý mang lại hiệu quả về quản lý cũng như về doanh thu.Mặc dù nghiên cứu chỉ được tiến hành ở một doanh nghiệp cụ thể nhưng mô hình này hoàn toàn có thể vận dụng được ở hầu hết các Đài truyền hình ở Việt Nam.
Kết cấu luận văn
Luận văn được chia thành 5 chương:
Chương 1: Phần mở đầu Chương 2: Trình bày tổng quan cơ sở lý thuyết về khai phá dữ liệu, hồi quy và trí tuệkinh doanh,một số bài báo nghiên cứu ứng dụng khai phá dữ liệu vào quảng cáo trên truyền hình.
Chương 3: Trình bày một số khái niệm liên quan đến quảng cáo trên truyền hình và dữliệu cụthểtại TTDV–HTV.
Chương 4: Trình bày các bài toán có thểgiải quyết tại TTDV– HTV và các kết quả đạt được.
Chương 5: Kết luận và khuyến nghị.
CƠ SỞ LÝ THUYẾT
Tổng quan lý thuyết về khai phá dữ liệu và trí tuệ kinh doanh
2.1.1 Trí tuệ kinh doanh là gì? (Business Intelligence-BI)
Hiện nay, có nhiều doanh nghiệp ở Việt Nam vì lý do này hay lý do khác đã hoặc chưa triển khai Business Intelligence (BI – Trí tuệ kinh doanh/Kinh doanh thông minh) BI có khá nhiều đặc trưng nên cũng có nhiều định nghĩa khác nhau.
Mỗi định nghĩa nhấn mạnh một đặc trưng nổi bậc nào đó của BI như là:
Business Intelligence đề cập đến các kỹ năng, qui trình, công nghệ, ứng dụng được sử dụng để hỗ trợ ra quyết định (Business Intelligence (BI) refers to skills, processes, technologies, applications and practices used to support decision making).
BI là các ứng dụng và công nghệ để chuyển dữ liệu doanh nghiệp thành hành động (BI is the applications and technologies transforming Business Data into Action)
BI là công nghệ mới giúp doanh nghiệp hiểu biết về quá khứ và dự đoán tương lai (BI is the new technology for understanding the past & predicting the future) Các định nghĩa chung quy lại tất cả đều đề cập đến khả năng trợ giúp ra quyết định hiệu quả trong kinh doanh của BI Tóm lại, BI là qui trình và công nghệ mà các doanh nghiệp dùng để kiểm soát khối lượng dữ liệu khổng lồ, khai phá tri thức giúp cho các doanh nghiệp có thể đưa các các quyết định hiệu quả hơn trong hoạt động kinh doanh của mình Công nghệ BI (BI technology) cung cấp một cách nhìn toàn cảnh hoạt động của doanh nghiệp từ quá khứ, hiện tại và các dự đoán tương lai.
Mục đích của BI là hỗ trợ cho doanh nghiệp ra quyết định tốt hơn Vì vậy, theoCarlo Vercellis (2009) thì hệ thống hỗ trợ quyết đinh (Decision Support System -DSS)có thể được xem là thành phần cốt lõi để phát triển một kiến trúc BI.
Kiến trúc của một hệ thống BI, được mô tả như Hình 2-1, chứa đựng ba thành phần cơ bản Data sources (nguồn dữ liệu), Data warehouses and data marts (kho dữ liệu) và Business intelligence methodologies (các phương pháp học trí tuệ kinh doanh).
Data sources là chặn đầu tiên cần thiết để thu thập và tích hợp dữ liệu từ nhiều nguồn khác nhau.Các dữ liệu này thường không đồng nhất chủ yếu được lấy từ hệ thống cơ sở dữ liệu tác nghiệp, nhưng cũng có thể chứa những tài liệu phi cấu trúc như là thư điện tử và các dữ liệu nhận được từ bên ngoài.
Data warehouses and data marts là những cách thức tổ chức cơ sở dữ liệu để lưu trữ các dữ liệu sau khi dùng các công cụ rút trích và chuyển đổi định dạng dữ liệu từ Data sources Các công cụ này thường được gọi là ETL tool (Extract,Transform, Load) Dữ liệu lưu trữ trong nhà kho dữ liệu được dùng để hỗ trợ các phân tích trí tuệ kinh doanh.
Business intelligence methodologies là các mô hình toán hay các phương pháp phân tích dữ liệu để hỗ trợ ra quyết định Có khá nhiều ứng dụng hỗ trợ ra quyết
- 21 - định như là multidimensional cube analysis (phân tích khối dữ liệu đa chiều); exploratory data analysis (phân tích thăm dò dữ liệu); time series analysis (phân tích chuỗi thờ gian); inductive learning models for data mining (mô hình quy nạp dùng cho khai phá dữ liệu); optimization models (mô hình tối ưu hóa).
Hình 2-2: Các thànhphần chủ yếu của hệ thống BI.
Hệ thống BI được cấu thành từ các thành phần quan trọng như kim tự tháp mô tả Phần cốt lõi của BI là Kho dữ liệu (Data Warehouse) và Khai phá dữ liệu (Data Mining) Dữ liệu trong BI là dữ liệu tổng hợp từ nhiều nguồn, định dạng khác nhau, được lưu trữ phân tán và theo thời gian, do đó Kho dữ liệu đóng vai trò thiết yếu Khai phá dữ liệu trong BI không chỉ là phân tích đơn giản mà còn sử dụng các kỹ thuật như phân loại (classification), phân cụm (clustering) và dự đoán (predicting) Vì vậy, BI có mối quan hệ chặt chẽ với cả Kho dữ liệu và Khai phá dữ liệu.
BI đem lại khá nhiều lợi ích cho tổ chức triển khai nó như là:
• BI làm tăng khả năng kiểm soát thông tin của doanh nghiệp một cách chính xác, hiệu quả từ đó có thể phân tích, khai phá tri thức giúp doanh nghiệp có thể dự đoán về xu hướng của giá cả dịch vụ, hành vi khách hàng, phát hiện khách hàng tiềm năng để đề ra các chiến lược kinh doanh phù hợp nhằm tăng khả năng cạnh tranh doanh nghiệp;
• BI giúp cho các doanh nghiệp sử dụng thông tin một cách hiệu quả, chính xác để thích ứng với môi trường thay đổi liên tục và cạnh tranh khốc liệt trong kinh doanh;
• Ra các quyết định kinh doanh hiệu quả hơn;
• Xác định được vị trí và sức cạnh tranh của DN;
• Phân tích hành vi khách hàng;
• Xác định mục đích và chiến lược Marketing;
• Dự đoán tương lai của doanh nghiệp;
• Xây dựng chiến lược kinh doanh;
• Giữ được khách hàng có giá trị và dự đoán khách hành tiềm năng.
2.1.3 Khai phá dữ liệu(Data mining)và Khai phá tri thức (Kownledge
Như đã đề cập ở phần trên,Data mining là một thành phần chủ yếu/cốt lõi của hệ thống BI.Vậy Data mining là gì?
Khai phá dữliệu là một khái niệm ra đời vào những năn cuối của thập kỷ80 của thế kỷ XX Nó bao hàm một loạt các kỹthuật nhằm phát hiện ra các thông tin có giá trị tiềmẩn trong các tập dữliệu lớn (các kho dữliệu) Vềbản chất, khai phá dữliệu liên quan đến việc phân tích các dữliệu và sửdụng các kỹthuật để tìm ra các mẫu hình có tính chính quy (regularities) trong tập dữliệu.
Năm 1989, Fayyad, Piatestsky-Shapiro và Smyth đã dùng khái niệm Phát hiện tri thức trong cơ sở dữliệu (Kownledge Discovery in Database– KDD) để chỉ toàn bộquá trình phát hiện các tri thức có ích từcác tập dữliệu lớn Trong đó, khai phá dữliệu là một bước đặc biệt trong toàn bộquá trình, sửdụng các giải thuật đặc biệt đểchiết xuất ra các mẫu (pattern) (hay các mô hình) từdữliệu.
Có các cách nhìn khác của giới nghiên cứu về quá trình KDD được mô tả ở hai hình ngay sau đây.
Hình2-3:Quá trình khám phá tri thức (cách nhìn của giới nghiên cứu về các hệ thống dữ liệu và kho dữ liệu).
Năm 1989, Fayyad, Piatestsky-Shapiro và Smyth đã dùng khái niệm Phát hiện tri thức trong cơ sở dữliệu (Kownledge Discovery in Database– KDD) để chỉ toàn bộquá trình phát hiện các tri thức có ích từcác tập dữliệu lớn Trong đó, khai phá dữliệu là một bước đặc biệt trong toàn bộquá trình, sửdụng các giải thuật đặc biệt đểchiết xuất ra các mẫu (pattern) (hay các mô hình) từdữliệu.
Có các cách nhìn khác của giới nghiên cứu về quá trình KDD được mô tả ở hai hình ngay sau đây.
Hình2-3:Quá trình khám phá tri thức (cách nhìn của giới nghiên cứu về các hệ thống dữ liệu và kho dữ liệu).
Tổng quan về các nghiên cứu ứng dụng khai phá dữ liệu trong dịch vụ quảng cáo trên truyền hình
quảng cáo trên truyền hình
Nhìn nhận các Đài truyền hình là các doanh nghiệp với sản phẩm là các time slots trong các chương trình truyền hình dành cho các khách hàng cần quảng cáo mua.Hoạt động mua bán này phải đảm bảo làm sao đểkháchhàng mua được “sóng tốt” (đến được đông đảo khán giả mục tiêu của họ với chi phí hợp lý) và các Đài truyền hình khai thác hiệu quả các block quảng cáo đem lại doanh thu tốt là một việc khá phức tạp.Ở đây có hai vấn đề chung cần giải quyết là i) lựa chọn chương trình phù hợp và tần suất xuất hiện của commercial trong đó nhằm đáp ứng nhu cầu của khách hàng (Advertisement Planning – Lập kế hoạch quảng cáo); ii) lựa chọn slot cụthểcho từng commercial mà khách hàng đã lên kếhoạch nhằm thỏa các quy định về quảng cáo cũng như yêu cầu của khách hàng (Advertisement Scheduling/Allocation–Lập lịch quảng cáo).
Vấn đề Scheduling được khá nhiều tác giả lựa chọn làm đề tài nghiên cứu của mình (như trong các bài báo [1], [4], [5], [6], [8] và [10]) Mỗi tác giả tự lựa chọn một số yêu cầu mà mình cho là quan trọng để giải quyết vấn đề Bollapragada và cộng sự (2004) quan tâm giải quyết vấn đề làm sao để phân bổ các mẫu quảng cáo(khác nhau, có nhiều lần phát sóng) vào những khe thời gian quảng cáo (advertising slots) có sẵn (đã ký hợp đồng trước) trong các chương trình khác nhau sao cho các mẫu quảng cáo này được trải đều trong càng nhiều chương trình nhất càng tốt Còn
- 33 - tác giả Xinhui Zhang (2006) lại giải quyết vấn đề Advertisement Scheduling theo hai bước có thứ tự i) đem các time slot ra đấu giá để lựa chọn mẩu quảng cáo nào trảcao nhất; ii) đóng gói các mẩu được chọn vào đúng slot đã chọn, đồng thời cũng xử lý nguyên tắc sản phẩm cạnh tranh không được phát sóng kế nhau và cấu trúc các block ổn định Kimms và cộng sự (2007) cũng đề xuất một mô hình để giải quyết cùng một vấn đề chỉ có một time slot nhưng nhiều mẫu quảng cáo khác nhau cùng muốn đăng ký phát sóng như bước i) của Zhang Lập lịch trực tiếp trên web là mô hình của Saeed Alaei và cộng sự (2009) đưa ra Năm 2011, Ron Adany đề xuất mô hình Scheduling trong truyền hình tương tác, có tính đến yếu tố cá nhân hóa đặc trưng của loại truyền hình này Tất cảcác nghiên cứu trên đều giải quyết bằng cách lập các mô hình toán và tìm lời giải tối ưu.
Lập kế hoạch quảng cáo đáp ứng các đòi hỏi của khách hàng (tài chính, đối tượng khách hàng, và sự hòa hợp giữa chương trình, thời lượng quảng cáo và tuần nào trong năm được khán giảquan tâm) là công trình nghiên cứu của nhóm tác giả Bollapragada và cộng sự(2002b) lập trìnhứng dụng thành công tại Đài truyền hình quốc gia NBC của Hoa Kỳ Owoloko và Sagoe (2010) ứng dụng mô hình tổng quát về phân bổ nguồn lực - The Knapsack để tối ưu hóa ngân sách dành cho các hoạt động quảng cáo (quảng cáo bao nhiêu lần trên TV, trên Radio) Tính giá quảng cáo cho khách hàng không theo thời gian mà theo “viewer attention” (sự chú ý của khán giả) David Kempe và cộng sự(2010) phát triển một giải thuật mang tên Audience Value Maximization Algorithm (AVMA) giúp định giá quảng cáo cho từng slot cụ thểdựa trên rating lấy từphản hồi từset-top box.
Nhận dạng rõ các yêu cầu riêng của lĩnh vực quảng cáo trên truyền hình và đề xuất một hệ thống tư vấn quảng cáo đáp ứng các yêu cầu này là công trình củaSudha Velusamy và cộng sự(2008) Các yêu cầu mà họ nhận dạng được đó là các thông số ad/program content (nội dung chương trình/quảng cáo), viewers’ interests(sự quan tâm của người xem), sponsors’ preferences (đòi hỏi của nhà tài trợ),program timing (thời gian chương trình), program popularity (tính phổ biến của chương trình) và available ad slots (các slot có sẳn hay không).
Hình 2-6:Hệ tư vấn quảng cáo tự động của Sudha Velusamy và cộng sự(2008).
Hệ thống mà họ đề xuất xử lý cả vấn đề Planning và Scheduling Vấn đề Scheduling vẫn được giải quyết bằng mô hình toán tối ưu như các tác giảkhác Tuy nhiên, điểm khác biệt là ở vấn đề Planning họ dùng mô hình Fuzzy clustering của khai phá dữliệu đểgiải quyết Các mẫu quảng cáo sẽ được phân loại dựa vào những thông tin có ngữnghĩa dạng text rút trích từ file định dạng MPEG-7 Đồng thời, các chương trình cũng sẽ được phân loại nội dung theo các lớp khác nhau như film, cartoon,… Quá trình phân loại là bước tiền xử lý trước khi cluster để tìm ra các chương trình phù hợp với từng loại quảng cáo để tư vấn cho khách hàng Giải pháp mà các tác giả đưa ra khá toàn diện nhưng khó khảthikhi áp dụng trong điều kiệnở Việt Nam vì việc phân loại quảng cáo (vấn đề cốt lõi) được dựa trên một bộ từ điển các từkhóa tiếng anh có ngữnghĩa bởi một nghiên cứuởMỹ.
Nhìn chung, hầu hết các nghiên cứu tập trung vào việc tìm ra các cách tối ưu hóa hoạt động lập lịch quảng cáo Đáng tiếc thay, quá trình tối ưu hóa này thường phức tạp khi triển khai.
- 35 - khai và hiệu quả không cao trong môi trường truyền thông có nhiều biến động và thay đổi hiện nay Các nghiên cứu mang tính hệ thống giải quyết phần lớn các vấn đề của quảng cáo trên truyền hình như của Sudha Velusamy và cộng sự(2008) hayBollapragada và cộng sự(2002b) (áp dụng thành công tại NBC) lại dựa trên những nền tảng về dữ liệu và nghiên cứu mà theo tác giả luận văn được biết thì khó có Đài truyền hình nào ở Việt Nam có khả năng đáp ứng.Dẫu vậy các nghiên cứu trên vẫn cho thấy khả năng ứng dụng của các kỹ thuật khai phá dữ liệu vào quảng cáo trên truyền hình Đặc biệt trong việc giải quyết vấn đề lập kế hoạch quảng cáo, ý tưởng phân nhóm sản phẩm quảng cáo và nhóm chương trình để hỗ trợ khách hàng củaSudha Velusamy và cộng sự(2008) hoàn toàn có thể hiện thực với một mức độ phù hợp ở Việt Nam mà cụ thể là ở Đài HTV Kế thừa ý tưởng trên trong những phần tiếp theo tác giả luận văn sẽ hoàn thiện dần mô hình ứng dụng tại TTDV-HTV.
BÀI TOÁN KINH DOANH DỊCH VỤ QUẢNG CÁO TRÊN TRUYỀN HÌNH
Tổng quan về dịch vụ quảng cáo trên truyền hình
Trong kinh tếhọc, dịch vụ được hiểu là những thứ tương tự nhưhàng hóanhưng là phi vật chất Có những sản phẩm thiên vềsản phẩm hữu hình và những sản phẩm thiên hẳn về sản phẩm dịch vụ, tuy nhiên đa số là những sản phẩm nằm trong khoảng giữa sản phẩm hàng hóa-dịch vụ [Wikipedia]
Dịch vụ có các đặc tính sau:
• Tính đồng thời (Simultaneity): sản xuất và tiêu dùng dịch vụ xảy ra đồng thời;
• Tính không thểtách rời (Inseparability): sản xuất và tiêu dùng dịch vụkhông thểtách rời Thiếu mặt này thì sẽkhông có mặt kia;
• Tính chất không đồng nhất (Variability): không có chất lượng đồng nhất;
• Vô hình (Intangibility): không có hình hài rõ rệt Không thể thấy trước khi tiêu dùng;
• Không lưu trữ được (Perishability): không lập kho để lưu trữ như hàng hóa được.
Quảng cáo là một hoạt động truyền thông gián tiếp nhằm tác động đến người nhận thông tin để thuyết phục hoặc tạo hành động mong muốn Để thực hiện quảng cáo, nhà quảng cáo phải chi trả cho các phương tiện truyền thông đại chúng, chẳng hạn như truyền hình, báo chí hay internet, để đưa thông tin tiếp cận tới người nhận thông tin Mục đích của quảng cáo là truyền đạt thông điệp, tạo nhận thức, kích thích nhu cầu và hướng dẫn hành vi của người nhận thông tin.
Dịch vụ quảng cáo là hình thức tuyên truyền được trả tiền để thực hiện việc giới thiệu thông tin về sản phẩm, dịch vụ, công ty hay ý tưởng của người muốn truyền thông [Wikipedia]
Quảng cáo có một số đặc điểm như:
• Quảng cáo là hình thức truyền thông phải trảtiền;
• Bên trảphí quảng cáo là một tác nhân được xác định;
• Nội dung quảng cáo tạo nên sự khác biệt của sản phẩm, nhằm thuyết phục hoặc tạoảnh hưởng tác động vào đối tượng;
• Quảng cáo được chuyển đến đối tượng bằng nhiều phương tiện truyền thông khác nhau;
• Quảng cáo tiếp cận đến một đại bộphận đối tượng khách hàng tiềm năng;
• Quảng cáo là một hoạt động truyền thông marketing phi cá thể.
Quảng cáo được chuyển đi bằng nhiều phương tiện truyền thông khác nhau, như:
• Truyền hình: là phương tiện tác động đến khách hàng đa dạng và toàn diện nhất, bằng âm thanh, hình ảnh sống động Chi phí hình thức này thường là đắt nhất;
• Báo chí: tác động bằng hìnhảnh và khẩu hiệu;
• Internet: khi công nghệ thông tin và Internet phát triển, loại hình báo mạng cũng phát triển nên các công ty thường khai thác phương tiện này Còn có thểgửi vào các hòm emailđểquảng cáo, hay gọi là thư rác;
• Phát thanh: tác động bằng âm thanh, là những đoạn quảng cáo bằng lời;
Quảng cáo qua bưu điện được thực hiện bằng cách gửi thư chứa thông tin về công ty và sản phẩm đến từng hộ gia đình Mặc dù chi phí của phương pháp này tương đối thấp, hiệu quả mang lại lại không cao Mỗi bức thư chỉ tiếp cận được một gia đình, hạn chế khả năng tiếp cận lượng lớn khách hàng tiềm năng.
Quảng cáo trên phương tiện vận tải mang lại hiệu quả cao, đặc biệt là trên xe buýt với diện tích thân xe lớn và lượng khách qua lại đông đảo trong ngày Tuy nhiên, do đặc tính khó thay đổi liên tục hình ảnh quảng cáo, các doanh nghiệp thường lựa chọn xe buýt để quảng bá cho những sản phẩm có vòng đời dài hoặc thương hiệu công ty, tránh quảng bá sản phẩm có vòng đời ngắn hoặc dễ lỗi thời.
• Quảng cáo qua ấn phẩm danh bạdoanh nghiệp: là những ấn phẩm phát rộng rãiđếnngười tiêu dùng;
Quảng cáo trên các phương tiện truyền thống như tờ rơi, áp phích, pano hay băng-rôn vẫn là cách phổ biến để các công ty tiếp cận khách hàng Trong đó, tờ rơi được sử dụng rộng rãi, với đội ngũ nhân viên thường được triển khai đến các ngã tư, nơi công cộng để phân phát các ấn phẩm in chứa thông tin giới thiệu sản phẩm và địa chỉ cung cấp.
• Quảng cáo trên bao bì sản phẩm;
• Quảng cáo truyền miệng: thông qua đội ngũ nhân viên đi tuyên truyền;
• Quảng cáo SMS: thông qua các hãng viễn thông, gửi tin nhắn đến các khách hàng giới thiệu vềsản phẩm, chương trình khuyến mại mà công tyđang áp dụng.
3.1.3 Lợi thếcủa dịch vụquảng cáo trên truyền hình
Dịch vụ quảng cáo trên sóng truyền hình là một hình thức dịch vụ do các đài truyền hình cung cấp cho các khách hàng có nhu cầu quảng cáo trên các chương trình truyền hình Sản phẩm dịch vụ ở đây là các khung giờ phát sóng khác nhau dành cho quảng cáo trên những kênh khác nhau Nhờ vào lợi thế của một phương tiện truyền thông mạnh nên nguồn thu từ dịch vụ quảng cáo luôn chiếm một tỷ trọng rất lớn nếu không muốn nói là chủyếu của cácNhà đài.
Theo nghiên cứu mới nhất của trường Đại học Ball State về thói quen sử dụng các phương tiện truyền thông của người Mỹ, mặc dù Internet gia tăng dần trong dân sốtrong suốt vài năm gần đây, tivi vẫn giữ ưu thế bình quân trong các gia đình tại Hoa Kỳ Trung bình, người dân nói chung dành hơn 4 giờ 30 phút mỗi ngày ngồi trước TV, làm cho xem TV trở thành thú vui giải trí hiện đại phổbiến nhất.
Quảng cáo trên truyền hình mang lại cho khách hàng những ưu điểm vượt trội như:
• Quảng cáo trên truyền hình có thể tạo ra giá trị và ảnh hưởng ngay lập tức cho một sản phẩm hoặc dịch vụ;
• Người muốn truyền thông có thể dễ dàng tiếp cận với các khán giả xem truyền hình mà mình đang hướng đến qua việc quảng cáo qua truyền hình.
Có thể tiếp cận với đối tượng trẻ em trong các chương trình chiếu phim hoạt hình, tiếp cận nông dân trong những bản tin nông nghiệp buổi sáng và tiếp
- 39 - cận với các bà nội trợ trong thời gian chiếu phim truyền hình vào buổi chiều.
Một bộ phim tài liệu đặc biệt về các nguồn năng lượng dùng để sưởi ấm trong nhà và doanh nghiệp cũng có thể thu hút người xem quan tậm đến các phương án sưởi ấm;
Truyền hình là nơi lý tưởng cho các hoạt động quảng cáo sáng tạo Bằng cách sử dụng máy quay phim, nhà quảng cáo có thể đưa người xem đến bất cứ đâu và giới thiệu cho họ về bất cứ điều gì.
• Do trong mỗi khu vực thường có ít đài truyền hình hơn đài phát thanh, số lượng khán giả của mỗi đài truyền hình thường đông đảo hơn, điều đó khiến bạn có thể tiếp cận với số lượng khán giả đông đảo hơn và đa dạng hơn.
Những ưu điểm này làm cho giá quảng cáo trên truyền hình luôn rất cao so với các phương tiện truyền thông khác Đây là lợi thế cho các Nhà đài Tuy nhiên, để duy trì và phát huyđược hết lợi thế đó đòi hỏi các đài truyền hình phải cập nhật các công nghệ, kỹ thuật mới vào quản lý Một mặt là làm cho hoạt động nội bộ được trôi chảy, linh hoạt Mặt khác là mang đến nhiều tiện ích, tạo thuận lợi hơn cho khách hàng.
Tìm hiểu bài toán hỗ trợ ra quyết định kinh doanh tại TTDV-HTV39
3.2.1 Giới thiệu vềTrung tâm Dịch vụTruyền hình HTV
Trung tâm Dịch vụ Truyền hình HTV (HTVS) là đơn vị sự nghiệp có thu, có con dấu riêng và tài khoản tại ngân hàng Trung tâm Dịch vụTruyền hình thực hiện các dịch vụquảng cáo, giới thiệu sản phẩm, thông tin kinh tế, thông báo trên các kênh của HTV; sản xuất các chương trình quảng cáo; sản xuất và phát hành các chương trình nghe nhìn chất lượng cao bằng các thiết bị chuyên dụng, hiện đại.
Cung cấp thiết kếvà lắp đặt các thiết bị kỹthuật, chuyển giao công nghệnghe nhìn cho các đơn vịcó nhu cầu.
Hiện tại, HTVS đang có những hoạt động cụthể như sau:
• Công tác quảng cáo và dịch vụ:
- Nhận đăng ký phát sóngquảng cáo, thông tin kinh tế, Tự giới thiệu, Rao vặt trên sóng truyền hình HTV.
- Phối hợp với các đơn vị chức năng liên quan trong và ngoài Ðàiđể thực hiện các hợp đồng tài trợvà tổ chứcsản xuất các chương trình.
• Dịch vụ kỹ thuật-sản xuất chương trình - Sản xuất các chương trình quảng cáo - Sản xuất phim tài liệu và các loại phim khác - Thực hiện các dịch vụ hậu kỳ (âm thanh, lồng tiếng, kỹ xảo hình ảnh, âm thanh…)
- Cho thuê thiết bị, phim trường, phòng thu hình-tiếng.
HTV và Hãng phim truyền hình TP Hồ Chí Minh phát hành các chương trình nghe nhìn dưới dạng VCD, DVD, bao gồm các thể loại như phim truyện, phim tài liệu, phim hoạt hình, chương trình sân khấu, ca nhạc, giáo dục, thể dục thể thao và các chuyên đề.
- Cung cấp, trao đổi, bán bản quyền chương trình phát sóng của HTV cho các Ðài truyền hình trong cả nước.
- In sang, chuyển hệ các chương trình của HTV đã phát sóng trên truyền hình theo yêu cầu khách hàng.
3.2.2 Lãnh vực quan tâmvà các khái niệmliên quan đếnbài toán tại
TTDV-HTV 3.2.2.1 Lãnh vực quan tâm
Như trình bày ở mục trên, HTVS hoạt động trên ba mãng chính là quảng cáo, dịch vụ sản xuất chương trình và phát hành Trong đó hoạt động mang tính chất thường xuyên, quan trọng và đem lại nguồn thu chủ yếu là quảng cáo Có thể xem HTVS là một doanh nghiệp dịch vụ với sản phẩm là các khung giờ quảng cáo trên các chương trình truyền hình của HTV Khách hàng của HTVS là các doanh nghiệp có nhu cầu quảng cáo (bao gồm cả các công ty hoạt động môi giới quảng cáo).
Tổng thời gian quảng cáo trong mỗi ngày, mỗi chương trình là có giới hạn cho nên
- 41 - việc tăng giá quảng cáo một cách đồng loạt để tăng doanh thu là điều không thểlàm thường xuyên Nhất là trong điều kiện ngày càng có nhiều Đài và phương tiện quảng cáo khác (như quảng cáo trên internet) cạnh tranh về giá cũng như các tiện ích khác, nguồn thu của HTVS từquảng cáo chắc chắn sẽsụt giảm trong tương lai.
Chính vì vậy, bài toán đặt raở đây là làm thế nào có được có công cụmang tính khoa học và trực quan nhất có thể giúp cho quản lý của HTVS nắm bắt được tình hình hoạt động trong mãng quảng cáo một cách nhanh chóng, chính xác Những thông tin mà các công cụnày cung cấp phải hỗtrợtối đa người quản lý có được các quyết định kịp thời về chính sách giá, các chuyên viên quảng cáo trợ giúp được khách hàng trong việc lựa chọn khung giờ và chương trình phù hợp với mục tiêu, chiến lược tiếp thị sản phẩm của họ Có như vậy nguồn thu từquảng cáo của HTVS mới được đảm bảo.
3.2.2.2 Các khái niệm liên quan
Trước khi trình bày về quá trình thu thập dữ liệu xin nêu một số khái niệm và qui định có liên quan đến hoạt động quảng cáo trên truyền hình.
Phim quảng cáo (hoặc còn gọi hẹp là Quảng cáo truyền hình , theo thuật ngữ tiếng Anh là television advertisement hay television commercial -viết tắt TVad hay TVC- hoặc thường được gọi đơn giản là commercial/advert hay media) là một dạng phim hay tiết mục được dàn dựng sản xuất và phải trả phí bởi những tổ chức, hội đoàn muốn quảng bá một thông điệp nào đó, thường là để quảng cáo hay khuyến mại một món hàng nào hoặc đểcổ động, phổbiến điều gìđó.
Sự phong phú của phim quảng cáo ngày nay bao gồm những quảng cáo ngắn (brief advertising spot), có độ dài từ vài giây đến nhiều phút cũng như các chương trình quảng cáo cung cấp thông tin đặc biệt trong thời gian dài (infomercial) khác.
Trong đề tài này chỉ các spot quảng cáo có độ dài 1 giây, 5 giây, 15 giây, 30 giây và 45 giây được sử dụng để phân tích, đánh giá vì tính phổ biến và giá trị doanh thu của chúng.Các spot có thời lượng lớn hơn 45giây thường là các phim tự giới thiệu ít gặpvà giá bán không caonên không được khảo sát.
Các thểloại chương trình truyền hình
Chương trình trò chuyện (Talk Show) là một thể loại chương trình truyền hình có sự tham gia của một nhóm người ngồi lại và thảo luận về các chủ đề được người dẫn chương trình đưa ra Loại chương trình này thường được gọi là Talk Show ở Mỹ và Chat Show ở Anh.
• Shopping:chương trình mua sắm trên truyền hình.
• Game Show:chươngtrình trò chơi.
• Music:chương trình ca nhạc.
• Gardening Show:chương trình nông nghiệp.
• Lifestyle: chương trình về phong cách sống (bàn về các chủ đề thời trang, ăn kiêng, thể dục, thú vui giải trí …).
• Charity:chương trình về nhân đạo (giúp đỡ người nghèo, bệnh tật).
• Animal hay Wildlife:chương trình về động vật hoang dã.
• Sports:chương trình thể thao.
• Situation Comedy (Sitcom):chương trình hài kịch.
• Documentary:chương trình phim tài liệu.
• Soap:chương trình phim/kịch nhiều tập.
• Cartoon:chương trình phim hoạt hình.
• Travel hay Holiday:chương trình du lịch.
• Kids/Children's:chương trình thiếu nhi.
• Drama:chương trình sân khấu.
• News:chương trình tin tức.
• Cookery:chương trình dạy nấu ăn.
• Reality TV: chươngtrình truyền hình thực tế(các tình huống xảy ra một cách tự nhiên và thường không được biên tập trước).
Các chỉsố liên quan đến mức độthu hút của các chương trình truyền hình
(Các khái niệm ở mục này được trích từ tài liệu do công ty TNS cung cấp.)
• Universe: khái niệm này chỉ tổng thể các đối tượng khán giả mục tiêu (target audience) mà một sản phẩm cần quảng cáo muốn nhắm đến.
Ví dụ: Universe của “Red Bull” là tất cảnam tuổi từ15-24 thuộc tầng lớp A, B, C và D.
• Ratings(%): phần trăm khán giả mục tiêu đã xem một chương trình/mẩu quảng cáo trong một timeslot (khe thời gian) nào đó.
Ví dụ: Trong số 100 người (lớn hơn 4 tuổi) xem TV, trong timeslot từ 18g15-19g03, có 17 người xem phim Đường lên thiên đàn của HTV7 ->
Rating của phim là 17% (4+) tại thời điểm khảo sát.
• GRP: tổng ratings cho một chương trình nào đó/phần trăm cơ hội tiếp xúc (contact) của chiến dịch quảng cáo (campaign) trong phạm vi toàn bộkhán giảmục tiêu 2GRP có nghĩa là có 2% khán giảmục tiêu đã xem chiến dịch 1 lần hay 1% khán giảmục tiêu đã xem chiến dịch 2 lần.
Ví dụ: Chiến dịch “Basket ball – tag on” đã đi 8 lần trên HTV7 từ 14 - 19/04/2003 và có được 9.992.000 contacts, với Universe = 3939, đã tạo ra 253.7 GRP.
• Reach: đo lường sự tích lũy lượng khán giả khác nhau (không tính lặp lại)xem chương trình/quảng cáo.
Ví dụ: Nếu 10 người khác nhau trong số 100 người xem chương trình thì ta có reach là 10%.
• OTS: sốlần khán giảmục tiêu xem chương trình/quảng cáo.
Ví dụ: Chiến dịch “Wedding dress” từ 17 - 18/04/2003 lúc 20g58’46” có 1.573.000 người khác nhauở TP HCM đã xem nó trung bình 3 lần (OTS).
• Sựkhác biệt vềý nghĩa giữa các chỉsố:
- Rating là giá trị trung bình số người xem còn Reach là số người xem không lặp lại Như vậy, Reach mang ý nghĩa về số lượng người xem và Rating là chất lượng.
- OTS biểu diễn cho tầng suất xem lại cùng một chương trình của khán giả còn Reach biểu diễn số người xem (ít nhất 1 lần) chương trình đó Như vậy, OTS mang ý nghĩa về mức độthu hút về chiều sâu của chương trình và Reach mang ý nghĩa mức độ ảnh hưởng rộng hay hẹp đến người xem.
GRB = Reach x OTS Hiện nay, hầu hết các công ty quảng cáo, đại lý quảng cáo trong và ngoài nước đều lấy số liệu media rating của TNS làm cơ sở để lựa chọn thời lượng phát sóng, chương trình phát sóng trên đài phát thanh, truyền hình mà họ cần đăng ký quảng cáo vì không có sự lựa chọn nào khác.
Qui trình việc tiếp nhận lịch đăng kýquảng cáocủa khách hàng
Hình 3-1:Qui trình nhận đăng ký quảng cáo.
Thu thập và chuẩn bị dữ liệu
Hình 3-2:Qui trình rút trích dữ liệu.
Dữ liệu được rút trích từ những máy chủ lưu trữ thông tin về hoạt động quảng cáo của HTV bằng phần mềm quản lý quảng cáo TVAMS Phần mềm này ngoài dùng phục vụ việc nhập lịch quảng cáo của khách hàng còn có tính năng lọc các thông tin cần thiết (được định nghĩa sẵn) ra một số định dạng phục vụ cho những người có trách nhiệm lập các báo cáo.Tác giả luận văn đã trực tiếp dùng phần mềm TVAMS để thu thập tập dữ liệu mẫu.
Tập dữ liệu mẫu thu được là dữ liệu của 03 năm (từ 01/2008 – 12/2010) lưu trong 03tập tin xls.Ba tập tin này có tổng cộng235.996mẫu tin(dòng dữ liệu).
Tháng Block Sản phẩm Mã băng T/L (s)
1 Xây dựng thương hiệu mạnh Gạt tin quảng cáo TL.729 1
Xây dựng thương hiệu mạnh Total
Thángphátsóng chươngtrình Tên chươngtrình Tênsản phẩmquảngcáo Mãbăng được cấp Thời lượngquảngcáocủasản phẩm
Hình 3-3:Mẫu dữ liệu trong tập dữ liệu mẫu.
Block là tên chương trình trong đó có dành một khoảng thời gian cho quảng cáo.
Khoảng thời gian đó có thể là ở đầu, giữa hay cuối chương trình Chi tiết hơn các khoảng thời gian này còn gọi là Break/Cut hay Block con Trong mỗi Block con chia thành những khe thời gian dành cho những(Mẫu/Spot)quảng cáo.
Mã băng quảng cáo cấp cho các sản phẩm trước năm 2009 gồm hai phần chứa hai thông tin là nhóm loại sản phẩm và số thứ tự băng Từ 2009, mã băng có thêm hai phần ghi nhận thêm hai thông tin nữa là nhóm khách hàng và tháng mà băng phát sóng Tuy nhiên dù trong giai đoạn nào thì nhóm loại sản phẩm quảng cáo đều được mã hóa như bảng sau.
Ký tự thứ 1(2) của Mã băng NHÓM LOẠI QC KÝ HIỆU
C Rượu Bia_Nước giải khát AD03
F Doanh nghiệp_Dịch vụ AD04
L Điện tử_Viễn thông AD09
Bảng3-1:Bảng phân nhóm loại quảng cáo.
Dữ liệu thu thập được còn nhiều thông tin dư thừa,không cần thiết cần được lọc bỏ trước khi có thể phân tích.Các record có thể loại bỏ là các record có chứa
“Total”- trống không có thông tin;
“Trailer”- giới thiệu chương trình, không tính phí;
“Gạt tin” - báo hiệu cho khán giả biết bắt đầu/kết thúc block quảng cáo, không tính phí;
“TGT” - các chương trình tự giới thiệu của doanh nghiệp, thời lượng rất lớn và chỉ phát sóng vào một số khung giờ nhất định trong ngày nhưng phí rất rẻ so với các spot quảng cáo,nếu đưa vào phân tích sẽ làm sai lệch kết quả;
“keylogo” - các hình ảnh logo sản phẩm chạy qua góc dưới chương trình, rất ít và phí không cao.
Các dòng dữ liệu này được loại bỏ bằng công cụ Filter của Excel.(Xem Phụ lục
MỘT SỐ BÀI TOÁN CẦN GIẢI QUYẾT TẠI TRUNG TÂM DỊCH VỤ TRUYỀN HÌNH – ĐÀI TH TP HCM
Bài toán 1
Từ các thông tin được trình bày trong chương 3 dễ dàng nhận thấy các băng quảng cáo đã được gom nhóm một cách ngẫu nhiên chỉ để đặt mã băng (nhằm quản lý băng là chính) mà chưa phục vụ cho mục đích quản lý nào khác Ngoài ra, các chương trình có quảng cáo cũng chưa được phân loại Khách hàng chủ yếu dựa vào rating chương trình để đặt quảng cáo Vậy liệu phân nhóm được các chương trình và nhận dạng được mối liên hệ giữa nhóm loại (sản phẩm) quảng cáo và nhóm loại chương trình(có quảng cáo) có giúp ích gì chokhách hàng trong việc chọn lựa loại chương trình để đặt quảng cáo hay không?
Dựa vào các khái niệm về thể loại chương trình đã trình bày ở chương trước và kinh nghiệm hơn mười năm làm việc trong lĩnh vực truyền hình tác giả luận văn tác giả đã phân loại tổng cộng 282 chương trình khác nhau trong ba năm vào 12 nhóm chương trình trong bảng sau.(Xem Phụ lục 2)
Thể Thao SPORTS Phim Truyện SOAP
Trò Chơi GAME SHOW TH Thực Tế REALITY TV Tọa đàm TALK SHOW Tài Liệu_Phóng sự DOCUMENTARY Ẩm thực COOKERY
Bảng4-1:Bảng phân nhóm loại chương trình. Để điền thêm hai cột thông tin chứa nhóm loại quảng cáo và nhóm loại chương trìnhtác giả sử dụng hàmvlookup và hàm mid của Excel.(Xem Phụ lục3).
Với dữ liệu thu được sau khi lọc và bổ xung thêm hai thuộc tính phân loại, tác giả nhận thấy có thể áp dụng mô hình Cây quyết định (Decision Tree) phân tích ba thuộc tính nhóm chương trình, nhóm sản phẩm và loại thời lượng của từng sản phầm quảng cáo (5”, 10”, 15”, 30”, 45” và 60”) Mặc dù có thể dùng mô hình luật kết hợp (Association Rule) để phân tích ở đây Tuy nhiên, mô hình cây quyết định lại tỏ ra hiệu quả trong trường hợp này bởi tính trực quan của nó Tác giả sử dụng công cụAnalyze/Classify/Tree (chọn giải thuậtCHAID) của SPSS17.0để tiến hành phân lớp cho các nhóm quảng cáo.Ở đây,biến phụ thuộc là nhóm chương trình còn biến độc lập là nhóm sản phẩm quảng cáo và loại thời lượng.
Sau một quá trình xử lý từ 235.996 mẫu tin trong tập dữ liệu ban đầu còn lại 64.984 mẫu tin có giá trị được dùng để phân tích ra cây quyết định(Xem Phụ lục 6).
Hình 4-1: Nútgốc của cây quyết định.
Nút 0 (Node 0)của cây quyết định cho cái nhìn tổng quan về phân bố của quảng cáo trong các nhóm chương trình Ở đây, rõ ràng có sự phân bố không đều của quảng cáo trong các nhóm chương trình Một số nhóm chương trình như Soap,Game Show, Reality TV có lượng quảng cáo khá lớn so với các nhóm còn lại.
Thống kê từ các nút 1 đến 13 cho biết phân bố lượng quảng cáo của từng nhóm sản phẩm quảng cáo AD01-AD13trong từng nhóm chương trình Các nút còn lại từ nút 14-50cung cấp thông tin phân bố quảng cáo tùy theo loại thời lượng trong từng nhóm chương trình khác nhau.
Hình 4-2:Một phần của các nút lá&nút trung gian của cây quyết định.
Như vậy, các thông tin với các số liệu thống kê cụ thể rõ ràng trên cây quyết định sẽ là cơ sở giúp hỗ trợ các khách hàng của HTV có được quyết định chọn lựa chương trình phù hợp với sản phẩm quảng cáo của mình Ví dụ, một khách hàng cần quảng cáo một sản phẩm thuộc nhóm AD01 với thời lượng là 30” thì có thể dò theo cây quyết định từ nút1 đến nút 14, tại nút14 các thống kê sẽ cho biết ứng với loại quảng cáo có thời lượng như trên thì khách hàng có thể xem xét quảng cáo trong nhóm chương trình Soap, Game Show hay Reality TV (03nhóm chương trình dẫn đầu về thu hút quảng cáo) Ngoài ra, người quản lý mảng quảng cáo của HTV HTV cần xem xét lại tại sao lượng quảng cáo trong các chương trình SPORT, NEWS,… quá ít Do ítthời gian dành cho các chương trình này hay vì chúng không thu hút?Hoặc còn lý do nào khác?
Dữ liệu thu thập được sẽ tiếp tục phân tích để giải quyết bài toán 2tiếp theo sau đây.Kết quả có được từ bài toán này tin rằng sẽ cung cấp thêm thông tin giúpkhách hàng lựa chọn loại chương trình phù hợp cho quảng cáo của mình, cũng như giúp nhà quản lý HTV nhận biết được các vấn đề bất thường trong hoạt động của mình và có cách xử lý kịp thời.
Bài toán 2
Phân tíchxu hướng của từng nhóm loại quảng cáo trong tháng tiếp theo dựa trên số liệu thu thập được của 36 tháng (từ 01/2008 đến 12/2010) để HTV có kế hoạch tiếp thị quảng cáo thích hợp với từng thời kỳ trong năm.
4.2.2 Phương pháp giải quyết Đầu tiên tác giả dùng công cụ Data/Aggregatecủa SPSS để tính toán tổng thời gian quảng cáo tương ứng với từng tổ hợp của nhóm loại quảng cáo và nhóm loại chương trình (Xem Phụ lục4) Sau bước này có được bảng thống kê sau để làm cơ sở phân tích xu hướng của từng nhóm quảng cáo.
THÁNG AD01 AD02 AD03 AD04 AD05 AD06 AD07 AD08 AD09 AD10 AD11 AD12 AD13
Bảng 4-2:Bảng thống kê thời lượng phát sóng của từng nhóm quảng cáo theo tháng.
Tiếp theo là xây dựng đường hồi quy cho từng nhóm sản phẩm quảng cáo(theo từng12 tháng)bằng công cụ SPSS 17.0 như sau:
- Chọn THANG(tháng)làm biến độc lập(Independent)
- Lần lượt chọn AD01-AD13, TONG (cột này tính tổng thời lượng 13 nhóm quảng cáo được thêm vào để dễ nhận xét)là biến phụ thuộc(Dependent)
- Chọn mô hình hồi quy đa thức(Cubic Model) vì mô hình này cho mức độ sai số là thấp nhất.
Sau cùng để biết được xu hướng quảng cáo của từng nhóm sản phẩm quảng cáo là tăng hay giảm tác giả dùng Analyze/Forcasting/Expert Modeler/ của SPSS.
Sau khi chạy xong chương trình SPSS cho kết quả là những đường cong đa thức
(Xem Phụ lục 5) biểu diễn xu hướng của từng nhóm loại sản phẩm quảng cáo Từ những đường xu hướng này,tác giả nhận thấy:
Hình 4-3:Xu hướng Tổng các nhóm quảng cáo của các năm2008-2010. i Trong 36 tháng từ 2008-2010, xét ba đường xu hướng TONG, thời gian quảng cáo của tất cả các nhóm quảng cáo trong từng thời đoạn trong năm có thay
Std Error of the Estimate
The independent variable is THANG.
Std Error of the Estimate
The independent variable is THANG.
Std Error of the Estimate
The independent variable is THANG.
- 57 - đổi nhưng mức độ dao động không quá lớn Riêng năm 2009, mức độ biến động thấp và thời gian quảng cáo duy trì ở mức cao. ii Dựa trên tổng thể các đường xu hướng của AD01-AD13, trong từng thời đoạn các nhóm sản phẩm có thể tăng giảm quảng cáo tuy nhiên chúng có điểm chung là thay đổi xu hướng tại ba thời điểm là đầu,giữa và cuối mỗi năm.
Như vậy, từ nhận xét i.kết hợp với kết quả của bài toán một có thể đưa ra nhận định là thời lượng tối đa dành cho quảng cáo trong các chương trình có thể chưa được tận dụng hết vì còn nhiều chương trình chưa có nhiều quảng cáo Còn từ nhận xét ii có ba thời điểm trong năm mà số chương trình thu hút được quảng cáo có thay đổi nhiều; tại những thời điểm này HTV cần có các chính sách điều chỉnh về nội dung chương trình, giờ phát sóng, giá biểu quảng cáo để lượng quảng cáo phải luôn ở xu hướng tăng đồng nghĩa với doanh thu cao Ngoài ra để biết nhóm quảng cáo nào sẽ có xu hướng giảm có thể dựa vào kết quả dự đoán lượng quảng cáo của từng nhóm quảng cáo tháng kế tiếp bằng SPSS như hình dưới đây là một ví dụ của kết quả dự đoán lượng quảng cáo AD01sẽ giảm trong tháng 01 năm 2011.
Hình 4-4:Dự đoán xu hướng quảng cáo AD01 trong tháng 01/2011
Kết luận
Với mục tiêu khai thác được các cơ sở dữ liệu có sẵn tại tổ chức tạo thành những thông tin hữu ích hỗ trợ việc ra quyết định của khách hàng và người quản lý Đài truyền hình,luận văn đã thực hiện qua các bước tìm hiểu các kiến thức cơ sở có liên quan, các công trình nghiên cứu có trước; xây dựng mô hình ứng dụng cụ thể trên tập dữ liệu mẫu thu thập tại TTDV –HTV như một case study Mô hìnhnghiên cứu tập trung vào giải quyết hai bài toán i) Tìm được mối tương quan giữa các nhóm loại sản phẩm quảng cáo và các nhóm loại chương trình truyền hình; ii) Nhận dạng được xu hướng quảng cáo của các nhóm sản phẩm quảng cáo trong năm.
Quá trình khai phá dữ liệu bám sát các bước của quy trình khai phá dữ liệu đã tìm hiểu trong cơ sở lý thuyết.Dữ liệu mẫu sau khi được thu thập được chọn lọc và thêm các thuộc tính phân loại theo đặc thù của lĩnh vực nghiên cứu.Việc phân loại các sản phẩm quảng cáo và các chương trình truyền hình có quảng cáo dựa trên cơ sở hiệu chỉnh cách phân loại sẵn có của tổ chức, cách phân loại phổ biến trên thế giới và kinh nghiệm làm việc thực tế nhiều năm của tác giả tại HTV.Sau bước phân loại dữ liệu được phân tích xử lý theo yêu cầu cần giải quyết của hai bài toán đặt ra.
Kết quả của từng bài toán thể hiện dưới dạng sơ đồ, đồ thị trực quan và được nhận xét để rút ra những thông tin có khả năng giúp đạt được mục tiêu nghiên cứu ban đầu đã đề ra.
Qua bài toán thứ nhất, kết quả thu được là sơ đồ cây quyết định Sơ đồ này giúp khách hàng HTV lên kế hoạch đặt phát sóng chương trình phù hợp với sản phẩm của họ, ngoài công cụ bảng thống kê rating chương trình đang có Từ sơ đồ, tác giả cũng đưa ra nhận xét về phân bố quảng cáo trong các chương trình.
Kết quả giải được bài toán thứ hai là các biểu đồ xu hướng từng nhóm sản phẩm quảng cáo trong vòng 36 tháng do công ty nghiên cứu thị trường cung cấp Từ các biểu đồ này, tác giả có những nhận xét quan trọng giúp các nhà quản lý HTV đưa ra các chiến lược về giá và sản xuất chương trình.
- 59 - thích hợp với từng thời đoạn kinh doanh trong năm sao cho thu hút được nhiều nhóm quảng cáo nhất Đồng thời, ở đây tác giả cũng chỉ ra cách thức dự đoán xu hướng tăng giảm của từng nhóm quảng cáo bằng một công cụ đơn giản nhưng hiệu quả là SPSS.
Như vậy, các câu hỏi nghiên cứu đặt ra ban đầu để đạt được mục tiêu nghiên cứu đã có lời giải qua các chương và các kết quả đạt được từ hai bài toán Qua chương thứ ba tác giả nhận dạng được khi chưa áp dụng mô hình khai phá dữ liệu này HTV không có gi hỗ trợ cho khách hàng lựa chọn chương trình để quảng cáo.
Và cách thức phân loại sản phẩm quảng cáo theo cách HTV phân loại sẵn vẫn sử dụng được để phân tích.Còn vấn đề phân loại chương trình,tác giả đã đề ra được ở chương thứ tư Tập dữ liệu mẫu được tác giả thu thập từ phần mềm quản lý quảng cáo của HTVS là đáng tin cậy tuy chưa có được các dữ liệu như mong đợi để phân tích.Với dữ liệu thu được,kỹ thuật Clasification (phân lớp) và Regression (hồi qui) được tác giả áp dụng để phân tích là phù hợp Thông tin khai phá được tuy còn hạn chế nhưng cũng cho thấy tiềm năng ứng dụng tại HTVS.
Đóng góp của đề tài
Mặc dù mô hình nghiên cứu chỉ được áp dụng ở một trường hợp cụ thể tại HTV nhưng nó hoàn toàn có thể vận dụng lại tại những Đài truyền hình khác tại ViệtNam.Có thể nói vậy vì loại hình chương trình,sản phẩm quảng cáo,dữ liệu lưu trữ và trình độ quản lý của các đơn vị này gần như tương tự nhau Áp dụng cách thức khai phá dữ liệu như trong đề tài này (dùng mô hình phân lớp và hồi qui) nhìn chung sẽ có được các thông tin hỗ trợ việc lập kế hoạch của khách hàng cũng như kế hoạch kinh doanh của các Đài truyền hình Từ kết quả của đề tài có thể khẳng định nếu vận dụng sáng tạo các công cụ hỗ trợ theo đúng quy trình khai phá dữ liệu thì khai phá dữ liệu hoàn toàn có thể áp dụng được trong lĩnh vực kinh doanh quảng cáo trên truyền hình tại Việt Nam như các lĩnh vực khác đã thành công như y tế,viễn thông Điều này sẽ góp phần nâng cao khả năng quản lý của các Đài truyền hình của Việt Nam.Thực tế là sau khi xem luận văn người quản lý của phòng quảng cáo của TTDV – HTV đã có nhận xét là kết quả của hai bài toán mà tác giả đặt ra mang lại những thông tin có giá trị và sẽ xem xét áp dụng tại đây trong thời gian sắp tới Ngoài ra, luận văn cũng có thể dùng làm tài liệu tham khảo để phát triển các nghiên cứu ứng dụng chuyên sâu hơn của khai phá dữ liệu trong lĩnh vực truyền hình sau này.
Các hạn chế và hướng nghiên cứu tiếp theo
Trong quá trình thu thập dữ liệu nghiên cứu dodữ liệu chỉ lấy được từfile Excel thông qua một chương trình chuyên quản lý các hoạt động tác nghiệp và phục vụ một số báo cáo của TTDV- HTV nên còn nhiều dữ liệu lưu trữ chưa được khai thác hết.Nhất là các dữ liệu liên quan đến thông tin khách hàng không thể tiếp cận vì lý do bảo mật thông tin Chính vì vậy, có thể còn nhiều mẫu thông tin giá trị chưa được phát hiện Ngoài ra, các tiêu chí để phân loại chương trình và loại sản phẩm quảng cáo khi áp dụng thực tế cần phải được nghiên cứu thêm để các phân tích được chi tiết và chính xác Loại quảng cáo và loại chương trình cần được ghi nhận và lưu trữ đầy đủ sẽ giúp xử lý các bài toán nhanh hơn Ngoài ra, kết quả nghiên cứu còn mang tính chủ quan chưa được đánh giá một cách khách quan từ phía khách hàng của HTV.Các yếu tố phân lớp còn ít,chưa đưa được các thuộc tính thời gian phát sóng,giá quảng cáo,… nên tính tổng quát của mô hình còn hạn chế Trong tương lai, tác giả mong muốn được quyền tiếp cận trực tiếp vào cơ sở dữ liệu, thu thập thêm các dữ liệu phản hồi từ khách hàng,khán giả; tổ chức lưu trữ thêm nhiều dữ liệu quan trọng để có điều kiện xây dựng được hệ tư vấn đặt quảng cáo tự động giúp hỗ trợ cho hoạt động kinh doanh quảng cáo nhanh chóng và hiệu quả hơn.