Luận văn thạc sĩ Khoa học máy tính: Hỗ trợ xếp lịch cho kênh mua sắm trên sóng truyền hình

Đồng thời, đề xuất hai giải thuậtheuristic và giải thuật di truyền để khảo sát miền nghiệm của bài toán, từ đó chothấy được các heuristic có đủ tốt để sử dụng trực tuyến.. Để đạt được cá

Giới thiệu

Mua sắm tại gia (home shopping) là một loại hình mua bán xuất hiện đã lâu đời và phát triển mạnh mẽ trong thời đại số hóa Nghiên cứu của Eleanor và Stephen [8] cho thấy sự khác biệt giữa mua sắm tại nhà và mua tại cửa hàng (in-store) Mua sắm tại nhà trở nên ngày càng quan trọng mặc dù hạn chế trong tương tác giữa người mua, sản phẩm và người bán Tuy nhiên không ai có thể phủ nhận được sự tiện lợi mà nó mang lại, đặc biệt là cho những người bận rộn, có ít thời gian để mua sắm.

Mua sắm điện tử ra đời đã phần nào giải quyết những vấn đề về tương tác mà những loại hình mua sắm tại gia trước đó gặp phải Với mua sắm điện tử, người dùng có thể tìm kiếm, mua sắm ở bất kì đâu, vào bất kì thời gian nào, đây chính là điểm ưu việt so với mua tại cửa hàng.

Ngành công nghiệp mua sắm điện tử (electronic shopping industry) bắt đầu phát triển vào cuối thập niên 90 khi mạng máy tính cũng như truyền hình cáp bắt đầu được đưa vào phục vụ trong ngành công nghiệp bán lẻ ở Châu Âu Vào thời gian này, khi mạng máy tính lẫn truyền hình cáp còn chưa được phổ biến, các giao dịch buôn bán bị giới hạn về số lượng mặt hàng và phương thức giao dịch Tuy nhiên,chính sự thay đổi về lối sống cũng như công việc đã làm thay đổi hành vi mua sắm của người dùng Họ nhanh chóng chấp nhận những phương thức mua sắm mới mặc dù nó vẫn còn rất nhiều hạn chế Mua sắm trực tuyến (shopping online) và mua sắm qua sóng truyền hình (TV-home shopping) phát triển mạnh khi mà công nghệ được phát triển, giá thành thiết bị cũng như dịch vụ mạng trở nên rẻ hơn Cả hai sẽ được sử dụng và bổ trợ cho nhau khi thị trường cũng như đối tượng khách hàng ngày càng ít phân hóa giữa hai phương thức mua sắm này Ngành công nghiệp bán lẻ sẽ chuyển dịch từ mua sắm truyền thống sang mua sắm điện tử[7].

Ngày nay, thương mại điện tử không còn xa lạ với mọi người trên thế giới Số lượng giao dịch điện tử càng ngày tăng thông qua hai loại hình chính là mua sắm trực tuyến và mua sắm trên sóng truyền hình So với mua sắm trực tuyến, mua sắm qua sóng truyền hình có những ưu điểm vượt trội hơn: cách thức giới thiệu sản phẩm sống động và có sức thuyết phục, phương thức thanh toán an toàn thông qua tổng đài điện thoại Tuy nhiên, mua sắm qua sóng truyền hình bị hạn chế về thời gian [7] cũng như không gian trình chiếu Người xem phải sắp xếp thời gian để đón xem các chương trình quảng cáo mà họ thích, trong khi mua sắm trực tuyến có thể cho phép người dùng truy cập 24/7 Hơn nữa, không gian trình chiếu của mua sắm trên sóng truyền hình cũng bị giới hạn chỉ trong một khung hình, không thể mở rộng như mua sắm trực tuyến với nhiều khung hình, nhiều đường dẫn, quảng cáo nhiều sản phẩm trên nhiều phần của màn hình Trong đó, thời gian giữ vai trò quan trọng nhất và là nguồn tài nguyên cần được cân nhắc để sử dụng một cách hợp lý để mang lại hiệu quả cao nhất Bài toán sắp xếp các quảng cáo một cách hợp lý để thu được doanh thu tối đa trở thành một thách thức cần được tìm hiểu và giải quyết Vì vậy, giải quyết bài toán sắp lịch cho mua sắm trên sóng truyền hình chính là mục tiêu của luận văn này.

Thử thách đặt ra cho đề tài là phải sắp lịch trong môi trường không chắc chắn vì thị trường luôn biến đổi liên tục cần phải dự báo trước thị trường Dữ liệu được cung cấp từ công ty chứa ít thông tin để có thể dự báo chính xác cũng như kích thước dữ liệu quá nhỏ khó áp dụng cho các mô hình dự báo dựa trên chuỗi thời gian Đồng thời, cần xác định được độ phức tạp của bài toán đang nghiên cứu để có thể tìm ra được phương pháp giải quyết hiệu quả nhất Theo tìm hiểu của tác giả thì chưa có các nghiên cứu đặc thù về sắp lịch trước đây áp dụng cho lĩnh vực kinh doanh này.

Vì vậy, cần phải tìm hiểu mở rộng để thấy được các nghiên cứu liên quan trong các ngành quảng cáo, từ đó sử dụng làm nguồn tài liệu nghiên cứu phù hợp. Để đạt được các mục tiêu đã đề ra cho luận văn, các bước cần thực hiện bao gồm:

• Thu thập dữ liệu thực tế, tìm hiểu quy trình nghiệp vụ của công ty cung cấp dịch vụ mua sắm trên sóng truyền hình.

• Đặc tả bài toán, mô hình hóa toán học, đánh giá độ phức tạp của bài toán sắp lịch

• Đề xuất giải pháp cho bài toán dựa trên các nghiên cứu liên quan, cũng như cơ sở lý thuyết căn bản.

• Thực nghiệm để kiểm tra độ chính xác của giải pháp đề xuất.

Luận văn đã đóng góp thực tiễn thông qua việc giải quyết khó khăn về vấn đề sắp lịch cho doanh nghiệp, đóng góp khoa học áp dụng kiến thức toán tối ưu cũng như dự báo để giải quyết bài toán công nghiệp Cụ thể các đóng góp chính của luận văn là:

• Đặc tả bài toán thực tế, mô hình hóa bài toán học bài toán, chứng minh bài toán bài toán lập lịch thuộc lớp bài toán khó, lớp bài toán NP−complete trong chương 4.

• Đề xuất quy trình sắp lịch mới thích ứng với sự thay đổi của thị trường đồng thời có thể tận dụng được dữ liệu quá khứ để tiên đoán cho tương lai gần Quy trình được trình bài trong mục 5.1.

• Đề xuất hai giải thuật heuristic và giải thuật di truyền để giải quyết bài toán sắp lịch trong mục 5.3, 5.4.

Trong luận văn này, giới hạn đề tài nghiên cứu là tập trung giải quyết bài toán sắp lịch, các bài toán liên quan trong quá trình nghiên cứu về dự báo sẽ được nghiên cứu chuyên sâu trong các công trình sau này.

Nội dung chính của luận văn bao gồm:

• Chương 1 giới thiệu chung đề tài đang nghiên cứu

• Chương 2 giới thiệu bài toán sắp lịch cho kênh mua sắm truyền hình, tình hình nghiên cứu và các công trình nghiên cứu liên quan

• Chương 3 giới thiệu các cơ sở lý thuyết về mô hình dự báo, giải thuật tính toán được áp dụng cho luận văn

• Chương 4 mô hình hóa toán học bài toán sắp lịch, chứng minh bài toán thuộc lớp bài toán NP−complete

• Chương 5 đề xuất giải pháp để giải quyết bài toán sắp lịch bao gồm quy trình sắp lịch đề xuất, các giải thuật heuristic và giải thuật di truyền

• Chương 6 thể hiện các kết quả thực nghiệm khi áp dụng các giải thuật đề xuất trên dữ liệu

Tổng quan

các chương trình quảng cáo

Bài toán sắp lịch

Bài toán sắp lịch được miêu tả cơ bản như sau: công ty có một danh sách các sản phẩm cần được bán Ứng với mỗi sản phẩm sẽ có một chương trình quảng cáo cho nó Các chương trình quảng cáo được lượng giá độ hiệu quả thông qua một chỉ số gọi là độ hiệu quả Từ đó, các chương trình này được chia thành các nhóm chương trình dựa trên ngưỡng hiệu quả định trước Mỗi nhóm chương trình lại được quy định tổng thời lượng phát sóng trong một ngày Dựa vào mức độ hàng tồn kho, xu hướng mua hàng mà mỗi chương trình được giới hạn số lần phát tối đa trong một ngày Đồng thời, mỗi chương trình sẽ được quy định cụ thể các khung giờ mà chúng có thể được trình chiếu dựa trên kinh nghiệm của chuyên gia sắp lịch Họ chia thời gian chiếu một ngày ra thành các khung giờ liên tiếp dựa trên lượng người xem, và lượng mua hàng Lịch chiếu cần phải thỏa mãn nhiều ràng buộc như: thời gian chiếu, khung giờ được phép chiếu, thời lượng chiếu của nhóm, các chương trình không được chiếu chồng lấp lên nhau, một chương trình được chiếu lại không quá gần lần chiếu trước (chi tiết các ràng buộc sẽ được trình bày ở chương 3).

Luận văn sẽ đề xuất quy trình sắp lịch cho kênh mua sắm trên sóng truyền hình.

Dựa vào quy trình đã đề xuất, đưa ra những giải quyết cụ thể cho từng bước trong quy trình bao gồm: dự báo, lập lịch và hiệu chỉnh Luận văn sẽ mô hình hóa toán học bài toán lập lịch và đưa ra lời giải cho bài toán tối ưu.

Tình hình nghiên cứu

Hiện nay có nhiều nghiên cứu sắp lịch cho quảng cáo trên truyền hình [1, 3], quảng cáo trên tạp chí, báo [5], hay trên các trang mạng [15] Với mỗi loại hình quảng cáo thì các nguyền tài nguyên chính cần quan tâm là không gian và thời gian. Đối với quảng cáo trên sóng truyền hình thời gian luôn được ưu tiên xem xét Đài truyền hình cần tính toán để sắp lịch các quảng cáo như thế nào để đạt doanh thu cao nhất Bởi vì nguồn thu nhập chính của các đài truyền hình xuất phát từ phát sóng quảng cáo Một bài toán đặt ra đối với họ là sắp xếp các quảng cáo theo yêu cầu của khách hàng vào các khung giờ quảng cáo một cách hợp lý để thu được doanh thu tối đa Alaei và cộng sự [1] đã áp dụng chiến lược đấu giá nhiều món hàng (multi-unit combinatorial auction) kết hợp với giải thuật tiến hóa để giải quyết bài toán này.

Nghiên cứu của họ cho thấy giải thuật di truyền (GA) đề xuất có độ chính xác gần như không đổi khi tăng kích thước bài toán thực.

Một yếu tố thường được chú ý trong sắp lịch quảng cáo truyền hình truyền thống là tỉ lệ người xem (audience ratings) Các nhà quảng cáo trả tiền để tăng lượng người xem cho các quảng cáo của mình Một nghiên cứu ở Trung Quốc giải quyết bài toán sắp lịch quảng cáo cho các quảng cáo dựa vào hai yếu tố là tỉ lệ người xem và độ dài quảng cáo để tối đa hóa doanh thu cho đài truyền hình Ru Bai và Jinxing Xie [3] đã mô hình hóa bài toán theo mô hình quy hoạch nguyên (interger programming model), lấy tích số giữa tỉ lệ người xem mà nhà quảng cáo yêu cầu và thời lượng quảng cáo làm giá trị đo doanh thu cho mỗi quảng cáo Tác giả đã đưa ra ba giải thuật heuristic để giải quyết bài toánNP−Completenày Kết quả thực nghiệm cho thấy giải thuật hiệu quả với dữ liệu giả lập.

Trong khi đó quảng cáo trên báo, tạp chí và trang mạng, yếu tố không gian để đặt quảng cáo luôn được tối ưu hóa để thu hút dược người đọc nhưng tiết kiệm diện tích.

Nghiên cứu về cách đăng tải quảng cáo hợp lý vào các vị trí nhất định trên website áp dụng giữa giải thuật heuristic đề xuất và giải thuật di truyền thiết kế riêng cho bài toán sao cho quảng cáo có được số lượng người xem trung bình thỏa mãn yêu cầu khách hàng đồng thời tăng doanh thu quảng cáo Kumar [15] và đồng nghiệp đã cho thấy được sự cải tiến đáng kể khi thử nghiệm giải thuật lai giữa giải thuật di truyền và giải thuật heuristic tự đề xuất dựa trên giải thuật bin-packing so với một giải thuật heuristic đã tồn tại trước đó Kết quả thực nghiệm cho thấy giải thuật mới cải thiện trên 87% so với giải thuật đã đề xuất trước đó Điều này giúp cho doanh thu của quảng cáo trên trang mạng được tối đa hóa.

Không chỉ truyền hình hay mạng cần đến bài toán sắp xếp mà quảng cáo trên báo, tạp chí cũng cần tối ưu hóa để giảm chi phí in ấn mà không ảnh hưởng đến tiến độ in ấn Công việc sắp xếp in quảng cáo vào các vùng (zone) đã định sao cho rút ngắn thời gian in ấn của các máy in là bài toán mà Carter [5] và công sự phải đối mặt Họ đã áp dụng một cách khéo léo giải thuật di truyền để đưa ra được lịch in tối ưu giúp giảm gần 25% thời gian in ấn nhà xuất bản Điều này đồng nghĩa rằng họ đã tiết kiệm chi phí cũng như công sức in ấn, đồng thời giúp nhà xuất bản có nhiều vùng in ấn trống hơn nhờ đó có thể tăng số lượng in ấn.

Nhìn chung các bài toán đặt ra được mô hình hóa và giải quyết theo nhiều chiến lược đa dạng, cơ bản sử dụng heuristic và giải thuật di truyền một cách hợp lý để đưa ra được giải pháp tốt cho công nghiệp Tuy nhiên, hiện nay theo tìm hiểu của tác giả thì vẫn chưa có những nghiên cứu lập lịch chuyên biệt cho lĩnh vực mua sắm trên sóng truyền hình, mặc dù đặc tính của chương trình cũng như mục tiêu của nó và quảng cáo truyền thống là khác nhau Quảng cáo của mua sắm trên sóng truyền hình thường dài hơn rất nhiều so với quảng cáo thông thường có thể lên đến 60 phút Các quảng cáo này được chiếu liên tục, không phụ thuộc vào các chương trình chính khác như: các chương trình phim, bóng đá, chương trình giải trí khác.

Mục tiêu của quảng cáo trên sóng truyền hình là thuyết phục người xem mua hàng một cách nhanh chóng với nhiều khuyến mãi ngắn hạn (count down time), doanh thu chính từ nguồn bán hàng Đối với quảng cáo truyền thống thì đài truyền hình sẽ là người sắp lịch và nguồn doanh thu là tiền khách hàng trả cho quảng cáo, không phụ thuộc vào doanh số mà sản phẩm quảng cáo đó thu được.

Chính sự khác biệt của lĩnh vực này đòi hỏi chúng ta cần phải có những công trình nghiên cứu mới để đáp ứng những thay đổi của lĩnh vực này Đây là động lực chính để tác giả thực hiện đề tài Trong luận văn này, bài toán sẽ được mô hình hóa lại để miêu tả chính xác các ràng buộc đặc thù, đồng thời áp dụng các giải thuật lập lịch đã được áp dụng trong các nghiên cứu liên quan.

Cơ sở lý thuyết

Mô hình dự báo

Một chuỗi thời gian bất kỳ thường có 3 thành phần quan trọng: xu hướng, mùa vụ và ngẫu nhiên, tùy vào đặc tính dữ liệu mà các thành phần này đóng vai trò khác nhau Các mô hình dự báo dưới đây sẽ chú trọng vào các thành phần này để đưa ra dự báo.

3.1.1 Mô hình dự báo Holt-Winter Để dự báo trong thời gian ngắn hạn các công ty thường sử dụng mô hình Holt-Witer bởi vì nó đơn giản, cần ít dữ liệu và rất dễ dàng tự động hóa cho kết quả tốt[12] Mô hình do Holt(1957) và Winter (1960) [13] phát triển từ mô hình do Holt đề trước đó để có thể thể hiện tính chất mùa Trong khi mô hình cũ chỉ thể hiện được tính chất xu hướng Có hai loại mô hình được sử dụng là mô hình cộng và mô hình nhân Mô hình cộng xem yếu tố mùa ít thay đổi trong chuỗi thời gian, trong khi mô hình nhân xem xét yếu tố mùa tỉ lệ với yếu tố cấp độ (level) Mô hình này gồm 3 phương trình cho cấp độ (level)lt, xu hướngbt, mùa vụst, các thông số làm trơnα,β ∗ vàγ,mlà khoảng thời gian xét tính mùa.

Công thức hàm cộng: y t+h|t =lt+hbt+s t−m+h + m (3.1) lt =α(y t −s t−m ) + (1−α)(l t−1 +b+t−1) (3.2) b t =β ∗ (l t −l t−1 ) + (1−β ∗ )b t−1 (3.3) s t =γ(y t −l t−1 −b t−1 ) + (1−γ)s t−m (3.4)

Công thức hàm nhân: y t+h|t = (l t +hb t )∗s t−m+h + m (3.5) l t =α( yt s t−m ) + (1−α)(l t−1 +b+t−1) (3.6) b t =β ∗ (l t −l t−1 ) + (1−β ∗ )b t−1 (3.7) st =γ( y t l t−1 +b t−1 ) + (1−γ)s t−m (3.8) Với:h + m =b(h−1)modcm+1

3.1.2 Mô hình dự báo bước ngẫu nhiên (Random walk)

Mô hình bước ngẫu nhiên[9] được áp dụng rất thông dụng trong dự báo chứng khoán vì chuỗi thời gian giá trị biến đổi một cách không biết trước do những nhân tố chưa biết gây nên Với những dữ liệu có tính biến đổi nhanh và khó dự báo thì đây là mô hình thích hợp để áp dụng Trong chuỗi thời gian, một quá trình thỏa mãn theo phương trình sau được gọi là bước ngẫu nhiên. yt =y t−1 +εt (3.9)

Vớiεt là độ sai lệch tại thời giant tuân theo phân phối chuẩn,εt iid(0,σ ε 2 )

3.1.3 Mô hình dự báo trung bình động (moving average)

Một mô hình đơn giản hay được sử dụng để nhận biết xu hướng của thị trường là mô hình trung bình động Mô hình trung bình có số bướcmcó công thức như sau:

Thông thường, chúng ta có thể sử dụng hai mô hình trung bình động, một sử dụng với bước thời gian m 1 lớn để xem hướng ổn định của thị trường, một mô hình khác có bước thời gianm 2 vớim 1 >m 2 để nhận biết sự thay đổi ngắn hạn đang diễn ra.

3.1.4 Kiểm tra chéo cho dữ liệu thời gian Để so sánh tính chính xác hay tính thích hợp của các mô hình dự báo với nhau khi khớp dữ liệu Chúng ta cần đến phương pháp kiểm thử các mô hình Kiềm tra chéo là một phương pháp hay được sử dụng Trong luận văn, chúng tôi sẽ sử dụng phương pháp kiểm tra chéo cho dữ liệu thời gian.

Giả sửklà số lượng tối thiểu điểm quan sát trong tập huấn luyện Chọn điểm thứ k+i+1cho tập kiểm thử Dữ liệu tại các điểm1,2, ,kđược khớp mô hình để dự báo cho thời điểm k+1 Sau khi có mô hình dự báo, kết quả dự báo được tính và đồng thời so sánh kết quả đó với điểm dữ liệu thật ở thời điểm k+1để tính độ lỗi.

Quá trình này tiếp tục lắp vớii=0,1, ,n−k−1,nlà tổng số điểm quan sát được. Để so sánh độ chính xác của các mô hình khi khớp dữ liệu và dự báo thì các phép đo sau đây được áp dụng: căn bậc hai trung bình bình phương độ lỗi (RMSE), trung bình độ lỗi tuyệt đối (MAE), trung bình phần trăm độ lỗi tuyệt đối (MAPE) Với y i là giá trị thật cònybi là giá trị dự báo tại thời điểmi.

Heuristic

Heuristic [14] là những giải thuật cho kết quả gần đúng hoặc cung cấp một lời giải nhưng không đầy đủ trên toàn bộ tập nghiệm Đối với những bài toán tối ưu cần tìm cực trị lớn nhất hoặc nhỏ nhất thuộc lớp bài toánNP−hard thì thời gian để tìm nghiệm tối ưu đối với dữ liệu đầu vào có không gian nghiệm lớn thì thời gian thực thi rất lâu, không đáp ứng được yêu cầu về mặt thời gian Giải thuật heuristic mặc dù không tìm được nghiệm tối ưu toàn cực vì nó chỉ chỉ tìm nghiệm tối ưu trên một không gian nghiệm cục bộ, nhưng thời gian thực thi lại rất nhanh Để có thể thoải mãi thời gian thực thi thì các giải thuật heuristic luôn được áp dụng một cách hiệu quả với các bài toán thuộc nhóm NP−Hard.

Metaheuristic

Metaheuristic [11] là một khung hay một quy trình cung cấp một tập hướng dẫn hoặc nhiều chiến lược phát triển heuristic để giải bài toán tối ưu độc lập Các giải thuật metaheuristic thường thiết kế các chiến lược của mình dựa trên những chiến lược của tự nhiên Chúng cần chứng minh được khả năng có thể tìm được nghiệm tối ưu trong một không gian giới hạn, thời gian vì vậy không vô hạn Metaheuristic phát triển các chiến lược đặc thù cho các bài toán của mình để có thể tìm được nghiệm là đủ tốt đồng thời thời gian tính toán là đủ nhỏ Có thể phân loại metaheuristic thành ba loại chính dựa trên các thức các bước giải của giải thuật nhân rộng nghiệm trên miền tìm kiếm.

Tìm kiếm cục bộ (local search) metaheristic là hướng cải thiện kết quả bằng cách thay đổi nhỏ nghiệm đã tìm thấy trong các bước lặp của giải thuật Mục đích tinh chỉnh nghiệm để nghiệm đạt đến mức tối ưu Quá trình này được thấy rất rõ qua các giải thuật leo đồi, giải thuật giải kim Tuy nhiên các giải thuật này vẫn bị tính chất cục bộ chi phối vì vậy cần có các điểm thoát cục bộ Các kỹ thuật thoát cục bộ thường dùng là sử dụng xác suất để chuyển qua miền nghiệm mới từ đó thoát được nghiệm cục bộ Để lưu vết và tránh việc tìm kiếm bị trùng lặp quá nhiều trên miền tìm kiếm kỹ thuật tìm kiếm tabu được áp dụng Với kỹ thuật này, các nghiệm đã đi qua sẽ được lưu lại vì vậy giải thuật sẽ nhanh chóng khai phá các miền tìm kiếm mới mà không bị trùng lặp Tuy nhiên vấn đề không gian lưu trữ bị giới hạn cần phải được quan tâm.

Loại thứ hai là contructive metaheuristic Với loại hình này thì các giải thuật sẽ sinh ra các nghiệm mới dựa vào việc thêm một thành phần của tập nghiệm trong các lần lặp Cách làm này thích hợp theo hướng giải thuật tham lam, mỗi bước lặp sẽ luôn được thêm vào nghiệm tốt nhất để cải thiện chất lượng của toàn tập nghiệm mà giải thuật tìm thấy trong bước tiếp theo Một số giải thuật thuộc loại này có thể kể đến như acronym for greedy randomized adaptive search procedure (GRASP), Large neighborhood search (LNS), Ant colony optimization (ACO).

Loại thứ ba dựa trên quần thể nghiệm Các nghiệm được chọn lựa kết hợp để sinh ra một quần thể Giải thuật tiêu biểu là giải thuật di truyền hay giải thuật tiến hóa.

Giải thuật này mô phỏng sự phát triển trong giới tự nhiên để đạt được hình thái tốt ưu hơn Trên đây là các phân loại cơ bản về metaheuristic, ngoài ra còn nhiều chiến lược lai giữa các chiến lược trên, cũng như kết hợp nhiều kỹ thuật như học máy.

Giải thuật di truyền (Genetic algorithm)

Giải thuật di truyền [4] là một phương thức thích nghi thường dùng để giải các bài toán tối ưu hóa Chiến lược được áp dụng dựa trên quá trình mô phỏng quá trình sinh học tự nhiên của các gen Các gen tốt qua chọn lọc sẽ được giữ lại và ngược lại sẽ bị đào thải, chính quá trình này tạo ra sự tiến hóa của các cá thể thích ứng lại sự thay đổi của môi trường Sức mạnh của giải thuật này đến từ khả năng bền vững, có khả năng hoạt động tốt với các bài toán có miền tìm kiếm lớn Mà đây là vấn đề mà nhiều kỹ thuật khác rất khó để giải quyết Mặc dù giải thuật di truyền không đảm bảo sẽ tìm được tối ưu toàn cục nhưng lời giải của nó đưa thường đủ tốt trong một thời gian tính toán chấp nhận Các bước chính để hiện thực giải thuật bao gồm: quá trình mã hóa, chọn lọc, lai hóa (trao đổi chéo), đột biến Quy trình thực hiện như hình 3.1.

Lượng giá từng cá thể

Chọn cá thể bố mẹ

Lai tạo Đột biến một phần cá thể mới Kết quả

Hình 3.1: Giải thuật di truyền truyền thống

Quá trình mã hóa là quá trình chuyển đầu vào dữ liệu của một bái toán thành dạng số nhị phân hay về dạng chữ đại diện chư các gen Một nghiệm hoặc một tập nghiệm của bài toán được biểu diễn bằng cách kết hợp các gen tạo thành một nhiễm sắc thể duy nhất Mỗi kết quả hay mỗi nhiễm sắc thể tìm thấy cần được lượng giá chất lượng theo hàm mục tiêu Khi đó chúng ta cần đến hàm lượng giá Thông qua hàm lượng giá các cá thể được tách biệt và đối xử khác nhau Những cá thể tốt thường được ưu tiên giữ lại hoặc chọn là các thể bố mẹ để sản sinh thế hệ sau.

Sau khi đã mã hóa một quá trình lặp để sinh ra quần thể được thực hiện với quần thể khởi tạo Quần thể khởi tạo là quần thể thường được sinh ngẫu nhiêu nhưng vẫn đảm bảo tính đa dạng cho quần thể này Vì nếu quần thể khởi tạo thiếu tính đa dạng thì các thế hệ sau khó được cải thiện là chậm tốc độ hội tụ Quá trình lặp này sẽ dừng lại khi đạt được điều kiện dừng, và khi đó nghiệm đã hội tụ về nghiệm tối ưu hoặc gần tối ưu Điều kiện dừng thường được sử dụng là khi quần thể mới sinh ra không còn cải thiện hoặc cải thiện không đáng kể hoặc thời gian thực thi được giới hạn.

Quá trình lặp tạo quần thể mới gồm các bước như sau: đầu tiên các cá thể bố mẹ được chon để thực hiện lai hóa Mỗi giải thuật hiện thực cho mình một chiến lược lựa chọn riêng, thông thường nhiễm sắc thể nào có kết quả lượng giá cao sẽ được chọn Sau khi chọn được bố mẹ, quá trình lai hóa bắt đầu Cặp nhiễm sắc thể bố mẹ được trao đổi chéo, nghĩa là những gen của bố sẽ được hoán đổi cho gen của mẹ.

Việc trao đổi này có thể diễn ra tại nhiều điểm hay một điểm trên cặp nhiễm sắc thể Hai nhiễm sắc thể con ra đời Chúng sau đó được đưa vào quần thể, quần thể trở thành quần thể mới.

Mặc dù quá trình lai hóa đã tạo được con mới là cho quần thể lớn hơn tức miền tìm kiếm đã mở rộng nhưng vẫn thiếu tính đa dạng về gen Vì vậy quá trình đột biến được thực hiện để tạo những gen mới khắc phục tình trạng này Tuy nhiên tỉ lệ đột biến đường rất thấp để tránh làm mất đi tính ổn định của quần thể.

Mô hình bài toán sắp lịch

Bài toán sắp lịch

Để sắp lịch chiếu cho chu kỳ phát sóng Độ hiệu quả chương trình được lấy từ kết quả của bài toán dự báo Trong chu kỳ lịch phát sóng hằng ngày là không đổi.

Lịch chiếu hằng ngày tuân thủ theo một số ràng buộc cứng được định nghĩa như sau:

H 1 Các chương trình chỉ được chiếu trong các khung giờ được cho phép, tính tại thời điểm bắt đầu chiếu chương trình.

H 2 Mỗi chương trình đều được chiếu ít nhất một lần trong ngày.

H 3 Không thể chiếu một chương trình trong khi một chương trình khác đang chiếu.

H 4 Mỗi chương trình không được chiếu vượt quá số lượng chiếu tối đa trong ngày.

H 5 Khoảng thời gian giữa hai lần chiếu của một chương trình không quá gần (không được chiếu gần nhau trong một khoảng thời gian đã định)

H 6 Tổng thời lượng chiếu các chương trình trong một nhóm không vượt quá thời lượng phát mà nhóm đó được phép chiếu trong một ngày.

Các ràng buộc mềm có thể cần quan tâm:

S 1 Tối đa hóa doanh thu

Mô hình bài toán sắp lịch

4.2.1 Định nghĩa tập dữ liệu yêu cầu

• Lịch chiếu bao gồm T khoảng thời gian Mỗi khoảng thời giant bắt đầu từ thời điểmt−1và kết thúc vào thời điểmt Miền thời gian được kí hiệu làT, nghĩa là chúng ta sẽ quan tâm đến các khoảng thời gian1,2, ,T.

• F ={F 1 , ,F m }: tập các khung giờ trình chiếu

• Mỗi khung giờ F j , j ∈ [1,m] là một đoạn thời gian bắt đầu từ khoảng thời gian hj cho đến khoảng thời gian kj, với hj,kj ∈[1,T] Hay có thể viết là F j = [h j ,k j ]

• P={P 1 , Pn}: tập các chương trình cần sắp lịch

• {p 1 , ,pn}: tập thời lượng chiếu của mỗi chương trình trong tậpP.

• {` 1 , , ` n }: tập số lần phát tối đa của mỗi chương trình trong tậpP.

• {e i , ,en}: tập chỉ số hiệu quả của mỗi chương trình trong tậpP.

• {q 1 , ,q r }: tập thời lượng chiếu tối đa của mỗi nhóm trong tậpQ

• {r 1 , ,rr}: tập tỉ lệ thời gian thuộc về mỗi nhóm chương trình.

• A= {a i j }: Danh sách các chương trình có thể được gán vào các khung giờ chỉ định:ai j =1nếu chương trìnhPi được phép gán vào khung giờFj; ngược lạiai j =0(vớiPi∈PvàFj∈F)

• B = {b ik }: Danh sách các chương trình thuộc về các nhóm chương trình: b ik =1nếu chương trình P i thuộc về nhómQ k ; ngược lại b ik =0 (vớiP i ∈P vàQk ∈Q)

• α là độ đa dạng của chương trình α ∈(0,1] α càng gần 1 thì các chương trình càng được đối xử công bằng trong việc chiếu lặp lại, ngược lại thì các chương trình có độ hiệu quả tốt sẽ chiếm ưu thế.

4.2.2 Biến quyết định của mô hình

Biến quyết định được định nghĩa như sau:

 1 Nếu chương trìnhPi được quyết định chiếu bắt đầu vào khoảng thời gian t tại thời điểmt−1 0 trong trường hợp ngược lại

4.2.3 Các ràng buộc của mô hình

Các ràng buộc được định nghĩa trong mục 4.1 được biểu diễn toán học như sau:

H 1 Các chương trình chỉ được chiếu trong các khung giờ được cho phép tính thời điểm bắt đầu chiếu

H 2 Mỗi chương trình đều được chiếu ít nhất một lần

H 3 Không thể chiếu một chương trình trong khi một chương trình khác đang chiếu.

H 4 Mỗi chương trình đều được chiếu không vượt quá số lượng chiếu tối đa trong ngày.

H 5 Khoảng thời gian giữa hai lần chiếu của cùng một chương trình không quá gần (không chiếu liên tiếp nhau)

H 6 Tổng thời lượng chiếu các chương trình trong một nhóm không vượt quá thời lượng phát mà nhóm đó được phép chiếu trong một ngày.

∀k|Q k ∈Q: ∑ i|P i ∈P ∑ t∈[1,T −p i +1] x it ∗b ik ∗p i ≤q k (4.7) H 7 Biếnx it có giá trị nhị phân

Các ràng buộc mềm được mô hình như sau:

S 1 Tối đa hóa tổng doanh thu toàn bộ chương trình là: maximize ∑ i|P i ∈P ∑ t∈[1,T −p i +1] xit∗pi∗ei (4.9)

Luận văn này hướng đến việc giải quyết mục tiêu sau: doanh thu của công ty là tối đa: maximize ∑ i|P i ∈P ∑ t∈[1,T − p i +1] x it ∗p i ∗e i (4.10)

Chứng minh bài toán thuộc lớp NP-complete

Bài toán sắp lịch cho kênh mua sắm trên sóng truyền hình có thể được mô tả một cách đơn giản như sau.

Dữ liệu đầu vào: Một tậpnchương trình có thời gian chiếu tương ứng là p 1 ,p 2 , ,pn được chỉ định cụ thể chiếu vào những khung giờ thuộc tập khung giờF={F 1 ,F 2 , ,Fm}.

Các khung giờF 1 ,F 2 , ,Fm nằm liên tiếp nhau Câu hỏi đặt ra: liệu có cách sắp lịch nào khả thi để nchương trình này được sắp hết vàomkhung giờ này. Định lý 1:Bài toán xác định một lịch chiếu khả thi cho kênh mua sắm trên sóng truyền hình thuộc lớp bài toán NP−complete

Mệnh đề 1:Bài toán sắp lịch thuộc lớpNP.

Chứng minh: Nếu có thể đưa ra được các thông số cụ thể của bài toán sắp lịch và nó có nghiệm ("yes-instance"), thì sẽ tồn tại một tập hoán vị các quyết định để chúng ta có thể tìm ra được nghiệm khả thi và xác thực nó là nghiệm trong thời gian đa thức 2

Mệnh đề 2:Bài toán sắp lịch thuộc lớpNP−complete Để chứng minh bài toán sắp lịch đã cho thuộc lớp NP−complete, cần quy dẫn bài toán này về bài toán phân hoạch (partition) Bài toán ra quyết định phân hoạch(partition) được định nghĩa như sau:

Dữ liệu đầu vào: một số nguyên không âmB và tậpA={a 1 , ,ar} chứa các số nguyên dương với∑ r k=1 a k +vàa k

Tiêu đề	Hỗ trợ xếp lịch cho kênh mua sắm trên sóng truyền hình
Tác giả	Nguyễn Quốc Thịnh
Người hướng dẫn	TS. Huỳnh Tường Nguyên, PGS. TS. Trần Văn Hoài
Trường học	Trường Đại học Bách Khoa - ĐHQG - HCM
Chuyên ngành	Khoa học Máy tính
Thể loại	Luận văn thạc sĩ
Năm xuất bản	2017
Thành phố	Tp. Hồ Chí Minh

Định dạng
Số trang	66
Dung lượng	380,71 KB