Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 165 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
165
Dung lượng
18,5 MB
Nội dung
TẠP CHÍ KHOA HỌC CƠNG NGHỆ VÀ THỰC PHẨM Tập 22 - Số (6/2022) MỤC LỤC Vo Thuy Vi - Adsorption of methylene blue on wastes from lemongrass leaves after essential oil extraction Tran Hoai Lam, Nguyen Van Hoa, Tran Thi Thanh Truc, Truong Tien Dung, Le Minh Hoa, Nguyen Phan Duyen Nu, Giang Ngoc Ha, Nguyen Hoc Thang - Characteristics and phenol red adsorption capacity in aqueous solutions of SBA-15 adsorbent synthesized from the ash of brickyard 11 Tran Thi Thuy Nhan, Tran Thi Ngoc Mai, Truong Thi Dieu Hien, Nguyen Thi Tra Mi, Nguyen Thi Thanh Thao - Assessment of GHGs emission from different cow-pat treatment methods and effectiveness of EM supplementation 22 Hoàng Vũ Thu Phương, Vũ Quang Mạnh, Nguyễn Phan Hoàng Anh, Sakkouna Phommavongsa, Bùi Minh Hồng - Nghiên cứu bước đầu thành phần loài phân bố nhóm động vật hình nhện (Arachnida) thị trấn Tuấn Giáo, tỉnh Điện Biên 31 Nguyễn Vũ Hoàng Phương, Lê Minh Thành, Trần Thanh Tú, Nguyễn Thị Thu Thảo, Bùi Thị Ngọc Hà, Huỳnh Thị Thanh Tuyết - Nghiên cứu xử lý chất thải hữu ruồi lính đen (Hermetia illucens) quy mơ phịng thí nghiệm 41 Đào Thị Mỹ Linh, Nguyễn Thị Quỳnh Mai, Bùi Thiên Kim Thu, Nguyễn Đình Triều Vũ, Nguyễn Đăng Khoa, Sơn Thiên Nga, Kiều Yến Vy, Trần Quỳnh Hoa - Nghiên cứu ảnh hưởng yếu tố môi trường ni cấy tới q trình sinh chitinase từ nấm mốc (Aspergillus sydowii) 52 Nguyễn Thị Thùy Dương, Nguyễn Ngọc Tuấn - Biến động số yếu tố khí tượng hải dương học nghề cá vùng biển vịnh Bắc Bộ giai đoạn 1/2019 - 6/2021 63 Phan Thế Duy, Nguyễn Thành Văn, Võ Thị Dâng Dâng, Đỗ Văn Thanh - Đánh giá khả ứng dụng thiết bị sấy vi sóng chân khơng dựa biến đổi thành phần dinh dưỡng khoai lang tím 75 Nguyễn Thuần Anh - Đánh giá kiến thức, thái độ thực hành vệ sinh an toàn thực phẩm hộ trồng rau Khánh Hòa 83 10 Trần Thị Anh Đào, Nguyễn Hoàng Dâng - Xây dựng bảng cỡ số áo polo shirt cho nữ sinh viên Khoa Công nghệ May Thời trang HUFI nhằm mục đích giảng dạy 96 11 Phạm Ngọc Nam, Nguyễn Thị Ánh Nguyệt, Lê Quang Nghĩa, Nguyễn Hà - Nghiên cứu chế độ uốn gỗ cao su để sản xuất chi tiết cong cho sản phẩm mộc 107 12 Phạm Minh Nguyệt - Nghiên cứu khả hấp phụ chất khí borophene pha tạp ngun tử kim loại: tính tốn mô DFT 117 13 Lê Thể Truyền, Nguyễn Minh Huy, Nguyễn Tấn Ken, Mai Văn Nam - Thiết kế kích thước rơ-bốt delta dựa khơng gian làm việc 124 14 Bùi Văn Hiền, Trương Việt Anh, Dương Văn Khải - Giải pháp đa tầng theo dõi điểm phát cơng suất cực đại tồn cục hệ thống pin quang điện điều kiện bóng che phần 136 15 Nguyễn Thị Thu Tâm, Đinh Nguyễn Trọng Nghĩa - Ẩn tập phổ biến dựa phương pháp quy hoạch tuyến tính nguyên kết hợp với biên dương lý tưởng 153 Journal of Science Technology and Food 22 (2) (2022) 3-10 ADSORPTION OF METHYLENE BLUE ON WASTES FROM LEMONGRASS LEAVES AFTER ESSENTIAL OIL EXTRACTION Vo Thuy Vi Ho Chi Minh City University of Food Industry Email: vivt@hufi.edu.vn Received: January 2022; Accepted: May 2022 ABSTRACT In this study, a biosorbent from lemongrass leaf after the distillation of essential oil was prepared by the alkali treatment with NaOH 10% The removal of Methylene blue (MB) was tested under the following conditions: adsorbent dose (0.02-0.4 mg), pH (2-10), and dye concentration (20 and 100 mg/L) When the adsorbent dose and pH were raised, the percentage removal and adsorption capacity of dye increased The kinetic studies revealed that the MB adsorption process complied with the pseudo-second-order model with a 30-min adsorption equilibrium The percentage removal and adsorption capacity of MB at a concentration of 20 mg/L were 90.9% and 6.30 mg/g at the adsorbent dose of 0.1g in 30 According to the findings, alkali-treated lemongrass waste is an inexpensive and effective biosorbent in treating dye wastewater Keywords: Biosorbent, lemongrass, adsorption, methylene blue INTRODUCTION The textile and garment industry is a core industry in many economies, accounting for 7% of global export trade, worth $1400-1550 billion USD, and employing over 35 million people worldwide [1] Nevertheless, the textile industry also contributes significantly to environmental pollution Textile dyeing procedures use a lot of water throughout the manufacturing process, and the wastewater generated varies between 12 and 300 m 3/ton of cloth Textile dyes are now available in over 10,000 types [1] Methylene Blue (MB) is a popular cationic dye that has been identified as being more harmful than other anionic dyes [2] This is a synthetic dye that dissolves in water to produce a blue solution that is difficult to remove According to previous reports, dye-containing wastewater can block light and impede photosynthesis, increase chemical and biological oxidation demands, impede organism growth and reproduction, and have a negative impact on photosynthesis Methylene blue can cause skin allergies, nausea, and breathing problems [2, 3] As a result, water pollution from dyecontaining wastewater and dye adsorption for wastewater treatment has gotten a lot of attention Many techniques have been employed to remove these contaminants, including nanofiltration, reverse osmosis, electrolytic deoxidation, aerobic treatment, and adsorption Adsorption, one of the most effective dye removal processes, has several advantages over other methods, including a lower cost, a simpler process, and complete dye removal [4] Agricultural wastes such as bagasse, corn cobs, orange peels, and coconut shells are commonly utilized as adsorbents to remove dyes due to their inexpensive cost, abundance, high adsorption capacity and speed, and selectivity [4-6] Vo Thuy Vi In the last two years, Coronavirus disease (COVID-19) has emerged as a global health threat Lemongrass (Cymbopogon citratus) contains 1-2% essential oil, 39.5% cellulose, 22.6% hemicellulose, and 28.5% lignin [7] Lemongrass essential oil, which is a mixture of volatile compounds, has antibacterial, antifungal, and antiviral properties Due to its benefits, lemongrass oil is used as a COVID prevention method, resulting in a significant amount of lignocellulose-containing waste after distillation The functional groups in cellulose fibers, such as hydroxyl and carboxyl, participate in the formation of covalent bonds with the chromogenic groups of dye molecules Therefore, MB molecules were kept on the cellulose surface As a result of the good adsorption characteristics of cellulose materials, lemongrass leaves are a viable choice for dye adsorption Previous studies focused on MB adsorption by activated carbon from lemongrass leaves using a 500 oC - 600 oC thermal treatment [8, 9] However, this method necessitates a complex treatment process, resulting in a high price for activated carbon Furthermore, it is difficult to separate activated carbon from the water after dye adsorption, posing a risk to many living organisms In this study, cellulose-containing lemongrass waste was chemically treated with a caustic soda solution to investigate methylene blue adsorption in water The goal is to introduce a simpler and more effective method of treating biosorbents used in dye adsorption This helps to reduce treatment time and increase the reuse of agricultural waste This alkali treatment of lemongrass leaves has been rarely used, particularly in terms of methylene blue adsorption [8] Furthermore, SEM and XRD measurements were used to evaluate the surface properties and identify the crystallinity of cellulose To determine the adsorption mechanism, the adsorption kinetics and factors such as adsorbent dosage, pH, and dye concentration were investigated MATERIALS AND METHODS 2.1 Adsorbent preparation Lemongrass is cultivated on a farm in Taiwan's Tainan province After distillation, lemongrass leaves were dried overnight at 60oC to make the adsorbent These lemongrass leaves were alkali-treated to eliminate lignin The elimination of lignin aids in increasing cellulose concentration and improving the material's surface characteristics for improved pigment adsorption [10] The preparation steps of the biosorbent were described as follows Lemongrass leaves after distillation were powdered, milled, and sieved to obtain sizes ranging from 250 µm to 1000 µm Lemongrass leaves were stirred for hours at 90oC in a vessel containing a 10% NaOH solution The ratio of lemongrass mass to the volume of NaOH solution was kept constant at 1:25 (w/v) After alkalinizing, the lemongrass leaves were rinsed many times with deionized water until the pH was neutral, then dried for 24 hours at 60oC Lemongrass leaves after alkali treatment were named TLG 2.2 Absorbent characterization The characteristics of TLG material before and after dye adsorption were examined using a scanning electron microscopic (SEM) analysis and X-ray spectroscopy (XRD) The surface morphology of absorbents was investigated by scanning electron microscopy (SEM) (Hitachi SU8010) A small amount of adsorbent was placed on the specimen stub and coated with a thin gold layer by a DC sputter coater (AGAR B7340, Agar Scientific, Stansted, UK) The adsorbent was then imaged at a 110KV accelerating voltage with a 10 mm working distance and magnifications of ×2500 were applied XRD measurements were carried out with an Ultima IV diffractometer (Rigaku Americas Corp., USA) equipped with a Cu-target tube at wavelengthλ = 0.1540 nm Diffractograms were collected at 2θ ranging from 5º to 65º with a scan step of 0.02º The crystallinity index (CrI %) of TLG was determined by Eq (1) [11] Adsorption of methylene blue on wastes from lemongrass leaves … 𝐶𝑟𝐼(%) = 𝐼002 −𝐼𝑎𝑚 𝐼002 × 100 (Eq 1) where I002 is the maximum intensity of the crystalline peak ((22° < 2θ < 23°) and Iam is the scattered intensity of the amorphous peak (18° < 2θ < 19°) of the sample 2.3 Preparation of MB adsorbate The appropriate quantity of methylene blue (analytical grade, Sigma Aldrich 46465224) was dissolved in distilled water to make a stock solution (1000 mg/L) Solutions of various concentrations (1, 2, 4, 8, and 10 mg/L) were prepared by a serial dilution process of the initial stock solution For all experiments, the MB concentration was determined by a UV-visible spectrophotometer (CT-2200 spectrophotometer, Germany) at a wavelength of 665 nm 2.4 The influence of adsorbent dose and pH The following steps were used to test the effect of the adsorbent dose In Erlenmeyer flasks containing 40 mL of 20 mg/L MB solution, different amounts of TLG adsorbent (0.02, 0.06, 0.1, 0.2, 0.3, and 0.4 gram) were added The sample was shaken at 25 oC at 150 rpm and then put into a thermostatic shaker Aqueous solutions were obtained after two hours of adsorption The percentage removal H (%) and the adsorbed amount Q (mg/g) of MB on TLG were calculated following Eqs (2)-(4) [8, 9] 𝐻(%) = 𝐶0 −𝐶𝑡 𝐶0 𝑄𝑡 (𝑚𝑔/𝑔) = 𝑄𝑒 (𝑚𝑔/𝑔) = × 100 (Eq 2) 𝐶0 −𝐶𝑡 𝑚 𝐶0 −𝐶𝑒 𝑚 × 𝑉 (Eq 3) × 𝑉 (Eq 4) where Co, Ct and Ce (mg/L) are the liquid-phase concentrations of MB at the initial time, time t, and the equilibrium state, respectively V (mL) is the volume of the MB solution, and m is the weight of the adsorbent (g) Qe and Qt (mg/g) are the amounts of MB adsorbed per weight of TLG at the equilibrium state and at time t, respectively On the other hand, pH changes the charge on the surface of the adsorbent and thus affects its dye adsorption capacity The adsorption of 20 mg/L MB solution with pH values ranging from 2.5 to 10.5 by TLG was investigated The pH of the MB solution was adjusted using sodium hydroxide (NaOH) and hydrochloric acid (HCl), both from Labscan (Thailand) A properly weighed amount of TLG (0.1 g) was added to an Erlenmeyer holding 40 mL of MB (20 mg/L) at the appropriate pH The adsorption procedure was followed in the same way as the experiment to determine the adsorbent dose All experiments were performed in triplicate 2.5 Kinetic studies A fixed amount of TLG (0.1 g) was added to twelve Erlenmeyer flasks containing 40 mL of dye The effect of dye concentration on adsorption kinetics was investigated at 20 mg/L and 100 mg/L of MB The Erlenmeyer flasks were firmly covered and held at a constant temperature of 25 oC in a thermostatic shaker with 150 rpm The absorbance of the MB solution in Erlenmeyer was then measured between and 180 The rate constants and other parameters for the kinetic data were calculated using the kinetic equations of the first and second-order reactions, as demonstrated in Eqs (5) & (6) [12]: Vo Thuy Vi 𝑙𝑛 (𝑄𝑒 − 𝑄𝑡 ) = 𝑙𝑛𝑄𝑒 − 𝑘1 𝑡 (Eq 5) 𝑡 𝑄𝑡 = 𝑘2 𝑄𝑒2 + 𝑡 𝑄𝑒 (Eq 6) where k1 (min-1) and k2 (g mg-1min-1) were respectively the adsorption rate constant of the pseudo-first order and pseudo-second order models RESULTS AND DISCUSSION 3.1 Characterization of absorbents The surface shape of TLG before and after MB adsorption can be seen in Figure Before adsorption, the surface of the alkali-treated lemongrass leaves (TLG) was rough fibers with cellulose-like characteristics This observed behavior was similar to the findings of Putri et al [4] These fibers formed thin layers by stacking them up in a disorderly manner The irregular rough structure and pores play an important role in dye adsorption [13] After MB adsorption, the surface morphology of TLG became rougher than before, and there was an aggregation of MB particles on the surface of the material (a) TLG before adsorption (b) TLG after adsorption Figure SEM images of adsorbent (a) before and (b) after MB adsorption The X-ray diffractograms for TLG are shown in Figure The diffraction peaks of TLG at 2θ values of 15.9° (101), 22.5° (002), and 34.9° (040) are similar to cellulose characteristic peaks [4] From equation 2-1, TLG has a crystallinity index of 78% Figure XRD patterns of TLG before and after adsorption Adsorption of methylene blue on wastes from lemongrass leaves … 3.2 Effect of adsorbent dose and pH on adsorption The adsorbent dose has a direct impact on the adsorbent's surface area and the number of active adsorption sites Figure shows the effect of TLG doses ranging from 0.02 to 0.4 g on MB adsorption at a concentration of 20 mg/L As the adsorbent dose increased from 0.02 to 0.3g, the amount of MB removed increased This is because more active adsorption sites become available as the adsorbent's mass increases The percentage removal of MB was nearly unchanged with a dose increase from 0.3g to 0.4g at MB 20 mg/L, owing to the fact that the number of free binding sites exceeded the number of MB molecules The formation of hydrogen bonds between the hydroxyl group of cellulose and the nitrogen atom of the MB seems to contribute to the adsorption capacity According to this finding, as the dose of TLG was increased, the percentage removal increased and the adsorption capacity decreased Figure Effect of adsorbent dose on the percentage removal and adsorption capacity The pH changed the surface charge of the adsorbent, causing changes in the adsorption capacity of MB Fig shows the adsorption capacity of the TLG toward MB at various pH values (2.5, 3.5, 5.0, 6.5, 8.5, 9.5, and 10.5) A significant increase in MB sorption was observed as the pH increased from 2.5 to 6.5, while further increasing the pH value from 6.5 to 10 resulted in a slight change in sorption As illustrated in Fig 4, the lowest removal percentage was observed at pH 2.5 (9.30%) and the highest percentage of removal was 92.4% at pH 10.5 The removal of MB dye from TLG was found to be pH-dependent, which is consistent with previous studies [4, 8] As the pH increased, the active adsorbent sites deprotonated, promoting electrostatic interaction between the positively charged cationic methylene blue molecules and the negatively charged surface of the adsorbent In this study, pH 6.5 was selected because it was the pH of the MB solution that did not need to be modified As a result, all subsequent adsorption studies were carried out at pH 6.5 100 10 80 60 40 20 Q (mg/g) H (%) H (%) Q (mg/g) 10 pH Figure Effect of pH on the percentage removal and adsorption capacity Vo Thuy Vi 3.3 Adsorption kinetics The effect of contact time on the adsorption of MB is shown in Figure During the first 30 min, at both MB concentrations tested, adsorption increased swiftly and gradually The adsorption capacity achieved equilibrium after 30 The huge number of active sites on the material surface caused a quick increase in the rate of adsorption at the first stage, resulting in a high adsorption capacity However, as the number of active sites decreased and the adsorbent lost its ability to adsorb MB, the adsorption capacity was nearly unchanged, reaching 6.3 mg/g and 18.6 mg/L, respectively, for MB concentrations of 20 and 100 mg/L As the MB concentration increased, the amount of MB adsorbed increased until the maximum adsorption capacity of the biosorbent was reached Pseudo-first-order and second-order models were demonstrated in these plots in Fig and values of Qe and rate constants were presented in Table The computed findings revealed that the coefficient of determination (R2> 0.995) in the second-order model was higher than that in the pseudo-first-order model at all MB concentrations Furthermore, the Qe values calculated from equation were closer to the experimental Qe value Hence, pseudo-secondorder kinetic was the best way to describe the adsorption process The chemical sorption occurred due to the formation of hydrogen bonding between the hydroxyl group on the cellulose surface and the nitrogen of MB [13] Furthermore, the insignificant difference in the adsorption rate constant at both MB concentrations in the pseudo-second-order models (k2) pointed out that the adsorption rate depended on the number of adsorption sites available on the TLG surface rather than the quantity of MB dye molecules adsorbed 16 14 Q (mg/g) 12 MB 20 mg/L MB 100 mg/L 10 0 20 40 60 80 100 120 140 160 180 200 Contact time (min) Figure Effect of contact time on MB dye adsorption capacity MB 20 mg/L MB 100 mg/L (a) 4 t/Qt ln(Q e-Qt) Q (mg/g) MB 100 mg/L MB 20 mg/L (b) -1 -2 10 15 20 25 Contact time (min) 10 20 30 Contact time (min) Figure Kinetic plots for MB adsorption (a) pseudo-first order, (b) pseudo-second order model Adsorption of methylene blue on wastes from lemongrass leaves … Table Kinetic parameters of MB adsorption onto TLG Model Parameter Experiment Pseudo-first-order CMB(mg/L) 20 100 Qe (mg/g) 6.3047 13.8643 Qe (mg/g) 3.1267 25.9196 k1 (min-1) 0.1039 0.1889 0.9511 0.6217 6.6401 14.084 0.007 0.005 0.9954 0.9952 R Qe (mg/g) Pseudo-second-order -1 -1 k2 (g.mg ) R In comparing the Qe value in this study to Ahmad's study [9], we recognized that, while the Qe of the TLG biosorbent was low (13.864 mg/g at MB 100 mg/g), the adsorption equilibration time was short, lasting only 30 minutes In contrast, in Ahmad's study, the adsorption of MB 100 mg/L on lemongrass activated carbon reached equilibrium with Qe at 43.931 mg/g after 24 hours [9] CONCLUSION A new biosorbent was successfully prepared from lemongrass waste after distillation of essential oil Lemongrass leaves are stirred for hours at 90 oC in a vessel containing a 10% NaOH solution SEM and XRD results indicated that the functional groups of cellulose and irregular rough surface of fibers contributed to the adsorption process The removal of dye from cellulose-containing lemongrass waste was 90.9% The adsorption capacity is 6.30 mg/g, which corresponds to the experimental conditions of pH 6.5, 0.1 g adsorbent dose, and 30-min quick equilibrium time The results show that alkali treatment with NaOH for lignocellulosederived materials is a simple method that requires no complicated equipment, has a short fabrication time, and has a low adsorbent dose Lemongrass waste has the potential to be a low-cost, abundant and effective biosorbent source in environmental treatment REFERENCES Chequer F D., De Oliveira G R., Ferraz E A., Cardoso J C., Zanoni M B., & De Oliveira, D P - Eco-friendly textile dyeing and finishing, chapter 6- Textile dyes: Dyeing Process and Environmental Impact (2013) 151-176 Choi H.-J., Yu S.-W - Biosorption of methylene blue from aqueous solution by agricultural bioadsorbent corncob, Environmental Engineering Research 24 (1) (2019) 99-106 https://doi.org/10.4491/eer.2018.107 Gong R., Li M., Yang C., Sun Y., and Chen J - Removal of cationic dyes from aqueous solution by adsorption on peanut hull, Journal of Hazardous Materials 121 (1-3) (2005) 247-250 https://doi.org/10.1016/j.jhazmat.2005.01.029 Putri K N A., Keereerak A., and Chinpa W - Novel cellulose-based biosorbent from lemongrass leaf combined with cellulose acetate for adsorption of crystal violet, International Journal of Biological Macromolecules 156 (2020) 762-772 https://doi.org/10.1016/j.ijbiomac.2020.04.100 Bùi Văn Hiền, Trương Việt Anh, Dương Văn Khải 22 Huang C., Wang L., Yeung R S., Zhang Z., Chung H S and Bensoussan A – A prediction model guided jaya algorithm for the PV system maximum power point tracking, IEEE Transaction on Sustainable Energy (1) (2018) 45-55 23 Ram J P and Rajasekar N – A new global maximum power point tracking technique for solar photovoltaic (PV) system under partial shading conditions (PSC), Energy 118 (2017) 512-525 24 Ram J P and Rajasekar N – A novel flower pollination based global maximum power point method for solar maximum power point tracking, IEEE Transactions on Power Electronics 32 (11) (2017) 8486-8499 25 Diab A A Z and Rezk H – Global MPPT based on flower pollination and differential evolution algorithms to mitigate partial shading in building integrated PV system, Solar Energy 157 (2017) 171–186 26 Somashekar B and Esther B P – Partial shading conditions for photovoltaic system using MPPT techniques, International Journal of Recent Trends in Engineering& Research (IJRTER) 03 ( 06) (2017) 27 Mohanty S., Subudhi B and Ray P K – A new MPPT design using grey wolf optimization technique for photovoltaic system under partial shading conditions, IEEE transactions on sustainable energy (1) (2017) 181-188 28 Rajkumar M V., Mahakumar M., Manojkumar M., Hemaraj M and Kumaravel E – A new DC-DC converter topology with grey wolf MPPT algorithm for photovoltaic system, International Journal of Emerging Technologies in Engineering Research (IJETER) (4) (2017) 29 Kumar C S and Rao R S – Enhanced grey wolf optimizer based MPPT algorithm of pv system under partial shaded condition, Journal of Renewable Energy Development (3) (2017) 203-212 30 Rezk H and Fathy A – Simulation of global MPPT based on teaching–learning-based optimization technique for partially shaded PV system, Electrical Engineering 99 (3) (2016) 857-859 31 Fathy A and Rezk H – A novel methodology for simulating maximum power point trackers using mine blast optimization and teaching learning based optimization algorithms for partially shaded photovoltaic system, Journal of renewable and sustainable energy (2016) 32 Chao K H and Wu M C – Global maximum power point tracking (MPPT) of a photovoltaic module array constructed through improved teaching-learning-based optimization, Energies (12) (2016) 986 33 Fathy A., Zidan I and Amer D – An improved teaching learning based optimization algorithm for simulating the maximum power point tracking controller in photovoltaic system, The Egyptian International Journal of Engineering Sciences and Technology 21 (2016) 9-18 34 Kumar C S and Rao R S – A novel global MPP tracking of photovoltaic system based on whale optimization algorithm, Journal of Renewable Energy Development (3) (2016) 225-232 35 Kumar N., Hussain I and Singh B – Single sensor based MPPT for partially shaded solar photovoltaic by using human psychology optimisation algorithm, IET Generation, Transmission & Distribution 11 (10) (2017) 2562-2574 150 Giải pháp đa tầng theo dõi điểm phát công suất cực đại toàn cục hệ thống pin … 36 Shi Y J., Ling L T., Xue F., Qin Z J., Li Y J., Lai Z X and Yang T – Combining incremental conductance and firefly algorithm for tracking the global MPP of PV arrays, Journal of Renewable and Sustainable Energy (2017) 023501 37 El-Helw H M., Magdy A and Marei M I – A hybrid maximum power point tracking technique for partially shaded photovoltaic arrays, IEEE Access (2017) 11900-11908 38 Manickam C., Raman G P., Raman G R and Ganesan S I – Fireworks enriched P&O algorithm for GMPPT and detection of partial shading in PV systems, IEEE Transactions on Power Electronics 32 (6) (2017) 4432-4443 39 Mohanty S., Subudhi B and Ray P K – A grey wolf assisted perturb & observe MPPT algorithm for a PV system, IEEE Transaction on Energy Conversion 32 (1) (2017) 340347 40 Karagoz M., Demirel H and Erkal B – A novel MPPT method for PV arrays based on modified bat algorithm with partial shading capability, IJCSNS International Journal of Computer Science and Network Security 17 (2) (2017) 61-66 41 Hanafiah S., Ayad A., Hehn A and Kennel R – A hybrid MPPT for Quasi-Z-Source inverters in PV applications under partial shading condition, IEEE International Conference on Compatibility, Power Electronics and Power Engineering (CPEPOWERENG) (2017) 42 Yang Z., Duan Q., Zhong J., Mao M and Xun Z – Analysis of improved PSO and perturb & observe global algorithm for PV array under partial shading condition, Chinese Control and Decision Conference (CCDC) 29 (2017) 43 Guan T and Zhuo F – An improved SA-PSO Global maximum power point tracking method of photovoltaic system under partial shading conditions, IEEE International Conference on Enviroment and Electrical Engineering and IEEE Industrial and Commercial Power Systems Europe (EEEIC/ I&CPS Europe) (2017) 44 Qichang Duan Q., Mao M X., Duan P and Hu B – An intelligent algorithm for maximum power point tracking in photovoltaic system under partial shading conditions, Transactions of the Institute of Measurement and Control 39 (2) (2016) 244-256 45 Duan Q., Mao M X., Duan P and Hu B – Comprehensive improvement ofartificial fish swarm algorithm for global MPPT in PV system under partial shading conditions, Transactions of the Institute of Measurement and Control (2017) 46 Kumar N., Hussain I., Singh B and Panigrahi B K – Rapid MPPT for uniformly and partial shaded PV system by using jayade algorithm in highly fluctuating atmospheric conditions, IEEE Transactions on Industrial Informatics 13 (5) (2017) 2406-2416 47 Kumar N., Hussain I., Singh B and Panigrahi B K – MPPT in dynamic condition of partially shaded PV system by using WODE technique, IEEE Transactions on Sustainable Energy (3) (2017) 1204-1214 48 Nie X and Nie H – MPPT control strategy of PV based on improved shuffled frog leaping algorithm under complex environments, Journal of Control Science and Engineering (2017) 1-11 49 Mao M X., Zhang L., Duan Q C., Oghorada O J K., Duan P and Hu B – A two-stage particle swarm optimization algorithm for MPPT of partially shaded PV arrays, International Journal of Green Energy 14 (8) (2017) 694-702 50 Femia N., Petrone G., Spagnuolo G and Vitelli M – Optimization of perturb and observe maximum power point tracking method, IEEE transactions on power electronics 20 (4) (2005) 151 Bùi Văn Hiền, Trương Việt Anh, Dương Văn Khải 51 Alhussain H M A and Yasin N – Modeling and simulation of solar PV module for comparison of two MPPT algorithms (P&O & INC) in MATLAB/Simulink, Indonesian journal of electrical engineering and computer science 18 (2) (2020) 666-677 52 Rajput S., AverbukhM., Yahalom and Minav T - An approval of MPPT based on PV Cell’s simplified equivalent circuit during fast-shading conditions, Electronics (9) (2019) 1060 53 Ramaprabha R., Gothandaraman V., Kanimozhi K., Divya R and Mathur B.L Maximum power point tracking using ga- optimized artificial neural network for solar PV system, International Conference on Electrical Energy Systems (2011) 264-268 ABSTRACT A MULTI-STAGE SOLUTION TO GLOBAL MAXIMUM POWER POINT TRACKING OF THE PHOTOVOLTAIC SYSTEM UNDER PARTIAL SHADING Bui Van Hien1,2*, Truong Viet Anh2, Duong Van Khai1 Ho Chi Minh City University of Food Industry Ho Chi Minh City University of Technology and Education *Email: hienbv@hufi.edu.vn The power of a photovoltaic (PV) system is significantly dependent on the operating conditions This energy is directly proportional to solar radiation and inversely ratio to its surface temperature In addition, the power-voltage (P-V) current-voltage (I-V) curves have multiple peak power points when the operating conditions between the modules in the system are not uniform It is the biggest challenge of global maximum power point tracking (GMPPT) and avoidance of local extremes to get the best performance This paper introduces a multilayer GMPPT technique in a heterogeneous environment when partially shading due to natural phenomena In particular, the first stage has the task of narrowing the search scope to find the potential point Then increase MPPT speed and efficiency by basic P&O algorithm in the next stage The results obtained through simulation by PSIM software are compared with other optimization algorithms, showing the superiority of the proposed solution in improving the speed, performance, and stability of the PV system Keywords: Partial shade, multistage solution, photovoltaic system 152 Tạp chí Khoa học Cơng nghệ Thực phẩm 22 (2) (2022) 153-164 ẨN TẬP PHỔ BIẾN DỰA TRÊN PHƯƠNG PHÁP QUY HOẠCH TUYẾN TÍNH NGUYÊN KẾT HỢP VỚI BIÊN DƯƠNG LÝ TƯỞNG Nguyễn Thị Thu Tâm, Đinh Nguyễn Trọng Nghĩa* Trường Đại học Công nghiệp Thực phẩm TP.HCM *Email: nghiadnt@hufi.edu.vn Ngày nhận bài: 07/4/2022; Ngày chấp nhận đăng: 08/6/2022 TÓM TẮT Nghiên cứu đề xuất phương pháp để ẩn tập phổ biến nhạy cảm sở liệu giao tác Phương pháp dựa thông tin từ biên dương lý tưởng đề xuất hệ phương trình quy hoạch tuyến tính ngun Thực giải phương trình xác định giao tác cần phải hiệu chỉnh để ẩn hoàn toàn tập phổ biến nhạy cảm Trong trường hợp phương trình vơ nghiệm, số hệ số thêm vào để nới lỏng ràng buộc toán Thực nghiệm đánh giá phương pháp số tập liệu tiếng cho thấy phương pháp có độ xác cao phương pháp sử dụng quy hoạch tuyến tính ngun truyền thống Từ khóa: Khai thác liệu đảm bảo tính riêng tư, ẩn tập phổ biến, quy hoạch tuyến tính nguyên, biên dương lý tưởng MỞ ĐẦU Khai thác liệu đảm bảo tính riêng tư [1] lĩnh vực nghiên cứu kết hợp phương pháp khai thác liệu riêng tư liệu để thực khai thác liệu đảm bảo tính riêng tư Sự gia tăng lượng liệu tạo nên động lực cho ứng dụng khai thác liệu, ảnh hưởng tiêu cực đến riêng tư thông tin lưu liệu Cụ thể hơn, ta biết liệu liên quan người làm lộ danh tính họ, liệu liên quan kinh tế chứa liệu mật công ty kế hoạch kinh doanh, kế hoạch sáp nhập, mua lại công ty khác, v.v Mục tiêu khai thác liệu đảm bảo tính riêng tư thực khai thác liệu đảm bảo không làm lộ thông tin nhạy cảm Một số phương pháp đơn giản để bảo đảm tính riêng tư cổ điển xóa danh tính hay thuộc tính nhạy cảm chưa đủ việc đạt hiệu mong đợi Các kỹ thuật khai thác liệu đảm bảo tính riêng tư chia thành phương pháp riêng tư đầu vào riêng tư đầu Các kỹ thuật riêng tư đầu vào nghiên cứu kỹ thuật để bảo vệ liệu nhạy cảm cách biến đổi liệu ban đầu khơng có thơng tin nhạy cảm lộ tường minh khai thác liệu Các phương pháp riêng tư đầu che chắn gây xáo trộn mẫu kết quả, tri thức nhạy cảm bị cắt bỏ từ liệu gốc Trong số kỹ thuật riêng tư đầu ra, kỹ thuật ẩn tri thức kỹ thuật hiệu chỉnh liệu sử dụng để biến đổi liệu đầu vào theo cách mà tri thức định bị xóa hay ẩn từ liệu Phụ thuộc vào loại tri thức cần ẩn, có dạng thuật tốn khác sử dụng Trong ngữ cảnh khai thác tập phổ biến, kỹ thuật sử dụng báo thuật tốn ẩn tập phổ biến Đó kỹ thuật ẩn tập có số lần xuất chúng sở liệu lớn ngưỡng (gọi minsup) Ngồi tập đánh dấu nhạy cảm phải ẩn từ sở liệu ban đầu 153 Nguyễn Thị Thu Tâm, Đinh Nguyễn Trọng Nghĩa Atallah cộng đề xuất toán ẩn tập phổ biến, chủ yếu nghiên cứu kỹ thuật hiệu chỉnh sở liệu ban đầu [2] Kỹ thuật hiệu chỉnh cần thỏa điều kiện: (1) tập phổ biến nhạy cảm bị khai thác từ sở liệu hiệu chỉnh với ngưỡng hỗ trợ minsup dùng để khai thác tập sở liệu gốc, (2) chất lượng liệu hiệu chỉnh đạt mức tối đa (3) tập phổ biến không nhạy cảm đạt trạng thái phổ biến sở liệu hiệu chỉnh Nhiều cách giải gần đưa cho vấn đề Từ kỹ thuật Heuristic [3], kỹ thuật khai thác lý thuyết biên [4, 5] đến kỹ thuật dựa Deep Learning [6], để đạt việc ẩn tác dụng phụ nhỏ Các kỹ thuật quy hoạch tuyến tính nguyên (Linear-programming - ILP) [7-9] xây dựng vấn đề tốn quy hoạch tuyến tính lời giải giao tác hay hạng mục nên hiệu chỉnh Mặc dù kỹ thuật heuristic dễ hiểu khả mở rộng tốt kỹ thuật dựa ILP, kết tin cậy có tác dụng phụ Mặc khác, kỹ thuật dựa ILP khó phải giải hệ phương trình quy hoạch tuyến tính Tuy nhiên, kỹ thuật lại đáng tin cậy tìm lời giải tốt Mặc khác, có số khó khăn vốn có tốn khơng có gần đảm bảo giải pháp tối ưu tồn cho kỹ thuật nêu Ví dụ, sở liệu giao tác với tập phổ biến abc bc, bc nhạy cảm, cố gắng ẩn dẫn đến ẩn tập abc Chính khơng có giải pháp lý tưởng tồn tốn Nhìn chung, phương pháp ẩn tập phổ biến chia thành nhóm chính: phương pháp heuristic, phương pháp xác phương pháp tiến hóa Phương pháp heuristic có ưu điểm tính tốn hiệu thời gian tính tốn nhanh Tuy nhiên, phương pháp có khuyết điểm lớn có khả làm xuất hiệu ứng phụ khơng mong muốn Phương pháp dựa thuật tốn tiến hóa phương pháp phổ biến Phương pháp đưa hiệu ứng phụ vào hàm thích nghi thuật tốn thực tối ưu hóa dựa thuật tốn tiến hóa (GA, PSO, …) Các thuật tốn tiến hóa tìm kiếm lời giải gần khơng gian tìm kiếm Việc tìm lời giải tối ưu nhanh có khả lời giải khơng thể ẩn hoàn toàn tập phổ biến Phương pháp xác phương pháp dựa hệ phương trình điều kiện (ví dụ hệ ILP) Như tên gọi, phương pháp thông thường cho kết ẩn hoàn toàn tập phổ biến Tuy nhiên, tài nguyên sử dụng cho phương pháp lớn phải giải hệ phương trình điều kiện Ngồi ra, đưa vào hệ phương trình nhiều ràng buộc, số phương pháp dựa ILP đưa lại khơng có nghiệm giải hệ ILP Trong nhóm phương pháp sử dụng ILP phải kể đến Menon cộng [9] Đây nhóm đưa cơng thức quy hoạch tuyến tính ngun cho toán ẩn tập phổ biến Nghiệm ILP giao tác cần phải hiệu chỉnh để ẩn tập nhạy cảm Quá trình hiệu chỉnh xem xét độc lập không phụ thuộc nghiệm tốn quy hoạch Cơng thức phương pháp bỏ qua hồn tồn ảnh hưởng q trình hiệu chỉnh lên tập phổ biến không nhạy cảm Sau đó, số cơng trình đề xuất cải tiến phương pháp Menon chưa thu kết khả quan Kagklis cộng cải tiến công thức Menon chuyển tập S thành Min(S) để giảm bớt số lượng phương trình ràng buộc [7] Tuy nhiên, cơng trình Kagklis cải tiến thời gian tính tốn mà khơng cho kết tốt Sau đó, số cơng trình khác đưa thêm thơng tin biên dương lý tưởng vào điều kiện ràng buộc công thức ILP Tuy nhiên, xuất thêm điều kiện ràng buộc dẫn đến phương trình khơng có lời giải [14] Stavropoulos cộng bổ sung thêm số số hạng nới lỏng ràng buộc [14] Tuy nhiên, kiểm tra lại số tập liệu cho thấy công thức Stavropoulos xuất trường hợp vơ nghiệm Với tốn ẩn tập phổ biến, đóng góp quan trọng cách tiếp cận cho tập hợp tập phổ biến tập hợp tập nhạy cảm, tạo nên biên lý tưởng hai tập hợp Trong cơng trình này, mục tiêu sử dụng kết hợp kỹ thuật biên với phương 154 Ẩn tập phổ biến dựa phương pháp quy hoạch tuyến tính nguyên kết hợp … pháp quy hoạch tuyến tính nguyên áp dụng để ẩn tập nhạy cảm Lời giải phương trình xác định tập giao tác cần phải hiệu chỉnh ẩn đạt với độ xác cao Nếu khơng tồn lời giải, ta nới lỏng ràng buộc cần thỏa mãn, sở liệu sau hiệu chỉnh đảm bảo tính riêng tư với ảnh hưởng đến chất lượng liệu PHÁT BIỂU BÀI TOÁN VÀ ĐỀ XUẤT THUẬT TOÁN 2.1 Phát biểu toán Cho 𝐼 = {𝑖1 , 𝑖2 , … , 𝑖𝑟 } tập hữu hạn hạng mục (item) Cơ sở liệu D tập hợp giao tác 𝐷 = {𝑇1 , 𝑇2 , … , 𝑇𝑛 }, giao tác 𝑇𝑞 ∈ 𝐷, với 𝑇𝑞 tập I, 𝑇𝑞 có định danh q gọi định danh giao tác (Transaction IDentifier – TID) Ngưỡng hỗ trợ tối thiểu δ, giả định người dùng chuyên gia đặt theo cách thủ cơng (theo tỷ lệ phần trăm) Bảng Một ví dụ Cơ sở liệu giao tác D0 Tid Itemset B, D B, C, D, E, F A, B, C, D, F A, B, C, E, F A, B, C, D B, C, D Định nghĩa Bài toán khai thác tập phổ biến tốn thực trích xuất tất tập hạng mục (itemset) có độ hỗ trợ (support count) không nhỏ độ hỗ trợ tối thiểu (min support) Định nghĩa (Bài toán ẩn tập phổ biến) Cho trước sở liệu giao tác D có tập hạng mục 𝐼 = {𝑖1 , 𝑖2 , … , 𝑖𝑟 }, độ hỗ trợ tối thiểu tập tập phổ biến nhạy cảm S Thực biến đổi D thành D’ cho 𝑠𝑢𝑝𝐷′ (𝑋) < 𝜎 với 𝑋 ∈ 𝑆 Trong 𝑠𝑢𝑝𝐷′ (𝑋) độ hỗ trợ tập X tính sở liệu D’ Điều có nghĩa sở liệu ban đầu phải hiệu chỉnh cho khai thác tập phổ biến nằm tập hợp tập nhạy cảm thuật toán khai thác tập phổ biến Vấn đề đặt cho toán phải xác định giao tác cần hiệu chỉnh để ẩn hoàn toàn tập nhạy cảm đồng thời lượng mát thông tin giữ thấp Lượng mát thơng tin đo đạc thông qua số tập phổ biến không nhạy cảm bị trình hiệu chỉnh liệu 2.2 Đề xuất thuật toán 2.2.1 Định nghĩa biên Định nghĩa (Định nghĩa biên) Biên dương 𝐵𝑑+ (𝐹𝐷𝜎 ) tập hợp tất tập phổ biến tối đại (các tập phổ biến khơng có tập cha chúng phổ biến) Biên âm 𝐵𝑑− (𝐹𝐷𝜎 ) tập hợp tất tập không phổ biến tối tiểu (các tập không phổ biến khơng có tập chúng khơng phổ biến) 155 Nguyễn Thị Thu Tâm, Đinh Nguyễn Trọng Nghĩa 𝐵𝑑+ (𝐹𝐷𝜎 ) = {𝑋 ∈ ℱ𝐷𝜎 | ∀𝑌, 𝑋 ⊂ 𝑌 ⇒ 𝑌 ∉ ℱ𝐷𝜎 }, 𝐵𝑑− (𝐹𝐷𝜎 ) = {𝑋 ∉ ℱ𝐷𝜎 | ∀𝑌, 𝑌 ⊂ 𝑋 ⇒ 𝑌 ∈ ℱ𝐷𝜎 } (1) Ví dụ với sở liệu giao tác ví dụ Bảng độ hỗ trợ 𝜎 = 3, biên dương biên âm 𝐵𝑑+ (𝐹𝐷𝜎 ) = {{𝐵, 𝐶, 𝐹}, {𝐵, 𝐶, 𝐷}, {𝐴, 𝐵, 𝐶}} 𝐵𝑑 − (𝐹𝐷𝜎 ) = {{𝐸}, {𝐴, 𝐷}, {𝐴, 𝐹}, {𝐷, 𝐹}} 2.2.2 Siêu đồ thị đường ngang tối tiểu Định nghĩa (Siêu đồ thị) Một siêu đồ thị 𝐻 = (𝑉, 𝐸) tập hữu hạn siêu cạnh 𝐸 = {𝐸1 , 𝐸2 , … , 𝐸𝑚 }, siêu cạnh tập hữu hạn đỉnh 𝑉 = {𝑣1 , 𝑣2 , … , 𝑣𝑛 } cho 𝐸𝑖 ≠ ∅, 𝑖 = 𝑚 ⋃𝑚 𝑖=1 𝐸𝑖 = 𝑉 Định nghĩa (Phần bù) Phần bù siêu đồ thị H ký hiệu 𝐻 𝑐 = (𝑉, 𝐸 𝑐 ) 𝐸 = {𝑉\𝑒 | 𝑒 ∈ 𝐸} 𝑐 Định nghĩa (Siêu đồ thị đơn) Siêu đồ thị H gọi siêu đồ thị đơn với cặp 𝐸𝑖 , 𝐸𝑗 ∈ 𝐸, 𝐸𝑗 ⊆ 𝐸𝑖 ⇒ 𝑗 = 𝑖 Định nghĩa (Đường ngang siêu đồ thị) Đường ngang (transversal) siêu đồ thị tập 𝑇 ⊆ 𝑉 cho 𝑇 ∩ 𝐸𝑖 ≠ ∅ ∀𝐸𝑖 ∈ 𝐸 Điều có nghĩa đường ngang cắt ngang siêu cạnh siêu đồ thị Định nghĩa (Đường ngang tối tiểu) Một đường ngang siêu đồ thị gọi tối tiểu khơng có tập đường ngang siêu đồ thị Định nghĩa (Siêu đồ thị ngang) Tập hợp tất đường ngang tối tiểu siêu đồ thị H gọi siêu đồ thị ngang (transversal hypergraph) H, ký hiệu Tr(H) 2.2.3 Áp dụng siêu đồ thị ngang Gọi R hàm chuyển tập hợp tập hạng mục thành siêu đồ thị, tập hạng mục tương ứng với siêu cạnh tập hạng mục tương ứng với tập đỉnh Đặt 𝐻 + = 𝑅{𝐵𝑑+ (𝐹)} 𝐻 − = 𝑅{𝐵𝑑− (𝐹)} (2) Với 𝐻 + 𝐻 − siêu đồ thị tương ứng với biên dương biên âm tập liệu ban đầu Theo Stavropoulos cs, biên âm sở giao tác thu cách lấy Siêu đồ thị ngang phần bù biên dương sở liệu [14] Điều có nghĩa 𝐻 − = 𝑇𝑟[(𝐻 + )𝑐 ] (3) Áp dụng tính chất 𝑇𝑟[𝑇𝑟(𝐻)] = 𝐻 (𝐻 𝑐 )𝑐 = 𝐻, thu hệ thức tương ứng cho biên dương 𝑐 𝐻 + = (𝑇𝑟(𝐻 − )) 156 (4) Ẩn tập phổ biến dựa phương pháp quy hoạch tuyến tính nguyên kết hợp … Bằng cách biểu diễn tập hạng mục sở liệu giao tác dạng siêu cạnh siêu đồ thị, có biên âm biên dương có thơng tin biên cịn lại sử dụng số tính chất đặc biệt siêu đồ thị 2.2.4 Tính biên lý tưởng Định nghĩa 10 (Toán tử Min) Toán tử Min tập S, ký hiệu Min(S), toán tử giữ lại tập tối tiểu S, loại bỏ tập không tối tiểu Một tập gọi tối tiểu S khơng có tập tồn S Thuật tốn Thuật tốn để tính tốn biên dương lý tưởng sở liệu hiệu chỉnh Input: Tập nhạy cảm S, Biên âm 𝐵𝑑 − (𝐹) Đặt 𝐻 − = 𝑅(𝐵𝑑 − (𝐹)) 𝐻𝑆 = 𝑅(𝑆); ̂− = 𝑀𝑖𝑛(𝐻 − ∪ 𝐻𝑆 ); Tính siêu đồ thị ngang 𝐻 ̂− ) để tính 𝑇𝑟(𝐻 ̂ − ); Gọi 𝑇𝐻𝐺(𝐻 𝑐 ̂ − )) ̂ + = (𝑇𝑟(𝐻 Tính 𝐻 ̂+ ) Đặt 𝐵𝑑 + (𝐹) = 𝑅 −1 (𝐻 Output: 𝐵𝑑+ (𝐹) Ví dụ với sở liệu mẫu Bảng Giả sử tập nhạy cảm chọn 𝑆 = {{𝐴, 𝐵, 𝐶}, {𝐶, 𝐷}, {𝐵, 𝐶, 𝐹}} Biên âm lý tưởng xác định sau ̂− = 𝑀𝑖𝑛(𝐻 − ∪ 𝐻𝑆 ) = {{𝐸}, {𝐴, 𝐷}, {𝐴, 𝐹}, {𝐷, 𝐹}, {𝐴, 𝐵, 𝐶}, {𝐶, 𝐷}, {𝐵, 𝐶, 𝐹}} 𝐻 Dễ dàng thu siêu đồ thị ngang ̂ − ) = {{𝐴, 𝐶, 𝐷, 𝐸}, {𝐴, 𝐶, 𝐸, 𝐹}, {𝐶, 𝐷, 𝐸, 𝐹}, {𝐴, 𝐷, 𝐸, 𝐹}, {𝐴, 𝐵, 𝐷, 𝐸}, {𝐵, 𝐷, 𝐸, 𝐹}} 𝑇𝑟(𝐻 Do đó, biên dương lý tưởng 𝑐 ̂ + = (𝑇𝑟(𝐻 ̂ − )) = {{𝐵, 𝐹}, {𝐵, 𝐷}, {𝐴, 𝐵}, {𝐵, 𝐶}, {𝐶, 𝐹}, {𝐴, 𝐶}} 𝐻 2.2.5 Công thức ILP đề xuất để xác định giao tác cần hiệu chỉnh ∑ 𝑥𝑖 + 𝑠 𝑡 ∀𝑖:𝑇𝑖 ∈𝐷 ∑ ∀𝑗:𝑋𝑗 ∈𝐵𝑑 + (𝐹̂ ) 𝑠𝑗 , (5) ∑ 𝑎𝑖𝑗 𝑥𝑖 ≥ 𝑠𝑢𝑝𝐷 (𝑋𝑗 ) − 𝜎 + 1, ∀𝑋𝑗 ∈ 𝑀𝑖𝑛(𝑆), ∀𝑖:𝑇𝑖 ∈𝐷 ∑ 𝑎𝑖𝑗 𝑥𝑖 − 𝑠𝑗 𝑠𝑢𝑝𝐷 (𝑋𝑗 ) ≤ 𝑠𝑢𝑝𝐷 (𝑋𝑗 ) − 𝜎, ∀𝑋𝑗 ∈ 𝐵𝑑+ (𝐹̂ ), ∀𝑖:𝑇𝑖 ∈𝐷 𝑥𝑖 ∈ {0,1}, ∀𝑖: 𝑇𝑖 ∈ 𝐷 𝑠𝑗 ∈ {0,1}, , ∀𝑗: 𝑋𝑗 ∈ 𝐵𝑑+ (𝐹̂ ) (6) (7) (8) (9) Trong đó, biến 𝑥𝑖 tương ứng với giao tác sở liệu ban đầu Nếu nghiệm cho 𝑥𝑖 = 1, có nghĩa giao tác thứ i cần hiệu chỉnh Các biến 𝑠𝑗 tương ứng với tập 𝑋𝑗 biên dương lý tưởng Đây biến hỗ trợ nới lỏng ràng buộc Số hạng 𝑎𝑖𝑗 = giao tác thứ i có hỗ trợ cho tập 𝑋𝑗 , ngược lại 𝑎𝑖𝑗 = 157 Nguyễn Thị Thu Tâm, Đinh Nguyễn Trọng Nghĩa Trong công thức trên, hàm mục tiêu (5) gồm phần: phần thứ đòi hỏi số lượng giao tác cần hiệu chỉnh phải nhỏ nhất, phần thứ hai đặt số biến nới lỏng 𝑠𝑗 để đảm bảo cơng thức ILP có nghiệm Các ràng buộc (6) cần phải hiệu chỉnh 𝑛𝑗 = 𝑠𝑢𝑝𝐷 (𝑋𝑗 ) − 𝜎 + giao tác giao tác hỗ trợ cho tập phổ biến nhạy cảm 𝑋𝑗 để tất tập nhạy cảm S ẩn Các ràng buộc (7) tập hạng mục 𝐵𝑑+ (𝐹̂ ) nên giữ lại Tuy nhiên, điều làm cho cơng thức ILP trở nên vô nghiệm, cách cho 𝑠𝑗 = 1, số hạng 𝑠𝑗 𝑠𝑢𝑝𝐷 (𝑋𝑗 ) vơ hiệu hóa ràng buộc để cơng thức có nghiệm chấp nhận việc phát sinh hiệu ứng phụ Các ràng buộc (8) (9) đảm bảo biến toán nhận giá trị theo định nghĩa Nghiệm công thức ILP 𝑥𝑖 tương ứng với giao tác cần hiệu chỉnh để ẩn tập nhạy cảm Ví dụ với sở liệu mẫu Bảng Công thức ILP thu 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + 𝑥5 + 𝑥6 + (𝑠1 + 𝑠2 + 𝑠3 + 𝑠4 + 𝑠5 + 𝑠6 ), 𝑠 𝑡 𝑥3 + 𝑥4 + 𝑥5 ≥ 𝑥2 + 𝑥3 + 𝑥5 + 𝑥6 ≥ 𝑥2 + 𝑥3 + 𝑥4 ≥ 𝑥2 + 𝑥3 + 𝑥4 − 3𝑠1 ≤ 𝑥1 + 𝑥2 + 𝑥3 + 𝑥5 + 𝑥6 − 5𝑠2 ≤ 𝑥3 + 𝑥4 + 𝑥5 − 3𝑠3 ≤ 𝑥2 + 𝑥3 + 𝑥4 + 𝑥5 + 𝑥6 − 5𝑠4 ≤ 𝑥2 + 𝑥3 + 𝑥4 − 3𝑠5 ≤ 𝑥3 + 𝑥4 + 𝑥5 − 3𝑠6 ≤ 𝑥𝑖 ∈ {0,1}, ∀𝑖: .6; 𝑠𝑗 ∈ {0,1}, ∀𝑗: .6 Nghiệm thu từ công thức ILP (𝑥1 , … , 𝑥6 , 𝑠1 , … , 𝑠6 ) = (0, 0, 1, 0, 0, 1, 1, 0, 1, 0, 1, 1) Điều cho thấy cần thực hiệu chỉnh giao tác số để ẩn hoàn toàn tập nhạy cảm Thực hiệu chỉnh sở liệu giao tác D thu sở liệu hiệu chỉnh 𝐷 ′ = {{𝐵, 𝐷}, {𝐵, 𝐶, 𝐷, 𝐸, 𝐹}, {𝐴, 𝐵, 𝐷, 𝐹}, {𝐴, 𝐵, 𝐶, 𝐸, 𝐹}, {𝐴, 𝐵, 𝐶, 𝐷}, {𝐵, 𝐷}} Biên dương tương ứng với sở liệu 𝐵𝑑 + = {{𝐵, 𝐹}, {𝐵, 𝐷}, {𝐴, 𝐵}, {𝐵, 𝐶}} So sánh với biên dương lý tưởng độ mát liệu 33% KẾT QUẢ THỰC NGHIỆM Các thực nghiệm tiến hành tảng, code ngôn ngữ lập trình python, thực máy tính PC với CPU AMD Ryzen5 2600 Six-Core Processor 3.40 GHz RAM 16GB chạy hệ điều hành Windows 10 (64-bit) Kết phương pháp so sánh với công thức ILP túy không sử dụng đến thông tin biên dương đề xuất Menon [9] Phần bên gọi công thức Menon ILP1 cơng thức cải tiến ILP4 Như trình bày mục 1, công thức ILP Menon [9] cơng thức cơng thức có kết ổn định nhóm phương pháp xác Các cố gắng cải tiến cơng thức Menon chưa cho kết tốt việc ẩn tập phổ biến chưa ổn định (có nhiều trường hợp cơng thức khơng có lời giải) Ngồi ra, việc so sánh phương pháp thuộc nhóm phương pháp xác với phương pháp thuộc nhóm heuristic hay phương pháp tiến hóa khơng có ý nghĩa Thời gian tính tốn phương pháp xác ln cao với độ xác việc ẩn tập phổ biến ln tốt nhóm cịn lại Do đó, báo 158 Ẩn tập phổ biến dựa phương pháp quy hoạch tuyến tính nguyên kết hợp … chọn so sánh với phương pháp đề xuất Menon [9] cải tiến Kagklis [7] với toán tử Min(S) dù kết công bố lâu 3.1 Các độ đo đánh giá hiệu phương pháp ẩn tập phổ biến - Độ mát thông tin dựa biên dương: Đây độ đo để đánh giá hiệu phương pháp ẩn tập phổ biến theo hướng tiếp cận xác Trong hướng tiếp cận hệ ràng buộc thỏa mãn có nghiệm chắn phương pháp ẩn tất tập phổ biến nhạy cảm Chính vậy, hiệu phương pháp đánh giá hiệu ứng phụ Độ mát thông tin dựa biên dương xác định tỷ lệ số lượng tập phổ biến biên dương lý tưởng bị trình hiệu chỉnh liệu số lượng tập phổ biến biên dương lý tưởng ban đầu 𝐼𝐿𝐵𝑑 (𝐵𝑑 (𝐹̂ ), 𝐵𝑑+ (𝐹′)) = + |𝑋 ∈ 𝐵𝑑+ (𝐹̂ ) ∶ 𝑋 ∉ 𝐵𝑑+ (𝐹′)| |𝐵𝑑+ (𝐹̂ )| (10) Tỷ số nhỏ, độ mát thông tin biên dương lý tưởng ít, phương pháp hiệu - Độ mát thông tin dựa tập phổ biến: tỷ số tổng độ lệch tuyệt đối hỗ trợ tập phổ biến lý tưởng sở liệu ban đầu sỡ liệu hiệu chỉnh 𝐼𝐿(𝐷, 𝐷 ′ ) = ∑𝑋∈𝐹̂ |𝑠𝑢𝑝𝐷 (𝑋) − 𝑠𝑢𝑝𝐷′ (𝑋 ′ )| ∑𝑋∈𝐹̂ 𝑠𝑢𝑝𝐷 (𝑋) (11) Tỷ số nhỏ, độ mát thông tin tập phổ biến lý tưởng ít, phương pháp hiệu - Hiệu ứng phụ: xác định khác biệt số lượng tập phổ biến sở liệu lý tưởng số lượng tập phổ biến sở liệu hiệu chỉnh 𝑆𝐸(𝐹̂ , 𝐹) = |𝐹̂ | − |𝐹| |𝐹̂ | (11) Tỷ số nhỏ cho thấy tập hiệu chỉnh gần với tập lý tưởng, phương pháp hiệu 3.2 Mô tả tập liệu sử dụng thực nghiệm Bảng Đặc tính tập liệu Tập liệu Số giao tác Số hạng mục Chiều dài trung bình Ngưỡng hỗ trợ chess 3196 75 37 2557 mushroom 8124 119 23 1625 BMS1 59601 497 2.5 51 BMS2 77512 3340 5.6 39 Tập liệu Chess sinh mô tả Alen Shapiro công bố công khai thông qua UCI (Machine Learning Repository) [12] Định dạng cho thể tập liệu chuỗi gồm 37 giá trị thuộc tính Tập liệu Mushroom [12] rút từ “Hướng dẫn lĩnh vực xã hội Aududon” loại nấm Bắc Mỹ tác giả G H Lincoff, NewYork: Alfred A Knopf, công bố công khai thông qua UCI (Machine Learning Repository) [12] Đây tập liệu mẫu giả định mơ tả 23 lồi “nấm tia” họ Agricus Lepiota 159 Nguyễn Thị Thu Tâm, Đinh Nguyễn Trọng Nghĩa Hai tập Bms-1 Bms-2 hai tập liệu sử dụng cho KDD Cup 2000 [13] chứa dòng liệu click mua từ trang web nhà bán lẻ legwear legcare 3.3 Đánh giá thực nghiệm * So sánh độ mát thông tin dựa biên dương Bảng So sánh độ mát thông tin dựa biên dương Độ hỗ trợ Tập liệu chess 2557 mushroom 1625 bms1 51 39 Độ mát thông tin (%) bms2 Số tập nhạy cảm (tỷ lệ so với tập phổ biến) Độ mát thông tin dựa biên dương (%) ILP1 ILP4 10 (0,12%) 93 92 20 (0,25%) 100 97 50 (0,6%) 98 98 10 (0,02%) 74 66 20 (0,04%) 87 85 50 (0,1%) 91 88 10 (0,17%) 19 20 (0,34%) 38 13 50 (0,85%) 61 29 10 (0,01%) 20 (0,02%) 17 13 50 (0,05%) 19 12 100 90 80 70 60 50 40 30 20 10 ILP1 ILP4 chess mushroom bsm1 bsm2 Tập liệu Hình Biểu đồ thể giá trị trung bình độ mát thơng tin dựa biên dương số tập liệu Hình Bảng cho ta thấy hầu hết trường hợp, công thức ILP4 cho kết tốt công thức ILP1 ngoại trừ tập liệu chess với số lượng tập phổ biến nhạy cảm lớn chênh lệch khơng đáng kể 160 Ẩn tập phổ biến dựa phương pháp quy hoạch tuyến tính nguyên kết hợp … * So sánh độ mát thông tin dựa tập phổ biến Bảng So sánh độ mát thông tin dựa biên dương Tập liệu chess mushroom bms1 bms2 Độ hỗ trợ Số tập nhạy cảm (tỷ lệ so với tập phổ biến) 2557 1625 51 39 Độ mát thông tin dựa tập phổ biến (%) ILP1 ILP4 10 (0,12%) 5,8 4,3 20 (0,25%) 9,7 7,5 50 (0,6%) 15,9 8,9 10 (0,02%) 9,6 6,2 20 (0,04%) 10,2 7,3 50 (0,1%) 19,7 12,7 10 (0,17%) 3,4 1,0 20 (0,34%) 11,8 2,4 50 (0,85%) 25,3 6,7 10 (0,01%) 12,3 12,1 20 (0,02%) 16,2 15,7 50 (0,05%) 34,6 17,0 Độ mát thông tin (%) 25 20 15 ILP1 10 ILP4 chess mushroom bsm1 bsm2 Tập liệu Hình Biểu đồ thể giá trị trung bình độ mát thông tin dựa tập phổ biến số tập liệu Bảng Hình cho thấy độ đo độ mát thông tin dựa tập phổ biến, công thức ILP4 cho kết tốt hẳn công thức ILP1 Giữa hai cơng thức có độ chênh lệnh lớn 161 Nguyễn Thị Thu Tâm, Đinh Nguyễn Trọng Nghĩa * So sánh hiệu ứng phụ Bảng So sánh hiệu ứng phụ Độ hỗ trợ Tập liệu 2557 chess 1625 mushroom 51 bms1 39 bms2 Hiệu ứng phụ (%) Số tập nhạy cảm (tỷ lệ so với tập phổ biến) ILP1 ILP4 10 (0,12%) 61,6 52,1 20 (0,25%) 83,9 78,2 50 (0,6%) 95,4 86,6 10 (0,02%) 68,7 62,1 20 (0,04%) 69,2 62,5 50 (0,1%) 85,4 77,0 10 (0,17%) 14,4 2,7 20 (0,34%) 33,0 9,5 50 (0,85%) 52,6 21,7 10 (0,01%) 33,6 33,5 20 (0,02%) 39,1 37,9 50 (0,05%) 50,1 41,3 90 Hiệu ứng phụ (%) 80 70 60 50 ILP1 40 ILP4 30 20 10 chess mushroom bsm1 bsm2 Tập liệu Hình Biểu đồ thể giá trị trung bình hiệu ứng phụ số tập liệu Bảng Hình cho thấy với độ đo hiệu ứng phụ, ILP4 tỏ nhỉnh so với ILP1 đặc biệt với tập bms1 Tuy nhiên với bms2 hiệu ứng phụ hai cơng thức có chênh lệch khơng đáng kể Các thực nghiệm cho thấy cải tiến rõ rệt kỹ thuật sử dụng phương trình ràng buộc vào toán ẩn tập phổ biến So với phương pháp ILP truyến thống, phương pháp đề xuất công trình đưa thêm thơng tin biên dương lý tưởng vào hệ phương trình ràng buộc Việc thơng tin biên dương xuất yêu cầu nghiệm hệ ILP phải giữ lại tập biên dương lý tưởng ẩn tập phổ biến Điều dẫn đến hiệu ứng phụ phương pháp giảm rõ rệt Ngồi ra, cơng thức ILP4 cịn đưa vào hệ số để nới lỏng ràng buộc cần Một số cơng trình cố gắng đưa vào q nhiều ràng buộc gây ảnh hưởng đến tính ổn định tốn Cơng thức ILP4 có hệ số giúp nới lỏng ràng buộc nên có 162 Ẩn tập phổ biến dựa phương pháp quy hoạch tuyến tính nguyên kết hợp … nghiệm trường hợp Trường hợp xấu tất phương trình ràng buộc liên quan đến biên dương lý tưởng bị nới lỏng, công thức ILP4 quay công thức ILP1 Menon [9] với cải tiến Min(S) Kagklis [7] KẾT LUẬN Cơng trình cải tiến công thức ẩn tập phổ biến nhạy cảm sở liệu giao tác Bài toán ẩn tập phổ biến nhạy cảm mơ hình hóa công thức ILP1 Menon chưa xét đến ràng buộc liên quan đến biên dương lý tưởng Cơng thức ILP cải tiến cơng trình ngồi việc thêm vào ràng buộc cho biên dương thêm vào biến để nới lỏng ràng buộc trường hợp tốn vơ nghiệm Thực nghiệm cho thấy công thức ILP cải tiến nới lỏng ràng buộc cho kết khả quan công thức ILP ban đầu thông qua tính tốn độ đo độ mát thông tin hiệu ứng phụ Phương pháp có hạn chế thời gian tính tốn lâu việc phình khơng gian nghiệm sử dụng cho biến nới lỏng Do đó, hướng phát triển thời gian tới phương pháp tìm cách biểu diễn phương trình ràng buộc tốt giúp rút gọn thời gian tính tốn Lời cảm ơn: Nghiên cứu trường Đại học Công nghiệp Thực phẩm TP.Hồ Chí Minh bảo trợ cấp kinh phí theo Hợp đồng số 05/HĐ-DCT ký ngày 5/01/2021 TÀI LIỆU THAM KHẢO Inda K., Amra K., Lejla T - Data mining privacy preserving: Research agenda, WIREs Data Mining Knowl Discov 11 (2021) e1392 Atallah M., Bertino E., Elmagarmid A., Ibrahim M., Verykios V - Disclosure limitation of sensitive rules, Proceedings of the knowledge and data engineering exchange 99 (1999) 45-52 Moustakides G., Verykios V - A maxmin approach for hiding frequent itemsets, Data Knowl Eng 65 (1) (2008) 75-89 Sun X., Yu P - A border–based approach for hiding sensitive frequent itemsets, Proceedings of 5th IEEE internationa conference on data mining (2005) 426-433 Sun X., Yu P - Hiding sensitive frequent itemsets by a border-based approach, J Comput Sci Eng (1) (2007) 74-94 Usman A., Jerry C., Wei L., Gautam S., and Youcef D - A Deep Q-Learning Sanitization Approach for Privacy Preserving Data Mining, Proceedings of the 2021 International Conference on Distributed Computing and Networking 21 (2021) 43-48 Kagklis V., Verykios V., Tzimas G., Tsakalidis A - An integer linear programming scheme to sanitize sensitive frequent itemsets, Proceedings of 2014 IEEE international Conference on Tools with AI 14 (2014) 771-775 Gkoulalas-Divanis A., Verykios V - Hiding sensitive knowledge without side effects, Knowl Info Syst 20 (3) (2009) 263-299 Menon S., Sarkar S., Mukherjee S - Maximizing accuracy of shared databases when concealing sensitive patterns, Info Syst Res 16 (3) (2005) 256-270 10 Bayardo R - Efficiently mining long patterns from databases, Proceedings of the 1998 ACM SIGMOD international conference on management of data (1998) 85-93 163 Nguyễn Thị Thu Tâm, Đinh Nguyễn Trọng Nghĩa 11 Jimmy M., Tai W., Gautam S., Unil Y., Shahab T., Jerry C., Wei L - An evolutionary computation-based privacy-preserving data mining model under a multithreshold constraint, Trans Emerging Tel Tech 32 (2021) e4209 12 Dua D., Graff C – UCI Machine Learning Repository, University of California, School of Information and Computer Science (2019) http://archive.ics.uci.edu/ml 13 Kohavi R., Brodley C., Frasca B., Mason L., Zheng Z - KDD-Cup 2000 organizers’ report: peeling the onion, SIGKDD explorations (2000) http://www.ecn.purdue.edu/KDDCUP 14 Stavropoulos C., Vassilios S., Kagklis V - A transversal hypergraph approach for the frequent itemset hiding problem, Knowledge and Information Systems 47 (2016) 625- 645 ABSTRACT HIDING FREQUENT ITEMSETS BASED ON INTEGER LINEAR PROGRAMMING METHOD COMBINED WITH IDEAL POSITIVE BORDER Nguyen Thi Thu Tam, Dinh Nguyen Trong Nghia* Ho Chi Minh City University of Food Industry *Email: nghiadnt@hufi.edu.vn This study proposes a method to hide sensitive frequent itemsets in transaction databases This proposed method is based on using information from the ideal positive border to build integer linear programming equations The solution of this equation determines the transactions that need to be sanitized to completely hide the sensitive frequent itemsets In case the equation has no solution, some coefficients are added to loosen the constraints of the problem Experimental evaluation of this method on some well-known data sets shows that this method has higher accuracy than the method using traditional integer linear programming Keywords: Privacy-preserving aata mining, hiding frequent itemsets, integer linear programming, ideal positive border 164