1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tạp chí Khoa học và Công nghệ Việt Nam - Số 8B năm 2018

68 9 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 68
Dung lượng 19,67 MB

Nội dung

Tạp chí Khoa học và Công nghệ Việt Nam số 8B năm 2018 với các bài viết: gom nhóm văn bản dựa trên mẫu hữu ích được đánh trọng phổ biến; nghiên cứu cấu trúc của màng điện cực polymer sử dụng cho pin nhiên liệu bằng phương pháp tán xạ tia X góc nhỏ và siêu nhỏ; điều chế chất xúc tác hệ Fenton dị thể La/Fe-Bentonite ứng dụng xử lý đỏ congo trong nước...

Khoa học Tự nhiên Gom nhóm văn dựa mẫu hữu ích đánh trọng phổ biến Trần Thanh Trâm1, Võ Đình Bảy2* Trường Đại học Cơng nghệ thơng tin, Đại học Quốc gia TP Hồ Chí Minh Khoa Công nghệ thông tin, Trường Đại học Công nghệ TP Hồ Chí Minh Ngày nhận 26/3/2018; ngày chuyển phản biện 30/3/2018; ngày nhận phản biện 22/4/2018; ngày chấp nhận đăng 27/4/2018 Tóm tắt: Gom nhóm văn chủ đề quan trọng khai thác liệu văn bản, phương pháp hiệu để gom nhóm văn dựa mẫu phổ biến Đã có nhiều thuật tốn phát triển nhằm nâng cao độ xác cho tốn gom nhóm văn dựa mẫu phổ biến, lại không quan tâm tới trọng số từ văn Trong báo này, tác giả đề xuất phương pháp để gom nhóm văn dựa vào mẫu hữu ích đánh trọng phổ biến thông qua việc sử dụng TF (Term Frequency) cho từ văn Trọng số từ toàn tập văn tính dựa vào IDF (Inverse Document Frequency), sau sử dụng thuật toán MWIT-FWUI để khai thác mẫu hữu ích phổ biến Tiếp theo, tiến hành gom nhóm văn thuật toán MC (Maximum Capturing) Kết thử nghiệm kho ngữ liệu gồm 1.600 văn (16 chủ đề) cho thấy, phương pháp cải thiện đáng kể độ xác việc gom nhóm văn so với phương pháp dựa vào mẫu phổ biến Từ khóa: sở liệu số lượng, gom nhóm văn bản, mẫu hữu ích đánh trọng phổ biến, mẫu phổ biến, trọng số từ Chỉ số phân loại: 1.2 Đặt vấn đề Hiện nay, công trình nghiên cứu tốn gom nhóm văn tiếng Việt cịn ít, hầu hết sử dụng phương pháp truyền thống phương pháp gom nhóm đồ thị [1], gom nhóm dựa thực thể có tên [2]… Năm 2002, Beil cộng giới thiệu hướng tiếp cận cho tốn gom nhóm văn bản, gom nhóm văn dựa vào mẫu phổ biến [3] Kết thực nghiệm cho thấy, gom nhóm văn dựa vào mẫu phổ biến có độ xác cao hơn, thời gian xử lý tốt so với gom nhóm văn dựa vào bisecting k-means [4] Cơng trình mở hướng tiếp cận hồn tồn cho tốn gom nhóm văn tiền đề cho nhiều cơng trình nghiên cứu sau Một số thuật toán gần giải vấn đề gom nhóm văn dựa mẫu phổ biến phương pháp CMS [5], phương pháp FIHC [6], phương pháp CFWS [7] Tuy nhiên, phương pháp lại không quan tâm tới trọng số từ văn bản, quan tâm tới tần số xuất item mẫu phổ biến Trong [8], tác giả số hạn chế thuật toán sau: 1) Có thể dẫn tới việc trùng lặp văn kết * gom nhóm cuối cùng; 2) Có khuynh hướng chọn nhóm ứng viên có số văn ít, độ phổ biến văn lớn để gom thành nhóm, dẫn tới kết số lớn nhóm gom có văn bản; 3) Khơng thể giải mâu thuẫn nhóm định văn vào nhóm, văn chia thành nhiều nhóm khác nhau… Khai thác mẫu phổ biến khơng quan tâm đến trọng số mục, áp dụng thuật toán khai thác mẫu phổ biến để gom nhóm văn bản, tác giả quan tâm đến xuất hay không xuất từ văn Thực tế, từ văn có số lần xuất khác nhau, nên có đóng góp khác Trong báo này, chúng tơi đề xuất phương pháp gom nhóm văn dựa trọng số (chẳng hạn TF-IDF, tần số xuất hiện…) từ thuật toán MC với mục tiêu cải thiện độ xác kết gom nhóm Phương pháp nghiên cứu Cơ sở liệu (CSDL) số lượng: cho CSDL D với tập giao dịch T = {t1, t2, tm}, tập mặt hàng I = {i1, i2,… in} tập trọng số W = {w1, w2,…, wn} tương ứng với mặt hàng I Với giao dịch Tác giả liên hệ: Email: bayvodinh@gmail.com 60(8) 8.2018 Phương pháp nghiên cứu Cơ sở liệu (CSDL) số lượng: Cho CSDL D với tập giao dịch T = {t1, t2, tm}, tập mặt hàng I = {i1, i2,… in} tập trọng số W = {w1, w2,…, wn} tương ứng với mặt hàng I Với giao dịch tk = {xk1, xk2,… xkn} mà xki số lượng sản phẩm mua mặt hàng thứ i giao dịch tk Trọng số từ (TF-IDF): TF-IDF (term frequency - inverse document frequency) từ thể mức độ quan trọng từ văn nằm tập hợp văn Nó dựa vào tần số xuất từ văn (TF) tần số nghịch từ tập văn (IDF) TFtần(term frequency) số1xuất hiệnGiá củatrị1 TF từ TF (term frequency) số xuất 1là từtần văn một1 từ t văn d đượcvăn tínhbản theo công thức (1) Giá trị TF từ t văn d tính Khoa học Tự nhiên Text clustering using frequent weighted utility itemsets Thanh Tram Tran , Dinh Bay Vo theo công thức (1) �� (�, �) = 2* �(�, �) �(�) (1) (1) đó,hiện n(t,từd)t số văn lần xuấtd;hiện t vănhiện bản d; Trong đó, n(t, d) sốTrong lần xuất n(d) từ số lần xuất University of Information Technology, Vietnam National University n(d) tất từ văn d số lần xuất tất từ văn d Ho Chi Minh City Faculty of Information Technology, Ho Chi Minh CityIDF University (inverseof document frequency) tần số nghịch từ tập văn IDF (inverse document frequency) tần số nghịch (corpus) Trong tập văn bản, từ có giá trị IDF tính theo công thức Technology từ tập văn (corpus) Trong tập văn bản, (2): Received 26 March 2018; accepted 27 April 2018 từ có giá trị IDF duy tính theo cơng thức (2): Abstract: ��� (�, �) = ��� |�| |{� Ỵ �|� Ỵ � }| (2) (2) Ma trận trọng số Text clustering is one of the important topics of the |D|trong tập tổng số văn bảnlà tậpd có D,xuất tổng sốđó, văn D, |{� Ỵ �|� Ỵ � }| số văn text mining One of the most effective methods forTrong text đó, |D| làTrong từ t tập D Nếu từ khơng xuất văn tập D |{d ∈ D|t ∈ d }| số văn d có xuất từ t clustering is the frequent itemsets based approach mẫu số 0, dẫn tới phép chia khơng hợp lệ, người ta thường thay cơng tập D Nếu từ khơng xuất văn There are many frequent itemsets based algorithms thức + |{� Ỵ �|� Ỵ �}| Cơ số logarit công thức không thay đổi giá trị từ to improve the accuracy of text clustering mà However, D Việc mẫuthay số đổi dẫn ảnh tới hưởng phép đến chiatỷ lệ thu hẹp khoảng giá trị tập từ số sẽ0,không these algorithms not focus on the weight of terms intrị IDF giá Tuyhợp nhiên, thay người đổi khoảng giá trị sẽthay giúpbằng tỷ lệ TF khơng lệ,việc ta thường cơngIDF thức tương thức sau:trong công thức không documents In fact, the frequency of each term in đồng eachđể dùng 1+ cho |{d cơng ∈ D|t ∈ tính d} TF-IDF Cơ số logarit document has a great impact on results In this paper, thay đổi giá trị từmà TF-IDF(t,d,D) = tf(t,1 d) idf (t, D)thu hẹp khoảng giá trị từ (3) we propose a new method for text clustering based on Việc thay đổi số không ảnh hưởng đến tỷ lệ Trong từ có giá trị TF-IDF cao từ xuất nhiều văn frequent weighted utility itemsets First, we calculate TF đó, giácáctrịvăn IDF khoảng lại xuất hiệncác Tuy khác.nhiên, Việc nàyviệc giúpthay lọc rađổi từ phổ giá biến trị giữ (Term Frequency) for each term in documents to create |�| từ cóagiá trị cao (từ của�) văn giúp tỷ khoá lệ��� (�, IDF = bản) ���và TF tương đồng để dùng cho cơng (2) |{� Ỵ �|� Ỵ � }| number matrix for the documents The weights of terms Nội dung nghiênthức cứu tính TF-IDF sau: in the documents is based on the IDF (Inverse Document Mơ hình Trong đó, |D| tổng số văn tập D, |{� Ỵ �|� Ỵ � }| số văn d có xuất từ t tập D Nếu từ khơng bất văn tập(3) D TF-IDF(t,d,D) = nhóm tf(t,xuất d) × idf (t,cứD) Frequency) Next, we use MWIT-FWUI algorithmMơfor hìnhsốgiải gom văn thể sơ đồ mẫu 0, dẫn tốn tới phép chia khơng hợpbản lệ, tiếng Việt ngườiđược ta thường thay cơng mining frequent weighted utility itemsets fromhình a number thức + |{� Ỵ �|� Ỵ �}| số logarit cơngtrị thức khôngcao thay đổinhững giá trị củatừ từ Trong đó, Cơ từ có giá TF-IDF matrix and the weight of terms in the documents Finally, mà thu hẹp khoảng giá trị từ Việc thay đổi số không ảnh hưởng đến tỷ lệ Tập văn xuất nhiều Tập văn đượcvăn xử lý xuất Tập từ văn Tuy nhiên, giá Xử trịlýIDF việc thay đổi khoảng trị giúphiện tỷ lệ IDFsố TF Loại bỏgiá hư từ Đánh trọng based on frequent utility itemsets, we cluster text using tương đồng đểbản dùngkhác cho cơng thứcnày tính TF-IDF nhưra sau: văn Việc giúp lọc từ phổ biến giữ (Stopword) MC (Maximum Capturing) algorithm We have tested từ có giá trị caod)(từ (3) = tf(t,  idfkhố (t, D) văn bản) this method on a corpus consisting of 1,600 documents lại nhữngTF-IDF(t,d,D) including 16 different topics Experimental results Trong đó, từ có giá trị TF-IDF cao từ xuất nhiều văn nghiên cứu ítNội xuấtdung văn khác Việc giúp lọc từ phổ biến giữ lại have shown that our method significantly improves từ có giá trị cao (từ khố văn bản) the accuracy of the text clustering compared with the Mơ hình Tập mẫu hữu ích đánh Nội dung nghiên cứu clustering method using frequent itemsets trọng phổ biến Mơ hình Gom nhóm văn Mơ hình giải tốn gom nhóm Khai văn thác mẫu hữutiếng ích Văn giải toán gom nhóm văn tiếng Việt thể sơ đồ Mơbảnhình đánh trọng phổ biến Keywords: frequent itemsets, frequent weighted utility Việt nhómđược thể sơ đồ hình hình gom itemsets, quantitative databases, text clustering, weight Tập văn Tập văn xửvăn lý Hình Mơ hình giải tốn gom nhóm Loại tiếng Việt Tập từ Đánh trọng số Xử lý văn bỏ hư từ of terms (Stopword) Xử lý văn Tách từ tiếng Việt: Trước thực gom nhóm văn cần tiến hành tách từ tiếng Việt Không tiếng Anh, ranh giới từ tiếng Việt không đơn khoảng trắng, đòi hỏi phải xử lý riêng trước Ví dụ câu “Tổ quốc ta đẹp tranh vẽ” tách thành: Tổ_quốc | ta | đẹp | | tranh_vẽ Tập mẫu hữu ích đánh trọng phổ biến Gom văn Nhận dạng tên riêng tiếng Việt (NER - nhóm Named Entity Recogniton) tk = {xk1, xk2,… xkn} mà xki số lượng sản phẩm Khai thác mẫu hữu ích Văn đánh trọng phổ biến Sau tách từ tiếng Việt, hệ thống tiến hành nhận dạng tên riêng tiếng Việt Ví gom nhóm mua mặt hàng thứ i giao dịch tk dụ câu “Triển lãm diễn từ 22 đến 30/6 Bảo tàng Mỹ thuật” Sau tách từ tiến Hình Mơtiếng gomcác nhóm văn tiếng Việt hành nhận dạng tên riêng Việt, ratoán thành từ: Triển_lãm | diễn_ra từ | 22/NUM hình Mơ giải hình giải tốn gom nhóm văn | tiếng | Trọng số từ (TF-IDF): TF-IDF (term frequency - |Hình đến | 30/6/NUM tạilý| văn Bảo_tàng Mỹ_thuật/PER | Xử Việt Tách từ tiếng thựcdạng hiệntên gomriêng nhómtiếng văn cầnchúng tiến hành táchdụng từ inverse document frequency) từ thể mức Việt, sử Để độ giải tốnViệt: táchTrước từ vàkhi nhận tiếng Việt Khơng tiếng ranh giới từ tiếng Việt không để đơnnhận thuầndạng công cụ VnTokenizer để phân đoạnAnh, từ tiếng Việtgiữa công cụ CLC_VN_NER Xử lý văn quan trọng từ văn nằm tập tên riêng tiếng Việt.khoảng trắng, địi hỏi phải xử lý riêng trước Ví dụ câu “Tổ quốc ta đẹp tranh Ma trận trọng số Classification number: 1.2 vẽ” tách thành: Tổ_quốc | ta | đẹp | | tranh_vẽ từriêng tiếng Việt: trước- Named thực gom nhóm văn NhậnTách dạng tên tiếng Việt (NER Entityhiện Recogniton) táchtiến từ tiếng Việt,tách hệ thống tiến Việt hành nhận dạng tên riêng tiếngAnh, Việt Ví Sau bảnkhicần hành từ tiếng Không tiếng dụ câu “Triển lãm diễn từ 22 đến 30/6 Bảo tàng Mỹ thuật” Sau tách từ tiến ranh giữatiếng cácViệt, từ sẽtrong tiếng Việt không đơn | hành nhận dạnggiới tên riêng thành từ: Triển_lãm | diễn_ra | từ | 22/NUM đến | 30/6/NUM | | Bảo_tàng Mỹ_thuật/PER | Để giải toán tách từ nhận dạng tên riêng tiếng Việt, sử dụng công cụ VnTokenizer để phân đoạn từ tiếng Việt công cụ CLC_VN_NER để nhận dạng tên riêng tiếng Việt hợp văn Nó dựa vào tần số xuất từ văn (TF) tần số nghịch từ tập văn (IDF) 60(8) 8.2018 Khoa học Tự nhiên khoảng trắng, địi hỏi phải xử lý riêng trước Ví dụ câu “Tổ quốc ta đẹp tranh vẽ” tách thành: Tổ_quốc | ta | đẹp | | tranh_vẽ Nhận dạng tên riêng tiếng Việt (NER - Named Entity Recogniton) Sau tách từ tiếng Việt, hệ thống tiến hành nhận dạng tên riêng tiếng Việt Ví dụ câu “Triển lãm diễn từ 22 đến 30/6 Bảo tàng Mỹ thuật” Sau tách từ tiến hành nhận dạng tên riêng tiếng Việt, thành từ: Triển_lãm | diễn_ra | từ | 22/NUM | đến | 30/6/NUM | | Bảo_tàng Mỹ_thuật/PER | Để giải toán tách từ nhận dạng tên riêng tiếng Việt, sử dụng công cụ VnTokenizer để phân đoạn từ tiếng Việt công cụ CLC_VN_NER để nhận dạng tên riêng tiếng Việt Loại bỏ hư từ Sau tách văn thành danh sách từ, hệ thống tiến hành loại bỏ hư từ (stopword) khơng có ý nghĩa đặc trưng (thì, là, nhỉ, vâng, nếu, như…) Để loại bỏ hư từ, sử dụng từ điển hư từ tổng hợp lại (gồm 880 từ) Hình Thuật tốn MWIT-FWUI Thuật tốn tìm mẫu hữu ích đánh trọng phổ biến Loại bỏ hư từ Loại bỏ hư từ Như trình bày trên, cơng trình trước Sau tách văn bảnthành thànhdanh danhsách sáchcác cáctừ, từ,hệhệthống thốngtiến tiếnhành hànhloại loại bỏ cáchư hưtừtừ Sau tách quan văn tâm đến trọng số(thì, là, cácnhỉ, itemvâng, nếu, vừa quan tâmĐể đếnloạibỏbỏcác pword) khơng có ý nghĩa đặc trưng như…) hư từ, word) khơng cótrọng ý nghĩa đặccác trưng (thì, là,trọng nhỉ, số vâng, nếu, như…) Đểcác loại bỏ hư từ, số item, lẫn item tôisửsửdụng dụngtừtừđiển điểncác cáchư hư từđược đượcchúng chúngtôi tôitổng tổnghợp hợplạilại(gồm (gồm880 880từ) từ) gngtôi giao dịch.hữu Đốitừích vớiđược CSDL đượctrọng xây dựng từ văn bản, Thuật tốn tìm mẫu đánh phổ biến Thuật tốn tìm phổtrong biến giao dịch chỉmẫu quanhữu tâm ích đến trọng đánh số củatrọng item Như trình bày trên, cơng trình trước đâyquan quantâm tâmđến đếntrọng trọngsốsốcủa củacác Như đượcVì trình bày trên, cơng trình trước vậy, cóởtrọng thể ápsố dụng thuật tốn MWIT-FWUI (hình 2) mhoặc hoặcvừa vừaquan quantâm tâm đến item, lẫn trọng số item giao đếnthác trọng sốhữu củaích cácđược item,đánh lẫn trọng số item giao để khai mẫu trọng phổ biến Trong h.Đối Đốivới vớiCSDL CSDL xâydựng dựngtừ từcác cácvăn vănbản, bản,chỉ quan tâm đếntrọng trọngsốsốcủa củacác cácitem item xây quan tâm đến phần này, tác giả đề xuất thuật tốn cho phép khai thác cácgiao giaodịch dịch.VìVìvậy, vậy,cócóthể thểápápdụng dụngthuật thuậttốn tốnMWIT-FWUI MWIT-FWUI(hình (hình1)1)đểđểkhai khaithác thác gngcác mẫu hữu íchphổ đánh trọngphần phổ này, biến từ ma trận tần số thuật tốn cho uhữu hữch íchđược đượcđánh đánhtrọng trọng biến Trong tác giả đề xuất phổ biến Trong phần này, tác giả đề xuất thuật toán cho pkhai khaithác thácmẫu mẫuxuất hữuhiện íchđược đánh trọngvăn phổbản biến matrận trậntần tầnsốsốxuất xuấthiện hiệncủa củacác cáctừtừ từ trọng hình hữu ích đánh phổ biến từtừma ng văn hình g văn Định hình nghĩa 1: theo [9] Trọng số hữu ích giao dịch tk, Định nghĩa 1: Theo [9] Trọngsốsốhữu hữu íchcủa củagiao giaodịch dịch t , ký hiệu twu (t ), tính Định nghĩa 1:kýTheo theo cơng thức (4).tk,kký hiệu twu (tk),k tính hiệu [9] twuTrọng (tk), tínhích ocơng cơngthức thức(4) (4) ∑�� ∈ �(��) �� × ���� ∑ �� ∈ �(�� ) �� × ���� (4) ) ���(� = � ���(�� ) = |� | � |�� | Trongđó, đó,�����là làtrọng trọng itemi isố giaoidịch dịch thứ j Trong làitem trọng giao item giao đó, Trong sốsốxcủa thứ t t.k.dịch thứ t ��� kij j j k (4) (4) k Địnhnghĩa nghĩa22[9]: [9]: Độhỗ hỗtrợ trợ2hữu hữu ích (wus weighted utility support)của củamột mộtitemset itemset Định nghĩa [9]:ích độ(wus hỗ trợ hữu ích (wus - support) weighted Định Độ - -weighted utility htheo theocông côngthức thức(5) (5) utility support) itemset tính theo cơng thức (5) ∑�� ∈ �(�) ���(�)� ) ∑ �� ∈ �(�) ���(�� ( ) ��� � = (5) ���(�) = ∑ (5) (5) ���(�(�)� ) ∑�� �� ∈ �∈ ���� � Hình Thuật tốn Gom nhóm văn 60(8) 8.2018 Khoa học Tự nhiên 0,167 0,286 0 0,5 0,286 0,5 � Xét sở liệu tần số xuất từ bảng Item Bảng Cơ sở liệu số lần xuất từ A 0,35 B 0,25 C 0,11 D 0,25 E 0,18 ITEM B C D E IDF TID dụ minh họa 0 sở liệu tần số xuất hiện2 từ 3trên bảng 0,5 0 0,333 0,5 0 0,222 Sử dụng công thức (2) để tính trọng số từ văn Mỗi từ có giá trị IDF tập văn bản, xem trọng số từ tập văn � Ta có: IDF (A, D) =Bảng log 3.; Trọng tươngsốtựcủa thucác kết bảng Item Ví dụ minh họa A h Thuật tốn Gom nhóm văn 0,333 0,429 0,5 0,444 Bảng Trọng số Item Item IDF A 0,35 B 0,25 C 0,11 D 0,25 E 0,18 Tính trọng số hữu ích giao dịch (twu) văn bản: từ bảng bảng 3, tính văn đượcbản: trọng Tính trọng số hữu liệu ích giao dịch (twu) Từsố dữhữu liệuích bảng bảng giao dịch (twu) văn theo công thức (4): Bảng Cơ sở liệu số lần xuất 3, cáctính từ trọng số hữu ích giao dịch (twu) văn theo công thức (4): TID ITEM0 A 0B C D1 03 00 20 12 2 2 0 32 02 00 34 2 tập văn = 2{d , 0d , Ta có: D từ I = {A, B, C,4D, E}, tập E 2 Tương tự, 3 0 0 3 d03, d4, d5, d6, d7, d8, d9}, d = {2, 0, 3, 0, 4}, với ���(�� ) = ��� ��� ��� � Tương tự, tanhư 4như bảng ta kết trênkếtbảng = 0,064 số hữu giao văn Bảng 4.Bảng Trọng4.sốTrọng hữu ích giaoích dịch củadịch mỗicủa vănmỗi Tids twu Tids twu 0,064 0,064 0,072 0,072 0,0535 0,0535 0,063 0,108 0,074 0,0915 0,073 0,058 0,0915 0,657 0,058 nghĩa văn d có từ A, từ C, từ E, khơng C, D, có: Tập văn D =là{dtrong 1, d2, d3, d4, d5,1 d6, d7, d8, d9}, tập từ I = {A, B, có từ B, D có từ = {2, 0, 3, 0, 4}, nghĩa văn d1 có từ A, từ C, từ E, khơng Khai thác mẫu hữu ích đánh trọng phổ biến: thác mẫu hữu ích phổđểbiến: Sửđược dụng đánh cơng trọng thức (1) tính tần số xuất TF item dụng cơng thức tínhvăn tầnbản số xuất hiệnA TF từ Vì các(1) từ để Vì item xuấtcủa văn 1,văn 4, 6, � n văn 1,7,4,nên 6, 7,TF(A) nên TF(A) được tính tính như sau:sau: TF TF (A,(A,d1)d1)== ; TF (A, d4) � �,���×�,����,���×�,����,���×�,�� SUM 0,063 0,108 0,074 0,073 (A, ddd6666)))== = ;;; TF TF(A, (A,ddd777)7)))== = .Tương Tươngtự tựcho chocác item itemcòn lại, lại, thu thu được kết kết quả như ởởở TF (A, = TF (A, = Tương tự tự cho cho item lại, thu kết = TF (A, d4) = == ���;;; TF TF (A, 5cịn ��� ��� Tính độ hỗ trợSUM hữu ích 0,657 (wus): từ liệu bảng 4, bảng 2.thu kết bảng bảng bảng item cịn lại,2 ta tính độ hỗ trợ hữu ích theo cơng thức (5), lấy Bảng2 2.Tần Tầnsố sốxuất xuấthiện hiệncủa củacác cáctừ từđộ văn ích (wus): Từ liệu bảng 4, ta tính độ hỗ trợ hữu ích theo Tính hỗvăn trợbản hữu Bảng Bảng Tần số xuất từ trong văn min_wus = 0,2 Item A xuất văn 1, 4, 6, nên: ITEM công thức (5), lấy min_wus = 0,2 Item A xuất văn 1, 4, 6, nên: ITEM ITEM Bảng Tần số xuất củaTID từ văn B TID TID A AA B B C CC D DD EEE �,�����,�����,�����,��� wus (A) = = 0,42 ITEM � = ; TF � TID bảng 0,222 0,333 0,444 �,��� 111 0,222 0,222 000 0,333 0,333 000 0,444 0,444 0,333 0,167 0,5 (C) = 0,73, wus (D) = 0,49, wus (E) = 0,64 � 000 2 0,333 0,333 0 0,167 0,167 0,5 0,5 tự, wus (B)thu= 0,61, wus DTương E ta đượccòn (A, dA6) = ; TFB (A, d ) C= 00Tương tự cho quảwus như(B) = 0,61, wus (C) = 0,73, wus Tương 0,444các item 0,222 lại, 0,222tự, ta kết 0,111 333 0,444 0,444 0,222 0,222 0,222 0,222 0,111 0,111 � �Tất giá trị thỏa min_wus = 0,2, tất item đơn thêm 0,375 0,125(D) = 0,49, 0,25 wus (E) 0,25= 0,64 Tất giá trị thỏa 444 0,375 0,375 000 0,125 0,125 0,25 0,25 0,25 0,25 vào phổ biến:000 = min_wus {A, B,000C,=D, E}.do 0,5 0,5 55 0,5 0,5 0,5 0,5 0,222 5số mẫu 0,444 0,2, tất item đơn thêm Bảng Tần xuất0,333 hiện00của từ văn 0,167 0,333 0,5 666 0,167 0,167 0 0,333 0,333 0,5 0,5 0 Xét lớp tương đương A, A kết hợp với B, ta ITEM 0,333 0,167 0,5 vào mẫu phổ biến: φ =được {A, B, C,itemset D, E} AB với wus (AB) 0,286 0,286 0,429 777 A 0,286 0,286 0,286 0,286 0,429 0,429 000 E 000 TID B C D = 0,12 < min_wus, AB khơng thêm vào A Tương tự, wus (AC) = 0,42 ≥ 0,5 0,5 0 0,444 0,222 00 0,222 0,5 88 0,5 0,111 0,5 0,5 00 00 Xét lớp tương đương A, A kết hợp với B, ta 0,222 00 0,333 0,444 0,333 0,222wus (AD) = 0,21 ≥ min_wus, thêm AD vào min_wus, thêm AC vào A, ta A = {AC}; 9 0 0 0,444 0,444 0,333 0,333 0,222 0,222 0,444 0,375 0,125 0,25 0,25 itemset wus (AB)vì= 0,12AE < min_wus, thêm vào A 0,333 {AC, AD}; 0,167 0,5 =AB A, ta A = wus (AE) 0,19với < min_wus, không 0,5 0 0,5 AB không thêm vào A Tương tự, wus (AC) = 0,42 ≥ 0,444 0,222 0,222 0,111 Sửdụng dụngcơng cơng thức(2) (2)để đểSau tínhkhi trọng sốhiện của0,25 từtrong vănsẽ Mỗi từchỉ chỉcó có giá để tiếp tục tạo lớp Sử dụng cơng thức (2) để tính tính trọng trọng số số của các từ từ văn văn bản Mỗi từ từ có giá thực xong lớp A, gọiMỗi thuật toán đệ111Agiá quy 4Sử 0,375thức 0,125 0,25 min_wus, thêm AC vào A, ta = {AC}; wus (AD) = 0,167 0,333 0,5 trị IDF tập văn bản, xem trọng số từ tập văn trị trị IDF IDF5duy nhất trong tập tậptương văn văn bản, được xem xem là0,21 trọng trọng≥tương số số củatựmỗi từ từcác trong tập văn bản đương nó.như Thực vớithêm lớptập B, văn C, D, E, cuốiA ta có mẫu 0,5bản, 0sau 0là 0,5 min_wus, AD vào A, ta = {AC, AD}; 0,286 0,286 0,429 0 � 6IDF (A, D)0,167 ích 0,5 đánh trọng phổ biến thỏa mãn min_wus = 0,2 {A, B, C, D, E, AC, AD, BC, Tacó: có:IDF =log log��hữu ;tương tương tựthu thu0,333 đượckết kếtquả bảng Ta Ta có: IDF (A, (A, D) D) = = log ; ; tương tự tự thu được kết như ở bảng bảng 3 0,429 wus (AE) = 0,19 < min_wus, AE khơng thêm 0,5 0,286 0,5��� 0,286 0 BE, CD, CE, DE, ACD, CDE} hình vào A.Item 0,5 0,5 Bảng 3.Trọng Trọngsố số0của Item Bảng 3 Trọng số các Item 0 0,444 0,333Bảng 0,222 0 0,444 0,222 Item IDF0,333 � Item Item IDF IDF Sau thực xong lớp A, gọi thuật toán đệ quy Sử dụng cơng thức (2) để tính trọng số A từ A 0,35 để tiếp tục tạo lớp tương đương sau Thực A 0,35 0,35 dụng cơng để tính trọng từ trongtương văn Mỗi chỉB, cóC,1 D, giáE, cuối ta có mẫu văn bản.Sử Mỗi từ cóthức giá(2) trị IDF duy nhấtsốtrong tập văn B 0,25 B Bcủa 0,25 0,25 tự với cáctừlớp trị IDF tập số văncủa bản, xem Ctập trọng số từ tập văn bản, đượcduy xem nhưtrong trọng từ văn 0,11 hữu ích đánh trọng phổ biến thỏa mãn min_wus = 0,2 CC 0,11 0,11 � TaTacó: tương tự tự thu thuđược đượckết kết quảnhư bảng B, C, D, E, AC, AD, BC, BE, CD, CE, DE, ACD, có:IDF IDF(A, (A,D) D)==log log ; tương D 0,25 {A, D D 0,25 0,25 � bảng 0,18 CDE} hình Bảng Trọng Item EEE số 0,18 0,18 Item IDF Agiao 0,35 Tínhtrọng trọngsố sốhữu hữuích ích giaodịch dịch (twu) mỗimẫu vănhữu bản:ích Từđược dữliệu liệu bảngphổ bảng Tính Tính trọng số hữu ích giao dịch (twu) (twu) của mỗi văn văn bản: bản: Từ Từ dữ liệu bảng bảng 222và bảng bảng Hình Cây đánhởởởtrọng biến với min_wus = 0,2 B 0,25 3, tính trọng số hữu ích giao dịch (twu) văn theo công thức (4): 3, 3, tính tính được trọng trọng số số hữu hữu ích ích giao giao dịch dịch (twu) (twu) của mỗi văn văn bản theo theo cơng cơng thức thức (4): (4): Gom nhóm văn bản: �,���×�,����,���×�,����,���×�,�� C 0,11 �,���×�,����,���×�,����,���×�,�� �,���×�,����,���×�,����,���×�,�� 60(8) 8.2018 =Xây = 0,064 ���(((������)))= = dựng ma trận = 0,064 = 0,064 ��� ��� tương đương: Từ liệu bảng hình 3, ta xây dựng ��� D 0,25 maEtrận tương đương với a[i][j] = số mẫu phổ biến giống hai văn (bảng 5) Tươngtự, tự,ta tađược đượckết kếtquả quảnhư như0,18 trênbảng bảng444 Tương Tương tự, ta kết trên bảng Bảng Ma trận tương đương Khoa học Tự nhiên Bước 4: tìm giá trị max A cặp văn có giá trị với max Ta thấy max = 5; cặp văn (1, 4); (2, 3) có giá trị với max; (1, 4); (2, 3) có văn 3, thuộc nhóm (3, 4, 6, 9), ta gom 1, vào nhóm Thu (1, 2, 3, 4, 6, 9) nhóm gán giá trị cho cặp văn vừa tìm 0; cịn lại văn (5, 7, 8) chưa gom nhóm (bảng 7) Hình Cây mẫu hữu ích đánh trọng phổ biến với min_wus = 0,2 Bảng Ma trận tương đương với văn (1, 2, 3, 4, 6, 9) gom nhóm Gom nhóm văn bản: - Xây dựng ma trận tương đương: từ liệu bảng hình 4, ta xây dựng ma trận tương đương với a[i][j] = số mẫu phổ biến giống hai văn (bảng 5) 2 3 3 1 3 3 7 1 3 - Thực gom nhóm (5 bước): Bước 1: tìm giá trị nhỏ khác ma trận tương đương A: = Bước 2: tìm giá trị lớn A: max = Bước 3: tìm cặp văn có giá trị max Ta thấy (3, 4); (3, 9); (4, 6); (4, 9) có giá trị 7; gom (3, 4, 6, 9) nhóm gán giá trị cho cặp văn vừa tìm 0; lại văn (1, 2, 5, 7, 8) chưa gom nhóm (bảng 6) Bảng Ma trận tương đương với văn (3, 4, 6, 9) gom nhóm 1 3 3 3 1 3 3 3 0 1 3 Xét tiếp (2, 5) có văn thuộc nhóm (1, 2, 3, 4, 6, 9), ta gom vào nhóm có gán giá trị (2, 5) 0, (1, 2, 3, 4, 5, 6, 9) nhóm; (7, 8) nhóm, gán giá trị cho cặp văn vừa tìm Như vậy, tất văn gom nhóm; kết thúc việc gom nhóm Từ văn cho ban đầu ta gom thành nhóm: nhóm gồm văn (1, 2, 3, 4, 5, 6, 9) nhóm gồm văn (7, 8) bảng Bảng Ma trận tương đương với tất văn gom nhóm 3 3 1 3 3 3 0 1 3 8 60(8) 8.2018 Bước 5: tiếp tục tìm giá trị max A cặp văn có giá trị với max Ta thấy max = 3, cặp văn (1, 3); (1, 6); (1, 7); (1, 9); (2, 4); (2, 5); (2, 9); (3, 5); (3, 6); (3,7); (3, 8); (4, 7); (6, 7); (6, 9); (7, 8) có giá trị với max Trong cặp văn trên, có cặp văn (7, 8) chưa thuộc nhóm văn gom cụm, ta gom (7, 8) thành nhóm gán giá trị cho (7, 8) 5 3 3 Bảng Ma trận tương đương 2 5 0 0 0 0 1 0 0 0 0 0 1 1 0 1 Khoa học Tự nhiên Bảng Ma trậntrận tương đương với tất bản gomgom nhóm Bảng Ma tương đương vớicác tất văn văn nhóm 21 32 43 54 65 76 87 98 0 0 01 Kết thực 1nghiệm đánh giá 0 0 1 0 xây 10 dựng 1 01 Các2 thuật toán NET Framework 4.0, sử3 dụng Visual Studio 2010 Kho 0 0 0 0ngữ liệu thử nghiệm chúng tơi rút trích tự động kết hợp 01 10 01 với định dạng thủ 4 công bao 1 161 chủ đề (bảng 9) từ 5gồm 1.600 văn 0bản10 thuộc diễn đàn trực tuyến “www.vnexpress.net”, “www 10 01 6 dantri.com.vn”, “www.thanhnien.vn” 10 Tiến hành so sánh với phương pháp gom nhóm văn dựa mẫu phổ biến [7] với 1.600 văn liệu Bộ liệu gồm chủ đề (Đời sống, Mỹ thuật, VirusHacker, Thể thao) với 400 văn Kết độ đo F với ngưỡng tương ứng bảng 10 Bảng 10 Kết độ đo F liệu Bảng 9.8 Tập liệu thực nghiệm MS Số lượng 0,15 F Bộ liệu thử 0,14 0,13 0,12 0,11 0,1 0,09 0,085 0,08 0,07 0,05 STT Chủ đề MC 0,57 0,59 0,52 0,56 0,64 0,6 0,64 0,61 0,62 0,63 0,68 ảquả thực nghiệm đánh giá giá thực nghiệm đánh văn nghiệm MC-W 0,7 0,76 0,78 0,72 0,82 0,8 0,74 0,82 0,83 0,84 0,83 CácCác thuật toántoán xâyxây dựng trêntrên nềnnền NET Framework 4.0,4.0, sử dụng Visual Studio thuật dựng NET Framework sử dụng Visual Studio Đời sống 100 Kho ngữngữ liệuliệu thử thử nghiệm rút tự động kết kết hợphợp với với địnhđịnh dạng thủ thủ Kho nghiệm chúng tơi trích rút trích tự động dạng Mỹ thuật 100 ao gồmgồm 1.600 văn bảnbản thuộc 16 chủ đề (bảng 9) từ diễn1diễn đànđàn trựctrực tuyến nhưnhư g bao 1.600 văn thuộc 16 chủ đề (bảng 9) từ tuyến Đối với liệu 1, kết gom nhóm đạt Virus-Hacker 100 vnexpress.net”, “www.dantri.com.vn”, “www.thanhnien.vn” ww.vnexpress.net”, “www.dantri.com.vn”, “www.thanhnien.vn” cao Ở bảng 10 ta thấy, với thuật toán MC, độ đo F đạt kết liệu Thểnghiệm thao 100 Bảng Tập liệu thựcthực nghiệm Bảng Tập Tennis 100 Số lượng Số lượng Bộ Bộliệu liệu STTSTTChủChủ đề đề Y khoa 100 văn văn bản thử thử nghiệm nghiệm 1 Đời Đời sốngsống 100 Âm nhạc100 100 2 Mỹ thuật 100 100 Mỹ thuật Sân khấu điện ảnh 1 100 3 Virus-Hacker 100 100 Virus-Hacker 4 Thể Thể thaothao 100 100thông tin Công nghệ 100 5 Tennis 100 100 Tennis 10 Thời100 trang 100 6 Y khoa Y khoa 100 7 Âm Âm nhạcnhạc 2 100 11 Bóng100 đá 100 8 Sân Sân khấukhấu điệnđiện ảnh ảnh 100 100 12 Bất động sản 100 9 CôngCông nghệnghệ thông tin tin 100 100 thông 10 10 ThờiThời trangtrang 100 100 13 Ẩm thực 100 11 11 BóngBóng đá đá 100 100 14 Bệnh cúm 100 12 12 Bất động sản sản 100 100 Bất động 15 Xe 100 3 13 13 Ẩm Ẩm thựcthực 100 100 14 14 BệnhBệnh cúm16 cúm Hình100 100 100 15 15 Xe Xe 100 100 TC 16 1.600 16 16 HìnhHình sự 100 100 TC TC 16 16 16001600 cao 0,68 (khoảng 68%) số văn gom vào nhóm Với thuật tốn MC-W, độ đo F đạt kết cao 0,84 (khoảng 84%) số văn gom vào nhóm Bộ liệu gồm chủ đề (Tennis, Y khoa, Âm nhạc, Sân khấu điện ảnh, Công nghệ thông tin) với 500 văn Kết chạy với ngưỡng tương ứng bảng 11 Bảng 11 Kết độ đo F liệu MS F 0,15 0,14 0,13 0,12 0,11 0,1 0,095 0,09 0,085 0,08 0,07 MC 0,46 0,4 0,51 0,5 0,42 0,41 0,4 0,41 0,49 0,42 0,47 MC-W 0,48 0,47 0,51 0,5 0,48 0,48 0,49 0,49 0,49 0,48 0,5 Sử dụng độ đo F (F-measure) [4] để đánh giá tính hiệu Đối với liệu 2, bảng 11 cho thấy thuật tốn MC thuật[4] tốn nhóm mẫu phổcủa biến Độtốn đo gom Fnhóm Sử dụng độ đo (F-measure) để gom đánh giá giá tínhdùng hiệuhiệu quảquả thuật toán gom Sử dụng độ Fđo F (F-measure) [4] để đánh tính thuật nhóm thuật tốn MC-W có độ đo F cao 0,51 (51%), số phổphổ biến Độđược đo Fđođược tínhtính theo cơng thức từ (6-9): gẫumẫu biến Độ F theo công từ (6-9): tính theo cơng thức từ thức (6-9): văn gom vào nhóm ×2 P(i, j) ×j) R(i, j) j) × P(i, × R(i, F(i,F(i, j) =j) = P(i,P(i, j) +j) R(i, j) + R(i, j) Bộ liệu gồm chủ đề (Thời trang, Bóng đá, Bất (6) (6) (6) động sản, Ẩm thực, Bệnh cúm, Xe, Hình sự) với 700 văn Kết chạy với ngưỡng tương ứng (7) (7) (7) bảng 12 n� n� F =F� F(i,F(i, j) j) = � max max n n � � � � n�� P(i, j) = n� (8) (8) n�� R(i, j) = n� Bảng 12 Kết độ đo F liệu MS 9 0,1 0,095 0,09 0,085 0,08 0,075 0,07 0,065 0,06 0,05 0,045 0,04 0,035 MC 0,37 0,4 0,37 0,37 0,37 0,38 0,44 0,48 0,52 0,5 0,49 0,5 0,54 MC-W 0,43 0,46 0,54 0,52 0,56 0,57 0,53 0,51 0,53 0,57 0,54 0,54 0,59 F (9) (9) đó: ni số văn lớp i, nj số văn cụm j, nij số văn Trong đó: nibộ số liệu; văn i, ((Precision) nj số văn bảncụm ụm j, n tổng số văn P(i, j) lớp độ rõ j, nij số củacụm lớp j;i F(i, cụm j, nFlàcủa tổng R(i, j) độ baocụm phủ (Recall) củavăn lớpbản i j) độ đo cụmsốj dữcàng liệu;tốt P(i, j) độ rõ (Precision) cụm ộ đo F cao,văn kếtbản gom nhóm Độ i; R(i, độvăn baobản phủdựa (Recall) củaphổ lớpbiến i ành so sánh vớij phươnglớp pháp gomj)nhóm mẫu [7] hành n liệu Bộ liệu gồm chủ đề j(Đời sống, thuật, cụm j; F(i, j) độ1đo F cụm lớp Mỹ i Độ đo FViruscàng thao) với 400 văn độnhóm đo F với cao,bản kếtKết quảquả gom càngcác tốt.ngưỡng tương ứng Đối với liệu bảng 12 cho thấy, với thuật toán MC, độ đo F đạt kết cao 0,54 (khoảng 54%) số văn gom vào nhóm Với thuật tốn MC-W, độ đo F đạt kết cao 0,59 (khoảng 59%) số văn gom vào nhóm uả độ đo F liệu 15 0,14 0,13 0,12 0,11 0,1 0,09 60(8)0,085 8.20180,08 0,07 0,05 57 0,59 0,52 0,56 0,64 0,6 0,64 0,61 0,62 0,63 0,68 0,76 0,78 0,72 0,82 0,8 0,74 0,82 0,83 0,84 0,83 Khoa học Tự nhiên Từ kết thử nghiệm cho thấy, thuật tốn MC-W gom nhóm văn tốt có độ xác cao so với thuật toán MC Với ngưỡng khác cho kết độ đo F khác Do đó, việc xác định ngưỡng phù hợp cho toán thách thức với tốn tìm mẫu phổ biến nói chung, tốn gom nhóm văn sử dụng mẫu phổ biến nói riêng Kết luận Bài báo đề xuất phương pháp để gom nhóm văn dựa vào mẫu hữu ích đánh trọng phổ biến Đầu tiên, chúng tơi tính TF-IDF cho từ văn nhằm tạo ma trận trọng số cho tập văn bản, sau sử dụng thuật tốn MWIT-FWUI để khai thác mẫu hữu ích phổ biến từ ma trận trọng số Cuối cùng, dựa vào tập mẫu hữu ích khai thác để tiến hành gom nhóm văn theo thuật tốn MC Với phương pháp này, hệ thống cải thiện đáng kể độ xác việc gom nhóm văn bản, cụ thể độ đo F so với phương pháp gom nhóm dựa vào mẫu phổ biến Trong tương lai, tác giả tiếp tục áp dụng thêm đặc trưng ngôn ngữ từ nội dung, tên riêng… vào gom nhóm văn Mặc khác, chúng tơi tiếp tục thử nghiệm sử dụng phương pháp đánh trọng cho tốn khác như: Tìm kiếm văn bản, tóm tắt văn bản, phân loại văn bản… LỜI CẢM ƠN Nghiên cứu tài trợ Quỹ Phát triển KH&CN Quốc gia (NAFOSTED) khuôn khổ đề tài mã số 102.05-2015.10 Các tác giả xin trân trọng cảm ơn 60(8) 8.2018 TÀI LIỆU THAM KHẢO [1] Đỗ Phúc, Mai Xuân Hùng, Nguyễn Thị Kim Phụng (2008), “Gom cụm đồ thị ứng dụng vào việc rút trích nội dung khối thơng điệp diễn đàn thảo luận”, Tạp chí Phát triển khoa học cơng nghệ, 11(5), tr.21-32 [2] Dương Thị Thùy Vân (2010), “Gom cụm tài liệu dựa thực thể có tên”, Tạp chí Khoa học ứng dụng, Trường Đại học Tôn Đức Thắng, 11, tr.42-45 [3] F Beil, M Ester, X Xu (2002), “Frequent term-based text clustering”, Proceedings of the 8th ACM SIGKDD, pp.436-442 [4] M Steinbach, G Karypis, V Kumar (2000), “A comparison of document clustering techniques”, KDD-2000 Workshop on Text Mining, pp.109-110 [5] H Edith, A Rene, J Carrasco-Ochoa, J Martinez-Trinidad (2006), “Document clustering based on maximal frequent sequences”, Proceedings of the FinTAL, LNAI, 4139, pp.257-267 [6] B Fung, K Wang, M Ester (2003), “Hierarchical document clustering using frequent itemsets”, Proceedings of the 3rd SIAM International Conference on Data Mining, pp.59-70 [7] Y Li, S Chung, J Holt (2008), “Text document clustering based on frequent word meaning sequences”, Data & Knowledge Engineering, 64(1), pp.381-404 [8] W Zhang, T Yoshida, X Tang, Q Wang (2010), “Text clustering using frequent itemsets”, Knowledge-Based Systems, 23(5), pp.379-388 [9] B Vo, B Le, J Jung (2012), “A tree-based approach for mining frequent weighted utility itemsets”, ICCCI’12, LNAI Springer, 7653, Khoa học Tự nhiên Nghiên cứu cấu trúc màng điện cực polymer sử dụng cho pin nhiên liệu phương pháp tán xạ tia X góc nhỏ siêu nhỏ Trần Duy Tập* Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia TP Hồ Chí Minh Ngày nhận 19/3/2018; ngày chuyển phản biện 23/3/2018; ngày nhận phản biện 26/4/2018; ngày chấp nhận đăng 7/5/2018 Tóm tắt: Acid poly(styrene sulfonic) ghép mạch poly(ethylene-co-tetrafluoroethylene) (ETFE-PEM) tổng hợp phương pháp ghép mạch khơi mào chiếu xạ gamma, phim ban đầu original-ETFE chiếu xạ ghép mạch monomer styrene (Grafted-ETFE), sau sulfo hố để tạo thành màng dẫn proton Cấu trúc lamellar ETFE-PEMs nghiên cứu hàm mức độ ghép mạch (GD) phương pháp tán xạ tia X góc nhỏ siêu nhỏ Kết cho thấy, vật liệu styrene chủ yếu vào pha vơ định hình cấu trúc lamellar làm cho bề dày vùng tăng, kéo theo chu kỳ lamellar tăng GD = 0-34% Bề dày lamellar tinh thể, cấu trúc có liên quan đến độ bền lý màng, giảm nhẹ GD ≥ 34% Ngồi GD ≥ 34%, styrene khơng vào cấu trúc lamellar nữa, mà chủ yếu vào khối cấu trúc lamellar (tập hợp cấu trúc lamellar) Q trình dẫn đến chu kỳ lamellar khơng tăng thêm nữa, cấu trúc khối lamellar có phát triển mạnh mẽ GD ≥ 34% Từ khóa: chiếu xạ, lamellar, pin nhiên liệu, tán xạ tia X góc nhỏ Chỉ số phân loại: 1.4 Giới thiệu Pin nhiên liệu màng dẫn proton thiết bị điện hố nhiên liệu hydro chuyển trực tiếp thành lượng điện thơng qua phản ứng hố học [1] Thiết bị thu hút quan tâm nghiên cứu mạnh mẽ nhờ vào hiệu suất sinh lượng cao (40-60%), thân thiện với môi trường hoạt động khoảng nhiệt độ thấp (∼ 80-1000C) nên phù hợp sử dụng cho thiết bị di động, cầm tay phương tiện vận tải [2] Bộ phận quan trọng pin nhiên liệu màng điện cực polymer (PEM) hay màng trao đổi proton có chức dẫn proton (H+) từ anode sang cathode ngăn cản khí H2 từ anode O2 từ cathode khuếch tán vào màng Vật liệu thương mại dùng làm PEM nafion có hạn chế cố hữu giá thành cao, quy trình chế tạo phức tạp tính dẫn proton giảm xuống nhanh chóng độ ẩm (RH) pin thấp nhiệt độ pin trở nên cao [2] Tình trạng vừa nêu làm xuất nhu cầu cấp bách, cần nghiên cứu vật liệu khác thay vật liệu nafion Trong vật liệu nghiên cứu poly(styrene sulfonic acid)-grafted poly(ethylene-co-tetrafluoroethylene) (ETFE-PEM) lên ứng viên đầy tiềm năng, vật liệu có giá cạnh tranh, tổng hợp phương pháp đơn giản (chiếu xạ xạ hạt nhân) sở hữu tính chất phù hợp cho ứng dụng pin nhiên liệu [3, 4] Một số nghiên cứu trước cho thấy, ETFE-PEM có chứa cấu trúc lamellar, tức cấu trúc dạng khối tầng pha tinh thể vơ định hình xếp có tính tuần hồn, ln phiên có định hướng không gian [3-5] Chu kỳ lamellar (L) xác định tổng bề dày lamellar tinh thể (Lc) cộng với bề dày lamellar vơ định hình (La) thơng qua biểu thức: L = Lc + La Các thông số cấu trúc lamellar vật liệu polymer nghiên cứu rộng rãi phương pháp tán xạ tia X góc nhỏ (Small angle X-ray scattering - SAXS) hoặc/và siêu nhỏ (Ultra small angle X-ray scattering - USAXS) [6] Đối với vật liệu ETFE-PEM, cấu trúc lamellar thông số đặc trưng chúng (L, Lc, La) có thay đổi theo quy trình tổng hợp mẫu theo mức độ ghép mạch (grafting degree - GD) [3-5] Sự thay đổi làm thay đổi tính chất phụ vào cấu trúc lamellar tính dẫn proton, tính hấp thụ nước, độ bền học, độ bền hóa học độ bền nhiệt [1-3] Mối liên hệ cấu trúc lamellar với tính chất màng thơng tin quan trọng để có định hướng kiểm sốt tối ưu hóa cấu trúc làm cho pin nhiên liệu hoạt động ổn định, hiệu lâu dài Tuy nhiên hình thành phát triển cấu trúc lamellar thông số cấu trúc đặc trưng vật liệu ETFE-PEM theo mức độ ghép mạch chưa giải thích cách đầy đủ, rõ ràng tồn diện, xử lý số liệu SAXS thực trực tiếp mà khơng thơng qua việc áp dụng mơ hình tốn học Do đó, cơng trình nghiên cứu này, chúng tơi phân tích chi tiết thơng số cấu trúc lamellar thay đổi theo GD phương pháp xử lý phổ SAXS Email: tdtap@hcmus.edu.vn * 60(8) 8.2018 (1) Khoa học Kỹ thuật Công nghệ sản phẩm Fe2O3 thương mại biểu diễn hình Khác với α-Fe2O3 chế tạo được, hạt Fe2O3 thương mại có dạng hình trịn, kích thước khoảng 100 nm, hạt tương đối đồng Kích thước hình dạng khác mẫu α-Fe2O3 chế tạo Fe2O3 thương mại ảnh hưởng khác đến tính chất điện hóa điện cực Fe2O3 Như vậy, đỉnh khử c1 Fe(III)/Fe(II) c2 Fe(II)/Fe tách biệt hồn tồn khỏi đỉnh sinh khí hydro (c3) Đây đặc trưng có lợi q trình chu trình hóa điện cực sắt I ( mA) a1 a0 a2 -1 c2 c1 -2 Hình Ảnh SEM mẫu Fe2O3 tổng hợp phương pháp sol-gel c3 Hình Ảnh SEM mẫu Fe2O3 thương mại -3 -1,4 -1,2 0,1 Fe(OH)2 + 2e [Fe(OH)]ad + e Fe(OH)2 + e (2) (3) Cặp đỉnh a2/c1 tương ứng với cặp phản ứng oxy hóa khử Fe(II)/Fe(III) theo phương trình phản ứng (4) và/ (5): FeOOH + H2O + e (4) (E0 = - 0,658 V vs Hg/HgO) 3Fe(OH)2 + 2OH- 0,0 Fe3O4.4H2O + 2e (E0 = - 0,758 V vs Hg/HgO) 60(8) 8.2018 (5) c2 -0,2 -0,3 -0,4 -1,4 Đỉnh a0 xuất tương đối thấp, khoảng -1,2 V cho oxy hóa Fe thành Fe(I) hấp phụ nhóm OH- tạo thành Fe(OH)ad theo phương trình (2) trước Fe(OH)2 hình thành theo phương trình (3) Như phương trình (1) gồm hai bước riêng biệt (2) (3) hấp phụ ion OH-: Fe(OH)2 + OH- -0,2 a1 -0,1 (1) (E0 = -0,978 V vs Hg/HgO) [Fe(OH)]ad + OH- -0,4 0,0 Cặp đỉnh oxy hóa - khử a1/c2 tương ứng với cặp oxy hóa - khử Fe/Fe(II) theo phương trình (1): Fe + OH- -0,6 Hình Đặc trưng CV điện cực Fe2O3 sử dụng α-Fe2O3 chế tạo phương pháp sol-gel I ( mA) Để thu đặc trưng điện hóa vật liệu α-Fe2O3 tổng hợp phương pháp sol-gel, phép đo qt vịng tuần hồn (CV) thực cho năm chu kỳ đầu, kết biểu diễn hình Khi quét theo chiều thuận từ -1,3 đến -0,1 V đường CV có hai đỉnh oxy hóa xuất khoảng -0,85 V (a1) -6,5 V (a2) đỉnh khử tương ứng khoảng -0,95 V (c1) -1,1 V (c2) theo chiều qt ngược lại Ngồi ra, cịn có đỉnh oxy hóa a0 xuất -1,0 V đỉnh sinh khí hyđro c3 khoảng -1,2 V Fe + 2OH -0,8 Điện (V so với Hg/HgO) Đặc trưng điện hóa - -1,0 c3 -1,2 -1,0 -0,8 -0,6 -0,4 -0,2 0,0 Điện (V so với Hg/HgO) Hình Đặc trưng CV điện cực Fe2O3 sử dụng Fe2O3 thương mại Để đánh giá đặc trưng điện hóa mẫu α-Fe2O3 chế tạo được, phép đo CV mẫu thương mại thực cho năm chu kỳ đầu nhằm so sánh với mẫu chế tạo, kết biểu diễn hình Khác với mẫu chế tạo được, CV mẫu Fe2O3 thương mại có cặp đỉnh a1, c2 Fe/Fe(II) xuất khoảng -0,85 V (a1) -0,9 V (c2) Cặp đỉnh oxy hóa khử mẫu thương mại thấp mẫu α-Fe2O3 tổng hợp Cặp đỉnh oxy hóa - khử a2/c2 tương ứng với cặp phản ứng oxy hóa - khử Fe(II)/Fe(III) khơng quan sát Đó lớp thụ động Fe(OH)2 hình thành đỉnh a1 làm cản trở phản ứng oxy hóa lớp sắt bên giảm tốc độ phản ứng oxy hóa Fe(II) thành Fe(III) a2 So sánh CV mẫu Fe2O3 tổng hợp phương pháp sol-gel Fe2O3 thương mại ta dễ dàng nhận thấy đường CV điện cực Fe2O3 chế tạo (hình 4) có 52 Khoa học Kỹ thuật Cơng nghệ đỉnh oxy hóa - khử xuất rõ ràng hơn, cao hơn, đặc biệt đỉnh khử tách biệt khỏi đỉnh sinh khí hyđro so với điện cực Fe2O3 thương mại (hình 5) Kết chứng tỏ khả chu trình hóa α-Fe2O3 chế tạo tốt mẫu thương mại Như vậy, hình dạng, kích thước hạt Fe2O3 có ảnh hưởng đáng kể đến đặc trưng điện hóa điện cực Fe2O3 80 a2 60 40 I ( mA) 20 a1 a0 c1 -20 -40 -60 c3 -80 -1,4 c2 -1,2 -1,0 -0,8 -0,6 -0,4 -0,2 Kết luận α-Fe2O3 kích thước nanomét chế tạo thành công phương pháp sol-gel Kích thước, hình thái học hạt Fe2O3 ảnh hưởng mạnh đến đặc trưng điện hóa Phép đo CV chứng tỏ Fe2O3 tổng hợp phương pháp sol-gel có khả chu trình hóa tốt mẫu Fe2O3 thương mại Ảnh hưởng chất phụ gia cácbon AB đến tính chất điện hóa điện cực α-Fe2O3/ AB khảo sát Sự có mặt AB điện cực Fe2O3 mặt làm tăng độ dẫn điện điện cực, mặt khác cải thiện khả chu trình hóa dung lượng điện cực Fe2O3/AB TÀI LIỆU THAM KHẢO 0,0 Điện (V so với Hg/HgO) Hình Đặc trưng CV điện cực Fe2O3/AB sử dụng α-Fe2O3 tổng hợp phương pháp sol-gel Để đánh giá khả ứng dụng vật liệu α-Fe2O3 chế tạo được, ảnh hưởng chất phụ gia cácbon AB đến tính chất điện hóa điện cực α-Fe2O3 khảo sát thông qua phép đo CV, kết thể hình Khi quét theo chiều thuận, có xuất đỉnh oxy hóa Fe/Fe(II) (a1) khoảng -0,7 V Fe(II)/Fe(III)(a2) khoảng -0,5 V Với chiều quét ngược lại có đỉnh khử Fe(III)/ Fe(II) (c2) xuất khoảng -1,1 V với đỉnh sinh khí hydro c3 Đỉnh khử Fe(II)/Fe (c1) khơng quan sát bị che phủ đỉnh sinh khí hyđrơ c3 Dịng oxy hóa đỉnh a2 lớn so với dịng oxy hóa đỉnh a1 chứng tỏ đỉnh a2 bao gồm hai phản ứng oxy hóa Fe/Fe(II) Fe(II)/Fe(III) Khi có cácbon AB điện cực (hình 6), đường CV mẫu α-Fe2O3/AB có đỉnh oxy hóa cao cường độ dịng oxy hóa khử lớn đường CV mẫu α-Fe2O3 khơng có cácbon AB (hình 5) Kết khẳng định vai trò quan trọng AB việc cải thiện khả chu trình hóa điện cực Fe2O3/AB Ngun nhân AB có độ dẫn điện cao, kích thước hạt nhỏ, diện tích bề mặt lớn, có mặt điện cực Fe2O3/ AB, mặt làm tăng độ dẫn điện điện cực, mặt khác làm tăng diện tích bề mặt hoạt động điện hóa điện cực, dẫn đến tăng tốc độ phản ứng oxy hóa - khử làm tăng dung lượng, hiệu suất phóng - nạp Fe2O3/AB Bằng việc sử dụng AB làm chất phụ gia điện cực, khả chu trình hóa α-Fe2O3/AB sử dụng α-Fe2O3 chế tạo phương pháp sol-gel cải thiện đáng kể Với việc tối 60(8) 8.2018 ưu hóa điều kiện chế tạo cải thiện khả chu trình hóa α-Fe2O3, vật liệu α-Fe2O3 tổng hợp phương pháp sol-gel có tiềm ứng dụng làm điện cực âm pin sắt - khí [1] D Linden, T.B Reddy (2002), “Iron electrode batteries”, Handbook of Batteries, 3rd ed., McGraw-Hill, New York, pp.251-253 [2] S.V Falk, A.J Salking (1969), Alkaline Storage Batteries, 1, Wiley, New York [3] A Ito, L Zhao, S Okada, J Yamaki (2011), “Synthesis of nano-Fe3O4-loaded tubular carbon nanofibers and their application as negative electrodes for Fe/air batteries”, J Power Sources, 196, pp.8154-8159 [4] A Inoishi, T Sakai, Y Wan, S Ida, T Ishihara (2014), “Improved cycle stability of Fe-air solid state oxide rechargeable battery using LaGaO3-based oxide ion conductor”, J Power Sources, 262, pp 310-315 [5] Q Fang, C.M Berger, N.H Menzler, M Bram, L Blum (2016), “Electrochemical characterization of Fe-air rechargeable oxide battery in planar solid oxide cell stacks”, J Power Sources, 336, pp.91-98 [6] T.S Balasubramanian, A.K Shukla (1993), “Effect of metalsulfide additives on charge/discharge reactions of the alkaline iron electrode”, J Power Sources, 41, pp.99-105 [7] L Öjefors (1976), “Self-discharge of the alkaline iron electrode”, Electrochim Acta., 21, pp.263-266 [8] L Ojefors, L Carlsson (1977-1978), “An iron - air vehicle battery”, J Power Sources, 2, pp.287-296 [9] N Jayalakshmi, V.S Muralidharan (1990), “Electrochemical behaviour of iron oxide electrodes in alkali solutions”, J Power Sources, 32, pp.277-286 [10] N Jayalakshimi, S Muralidharan (1990), “Developmental studies on porous iron electrodes for the nickel-iron cell”, J Power Sources, 32, pp.341-351 [11] C Chakkaravarthy, P Perasamy, S Jegannathan, K.I Vasu (1991), “The nickel/iron battery”, J Power Sources, 35, pp.21-35 [12] P Periasamy, B.R Babu, and S.V Iyer (1996), “Cyclic voltammetric studies of porous iron electrodes in alkaline-solutions 53 Khoa học Kỹ thuật Công nghệ used for alkaline batteries”, J Power Sources, 58, pp.35-40 Power Sources, 132, pp.288-290 [13] J Černý and K Micka (1989), “Voltammetric study of an iron electrode in alkaline electrolytes”, J Power Sources, 25(2), pp.111-122 [22] B.T Hang, M Egashira, I Watanabe, S Okada, J Yamaki, S.H Yoon, I Mochida (2005), “The effect of carbon species on the properties of Fe/C composite for metal-air battery anode”, J Power Sources, 143, pp.256-264 [14] J Cerny, J Jindra, K Micka (1993), “Comparative study of porous iron electrodes”, J Power Sources, 45, pp.267-279 [15] K.C Huang, K.S Chou (2007), “Microstructure changes to iron nanoparticles during discharge/charge cycles”, Electrochemistry Communications, 9, pp.1907-1912 [16] H Wang, Y Liang, M Gong, Y Li, W Chang, T Meford, J Zhou, J Wang, T Regier, F Wei, H Dai (2012), “An ultrafast nickeliron battery from strongly coupled inorganic nanoparticle/nanocarbon hybrid materials”, Nature Communications, 3, p.917 [17] K Vijayamohanan, T.S Balasubramanian, A.K Shukla (1991), “Rechargeable alkaline iron electrodes”, J Power Sources, 34, pp.269-285 [18] T.S Balasubramanian, A.K Shukla (1993), “Effect of metalsulfide additives on charge/discharge reactions of the alkaline iron electrode”, J Power Sources, 41, pp.99-105 [19] A.K Shukla, M.K Ravikumar, T.S Baasubramanian (1994), “Nickel iron batteries”, J Power Sources, 51, pp 29-36 [20] C.A Caldas, M.C Lopes, I.A Carlos (1998), “The role of FeS and (NH4)2CO3 additives on the pressed type Fe electrode”, J Power Sources, 74, pp.108-112 [21] C.A.C Souza, I.A Carlos, M.C Lopes, G.A Finazzi, M.R.H de Almeida (2004), “Self-discharge of Fe-Ni alkaline batteries”, J 60(8) 8.2018 [23] B.T Hang, T Watanabe, M Egashira, I Watanabe, S Okada, J Yamaki (2006), “The effect of additives on the electrochemical properties of Fe/C composite for Fe/air battery anode”, J Power Sources, 155, pp.461-469 [24] B.T Hang, S.H Yoon, S Okada, J Yamaki (2007), “Effect of metal-sulfide additives on electrochemical properties of nano-sized Fe2O3-loaded carbon for Fe/air battery anodes”, J Power Sources, 168, pp.522-532 [25] H Kitamura, L Zhao, B.T Hang, S Okada, J Yamaki (2012), “Effect of Charge Current Density on Electrochemical Performance of Fe/C Electrodes in Alkaline Solutions”, J Electrochemical Society, 159(6), pp.A720-A724 [26] A Sundar Rajan, M.K Ravikumar, K.R Priolkar, S Sampath, and A.K Shukla (2014), “Carbonyl-Iron Electrodes for Rechargeable-Iron Batteries”, Electrochemistry Energy Technology, 1, pp.2-9 [27] M.M Ba-Abbad, M.S Takriff, A Benamor A.W Mohammad (2017), “Size and shape controlled of α-Fe2O3 nanoparticles prepared via sol-gel technique and their photocatalytic activity”, J Sol-Gel Science and Technology, 81(3), pp.880-893 54 Khoa học Kỹ thuật Công nghệ Phân lập tuyển chọn chủng vi khuẩn axít lactic vi khuẩn axít acetic tham gia vào trình lên men hạt ca cao Võ Thị Thúy Huệ*, Trần Thị Quỳnh Diệp, Nguyễn Minh Quang Trường Đại học Nơng lâm TP Hồ Chí Minh Ngày nhận 19/3/2018; ngày chuyển phản biện 23/3/2018; ngày nhận phản biện 23/4/2018; ngày chấp nhận đăng 4/5/2018 Tóm tắt: Lên men hạt ca cao công đoạn quan trọng, định chất lượng ca cao thương phẩm Mỗi lồi vi sinh vật có vai trị định giúp nâng cao chất lượng hạt ca cao lên men, đặc biệt chủng vi khuẩn axít lactic vi khuẩn axít acetic Trong nghiên cứu này, nhóm nghiên cứu phân lập mẫu vi khuẩn có khả sinh axít lactic mẫu vi khuẩn có khả sinh axít acetic; tuyển chọn chủng vi khuẩn có khả sinh axít lactic cao Bacillus coagulans, Lactobacillus plantarum chủng vi khuẩn có khả sinh axít acetic cao Acetobacter lovaniensis Thời gian nhân sinh khối tối ưu cho chủng vi khuẩn 48 môi trường bán rắn tối ưu để nhân sinh khối vi khuẩn Bacillus coagulans môi trường 85% cám bắp + 15% cám gạo (mật số vi khuẩn đạt 1,61x1012 Cfu/g); vi khuẩn Lactobacillus plantarum môi trường 90% cám bắp + 10% cám gạo (mật số đạt 2,15x1010 Cfu/g) vi khuẩn Acetobacter lovaniensis môi trường 90% cám bắp + 10% cám gạo (mật số đạt 2,19x1011 Cfu/g) Từ khóa: lên men ca cao, vi khuẩn axít acetic, vi khuẩn axít lactic Chỉ số phân loại: 2.8 Đặt vấn đề Vật liệu phương pháp nghiên cứu Lên men giai đoạn cần thiết để tạo hương vị cho ca cao Lên men trình vi sinh vật gây biến đổi vật lý, hóa học sinh hóa bên hạt ca cao để tạo tiền chất hóa học tạo màu mùi vị đặc trưng sôcôla [1] Trên giới Việt Nam, ca cao thường lên men đơn giản cách sử dụng nguồn nấm men vi khuẩn tự nhiên từ môi trường xâm nhập vào lớp cơm nhầy hay gọi lên men tự nhiên Với phương pháp lên men này, giá trị kinh tế thu không cao, đặc biệt trường hợp điều kiện phát triển hệ vi sinh vật kiểm sốt cách ổn định Vì vậy, nói việc xác định thành phần vai trò vi sinh vật tham gia trình lên men hạt ca cao cần thiết, đặc biệt chủng vi khuẩn axít lactic vi khuẩn axít acetic có ảnh hưởng định tới hương vị màu sắc bột ca cao thành phẩm Nghiên cứu thực với mục tiêu phân lập tuyển chọn số chủng vi khuẩn axít lactic, vi khuẩn axít acetic tham gia vào trình lên men hạt ca cao tự nhiên để sản xuất chế phẩm vi khuẩn bổ sung vào trình lên men, giúp ổn định nâng cao chất lượng sản phẩm ca cao sau lên men Vật liệu: mẫu ca cao thu thập huyện Châu Thành, tỉnh Bến Tre * Môi trường phân lập nhân sinh khối vi khuẩn: môi trường MRS, môi trường YPGD, môi trường TSA, môi trường TSB, môi trường bán rắn: cám bắp, cám gạo Phương pháp Phân lập chủng vi khuẩn axít lactic axít acetic trình lên men hạt ca cao tự nhiên: tiến hành lấy mẫu hạt ca cao để phân lập chủng vi khuẩn suốt trình lên men Lấy mẫu điểm chéo góc thùng lên men, điểm lấy 400 g hạt ca cao độ sâu 15 cm, khối lượng mẫu hạt ca cao cần lấy để phân tích tiêu kg Vi khuẩn axít acetic phân lập đếm mật số mơi trường YPGD có bổ sung CaCO3 bổ sung kháng sinh cycloheximide với nồng độ 100 ppm Vi khuẩn axít lactic phân lập đếm mật số môi trường thạch MRS chứa kháng sinh cycloheximide nồng độ 100 ppm Tác giả liên hệ: Email: thuyhue@hcmuaf.edu.vn 60(8) 8.2018 55 Khoa học Kỹ thuật Công nghệ Isolation and identification of lactic acid bacteria and acetic acid bacteria for the process of cocoa bean fermentation Thi Thuy Hue Vo*, Thi Quynh Diep Tran, Minh Quang Nguyen Nong lam University Ho Chi Minh City Received 19 March 2018; accepted May 2018 Abstract: The fermentation of cocoa beans is one of the important factors that determine the quality of the commercial cocoa products Each species of microorganisms has an important role to help improve the quality of fermented cocoa beans, especially lactic acid bacteria and acetic acid bacteria Therefore, strains of lactic acid bacteria and strains of acetic acid bacteria were isolated Bacillus coagulans, Lactobacillus plantarum and Acetobacter lovaniensis strains exhibited to be better acid producers than the others The optimal parameters of the semi-solid medium for the biomass production of Bacillus coagulans were 85% corn bran + 15% rice bran for 48 hours of fermentation (population of bacteria was 1.61x1012 Cfu/g); those of Lactobacillus plantarum were 90% corn bran + 10% rice bran for 48 hours of fermentation (population of bacteria was 2.15x1010Cfu/g); those of Acetobacter lovaniensis were 90% corn bran + 10% rice bran for 48 hours of fermentation (population of bacteria was 2.19x1011 Cfu/g) Khảo sát sinh trưởng chủng vi khuẩn: khảo sát sinh trưởng vi khuẩn môi trường nuôi cấy bán rắn khác nhau, thí nghiệm bố trí gồm nghiệm thức với lần lặp lại (NT1: 100% cám bắp; NT2: 95% cám bắp + 5% cám gạo; NT3: 90% cám bắp + 10% cám gạo; NT4: 85% cám bắp + 15% cám gạo) Khối lượng nghiệm thức 20 kg, mật số vi khuẩn bổ sung vào nghiệm thức đạt 106 Cfu/g chất Phương pháp xử lý số liệu: kết nhận giá trị trung bình lần lặp lại vẽ biểu đồ phần mềm Microsoft Excel Kết thảo luận Mẫu hạt ca cao lên men lấy huyện Châu Thành, tỉnh Bến Tre Tiến hành lấy mẫu ca cao ủ lên men tự nhiên lần vào thời điểm 0, 24, 48, 72, 96, 120 Kết phân lập làm vi khuẩn từ mẫu hạt ca cao lên men Mẫu ca cao sau thu nhận chuyển phịng thí Ký hiệu Hình dạng khuẩn lạc mơi trường ni cấy Hình dạng tế bào Định danh Lactobacillus plantarum* A Khuẩn lạc tròn, lồi, trắng đục, tâm sậm màu (cấy mơi trường MRS có bổ sung CaCO3) Tế bào hình que, gram dương, kích thước 0,7-1x3-8 µm Bacillus coagulans* B Keywords: acetic acid bacteria, cocoa fermentation, lactic acid bacteria Classification number: 2.8 Khuẩn lạc trịn, bóng, lồi, trắng (cấy mơi trường TSA) Quan sát hình thái khuẩn lạc tế bào, tiến hành nhuộm gram số phản ứng sinh hóa đặc trưng cho loại vi sinh vật Định danh chủng vi khuẩn phân lập phương pháp giải trình tự gen 16S rRNA (phân tích giải trình tự Cơng ty Nam Khoa, TP Hồ Chí Minh) Khảo sát khả sinh axít lactic axít acetic chủng vi khuẩn: định tính axít phương pháp dùng thuốc thử định lượng axít phương pháp chuẩn độ Therne 60(8) 8.2018 Tế bào hình que, gram dương, kích thước 3-5 µm I Acetobacter lovaniensis* Khuẩn lạc trịn, nhỏ, trắng sữa, mọc sát mặt thạch (cấy môi trường YPGD có bổ sung CaCO3) Tế bào hình que, gram âm, kích thước 0,3-0,6x1,0-8,0 µm Hình Đặc điểm khuẩn lạc vi khuẩn hình thái tế bào quan sát kính hiển vi *Tên vi khuẩn sau định danh phương pháp giải trình tự gen 16S rRNA tra cứu BLAST SEARCH 56 Khoa học Kỹ thuật Cơng nghệ nghiệm, tiến hành pha lỗng nồng độ thích hợp, cấy trang mơi trường thạch (có bổ sung CaCO3) để phân lập vi khuẩn có khả sinh axít lactic axít acetic Nghiên cứu phân lập mẫu vi khuẩn có ký hiệu A, B, C, D, E, F, G, H có đặc điểm: gram dương, khơng sinh enzyme catalase, tạo vịng mơi trường MRS có bổ sung CaCO3 làm đổi màu thuốc thử uphermen, bước đầu xác định mẫu thuộc nhóm vi khuẩn lactic Đã phân lập mẫu vi khuẩn có ký hiệu I, II, III với gram âm, sinh enzyme catalase, tạo vòng mơi trường YPGD có bổ sung CaCO3 tạo màu đỏ thẫm tiến hành phản ứng định tính axít acetic nên xác định mẫu thuộc vi khuẩn acetic Hình thái chủng vi khuẩn thể hình Khi so sánh trình tự 16S rDNA dòng vi khuẩn với liệu ngân hàng gen chương trình BLAST kết cho thấy, trình tự gen dịng vi khuẩn ký hiệu A tương đồng với trình tự gen lồi Lactobacillus plantarum, với mức độ tương đồng 100% (hình 2) Hình Kết so sánh độ tương đồng đoạn DNA dòng vi khuẩn I với liệu ngân hàng gen NCBI Đa số khuẩn lạc có dạng trịn, trơn bóng có màu trắng đục trắng sữa, khuẩn lạc tỏa mùi chua axit Tế bào dạng que, xếp đơn, gram dương vi khuẩn lactic gram âm vi khuẩn acetic Trong trình phát triển vi khuẩn tạo chất biến dưỡng với sản phẩm trao đổi chất, cụ thể axít lactic acetic Axít tác dụng với CaCO3 bổ sung vào mơi trường q trình ni cấy, lượng CaCO3 xung quanh khuẩn lạc bị chuyển hóa thành muối canxi, CO2 H2O nhờ mà trì pH mức 5,5-6, trả lại môi trường xung quanh khuẩn lạc ban đầu Bề dày vùng biểu thị lượng axít sinh nhiều hay [2] Khảo sát khả sinh axít lactic mẫu vi khuẩn phân lập từ hạt ca cao lên men tự nhiên Hình Kết so sánh độ tương đồng đoạn DNA dòng vi khuẩn A với liệu ngân hàng gen NCBI Kết tra cứu BLAST trình tự gen dịng vi khuẩn ký hiệu B tương đồng với trình tự gen lồi vi khuẩn Bacillus coagulans với mức tương đồng 99% (hình 3) dòng vi khuẩn ký hiệu I tương đồng lồi Acetobacter lovaniensis với độ tương đồng 100% (hình 4) Hình Kết so sánh độ tương đồng đoạn DNA dòng vi khuẩn B với liệu ngân hàng gen NCBI 60(8) 8.2018 Kết định tính axít lactic (hình 5) cho thấy, ống nghiệm chứa dịch nuôi cấy vi khuẩn chủng phân lập ký hiệu A B sau phản ứng với thuốc thử uphenmen làm đổi màu thuốc thử từ màu tím (giống đối chứng âm) thành màu vàng, chứng tỏ có axít lactic sinh Tuy nhiên, dung dịch ni cấy ngồi axit lactic tạo cịn chứa thành phần môi trường nuôi cấy nên màu vàng dung dịch ống nghiệm b, c không sáng ống d (đối chứng dương) Hình Kết phản ứng định tính axít lactic a) đối chứng âm (-), b) vi khuẩn ký hiệu A, c) vi khuẩn ký hiệu B, d) đối chứng dương (+) 57 Khoa học Kỹ thuật Cơng nghệ Hàm lượng axít lactic sinh môi trường nuôi cấy chủng vi khuẩn khác (hình 6) Vi khuẩn có ký hiệu B sinh axít lactic cao sau ngày nuôi cấy (27,36 g/l) vi khuẩn ký hiệu A sau ngày ni cấy, lượng axít lactic sinh cao (20,34 g/l) Lượng axít sinh tăng dần từ ngày nuôi cấy thứ đạt mức cao vào ngày 3, ngày 4, sau giảm dần Hình Kết định lượng axít lactic sinh ngày nuôi cấy Hai chủng vi khuẩn ký hiệu A, B có lượng axít lactic sinh cao chọn để thực định danh phương pháp sinh học phân tử Khảo sát khả sinh axít acetic mẫu vi khuẩn phân lập từ hạt ca cao lên men tự nhiên Sau tiến hành thử phản ứng định tính axít acetic mẫu vi khuẩn phân lập được, xác định có mẫu vi khuẩn ký hiệu I, II, III phản ứng với NaOH FeCl3 cho màu đỏ thẫm, chứng tỏ có axít acetic sinh q trình ni cấy Kết định tính axít acetic dịng vi khuẩn ký hiệu I thể qua hình Hình Kết phản ứng định tính axít acetic a) đối chứng âm (-), b) vi khuẩn ký hiệu I, c) đối chứng dương (+) Kết định lượng axít acetic (hình 8) cho thấy, lượng axít sinh tăng dần qua ngày ni cấy Mẫu I có lượng axít acetic sinh cao đạt 29,4 g/l sau 13 ngày nuôi 60(8) 8.2018 cấy, tiếp đến mẫu III đạt 16,32 g/l sau 15 ngày nuôi cấy mẫu II đạt thấp với 10,1 g/l sau 15 ngày ni cấy Chọn mẫu I có lượng axít acetic sinh cao tiến hành định danh sinh học phân tử Hình Kết định lượng axít acetic sinh 15 ngày ni cấy Kết định danh sinh học phân tử mẫu vi khuẩn phân lập từ hạt ca cao lên men tự nhiên Quan sát đặc điểm hình thái tế bào, khuẩn lạc đặc điểm sinh hóa vi khuẩn phản ứng catalase, khả sinh axít lactic khả sinh axít acetic, chọn chủng có khả sinh axít cao tiến hành gửi mẫu định danh kỹ thuật sinh học phân tử (giải trình tự gen) chủng vi khuẩn Công ty Nam Khoa, kết quả: chủng phân lập vi khuẩn ký hiệu A thuộc chủng Lactobacillus plantarum, vi khuẩn ký hiệu B thuộc chủng Bacillus coagulans, vi khuẩn ký hiệu I thuộc chủng Acetobacter lovaniensis Đây chủng vi khuẩn thường gặp trình lên men hạt ca cao tự nhiên Kết nghiên cứu Ghana, phân lập chủng Lactobacillus plantarum diện trình lên men hạt ca cao [3] Nghiên cứu Malaysia [4] phân lập chủng Acetobacter lovaniensis diện trình lên men hạt ca cao Ngoài vi khuẩn Lactobacillus sp Acetobacter sp Bacillus sp tham gia vào q trình lên men góp phần tạo nên hương vị sôcôla Kết nghiên cứu [5] [6] phân lập chủng vi khuẩn Bacillus coagulans số chủng Bacillus B subtilis, B cereus, B megaterium Dựa vào kết khảo sát khả sinh axít định danh sinh học phân tử xác định chủng vi khuẩn Bacillus coagulans chủng vi khuẩn Lactobacillus plantarum chủng vi khuẩn sinh axít lactic cao (lần lượt 27,36 20,34 g/l), chủng Acetobacter lovaniensis chủng có khả sinh axít acetic cao (29,40 g/l) Vì chọn chủng vi khuẩn lactic Bacillus coagulans, Lactobacillus plantarum 58 Khoa học Kỹ thuật Công nghệ chủng vi khuẩn acetic Acetobacter lovaniensis tiến hành nhân sinh khối môi trường bán rắn Kết khảo sát mật số vi khuẩn Bacillus coagulans môi trường bán rắn Khả sinh trưởng, phát triển vi khuẩn Bacillus coagulans khác môi trường nuôi cấy khác Kết ghi nhận bảng cho thấy, vi khuẩn nuôi cấy môi trường 85% cám bắp + 15% cám gạo đạt mật số cao (1,61x1012 Cfu/g) thời điểm 48 Bảng Mật số vi khuẩn Bacillus coagulans môi trường bán rắn 72 nuôi cấy Thời gian nuôi cấy (giờ) Mật số vi khuẩn môi trường bán rắn (Cfu/g) 100% cám bắp 95% cám bắp + 5% cám gạo 90% cám bắp + 10% cám gạo 85% cám bắp + 15% cám gạo 24 1,14x1011 7,13x1010 5,70x1010 6,90x1010 48 1,48x1012 4,13x1011 2,60x1011 1,61x1012 72 4,10x1011 3,17x1011 2,57x1011 2,80x1011 Kết khảo sát mật số vi khuẩn Lactobacillus plantarum môi trường bán rắn Bảng Mật số vi khuẩn Acetobacter lovaniensis môi trường bán rắn 72 nuôi cấy Thời gian (giờ) Mật số vi khuẩn môi trường bán rắn (Cfu/g) 100% cám bắp 95% cám bắp + 5% cám gạo 90% cám bắp + 10% cám gạo 85% cám bắp +15% cám gạo 24 1,19x1010 5,57x108 1,62x1010 4,03x1010 48 1,92x10 1,39x10 2,19x10 7,17x1010 72 8,13x108 1,02x108 4,23x108 3,47x108 11 10 11 Kết luận Nghiên cứu phân lập tuyển chọn chủng vi khuẩn Bacillus coagulans, Lactobacillus plantarum có khả sinh axít lactic cao chủng Acetobacter lovaniensis có khả sinh axít acetic cao Mỗi chủng vi khuẩn sinh trưởng phát triển điều kiện môi trường nhân sinh khối khác Vi khuẩn Bacillus coagulans phát triển tốt môi trường 85% cám bắp + 15% cám gạo, vi khuẩn Lactobacillus plantarum phát triển tốt môi trường 90% cám bắp + 10% cám gạo, vi khuẩn Acetobacter lovaniensis phát triển tốt mơi trường 90% cám bắp + 10% cám gạo Thời gian nhân sinh khối tối ưu cho chủng vi khuẩn 48 Sau 72 nuôi cấy môi trường bán rắn khác nhau, kết cho thấy vi khuẩn Lactobacillus plantarum sinh trưởng, phát triển mạnh thời điểm 48 nuôi cấy môi trường 90% cám bắp + 10% cám gạo, mật số đạt 2,15x1010 Cfu/g (bảng 2) Kết tương tự nghiên cứu [7] thực nhân sinh khối vi khuẩn Lactobacillus plantarum môi trường gạo lức cám gạo, sau 48 nuôi cấy, vi khuẩn đạt mật số 2,5x1010 Cfu/g Xác định thành phần vai trò vi sinh vật tham gia vào trình lên men hạt ca cao cần thiết, sở thiết lập quy trình lên men có bổ sung chủng vi sinh vật thích hợp giúp tạo sản phẩm ca cao lên men có chất lượng cao ổn định Bảng Mật số vi khuẩn Lactobacillus plantarum môi trường bán rắn 72 nuôi cấy [2] E.O Afoakwa, A Paterson, M Fowler, A Ryan (2008), “Flavour formation and character in cocoa and chocolate: a crtical review”, Crit Rev Food Sci Nutr., 48, pp.840-857 Thời gian nuôi cấy (giờ) Mật số vi khuẩn môi trường bán rắn (Cfu/g) 24 1,07x109 1,47x109 2,14x1010 3,67x109 48 1,53x1010 5,57x109 2,15x1010 1,49x1010 72 1,48x1010 3,20x109 4,67x109 1,35x1010 100% cám bắp 95% cám bắp + 5% cám gạo 90% cám bắp + 10% cám gạo 85% cám bắp + 15% cám gạo Kết khảo sát mật số vi khuẩn Acetobacter lovaniensis môi trường bán rắn Qua kết bảng cho thấy, mật số vi khuẩn Acetobacter lovaniensis nghiệm thức 90% cám bắp + 10% cám gạo sau 48 nuôi cấy đạt mật số cao 2,19x1011 Cfu/g 60(8) 8.2018 TÀI LIỆU THAM KHẢO [1] Lương Đức Phẩm (2004), Công nghệ vi sinh vật, Nxb Nông nghiệp, tr.243-287 [3] L Jespersen, D.S Nielsen, S Honholt, and M Jakobsen (2005), “Occurrence and diversity of yeasts involved in fermentation of West African cocoa beans”, FEMS Yeast Res., 5, pp.441-453 [4] J.G Carr, P.A Davies, and J Dougan (1979), Cocoa fermentation in Ghana and Malaysia, in Proc, 7th Int, Cocoa Ré Conf., pp.6-573 [5] M.M Ardhana, and G.H Fleet (2003), “The microbial ecology of cocoa bean fermentations in Indonesia”, J Food Microbiol., 86, pp.87-99 [6] Rosane F Schwan, Alan E Wheals (2004), “The microbiology of Cocoa fermentation and its role in chocolate quality”, Food Science and Nutrition, 44, pp.1-17 [7] Premsuda Saman1, Pablo Fuciños2, José A Vázquez3 and Severino S Pandiella1 (2009), “Fermentability of Brown Rice and Rice Bran for Growth of Human Lactobacillus plantarum NCIMB 8826”, Food Technol Biotechnol., 49(1), pp.128-132 59 Khoa học Kỹ thuật Công nghệ Khảo sát hàm lượng polyphenol khả kháng oxy hóa dịch trái giác (Cayratia trifolia) trước sau lên men sử dụng nấm men chịu nhiệt Saccharomyces cerevisiae HG1.3 Đoàn Thị Kiều Tiên1,2, Huỳnh Thị Ngọc Mi1, Nguyễn Đức Độ1, Hà Thanh Toàn1, Ngô Thị Phương Dung1* Viện Nghiên cứu Phát triển Công nghệ sinh học, Trường Đại học Cần Thơ Khoa Công nghệ thực phẩm Công nghệ sinh học, Trường Đại học Kỹ thuật - Công nghệ Cần Thơ Ngày nhận 13/4/2018; ngày chuyển phản biện 16/4/2018; ngày nhận phản biện 15/5/2018; ngày chấp nhận đăng 21/5/2018 Tóm tắt: Trái giác chứa nhiều hợp chất có hoạt tính sinh học cao, có khả kháng oxy hóa, giảm tăng trưởng khối u sử dụng làm dược liệu nguồn nguyên liệu tốt để lên men rượu vang Nghiên cứu nhằm mục đích khảo sát hàm lượng polyphenol khả kháng oxy hóa dịch trái giác trước sau lên men, góp phần mở rộng nguồn nguyên liệu cho sản xuất rượu vang, sản phẩm phổ biến Kết phân tích 53 mẫu trái giác thu 13 tỉnh/thành phố thuộc Đồng sông Cửu Long (ĐBSCL) cho thấy: hàm lượng đường khử trái giác đạt từ 0,22 đến 0,96 mg/100 ml, hàm lượng polyphenol đạt từ 0,47 đến 1,54 mg GAE/ml khả kháng oxy hóa từ 16,61 đến 82,86% Thử nghiệm trình lên men rượu vang từ nguồn nguyên liệu trái giác thu tỉnh Cà Mau Kiên Giang sử dụng chủng nấm men chịu nhiệt Saccharomyces cerevisiae HG1.3 cho kết quả: hàm lượng polyphenol khả kháng oxy hóa dịch trái giác trước sau lên men ổn định, khác biệt không ý nghĩa mức 5% (p

Ngày đăng: 16/04/2021, 23:05