Khóa luận Nghiên cứu đa dạng di truyền nguồn gen dây thường xuân (Hedera nepalensis K. Koch) ở miền Bắc Việt Nam dựa trên chỉ thị matK

61 trang thiennha21 9410

Download

Bạn đang xem 20 trang mẫu của tài liệu "Khóa luận Nghiên cứu đa dạng di truyền nguồn gen dây thường xuân (Hedera nepalensis K. Koch) ở miền Bắc Việt Nam dựa trên chỉ thị matK", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

khoa_luan_nghien_cuu_da_dang_di_truyen_nguon_gen_day_thuong.pdf

Nội dung text: Khóa luận Nghiên cứu đa dạng di truyền nguồn gen dây thường xuân (Hedera nepalensis K. Koch) ở miền Bắc Việt Nam dựa trên chỉ thị matK

ĐẠI HỌC QUỐC GIA HÀ NỘI KHOA Y DƯỢC  ĐỖ HẠNH NGUYÊN NGHIÊN CỨU ĐA DẠNG DI TRUYỀN NGUỒN GEN DÂY THƯỜNG XUÂN (Hedera nepalensis K. Koch) Ở MIỀN BẮC VIỆT NAM DỰA TRÊN CHỈ THỊ matK KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƯỢC HỌC Hà Nội - 2020
ĐẠI HỌC QUỐC GIA HÀ NỘI KHOA Y DƯỢC  Người thực hiện: ĐỖ HẠNH NGUYÊN NGHIÊN CỨU ĐA DẠNG DI TRUYỀN NGUỒN GEN DÂY THƯỜNG XUÂN (Hedera nepalensis K. Koch) Ở MIỀN BẮC VIỆT NAM DỰA TRÊN CHỈ THỊ matK KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC (NGÀNH DƯỢC HỌC) Khóa : QH2015.Y Người hướng dẫn Lời c: ảThS.m ơn Ph ạm Thị Hồng Nhung Để hoàn thành khóa luận, tôi đã nhận được rất nhiều sự giúp đỡ quý bạn Hà Nội - 2020
LỜI CẢM ƠN Để hoàn thành khóa luận, tôi đã nhận được rất nhiều sự giúp đỡ quý báu cả về vật chất lẫn tinh thần, về những kinh nghiệm và kiến thức chuyên môn của các thầy cô, bạn bè và gia đình. Lời đầu tiên, tôi xin bày tỏ sự kính trọng và lòng biết ơn sâu sắc tới ThS. Phạm Thị Hồng Nhung – Giảng viên Khoa Y Dược – Đại học Quốc gia Hà Nội, người tận tình chỉ bảo và hướng dẫn tôi trong suốt quá trình nghiên cứu đề tài và hoàn thành khóa luận này. Tôi xin cảm ơn ThS. Đỗ Thị Lệ Hằng và bạn Bùi Thị Yến đã hỗ trợ và giúp đỡ tôi trong quá trình thực nghiệm. Các cô, các bạn không chỉ trang bị cho tôi kiến thức, mà còn truyền cho tôi niềm đam mê, lòng nhiệt huyết, sự kiên trì và luôn sẵn sàng giúp đỡ mỗi khi tôi gặp khó khăn. Tôi xin chân thành cảm ơn các thầy cô giáo Bộ môn Y Dược học cơ sở đã hết lòng quan tâm, giúp đỡ và tạo điều kiện tốt nhất cho tôi thực hiện nghiên cứu và hoàn thành khóa luận tốt nghiệp này. Tôi cũng xin cảm ơn những cán bộ tại Viện Dược liệu - Bộ Y tế đã không quản ngại khó khăn thu thập và cung cấp mẫu vật giúp đỡ tôi thực hiện đề tài một cách thuận lợi nhất. Tôi xin gửi lời cảm ơn tới Ban chủ nhiệm khoa, cùng toàn thể các thầy cô giáo Khoa Y Dược - Đại học Quốc gia Hà Nội đã cho tôi những kiến thức quý báu trong quá trình học tập tại nhà trường. Chúng tôi trân trọng cảm ơn sự tài trợ kinh phí của Bộ Khoa học và Công nghệ Việt Nam cho đề tài mã số NVQG-2018/02 do PGS.TS Đinh Đoàn Long chủ trì để thực hiện nghiên cứu này. Cuối cùng, tôi xin được bày tỏ lòng biết ơn và sự yêu thương đến gia đình và bạn bè đã luôn ở bên cổ vũ, động viên và tạo mọi điều kiện giúp đỡ tôi trong thời gian học tập và thực hiện đề tài khóa luận này. Xin chân thành cảm ơn! Hà Nội, ngày 09 tháng 06 năm 2020 Tác giả Đỗ Hạnh Nguyên
DANH MỤC TỪ VIẾT TẮT bp Cặp bazơ (base pair) DNA Axit deoxyribonucleic (Deoxyribonucleic acid) dNTP Deoxyribonucleotide 5’ triphosphate GBSSI Gen mã hóa enzyme tạo liên kết hạt (Granule-Bound Starch Synthase) Genbank Ngân hàng dữ liệu gen quốc tế H.helix Thường xuân (Hedera helix L.) H.nepalensis Dây thường xuân (Hedera nepalensis K.Koch) ITS Vùng sao chép nội bộ (Internal transcribed spacer) Kit Thermo GeneJET Plant Genomic DNA Purification Mini Kit (Thermo Scientific, Mỹ) matK Maturase K ML Maximum Likelihood NCBI Trung tâm Thông tin Công nghệ sinh học Quốc gia (National Center for Biotechnology Information) OD Mật độ quang học (Optical Density) PCR Phản ứng chuỗi trùng hợp (Polymerase Chain Reaction) RNA Axit ribonucleic (Ribonucleic acid) TrnK Translocated tRNA-Lys gene UPGMA Unweighted PairGroup with Method using arthmetic Averages
DANH MỤC CÁC BẢNG Trang Bảng 1.1. Một số cặp mồi được sử trong nghiên cứu phân loại 9 Bảng 1.2. Các tác dụng dược lý của H. nepalensis 20 Bảng 2.1. Thông tin mẫu thực vật dùng trong nghiên cứu 21 Bảng 3.1. Nồng độ DNA tổng số của các mẫu nghiên cứu 26 Bảng 3.2. Các thành phần và chu trình nhiệt của phản ứng PCR nhân dòng đoạn gen matK 30 Bảng 3.3. Các trình tự tham chiếu lấy từ Genbank sử dụng trong nghiên cứu 31 Bảng 3.4. Phân nhóm các mẫu trong nghiên cứu 32 Bảng 3.5. Khoảng cách di truyền (phía dưới bên trái) và số lượng nucleotide sai khác (phía tên bên phải) giữa 03 haplotype với 03 trình tự tham chiếu 32 Bảng 4.1. Trình tự các mồi của gen matK được sử dụng trong các nghiên cứu về chi Hedera trên thế giới 43
DANH MỤC CÁC HÌNH Trang Hình 1.1. Vị trí của gen matK 11 Hình 1.2. Đặc điểm hình thái Dây thường xuân 17 Hình 1.3. Phân bố địa lý của Dây thường xuân ở miền Bắc Việt Nam. 18 Hình 2.1. Sơ đồ thiết kế nghiên cứu 23 Hình 3.1. Ảnh điện di DNA tổng số trên gel agarose 1,2% 26 Hình 3.2. Tối ưu nhiệt độ gắn mồi phản ứng nhân dòng gen matK 28 Hình 3.3. Tối ưu nồng độ DNA phản ứng nhân dòng gen matK 29 Hình 3.4. Tối ưu nồng độ mồi phản ứng nhân dòng gen matK 29 Hình 3.5. Kết quả PCR nhân dòng đoạn gen matK 30 Hình 3.6. Kết quả hiển thị giải trình tự của mẫu đại diện H4 của gen matK qua phần mềm BioEdit 31 Hình 3.7. So sánh trình tự đoạn gen matK của các haplotype nghiên cứu với các trình tự tham chiếu 33 Hình 3.8. Cây phát sinh chủng loại xây dựng bằng phương pháp UPGMA của 03 haplotype nghiên cứu với 03 trình tự tham chiếu dựa trên chỉ thị matK 34 Hình 3.9. Cây phát sinh chủng loại xây dựng bằng phương pháp Maximum Likelihood của 03 haplotype nghiên cứu với 03 trình tự tham chiếu dựa trên chỉ thị matK 35 Hình 3.10. Cây phát sinh chủng loại xây dựng bằng phương pháp UPGMA của 03 haplotype nghiên cứu với trình tự các loài Hedera dựa trên chỉ thị matK 36
MỤC LỤC Trang ĐẶT VẤN ĐỀ 1 CHƯƠNG 1. TỔNG QUAN TÀI LIỆU 3 1.1. Đa dạng và phân loại sinh học 3 1.1.1. Khái niệm đa dạng sinh học 3 1.1.2. Đa dạng di truyền 3 1.1.3. Thực trạng đa dạng sinh học tại Việt Nam 4 1.1.4. Các phương pháp phân loại học 5 1.2. Công cụ phân tích đa dạng di truyền và tiến hóa 8 1.2.1. Tổng quan về mã vạch DNA 8 1.2.2. Ứng dụng của mã vạch DNA ở thực vật 9 1.2.3. Vùng gen lục lạp matK (maturase K) 11 1.3. Phân tích phát sinh gen (Phylogenetic Analysis) 12 1.3.1. Lựa chọn trình tự sinh học 12 1.3.2. Sắp xếp đa chuỗi 13 1.3.3. Lựa chọn mô hình tiến hóa 13 1.3.4. Xây dựng cây phát sinh loài 14 1.3.5. Đánh giá cây phát sinh loài 15 1.4. Tổng quan về loài Dây thường xuân (Hedera nepalensis K.Koch) 15 1.4.1. Đặc điểm hình thái chung của loài Dây thường xuân 15 1.4.2. Đặc điểm phân bố, sinh thái 18 1.4.3. Thành phần hóa học 19 1.4.4. Tác dụng dược lý 19 CHƯƠNG 2. ĐỐI TƯỢNG & PHƯƠNG PHÁP NGHIÊN CỨU 21 2.1. Đối tượng nghiên cứu 21 2.1.1. Đối tượng 21 2.1.2. Tiêu chuẩn lựa chọn mẫu 21 2.2. Thời gian, địa điểm nghiên cứu 22 2.3. Dụng cụ, trang thiết bị và hóa chất nghiên cứu 22 2.3.1. Hóa chất 22
2.3.2. Trang thiết bị 23 2.4. Phương pháp nghiên cứu 23 2.4.1. Tách chiết DNA tổng số 24 2.4.2. Khuếch đại đoạn gen đích bằng kỹ thuật PCR 24 2.4.3. Tinh sạch và giải trình tự 25 2.4.4. Xử lý số liệu và phân tích kết quả 25 CHƯƠNG 3. KẾT QUẢ NGHIÊN CỨU 26 3.1. Tách chiết DNA tổng số 26 3.2. Kết quả tối ưu hóa quy trình nhân dòng đoạn gen matK bằng kỹ thuật PCR 27 3.2.1. Tối ưu quy trình PCR 27 3.2.2. Kết quả nhân dòng gen matK từ các mẫu thực vật 29 3.3. Giải trình tự 31 3.4. Độ tương đồng của trình tự gen matK được khuếch đại 31 3.5. Cây phát sinh chủng loại dựa trên vùng gen matK 34 CHƯƠNG 4. BÀN LUẬN 38 4.1. Kết quả xây dựng quy trình phân tích đoạn gen matK 38 4.1.1. Tách chiết DNA tổng số 38 4.1.2. Khuếch đại đoạn gen matK 39 4.1.3. Giải trình tự và so sánh độ tương đồng 40 4.2. Nghiên cứu đa dạng di truyền nguồn gen Dây thường xuân sử dụng mã vạch matK 40 4.2.1. Khoảng cách di truyền 40 4.2.2. Phân tích đa dạng di truyền nguồn gen Dây thường xuân ở miền Bắc Việt Nam 41 KẾT LUẬN VÀ KIẾN NGHỊ 47 TÀI LIỆU THAM KHẢO
ĐẶT VẤN ĐỀ Việt Nam nằm trong vùng khí hậu nhiệt đới ẩm gió mùa nên có hệ thực vật phong phú và đa dạng, trong đó đặc biệt phải kể đến nhóm tài nguyên cây thuốc. Theo kết quả điều tra của Viện Dược liệu, Việt Nam có 3948 loài thực vật bậc cao, bậc thấp và nấm lớn được dùng làm thuốc [2]. Tuy nhiên, phần lớn các cây thuốc được sử dụng theo kinh nghiệm dân gian hoặc theo Y học cổ truyền mà chưa được nghiên cứu một cách chuyên sâu và đầy đủ. Vì vậy, cần có thêm nhiều nghiên cứu đánh giá chính xác mức độ đa dạng di truyền của các loài cây thuốc nhằm định hướng bảo tồn, chọn, tạo và nhân giống để đáp ứng yêu cầu phát triển của nền công nghiệp chế biến dược liệu bền vững. Trong hệ thực vật đó, Hedera (L.) là một chi thuộc họ Nhân sâm (Araliaceae) trên thế giới đã ghi nhận 16 loài, một số loài được biết có giá trị làm thuốc [15]. Trong số đó, 2 loài đến nay được sử dụng rộng rãi và nghiên cứu nhiều hơn cả về dược học là Thường xuân - H. helix và Dây thường xuân - H. nepalensis đều có phạm vi phân bố tương đối hẹp trên thế giới. Theo đó H. helix được tìm thấy chủ yếu ở Châu Âu và một phần Nam Á, còn H. nepalensis được phát hiện phân bố ở các nước châu Á như: Trung Quốc, Ấn Độ, Pakistan, Nepal, Thái Lan, Ở Việt Nam, loài này được báo cáo xuất hiện tại một số tỉnh vùng núi phía Bắc như Lào Cai, Hà Giang, H. helix đã được các nhà khoa học trên thế giới chứng minh có nhiều tác dụng dược lý trong điều trị các bệnh về hô hấp, nhiễm khuẩn, bảo vệ gan và đã được phát triển thành thuốc điều trị viêm đường hô hấp cấp và mạn tính (Prospan). Trong khi đó ở Việt Nam, Dây thường xuân (H. nepalensis) chủ yếu được dùng làm cây cảnh và chưa có một nghiên cứu nào về thành phần hoá học và tác dụng dược lý. Trong Dây thường xuân có chứa các hợp chất n-hexan và ethyl acetate có tác dụng chống ung thư [55], ngoài ra còn chứa lupeol, một triterpenoid có hoạt tính ức chế dipeptidyl peptidase-4 với tiềm năng chữa bệnh tiểu đường [40, 83]. Không chỉ vậy, nhiều nghiên cứu đã chứng minh rằng H. nepalensis có tác dụng bảo vệ thần kinh [40], chống viêm, giảm đau, chống đông máu và chống trầm cảm [52]. Với những tiềm năng dược lý như vậy, song hiện nay chưa có nhiều nghiên cứu về H. nepalensis, đặc biệt là các nghiên cứu đánh giá tiềm năng đa dạng sinh học phục vụ công tác bảo tồn, khai thác và phát triển nguồn gen. Chúng tôi cho rằng việc phân tích đa dạng di truyền nguồn gen Dây thường xuân là thực sự cần thiết nhất là khi phạm vi phân bố tự nhiên của loài này trên thế giới tương đối hạn chế. Ngoài yêu 1
cầu đánh giá đa dạng di truyền nguồn gen Dây thường xuân ở Việt Nam, định loại chính xác loài để từ đó có chiến lược bảo tồn, khai thác và phát triển cũng là vấn đề nghiên cứu cấp thiết hiện nay. Trên thế giới, việc sử dụng các chỉ thị DNA ngày càng được dùng rộng rãi trong các nghiên cứu phân loại, phân tích đa dạng sinh học, xác định khoảng cách di truyền và đặc trưng cá thể và quần thể thực vật nhằm mục đích bảo tồn và chọn giống. So với các chỉ thị truyền thống (chỉ thị hình thái và chỉ thị hóa học), thì chỉ thị DNA mang những ưu điểm nổi bật: dễ thực hiện trong điều kiện phòng thí nghiệm, không phụ thuộc vào các yếu tố môi trường và hiện tượng tương tác gen, có thể xác định được các biến dị DNA trong các giai đoạn khác nhau và ở các cơ quan khác nhau của thực vật. Để phục vụ cho nghiên cứu này, chúng tôi sử dụng chỉ thị phân tử là matK (maturase K) trong vùng gen lục lạp làm công cụ giúp xây dựng cây phát sinh loài. Mã vạch này là chỉ thị phân tử nổi bật được ứng dụng thành công trong nhiều nghiên cứu giúp phân tích đa dạng di truyền và định danh nhiều loài thực vật, có thể kể đến như chi Panax, chi Alium[14], họ Valerianaceae [46] hay chi Dalbergia [22], Nhưng câu hỏi được đặt ra là liệu matK có phải là chỉ thị DNA thích hợp để phân tích đa dạng di truyền loài Dây thường xuân hay không? Chính vì vậy, chúng tôi thực hiện đề tài “Nghiên cứu đa dạng di truyền nguồn gen Dây thường xuân (Hedera nepalensis K.Koch) ở miền Bắc Việt Nam dựa trên chỉ thị matK”. Nghiên cứu này hướng đến hai mục tiêu: 1. Xây dựng được quy trình nhân dòng đoạn gen matK của Dây thường xuân. 2. Xây dựng cây phát sinh chủng loại dựa vào chỉ thị matK và dùng chỉ thị này để đánh giá mức độ đa dạng di truyền nguồn gen Dây thường xuân thu thập ở miền Bắc Việt Nam. Để thực hiện được mục tiêu nghiên cứu này, chúng tôi tiến hành các nội dung nghiên cứu sau: 1. Tách DNA tổng số thu từ mẫu lá khô Dây thường xuân 2. Tối ưu phản ứng PCR và tiến hành nhân dòng đoạn gen matK 3. Giải trình tự vùng gen matK được nhân dòng 4. Xây dựng cây phát sinh chủng loại dựa trên chỉ thị matK 2
CHƯƠNG 1. TỔNG QUAN TÀI LIỆU 1.1. Đa dạng và phân loại sinh học 1.1.1. Khái niệm đa dạng sinh học Năm 1982, định nghĩa của Wilcox “Đa dạng sinh học là sự đa dạng của các dạng sống ở tất cả các cấp độ của hệ thống sinh học” được đưa ra bởi Liên minh quốc tế về bảo tồn tài nguyên và tự nhiên (IUCN). Đến năm 1984, Wilcox cho rằng đa dạng sinh học có thể được định nghĩa về mặt di truyền là sự đa dạng của các alen, gen của sinh vật. Cho đến năm 1992, một định nghĩa khác được quốc tế công nhận và được sử dụng trong Công ước Liên hợp Quốc về đa dạng sinh học: Đa dạng sinh học là sự biến đổi sinh vật sống từ tất cả các nguồn bao gồm các hệ sinh thái và các phức hợp sinh thái mà chúng là một phần: bao gồm sự đa dạng trong loài (đa dạng di truyền, đa dạng gen), giữa loài (đa dạng loài) và hệ sinh thái (đa dạng hệ sinh thái) [41]. Ngoài ra, trong cuốn sách “Biodiversity: an introduction”, Gaston và Spicer định nghĩa “Đa dạng sinh học là sự biến đổi của sự sống ở tất cả các cấp độ tổ chức sinh học” [35]. Đa dạng sinh học thường được sử dụng để thay thế các thuật ngữ đa dạng loài và sự phong phú của loài. Các nhà sinh học thường định nghĩa đa dạng sinh học là “tổng số gen, loài và hệ sinh thái của một khu vực” [67]. Định nghĩa này có lợi thế trong việc bao trùm tất cả các trường hợp và trình bày một quan điểm thống nhất về các loại sinh học truyền thống bao gồm: đa dạng phân loại (cấp độ loài), đa dạng sinh thái (dưới góc độ hệ sinh thái), đa dạng hình thái (bắt nguồn từ đa dạng di truyền và đa dạng phân tử) và đa dạng chức năng (thước đo số lượng các loài khác nhau về chức năng trong quần thể). Đa dạng sinh học có vai trò quan trọng trong việc phát triển kinh tế, xã hội và môi trường, là cơ sở đảm bảo an ninh lương thực; duy trì nguồn gen vật nuôi, cây trồng; cung cấp các vật liệu cho xây dựng và các nguồn nguyên liệu và dược liệu. 1.1.2. Đa dạng di truyền Đa dạng di truyền là sự đa dạng ở cấp độ phân tử về thành phần gen giữa các cá thể trong cùng một loài và giữa các loài khác nhau; là sự đa dạng về gen có thể di truyền được trong một quần thể hoặc giữa các quần thể, tồn tại trong một loài và giữa các loài khác nhau. Đa dạng di truyền là cơ chế giúp sinh vật tồn tại trong những điều kiện khác nhau nên cần thiết cho tất cả các sinh vật để duy trì nòi giống. Thông qua đa dạng di truyền, sinh vật tạo nên những cơ chế mới, kháng lại các loại dịch bệnh và thích nghi với biến đổi môi trường [34]. Mỗi loài có chứa những gen 3
riêng biệt thể hiện đặc tính riêng của nó như một cách để các quần thể có thể thích nghi được với môi trường sống thay đổi. Với các áp lực như: chọn lọc nhân tạo, môi trường sống khắc nghiệt, một số cá thể trong một quần thể sẽ có cơ hội cao hơn trong việc sở hữu những biến dị alen phù hợp với môi trường giúp duy trì nòi giống có alen đó. Quần thể đó sẽ tiếp tục có thêm nhiều thế hệ nhờ sự thành công của những cá thể này. Đa dạng di truyền là phân mức cơ bản nhất trong đa dạng sinh học, tạo nên sự khác biệt của các cá thể trong quần thể. Đa dạng sinh học dù trong phạm vi một loài hay giữa các loài và các hệ sinh thái với nhau thì cũng đều xuất phát từ đa dạng di truyền. Nghiên cứu về đa dạng di truyền cũng là các nghiên cứu cơ bản và chính xác nhất về sự khác biệt giữa các loài. Tuy nhiên, đa dạng di truyền vẫn chưa được quan tâm đúng mức mặc dù loại đa dạng này chính là nền tảng cho sự đa dạng của sinh giới [5]. Ứng dụng của nghiên cứu đa dạng di truyền bao gồm: Bảo tồn nguồn gen; Lai tạo giống mới và Nghiên cứu tiến hóa. 1.1.3. Thực trạng đa dạng sinh học tại Việt Nam Việt Nam đứng thứ 16 về mức độ đa dạng sinh học trên thế giới và được biết đến như một trung tâm đa dạng sinh học với các hệ sinh thái tự nhiên phong phú và sự giàu có về các loài và nguồn gen sinh vật. Trong đó, đã xác định được khoảng 49200 loài sinh vật bao gồm: khoảng 7500 chủng vi sinh vật; 20000 loài thực vật trên cạn và dưới nước; 10500 loài động vật trên cạn; 2000 loài động vật không xương sống và cá sống ở nước ngọt; khoảng trên 11000 loài sinh vật biển. Đặc biệt, một bộ phận lớn của các giống thực vật, động vật này có các đặc tính quý chỉ có ở nước ta, nên tiềm năng phát triển và đem lại giá trị kinh tế rất cao [6]. Việt Nam có số lượng lớn nguồn gen dược liệu, sở hữu nhiều loài dược liệu quý hiếm và là nơi có nguồn đa dạng sinh học phong phú. Tuy nhiên, những sản phẩm từ dược liệu quý của nước ta chưa trở thành hàng hóa có giá trị cao và chưa được sử dụng rộng rãi trong cộng đồng. Cũng như nhiều quốc gia khác trên thế giới, Việt Nam đang đối diện với nguy cơ suy thoái đa dạng sinh học và sự mất cân bằng sinh thái diễn ra mạnh mẽ. Tài nguyên đa dạng sinh học đang trên đà suy giảm một cách đáng báo động, các hệ sinh thái bị thu hẹp, suy giảm và bị chia cắt, nguồn gen bị thất thoát, mai một. Nguyên nhân là do áp lực của gia tăng dân số kéo theo tài nguyên sinh vật bị khai thác quá mức và không được tái tạo. Ngoài ra, công tác bảo tồn còn nhiều bất cập, hệ thống các quy định pháp luật về bảo tồn đa dạng sinh học chưa đồng bộ. Vì vậy, vấn đề cấp thiết hiện nay là cần phải bảo tồn và phát triển nguồn gen. 4
1.1.4. Các phương pháp phân loại học Phân loại học là lĩnh vực sinh học liên quan đến xác định, đặt tên và phân loại các loài. Phân loại học là quá trình các nhà khoa học nhóm các sinh vật sống dựa trên mức độ giống nhau của chúng nhằm phản ánh sự liên quan tiến hóa của các sinh vật và các nhóm sinh vật. Trong lịch sử, sự giống nhau được xác định bằng cách kiểm tra các đặc điểm vật lý, hóa học. Theo truyền thống những đặc điểm này có thể quan sát bằng hình thái nhưng với sự ra đời và phát triển của giải trình tự gen, trình tự DNA và các dấu hiệu phân tử cũng được sử dụng để phân loại, định danh các loài. 1.1.4.1. Phương pháp phân loại học truyền thống Phân loại học truyền thồng gồm 2 phân loại là phân loại dựa trên các chỉ thị hình thái và dựa vào các chỉ thị hóa học (như sắc ký lớp mỏng - TLC hay sắc ký lớp mỏng hiệu năng cao – HPLC, ). Trong đó, phân loại học hình thái được sử dụng phổ biến hơn và đóng vai trò quan trọng trong lĩnh vực phân loại học. Phân loại học hình thái dựa trên sự tương đồng rõ ràng nhất giữa các loài và đã được đưa ra từ rất lâu trước khi ý tưởng về sự tiến hóa xuất hiện. Phân loại học này chủ yếu dựa trên sự khác biệt đặc điểm hình thái các cơ quan của thực vật, đặc biệt là hoa (cơ quan sinh sản). Phương pháp phân loại học hình thái có lịch sử lâu đời và nhờ vào phương pháp này mà hệ thống phân loại thực vật được hoàn thiện khá đầy đủ. Ưu điểm của nó là có thể phân biệt các loài dựa trên sự quan sát các đặc điểm bên ngoài, dễ ứng dụng và thân thiện với nhiều đối tượng. Tuy nhiên, nhược điểm của phương pháp này là sẽ gặp khó khăn khi phân loại các mẫu đang trong giai đoạn phát triển (chưa ra hoa) hoặc có các đặc điểm hình thái giống nhau do cùng sinh trưởng và phát triển trong cùng một điều kiện môi trường địa lý hay có nhiều điểm tương đồng do ở mức độ phân loại thấp như loài và dưới loài [57]. Không chỉ vậy, phương pháp này thường được sử dụng bởi các chuyên gia hình thái và cần một khoảng thời gian tương đối dài và tốn nhiều công sức [42]. Dù còn tồn tại nhiều nhược điểm nhưng không thể phủ nhận tầm quan trọng của phân loại học hình thái trong lĩnh vực phân loại học hiện nay. 1.4.1.2. Phương pháp phân loại học hiện đại Để khắc phục những nhược điểm của phương pháp phân loại học truyền thống, hiện nay các nhà khoa học đã xây dựng nhiều phương pháp phân loại học mới, trong đó: 5
Phân loại học phân tử Với sự phát triển của sinh học phân tử vào những năm 1990 cùng với thành công của việc giải trình tự gen, phân loại học phân tử được hình thành. Phương pháp phân loại này dựa trên việc phân tích các dữ liệu về gen (DNA) trong hoặc ngoài nhân hoặc cả hệ gen hay các sản phẩm của chúng như protein, enzyme. Từ đó giúp định danh và xây dựng mối quan hệ tiến hóa và di truyền giữa các loài. Tùy vào mục đích nghiên cứu, có thể lựa chọn một trong các công cụ DNA hay protein. Các kỹ thuật sinh học phân tử được sử dụng gồm: giải trình tự DNA, đa hình các đoạn DNA nhân bản ngẫu nhiên (Random Amplified Polymorphic DNA), đa hình chiều dài các đoạn cắt giới hạn (Restriction Fragment Length Polymorphism) hay kỹ thuật đồng enzyme (isozyme), [10] Các kỹ thuật này đã được ứng dụng thành công trong việc phân loại, định danh và xác định mối quan hệ tiến hóa của nhiều loài sinh vật và ngày càng cho thấy những lợi ích thiết thực. So với phân loại học truyền thống thì phương pháp này giúp quá trình xác định các loài trở nên nhanh, chính xác và ít tốn kém hơn [9]. Mục tiêu chính của phân loại học phân tử là: (i) Xác định mối quan hệ phân cấp giữa các loài hiện có theo mối quan hệ tiến hóa của chúng. Vì vậy, các sinh vật có chung một tổ tiên chung được nhóm lại sớm hơn so với những sinh vật có tổ tiên chung xa hơn. (ii) Ước tính thời gian phân kỳ giữa các loài, tức là thời gian tồn tại của tổ tiên chung gần nhất. Phân loại học hiện trạng số (Numerical taxonomy) Phân loại học hiện trạng số là một hệ thống phân loại cho phép so sánh số lượng lớn các đặc điểm (từ 60 dấu hiệu trở lên) cho số lượng lớn các chủng bằng cách phân tích bộ dữ liệu được tạo ra bằng máy tính. Phương pháp này áp dụng các quy trình toán học khác nhau cho dữ liệu trạng thái ký tự được mã hóa số. Nó nhằm mục đích tạo ra một phân loại sử dụng các thuật toán số như phân tích cụm thay vì sử dụng đánh giá chủ quan các thuộc tính. Các bộ dữ liệu về ma trận cho thấy mức độ tương đồng giữa từng cụm rồi từ đó tạo thành một bức tranh chung về đặc điểm kiểu hình của một nhóm cụ thể. Khái niệm này được đưa ra lần đầu tiên bởi Robert R. Sokal và Peter HA Sneath vào năm 1963 [87], sau đó được xây dựng và phát triển bởi cùng nhóm tác giả [86]. Ưu điểm của phương pháp này là dữ liệu phân loại được thu thập từ nhiều nguồn khác nhau, như hình thái, hóa học, sinh lý, Sự trợ giúp của hệ thống dữ liệu điện tử cho phép nhiều công việc phân loại được thực 6
hiện. Tuy nhiên, vẫn tồn tại nhược điểm bao gồm: Đối xử với sinh vật như những đối tượng phi sinh vật; Loại trừ yếu tố tiến hóa, không phân loại được phát sinh gen; Sự lựa chọn trọng số ngầm định hoặc rõ ràng của các đặc điểm bị ảnh hưởng bởi dữ liệu sẵn có và lợi ích của điều tra viên. Phân loại số đã được áp dụng thành công trong các nghiên cứu về sự tương đồng và khác biệt ở vi khuẩn và một số nhóm động vật, phân định một số chi như Oryza, Sarcostemma Solarium. Phân loại học PhyloCode PhyloCode hay còn gọi là Bộ luật danh pháp phát sinh quốc tế (International Code of Phylogenetic Nomenclature) là một dự thảo phát triển một bộ chính thức của quy tắc chi phối danh pháp phát sinh loài [85]. Khác với phân loại học truyền thống, PhyloCode không chia thành nhiều thứ hạng phân loại (như bộ, họ, chi, loài, ) mà chỉ gồm các bậc tiến hóa được xác định bởi các đặc điểm tổ tiên và các đặc điểm phân ly từ tổ tiên ban đầu từ đó tạo thành các nhánh tiến hóa đơn dòng [9]. Tất cả các bậc tiến hóa hình thành trong một nhánh đều được xác định như các loài, không có thứ hạng trên loài như trong phân loại học truyền thống. Ưu điểm của phương pháp này là cho phép đặt tên các cấp bậc trung gian; Cải thiện sự ổn định danh pháp; Tạo điều kiện cho việc đặt tên của các nhánh mới khi chúng được phát hiện; Cho phép loại bỏ các cấp bậc phân loại, loại bỏ khía cạnh chủ quan nhất của phân loại truyền thống và được áp dụng ở tất cả các cấp độ của phân loại. Tuy nhiên, PhyloCode còn gây nhiều tranh cãi và chưa được sử dụng rộng rãi [73]. Cận phân loại học (Parataxonomy) Cận phân loại học là một hệ thống phân công lao động sử dụng trong nghiên cứu đa dạng sinh học. Trong đó các nhiệm vụ sắp xếp sơ bộ của việc thu thập mẫu, nhận dạng và bảo quản được thực hiện bởi người ít chuyên môn hơn do đó giảm bớt khối lượng công việc cho các chuyên gia phân loại học. Phương pháp này được sử dụng để cải thiện hiệu quả và đẩy nhanh tốc độ phân loại [19]. Xu hướng của cận phân loại học không phân loại sinh vật thành các loài theo những nguyên tắc chung mà phân thành các đơn vị phân loại có thể thừa nhận dựa trên những đặc điểm dễ nhận biết bằng mắt thường [9]. Tuy nhiên, không thể sử dụng Parataxonomy vào việc thống kê sinh vật như trong phân loại học mà chỉ nên coi là một biện pháp kỹ thuật hỗ trợ phân loại học chứ không thể thay thế phân loại hoc truyền thống. 7
1.2. Công cụ phân tích đa dạng di truyền và tiến hóa 1.2.1. Tổng quan về mã vạch DNA Để định danh loài cũng như phân tích mối quan hệ di truyền và tiến hóa, các nhà khoa học thường sử dụng chỉ thị phân tử như dấu vân tay DNA (DNA fingerprinting), PCR RFLP (sử dụng enzyme giới hạn kết hợp với lai DNA) và đặc biệt là mã vạch DNA (DNA barcode). Nguyên lý chung của các phương pháp này đều dựa trên sự khác biệt của trình tự nucleotide (base nitơ) trong cấu trúc hóa học của DNA để xác định loài. Mã vạch DNA được ứng dụng và có tiềm năng trong nhiều ngành khoa học như phân loại học, công nghệ sinh học, công nghệ thực phẩm, pháp ý, giúp nhận diện và định danh nhiều mẫu vật [42]. DNA Barcode hay mã vạch DNA lần đầu tiên được đề xuất là phương pháp định danh loài bởi Paul Hebert (Đại học Guelph – Cananda) vào năm 2003 [42]. Mã vạch DNA có thể là vùng gen trong nhân hay ngoài nhân mã hóa hoặc không mã hóa protein. Mã vạch này tương tự như mã vạch sọc đen dán vào các sản phẩm trong siêu thị. Tuy nhìn hai sản phẩm bên ngoài giống nhau và không thể phân biệt được bằng mắt thường nhưng khi quét mã vạch lại có thể xác định được chúng [88]. Để trở thành một mã vạch DNA, cần đáp ứng những yêu cầu sau: (i) Tồn tại phổ biến (có mặt trong nhiều loài sinh vật); (ii) Trình tự có hiệu suất nhân dòng cao và đặc hiệu; (iii) Khả năng phân biệt được nhiều loài [50]. Hiện nay thì nhiều mã vạch DNA ngày càng được sử dụng phổ biến, có thể kể đến chỉ thị nằm trong hệ gen nhân (ITS, ) [18, 27, 28], hệ gen ty thể (Cytb, COI ) [18, 25, 43] hay hệ gen lục lạp (matK, trnK, rbcL, ) [48, 49, 71]. Đặc điểm chung của những chỉ thị này là đều có tính đặc hiệu cao và dễ sử dụng. Chúng có những đặc tính lý tưởng bao gồm: đủ độ bảo thủ để xác định những sinh vật cùng loài nhưng cũng đủ đột biến để phân biệt các loài [65]; có độ dài thích hợp (không quá ngắn để xuất hiện vị trí đa hình giữa các taxon, không quá dài để thuận lợi trong quá trình giải trình tự); vị trí mồi bảo tồn cao, DNA được khuếch đại và giải trình tự có độ tin cậy cao. Trong đó, ở động vật, vùng gen ty thể có ưu thế hơn vùng gen nhân do có tốc độ tiến hóa nhanh [26, 81]. Còn ở thực vật, vùng gen ty thể không được lựa chọn làm mã vạch DNA do hệ gen này tiến hóa chậm [38, 48]. Thay vào đó, hệ gen lục lạp được cho thấy khả năng phân biệt tốt các loài [23, 48, 74]. Ngoài ra, để tăng độ chính xác khả năng phân loại, các nghiên cứu thường kết hợp nhiều 8
hơn một chỉ thị phân tử. Thông tin về một số cặp mồi trong nghiên cứu phân loại được trình bày chi tiết trong Bảng 1.1. Bảng 1.1: Một số cặp mồi được sử trong nghiên cứu phân loại Barcode Mồi Trình tự TLTK ITS P1 F ATT GAA TGG TCC GGT GAA GTG TTC G [77] P2 R AAT TCC CCG GTT CGC TCG CCG TTAC [77] Is2P1 F ATG CGA TAC TTG GTG TGA AT [27] Is2P1 R TCC TCC GCT TAT TGA TAT GC [27] rbcL rP1 F ATG TCA CCA CAA ACA GAG ACT AAA GC [63] rP1 R GTA AAA TCA AGT CCA CCT CG [63] matK KIM 3F CGT ACA GTA CTT TTG TGT TTA CGA G [38, 58] KIM 1R ACC CAG TCC ATC TGG AAA TCT TGG TTC [38, 58] 390F CGA TCT ATT CAT TCA ATA TTT C [29] 1326R TCT AGC ACA CGA AAG TCG AAG T [29] 1F ACC GTA TCG CAC TAT GTA TC [93] 1R GAA CTA GTC GGA TGG AGT AG [93] 1.2.2. Ứng dụng của mã vạch DNA ở thực vật 1.2.2.1. Ứng dụng ở thực vật nói chung Ở thực vật, nghiên cứu mã vạch DNA không chỉ dùng để đánh giá sự khác nhau giữa các vùng DNA mà còn tiến tới những ứng dụng thực tế hơn. Các ứng dụng này bao gồm: (i) Cung cấp thông tin sâu hơn về phân loại học ở cấp độ loài đồng thời tham gia vào quá trình phân loại học: Nhận diện và phân biệt các loài. (ii) Hỗ trợ nhận diện các mẫu vật chưa được nhận biết thuộc loài nào hoặc xác định loài mới (Đây là ứng dụng chính). Với những loài có hình thái đơn giản, phân bố rộng, kích thước nhỏ hay hệ thống phân loại chưa đầy đủ và chưa được phân loại một cách triệt để thì mã vạch DNA giúp hoàn thiện hệ thống phân loại. Ngoài ra, nó còn cung cấp thêm thông tin 9
hữu ích về đa dạng loài có thể kể đến như nghiên cứu về nhóm thực vật bryphytes (rêu) [71] hay nhận diện những loài lan ẩn danh [66]. Ngày nay, mã vạch DNA được ứng dụng nhiều trong các nghiên cứu bao gồm: (i) Nghiên cứu đánh giá đa dạng di truyền của một vùng địa lý (các mẫu nghiên cứu thuộc nhiều bộ, họ, chi, loài); (ii) Phân biệt tập hợp mục tiêu các loài họ hàng có khả năng thay thế loài có giá trị thương mại; (iii) Nhận diện mẫu vật mà người sử dụng không có khái niệm quen thuộc. 1.2.2.2. Ứng dụng trong nhận biết dược liệu Ngày nay, thuốc được phát triển từ dược liệu ngày càng trở nên phổ biến và nhu cầu sử dụng các sản phẩm chăm sóc sức khỏe có nguồn gốc thiên nhiên ngày càng tăng. Tổ chức Y tế Thế giới (WHO) ước tính khoảng 80% dân số thế giới sử dụng cây thuốc để chăm sóc sức khỏe ban đầu [17]. Ở nước phương Tây, cây thuốc là nguồn gốc của nhiều loại thuốc thảo dược hỗ trợ chăm sóc sức khỏe. Còn ở các nước phương Đông, đặc biệt là Trung Quốc, việc sử dụng nguyên liệu thảo dược đã có lịch sử lâu đời, thống kê cho thấy có đến hơn 10000 loài, hơn 2000 chi và 400 họ được sử dụng để làm thuốc [27]. Thị trường toàn cầu cho dược liệu và cây cho tinh dầu thơm là 62 tỷ đô la vào năm 2002 và có thể đạt 5 nghìn tỷ đô la vào năm 2050 [85]. Nhu cầu sử dụng dược liệu thúc đẩy sự mở rộng và phát triển của thị trường xuyên quốc gia về nguồn nguyên liệu thảo dược. Tuy nhiên, nó cũng làm xuất hiện tình trạng giả mạo dược liệu. Các loài thảo dược này có thể bị thay thế bởi các loài có quan hệ gần gũi, thậm chí là bị giả mạo hoàn toàn. Tồn tại tình trạng này là do: (i) Nguyên liệu không phân biệt được bằng đặc điểm hình thái. (ii) Nguyên liệu có đặc điểm tương tự nhau. (iii) Thay thế các nguyên liệu có giá trị kinh tế bằng các nguyên liệu dễ kiếm và rẻ tiền hơn. Ngoài ra, việc định danh và xác định nguyên liệu thảo dược theo phương pháp truyền thống như đặc điểm cảm quan và phân tích hóa học đôi khi gặp khó khăn nhất là khi nguyên liệu được chế biến thành các dạng bào chế như bột hay bị phân cắt thành các đoạn nhỏ. Chính vì vậy, mã vạch phân tử có lợi thế ưu việt trong việc nhận biết nguồn gốc dược liệu từ các mẫu mô nhỏ. Không chỉ vậy, mã vạch phân tử còn được sử dụng phổ biến trong những năm gần đây để đánh giá đa dạng 10
sinh học phục vụ công tác bảo tồn và kiểm soát chất lượng sản phẩm. Việc định danh các nguyên liệu thảo dược bằng cách sử dụng mã vạch DNA giúp bảo vệ người dùng khỏi nguy cơ bị tổn hại sức khỏe bởi các thuốc giả mạo. 1.2.3. Vùng gen lục lạp matK (maturase K) Gen matK (maturase K), trước đây được gọi là orfK, là chỉ thị quan trọng được biểu hiện từ bộ gen lục lạp [47]. Gen này có tỷ lệ thay thế cao trong loài và nổi lên như một ứng cử viên tiềm năng để nghiên cứu hệ thống tiến hóa thực vật [75]. matK là một trong hai gen plastid (rbcL và matK) được Nhóm công tác thực vật (PWG) của Hiệp hội mã vạch sự sống (CBOL) khuyến nghị sử dụng làm mã vạch DNA thực vật tiêu chuẩn [38, 50]. matK là gen mã hoá một protein có liên quan đến quá trình cắt nối intron - exon nhóm II, dài khoảng 1500 bp, nằm trong intron của gen lục lạp trnK [20, 47] (Hình 1.1). Trong số các maturase, protein này chỉ giữ lại một miền X được bảo tồn tốt và tàn dư của một miền phiên mã ngược [72]. Các phức hợp gen matK-trnK thường được sử dụng cho các nghiên cứu tiến hóa thực vật và giải quyết quan hệ di truyền ở các mức phân loại khác nhau [54]. Hình 1.1:Vị trí của gen matK [47] Gen matK có tính đa dạng hơn những gen khác trong lục lạp, do vậy nó trở thành chỉ thị quan trọng giúp phân loại thực vật. Những đặc điểm của gen được khai thác bao gồm: có kích thước lý tưởng, tỷ lệ chuyển đổi cao và có trình tự bảo thủ. Tỷ lệ thay thế trong matK cao hơn gấp ba lần ở mức nucleotide và cao gấp sáu lần ở mức axit amin so với rbcL. Mặt khác sự hiện diện của vùng 3' tương đối được bảo tồn và vùng 5' ít được bảo tồn có thể được sử dụng để giải quyết các mối quan hệ phát sinh loài từ các mức độ phân loại nông đến sâu [31, 47]. Việc khuếch đại và giải trình tự vùng mã vạch matK rất khó khăn do tính biến thiên trình tự cao trong các vị trí liên kết mồi, đặc biệt khi đối tượng nghiên cứu không phải là thực vật hạt kín [38, 48, 50]. Hiện tại, có ba cặp mồi matK được sử dụng phổ biến để khuếch đại là: 390F/1326R [29, 90], KIM 3F /KIM 1R [38, 58] và XF/5R [33]. Kress và cộng sự (2009) đã sử dụng ba cặp mồi này để khuếch đại 11
mã vạch DNA từ 296 loài thực vật [64]. Sự kết hợp mồi này đã thành công khuếch đại trong 85% và thành công tuần tự ở 69% các loài, chứng minh rằng khuếch đại là đáng tin cậy. Tuy nhiên, việc sử dụng nhiều hơn một cặp mồi có thể tốn thời gian cũng như kinh phí và thường phức tạp đối với các dự án quy mô lớn [44]. Gen matK cho thấy khả năng phân biệt cao các loài thực vật hạt kín và hỗ trợ định danh cho nhiều loài thực vật [80]. Chỉ thị này đã được ứng dụng thành công để xây dựng cây phát sinh loài cho họ Valerianaceae [46], Saxifragaceae, Polemoniaceae, Poaceae [47], và giải quyết mối quan hệ di truyền của họ Aurantioideae đặc biệt là chi Citrus [76], Mã vạch này được sử dụng thành công để phân biệt Panax notoginseng (Araliaceae) giữa các vùng địa lý khác nhau [95] và xây dựng cây phân loài của Panax vietnamensis và 5 trình tự liên quan [62]. 1.3. Phân tích phát sinh gen (Phylogenetic Analysis) Việc xác định mối quan hệ phân cấp giữa các loài và ước lượng thời gian phân kỳ giữa chúng dựa trên các trình tự sinh học như protein hoặc DNA được thực hiện bởi các nghiên cứu phát sinh gen. Các nghiên cứu phát sinh gen thường được chia làm 5 giai đoạn: Giai đoạn 1: Lựa chọn trình tự sinh học cần phân tích. Giai đoạn 2: Xây dựng sự liên kết (sắp xếp đa chuỗi) giữa các trình tự sinh học được chọn. Giai đoạn 3: Lựa chọn các mô hình thay thế, các mô hình thống kê về tiến hóa phân tử cho các trình tự. Giai đoạn 4: Xây dựng các cây phát sinh loài Giai đoạn 5: Đánh giá thống kê các cây phát sinh loài 1.3.1. Lựa chọn trình tự sinh học Các nghiên cứu phát sinh gen dựa trên việc so sánh các trình tự sinh học tương đồng. Nghiên cứu về sự khác biệt giữa các trình tự cho phép ước tính mối quan hệ tiến hóa giữa các loài tương ứng và thời gian phân kỳ của chúng. Để có được các chuỗi tương đồng, các cơ sở dữ liệu như RefSeq, Uniprot hoặc HomoloGene có thể rất hữu ích. Một cách khác để có được các chuỗi tương đồng là sử dụng các trình tự từ các kết quả BLAST. Hai trình tự DNA ở hai sinh vật khác nhau tiến hóa từ một trình tự DNA tổ tiên thì được gọi hai trình tự DNA tương đồng. Tuy nhiên, vẫn có những khác biệt 12
giữa hai trình tự tương đồng trong quá trình tiến hóa do những đột biến (biến đổi). Có 3 loại biến đổi chính là: Thay thế (một nucleotide này bị thay thế bằng một nucleotide khác); Xóa (một hoặc một số nucleotide bị xóa khỏi trình tự); Chèn (một hoặc một số nucleotide được chèn vào trình tự). 1.3.2. Sắp xếp đa chuỗi Việc sắp xếp các trình tự sinh học cần phân tích (sắp xếp thẳng hàng) là bước quan trọng nhất trong nghiên cứu phát sinh gen vì nó liên quan trực tiếp đến việc so sánh sự giống và khác nhau giữa các trình tự. Có một số công cụ để thực hiện sắp xếp chuỗi trong đó có BioEdit, MEGA. Các công cụ này cho phép căn chỉnh nhiều chuỗi thông qua các phương pháp căn chỉnh MUSCLE và ClustalW. 1.3.3. Lựa chọn mô hình tiến hóa Sau khi hoàn thành việc sắp xếp chuỗi, có thể tính được khoảng cách di truyền giữa các trình tự khác nhau. Khoảng cách di truyền giữa hai chuỗi tương đồng được định nghĩa là số lượng thay thế được tích lũy giữa chúng kể từ khi chúng tiến hóa từ một tổ tiên chung. Ước tính khoảng cách di truyền là quan trọng vì không phải tất cả các sự biến đổi đều có thể quan sát được, đặc biệt là trong những chuỗi có 2 dạng biến đổi là đồng hoán và dị hoán. Phân tích phát sinh gen dựa trên sự lựa chọn chính xác mô hình tiến hóa, phổ biến nhất là: Mô hình JC69 (Jukes và Cantor, 1969) [59]: Là mô hình thay thế đơn giản nhất. Nó giả sử xác suất đột biến một nucleotide là độc lập với vị trí của nucleotide và chính nucleotide đó. Nghĩa là tần số cơ bản và tỷ lệ đột biến của mỗi loại nucleotide (A, T, G, C) bằng nhau. Do đó tham số duy nhất của mô hình này là tỷ lệ thay thế tổng thể. Tuy nhiên, JC69 không đủ để tính khoảng cách tiến hóa theo các mô hình phức tạp hơn. Mô hình K80 (Kimura 1980) [61]: Thường được gọi là mô hình hai tham số của Kimura (hoặc mô hình K2P), phân biệt giữa đồng hoán (A G, tức là từ purine đến purine, hoặc C T, tức là từ pyrimidine sang pyrimidine) và dị hoán (từ purine sang pyrimidine hoặc ngược lại). Trong mô tả ban đầu về mô hình, α và β được sử dụng để biểu thị tốc độ của các loại thay thế này. Mô hình T92 (Tamura 1992) [91]: T92 là một phương pháp toán học đơn giản được phát triển để ước tính số lượng thay thế nucleotide trên mỗi vị trí giữa hai chuỗi DNA, bằng cách mở rộng phương pháp hai tham số của Kimura (1980) cho 13
trường hợp tồn tại sự thiên về hàm lượng G+C. Phương pháp này hữu ích khi có nhiều chuyển đổi đồng hoán, dị hoán và sự thiên về hàm lượng G+C. Mô hình TN93 (Tamura và Nei 1993) [92]: Mô hình TN93 phân biệt giữa hai loại đồng hoán, nghĩa là (A G) được phép có tỉ lệ khác với (C T). Các dị hoán được giả định xảy ra ở tỷ lệ tương tự, nhưng tỷ lệ này được phép khác tỷ lệ đồng hoán. 1.3.4. Xây dựng cây phát sinh loài Cây phát sinh loài (Phylogenetic tree) hay còn gọi là cây phả hệ hay cây phân loài được sử dụng để mô hình hóa lịch sử tiến hóa của một nhóm các trình tự hay các sinh vật. Theo thuyết tiến hóa của Darwin, nhóm các loài với những đặc tính khác nhau đều tiến hóa và hình thành từ một tổ tiên chung trong quá khứ. Đối tượng nghiên cứu truyền thống của cây phân loài là biểu diễn mối quan hệ giữa các loài. Để xây dựng cây phát sinh loài, có một số phương pháp sau: Phương pháp ma trận khoảng cách – Distance Matrix Ma trận khoảng cách được tính toán dựa trên khoảng cách di truyền giữa các chuỗi được phân loại bao gồm một nhóm các thuật toán. Trên cơ sở khoảng cách giữa từng cặp trình tự (số nucleotide khác nhau giữa các trình tự), biểu diễn thành dạng ma trận khoảng cách. Trong đó, thuật toán lập nhóm không có trọng số dùng trung bình số học (UPGMA - Unweighted PairGroup with Method using arthmetic Averages) [86] phân tích tất cả các dấu hiệu qua đó xác định khoảng cách di truyền giữa tất cả các cặp trình tự, biểu diễn thành dạng ma trận khoảng cách (dạng đối xứng) rồi gộp từng cặp mẫu có khoảng cách di truyền giữa chúng là nhỏ nhất [8]. Phương pháp Neighbor – Joining Phương pháp này tương tự phương pháp gom cụm. Tuy nhiên, hai trình tự được coi là hàng xóm trong một cây nếu như giữa chúng chỉ có duy nhất một nút. Phương pháp NJ tương đối nhanh nhưng nó chỉ tạo ra một cây và bỏ qua các cây khác có thể tốt hơn. Hơn nữa, vì các lỗi ước tính khoảng cách theo cấp số nhân, trong một số điều kiện, phương pháp này sẽ tạo ra một cây thiên vị. Phương pháp tiết kiệm tối đa – Maximum Parsimony Phương pháp này sẽ lựa chọn cây tiến hóa thỏa mãn điều kiện là số lượng đặc tính bị biến đổi phải thấp nhất để giải thích những dữ liệu đã quan sát được. Maximum Parsimony giả định rằng cây tiến hóa tốt nhất mô tả quá trình tiến hóa tốt 14
nhất là cây mô tả được các loài ít thay đổi nhất (ít đột biến nhất) nên cây có điểm thấp nhất. Phương pháp khả năng xác suất: Hợp lý tối đa – Maximum Likelihood và phương pháp Bayes Phương pháp này dựa trên một hàm toán học tính xác suất khả năng một cây tiến hóa được tạo thành từ dữ liệu có sẵn. Hàm này cho phép tích hợp qua trình tiến hóa các đặc tính dưới dạng mô hình xác suất. Cây phát sinh được xây dựng bởi phương pháp hợp lý tối đa là cây tiến hóa có khả năng xảy ra cao nhất (xác suất tạo thành lớn nhất). Khác với Maximum Likelihood thì phương pháp Bayes không tìm đỉnh cao nhất (xác suất tối đa) mà tích hợp các thông số trong không gian dữ liệu. 1.3.5. Đánh giá cây phát sinh loài Sau khi xây dựng cây phát sinh loài, cần đánh giá cây và phương pháp đánh giá phổ biến nhất hiện nay là Bootstrapping. Phân tích bootstrap được thực hiện nhằm kiểm tra độ chính xác và độ tin cậy cho từng nhánh trong cây tiến hóa. Đầu tiên, các vị trí từ các chuỗi trình tự đã sắp xếp thẳng hàng sẽ được đảo chỗ một cách ngẫu nhiên và được xây dựng cây. Quá trình này được lặp lại một số lần nhất định (gọi là sự lặp lại bootstrap) để tính toán giá trị ủng hộ cho một nhánh. Do giá trị ủng hộ được biểu diễn bằng tỷ lệ % nên ít nhất phải có 100 lần lặp lại (thông thường 1000 lần lặp lại). Đối với mỗi nhánh được chỉ định một tỷ lệ xuất hiện trong các cây và một nhánh có ý nghĩa nếu nó xuất hiện hơn 50% hoặc 70%. 1.4. Tổng quan về loài Dây thường xuân (Hedera nepalensis K.Koch) 1.4.1. Đặc điểm hình thái chung của loài Dây thường xuân * Đặc điểm hình thái chung của chi Hedera Hedera thường được gọi là cây thường xuân (ivy) là một chi gồm 16 loài theo thông tin phân tích từ dữ liệu DNA lục lạp [15]. Chi Hedera là đại diện dạng dây leo duy nhất trong họ Nhân sâm (Araliaceae). Chi này có nguồn gốc ở miền tây, miền trung và miền nam châu Âu, Macaronesia, tây bắc châu Phi và khắp Đông Á đến Nhật Bản và Đài Loan. 15
Vị trí của chi Hedera trong hệ thống phân loại thực vật như sau: Liên giới: Eukaryota (Sinh vật nhân thực) Giới: Plantae (Thực vật) Phân giới: Viridaeplantae (Thực vật xanh) Ngành: Magnoliophyta (Thực vật có hoa; Ngọc Lan; Hạt kín) Lớp: Magnoliopsida (Ngọc lan; Hai lá mầm) Phân lớp: Rosidae (Hoa hồng) Bộ: Apiales (Hoa tán) Họ: Araliaceae (Nhân sâm) Chi: Hedera Chi Hedera gồm những cây dạng dây leo mọc thành lớp bao phủ trên bề mặt. Trên mặt đất, cây leo không quá 5-20 m, nhưng trên bề mặt thích hợp như mỏm đá, chúng có thể leo cao tới 30 m [32]. Cây leo thường xanh có rễ móc kí sinh. Lá đơn không có lá kèm, dài 5-10 cm, rộng 3-8 cm, phiến lá phân thùy, gân chân vịt, mọc so le. Cụm hoa chùy gồm nhiều tán có lông sao. Hoa nhỏ, màu vàng xanh, trắng xanh, tràng 5, có một mào cuốn ở giữa, nhị 5, bầu 5. Quả màu xanh đen, tím đậm hoặc vàng (hiếm khi) chín vào cuối mùa đông đến giữa mùa xuân. Quả hạch tròn có đường kính 5-10 mm, dài 5-9 mm, khối lượng trung bình khoảng 281,5 mg, chứa từ 1-5 quả [1, 45]. * Đặc điểm hình thái loài Hedera nepalensis Hình thái của H.nepalnensis K.Koch (Hình 1.2) được mô tả trong các tài liệu nghiên cứu vẫn chưa có sự thống nhất, đặc biệt là hình dạng và màu quả khi chín. Cụ thể: Trong “Cây cỏ Việt Nam” (2000): Dây thường xuân được mô tả là Dây bò. Lá không lông, hình thể hơi biến thiên, thon hình thoi, chóp nhọn, gân từ đáy 3, gân phụ 2-3 cặp, mặt trên oliu đậm, mặt dưới oliu nâu. Phát hoa mang tán như hoa đầu nhiều hoa, có lông sét. Trái tròn, màu cam đỏ [7]. Trong “Danh lục thực vật Việt Nam” tập II (2003) có mô tả H. nepalensis: Dây bò dài tới 20 m, có nhiều rễ móc khí sinh ở các mắt, lá đơn; cụm hoa có lông màu đỏ nâu [1]. 16
A B C D E F Hình 1.2. Đặc điểm hình thái Dây thường xuân A, B: Một đoạn Dây thường xuân; C: Cành mang hoa; D: Cành mang quả; E: Cụm hoa; F: Cụm quả 17
Theo cuốn “Cây thuốc và động vật làm thuốc ở Việt Nam” (2006), Dây thường xuân được mô tả là dây leo nhỏ, luôn xanh, mọc bám nhờ những rễ phụ mọc từ các mấu. Thân mềm nhẵn, màu lục nhạt hoặc nâu nhạt, có nốt sần. Lá mọc so le, rất đa dạng, dài 5-10 cm ở cành có hoa; nhỏ và ngắn hơn ở cành bất thụ; phiến dài, nhẵn, không chia thùy, gốc hẹp; cuống lá mảnh. Cụm hoa mọc ở đầu cành thành tán tròn hoặc 2-6 tán dạng ngù, cuống có lông hình sao; hoa có cánh hình tam giác, mọc cong xuống. Quả mọng, hình cầu, đường kính 7,5 mm, màu vàng lục hoặc vàng cam, có thịt nạc. Mùa hoa: tháng 10 [2]. Theo Võ Văn Chi (2012), Dây thường xuân là cây leo thường xanh có nhiều rễ móc khí sinh, không có gai. Lá đơn không có lá kèm, phiến lá phân thùy, dài 5-10 cm, rộng 3-8 cm; gân chân vịt. Cụm hoa chùy, gồm nhiều tán, có lông sao. Hoa nhỏ, màu vàng trắng và lục trắng, gốc rộng, có một mào cuốn ở giữa; nhị 5; bầu 5. Quả hạch tròn, khi chín màu đen [4]. 1.4.2. Đặc điểm phân bố, sinh thái Đặc điểm phân bố Trên thế giới, H. nepalensis K. Koch được tìm thấy ở Nepal, Bhutan cũng như ở Trung Quốc, Afganistan, Ấn Độ, Lào, Thái Lan, Myanmar và Việt Nam ở độ cao khoảng 1000-3000 m [21]. Tại Việt Nam, Dây thường xuân phân bố ở một số vùng núi cao phía Bắc như Lai Châu, Sơn La (Mộc Châu), Hòa Bình, Hà Giang (Đồng Văn, Mèo Vạc), Lào Cai (Sa Pa, Bát Xát), Cao Bằng, Lạng Sơn. [1, 2, 4, 7, 12, 13] (Hình 1.3). Hình 1.3. Phân bố địa lý của Dây thường xuân ở miền Bắc Việt Nam 18
Đặc điểm sinh thái H. nepalensis phân bố ở vùng cận nhiệt đới và ôn đới ấm ở châu Á, từ vùng cận dãy Himalaya (Ấn Độ) qua Tây – Nam Trung Quốc xuống Bắc Việt Nam. Dây thường xuân là loài thực vật ưa khí hậu ẩm ướt, hơi chịu bóng, mọc bám trên đá, rải rác trong rừng thưa, ở độ cao 100 – 1600 m. [1, 2] 1.4.3. Thành phần hóa học Nghiên cứu năm 2014 của Saleem S và cộng sự đã phát hiện hợp chất triterpenoid lupeol trong H. nepalensis [83]. Ngoài lupeol, saponin được chứng minh là hợp chất hóa học chủ yếu trong lá và thân của H.nepalensis K. Koch. Vào năm 2015, T. Li và cộng sự đã tìm thấy hai hợp chất chính có tác dụng chống ung thư trong Dây thường xuân là hederagenin 3-O-α-L-arabinopyranoside và pulsatilla saponin A bằng phương pháp sắc ký hóa học và phương pháp quang phổ. Ngoài ra, Jafri và cộng sự đã báo cáo sự tồn tại của catechin và axit caffeic trong phần ethyl acetate của H. nepalensis và tìm thấy tỷ lệ đáng kể các hợp chất phenolic có hoạt tính chống oxy hóa đầy hứa hẹn [56]. Không những vậy, phân tích hóa thực vật của H. nepalensis cho thấy sự tồn tại của các alcaloid, terpenoid, steroid, tannin và flavonoid [60]. 1.4.4. Tác dụng dược lý 1.4.4.1. Theo y học cổ truyền Dây thường xuân đã được sử dụng từ lâu đời trong y học cổ truyền để phòng và chữa bệnh. Ở mỗi quốc gia, Dây thường xuân có tên gọi khác nhau. Ở Việt Nam, Dây thường xuân còn được gọi là Bách cước ngô công [2]; ở Ấn Độ là arambal, kuhru hay laglya; ở Trung Quốc là chang chung teng và ở Nepal là dudela [78]. Bộ phận dùng: lá, thân, rễ, quả tươi hoặc phơi khô. Về tính vị quy kinh: Dây thường xuân có vị đắng, tính mát thường có tác dụng trong khu phong, giải độc, hoạt huyết, tiêu sưng; quả vị ngọt, tính ấm được dùng để trừ phong huyết. Công dụng: Chữa đơn sưng: chế rượu với lá đã giã nhỏ, gạn lấy dịch uống, phần bã còn lại đắp vào chỗ sưng đau. Khi gặp vấn đề về mụn lở thì lấy thân hoặc rễ cây sắc hoặc ngâm với rượu uống. Sắc hoặc ngâm rượu còn có công dụng chữa huyết bế trong bụng, giúp giảm các triệu chứng đau lưng, mỏi gối ở người già [2]. 19
Ở Ấn Độ, Nepal lá cây còn có thể dùng làm thuốc chườm nóng trị sưng hạch, quả dùng hãm uống có tác dụng trị thấp khớp [3]. Bột nhão khô dùng chống vẩy nến; bột cành lá khô trộn với lòng đỏ trứng gà được bôi chống sưng và viêm cơ. Ở Trung Quốc, nước sắc lá được dùng để chữa bệnh ngoài da [78]. Ở Pakistan, loại cây này được sử dụng theo truyền thống để chống ung thư, tiểu đường và làm thuốc tẩy [39, 79]. 1.4.4.2. Theo y học hiện đại H. nepalensis K. Koch là một trong những cây có nhiều lợi ích nhất để điều trị các bệnh khác nhau. Các nhà khoa học cho rằng H. nepalensis có nhiều tiềm năng để phát triển thành thuốc. Trên thế giới, đã có nhiều nghiên cứu chứng minh các tác dụng dược lý của H. nepalensis (chi tiết trình bày trong Bảng 1.2). Bảng 1.2: Các tác dụng dược lý của H. nepalensis Nơi thu STT Tác dụng Dạng phân tích TLTK mẫu Pakistan Dịch chiết thô của H. nepalensis và [40] Tác dụng chống 1 hợp chất lupeol được phân lập từ nó đái tháo đường Pakistan Chiết xuất thô của H. nepalensis [83] Tác dụng chống Pakistan Rutin ở chiết xuất methanol và chiết [51, 2 oxy hóa xuất thô của H. nepalensis 60] Tác dụng chống Pakistan Chiết xuất thô và các phần phân đoạn [39, 3 ung thư (n-hexan và ethyl acetate) 55, 60] Tác dụng giảm Pakistan Chiết xuất thô của H. nepalensis [53] 4 đau Tác dụng kháng Pakistan Chiết xuất thô của H. nepalensis [53] 5 viêm Tác dụng bảo vệ Pakistan Dịch chiết thô của H. nepalensis và [40] 6 thần kinh hợp chất lupeol được phân lập từ nó Tác dụng chống Pakistan Chiết xuất thô của H. nepalensis [53] 7 trầm cảm Tác dụng chống Pakistan Chiết xuất thô của H. nepalensis [53] 8 đông máu Hoạt tính kháng Trung Các thành phần dễ bay hơi trong chiết [70] 9 nấm Quốc xuất thô của H. nepalensis 20
CHƯƠNG 2. ĐỐI TƯỢNG & PHƯƠNG PHÁP NGHIÊN CỨU 2.1. Đối tượng nghiên cứu 2.1.1. Đối tượng 43 mẫu lá Dây thường xuân, trong đó 41 mẫu được thu thập từ các tỉnh miền núi phía Bắc: Lào Cai, Hà Giang, Lai Châu, Lạng Sơn; 01 mẫu được thu thập ở Lâm Đồng; 01 mẫu được thu thập từ Vườn thực vật Hoa Nam, Trung Quốc do Khoa Tài nguyên Dược liệu, Viện Dược liệu cung cấp. 2.1.2. Tiêu chuẩn lựa chọn mẫu Tiêu chuẩn lựa chọn mẫu: mẫu lá non, sạch đã được sấy khô và bảo quản trong túi silicagel chống ẩm. Các mẫu lá nhận về phòng thí nghiệm được nghiền mịn trong nitơ lỏng, bảo quản trong các ống eppendorf 1,5 mL ở -30 ºC đến khi được sử dụng. Thông tin chi tiết 43 mẫu được trình bày trong Bảng 2.1. Bảng 2.1. Thông tin mẫu thực vật dùng trong nghiên cứu Kí hiệu Địa điểm lấy mẫu Toạ độ địa lý H1* Sa Pa, Lào Cai 22°22'37.53"N - 103°47'31.76"E H2* Sa Pa, Lào Cai 22°22'37.53"N - 103°47'31.76"E H3 Sa Pa, Lào Cai 22°21'10.29"N - 103°51'36.04"E H4* Hoàng Su Phì, Hà Giang 22°39'28.47"N - 104°35'57.14"E H5* Sa Pa, Lào Cai 22°20'17.84"N - 103°49'52.89"E H6* Sa Pa, Lào Cai 22°20'17.84"N - 103°49'52.89"E HH Vườn TV Hoa Nam, Trung Quốc 23°11'12"N - 113°21'51"E H16* Đồng Văn, Hà Giang 23°14'49.81"N - 105°11'36.53"E H17* Đồng Văn, Hà Giang 23°14'46.36"N - 105°11'30.49"E H18* Đồng Văn, Hà Giang 23°15'01.61"N - 105°11'24.46"E H19* Đồng Văn, Hà Giang 23°15'48.33"N - 105°09'56.85"E H20* Đồng Văn, Hà Giang 23°15'20.97"N - 105°10'29.61"E H21* Đồng Văn, Hà Giang 23°14'39.08"N - 105°12'48.68"E H23* Đồng Văn, Hà Giang 23°14'37.25"N - 105°47'6.49"E H24* Đồng Văn, Hà Giang 23°12'49.49"N - 103°47'6.49"E H25* Đồng Văn, Hà Giang 23°13'00.07"N - 105°10'31.06"E H26* Đồng Văn, Hà Giang 23°14'39.08"N - 105°10'38.25"E H27* Hoàng Su Phì, Hà Giang 22°39'18.38"N - 104°35'45.13"E H28* Hoàng Su Phì, Hà Giang 22°39'43.50"N - 104°36'11.35"E 21
H30* Xín Mần, Hà Giang 22°39'01.08"N - 104°35'31.20"E H31* Hoàng Su Phì, Hà Giang 22°40'11.06"N - 104°36'11.85"E H32* Hoàng Su Phì, Hà Giang 22°39'28.47"N - 104°35'57.14"E H33* Hoàng Su Phì, Hà Giang 22°40'08.44"N - 104°36'17.29"E H34* Hoàng Su Phì, Hà Giang 22°40'00.73"N - 104°36'19.57"E H35* Đồng Văn, Hà Giang 23°14'47.62"N - 105°12'43.66"E H36* Sìn Hồ, Lai Châu 22°16'54.91"N - 103°12'20.03"E H37* Đồng Văn, Hà Giang 23°14'47.62"N - 105°12'43.66"E H38* Hoàng Su Phì, Hà Giang 22°39'31.37"N - 104°36'11.12"E H39* Sìn Hồ, Lai Châu 22°16'54.91"N - 103°12'20.03"E H40* Đồng Văn, Hà Giang 23°14'47.62"N - 105°12'43.66"E H41* Hoàng Su Phì, Hà Giang 22°39'31.37"N - 104°36'11.12"E H42* Hoàng Su Phì, Hà Giang 22°39'31.37"N - 104°36'11.12"E H43* Hoàng Su Phì, Hà Giang 22°40'04.61"N - 104°35'59.54"E H44* Hoàng Su Phì, Hà Giang 22°40'04.61"N - 104°35'59.54"E H45* Sa Pa, Lào Cai 22°22'59.25"N - 103°47'6.49"E H46* Sa Pa, Lào Cai 22°22'37.53"N - 103°47'31.76"E H47* Sa Pa, Lào Cai 22°22'51.15"N - 103°47'45.99"E H48 Sa Pa, Lào Cai 22°21'10.29"N - 103°51'36.04"E H50* Lộc Bình, Lạng Sơn 21°50'53.03"N - 106°55'4.96"E H51* Lộc Bình, Lạng Sơn 21°50'51.63"N - 106°55'2.76"E H52 Đà Lạt, Lâm Đồng 11°56'11.56"N; 108°27'28.12"E H53* Sìn Hồ, Lai Châu 22°16'54.91"N - 103°12'20.03"E H54* Sìn Hồ, Lai Châu 22°16'54.91"N - 103°12'20.03"E Nhận dạng hình thái: *Hedera nepalensis; Hedera helix 2.2. Thời gian, địa điểm nghiên cứu Thời gian thực hiện nghiên cứu: từ ngày 15/6/2018 – 25/11/2019. Địa điểm nghiên cứu: Phòng thí nghiệm của Bộ môn Y Dược học cơ sở, Khoa Y Dược, Đại học Quốc gia Hà Nội. 2.3. Dụng cụ, trang thiết bị và hóa chất nghiên cứu 2.3.1. Hóa chất Hóa chất để tách chiết DNA tổng số: Bộ kit GeneJET Plant Genomic DNA Purification Mini (Thermo Scientific, Mỹ). 22
Hóa chất thực hiện kỹ thuật PCR: dNTP mix (Thermo Scientific), Phusion Polymerase (Thermo Scientific), cặp mồi 390F/1326R [29] đặt tổng hợp từ công ty Phusa Biochem (Việt Nam), có trình tự như sau: Mồi xuôi 390F: 5’ CGA TCT ATT CAT TCA ATA TTT C 3’ Mồi ngược 1326R: 5’ TCT AGC ACA CGA AAG TCG AAG T 3’ Hóa chất điện di: Agarose, Ethylene Diamine Tetra Acetic Acid (EDTA, Affymetrix), 5X DNA loading dye (Lonza), GeneRuler 100bp DNA Ladder (Thermo Scientific), Lambda DNA/HindIII Ladder (Thermo Scientific), Tris base (Bio basic), acid acetic (Merck). 2.3.2. Trang thiết bị Các trang thiết bị và dụng cụ thí nghiệm được tiến hành trong Phòng thí nghiệm của bộ môn Y Dược học cơ sở - Khoa Y Dược, Đại học Quốc gia Hà Nội. Bao gồm: Cân phân tích, Bể ổn nhiệt, Máy soi, chụp ảnh gel (Gel Doc It, Mỹ), Hệ thống điện di (Cleaver Scientific Ltd, Anh), Máy PCR (Prime Thermal Cycler, Anh), Tủ an toàn sinh học (ESCO, Singapore), Máy li tâm EBA 21 (Hettich Zentrifugen, Đức), Máy lắc VELP (Scientifica, Đức), Máy quang phổ NP80 (Nanophotometer, Đức), Máy làm đá vảy (Fiocchetti, Ý), Tủ ấm (Panasonic, Nhật Bản), Tủ lạnh sâu -30oC (Panasonic, Nhật Bản), Tủ mát 4oC (FRIMED, Nhật Bản). 2.4. Phương pháp nghiên cứu Nghiên cứu được tiến hành theo sơ đồ trong Hình 2.1. Hình 2.1. Sơ đồ thiết kế nghiên cứu 23
2.4.1. Tách chiết DNA tổng số DNA được phân lập bằng phương pháp sử dụng GeneJET Plant Genomic DNA Purification Mini Kit (Thermo Scientific, Mỹ) theo nghiên cứu trước đó của Nguyễn Thị Thu Thảo và cộng sự [11]. Nguyên tắc của quá trình là: Các mẫu được ly giải trong Lysis Buffer với sự có mặt của RNase A. Protein và polysacaride được loại bỏ bởi Precipitation Solution do bị kết tủa. Dịch ly giải sau đó được trộn với Plant gDNA Binding Solution, ethanol và được nạp vào cột tinh chế nơi DNA liên kết với màng silica. Các tạp chất được loại bỏ hiệu quả bằng cách rửa cột với bộ đệm rửa. DNA tổng số sau đó được rửa giải trong điều kiện cường độ ion thấp với Elution Buffer. Quy trình GeneJET Plant Genomic DNA Purification Mini Kit (Thermo Scientific, Mỹ) thực hiện theo khuyến cáo của hãng. Kiểm tra và định lượng DNA Kiểm tra sự có mặt của DNA thực hiện bằng cách điện di sản phẩm tách trên gel agarose 1.2% với hiệu điện thế 100 V, 500 mA trong vòng 45 phút. Điện di mẫu 5 µL sản phẩm tách trộn với 1 µL DYE 5X (chứa ethidium bromide) trong đệm TAE 1X. Các băng DNA được hiện hình khi soi dưới ánh sáng tử ngoại. Định lượng nồng độ và độ tinh sạch của DNA tách chiết bằng cách đo chỉ số OD260/280 (tỷ lệ hấp thụ quang của DNA ở bước sóng 260 nm so với độ hấp thụ quang tại bước sóng 280 nm). Thông thường giá trị OD260/280 khoảng 1,8 – 2,0 có thể xem DNA tách chiết được là tinh sạch. 2.4.2. Khuếch đại đoạn gen đích bằng kỹ thuật PCR Để có quy trình nhân dòng đặc hiệu và ổn định, tiến hành các thí nghiệm tối ưu nhiệt độ gắn mồi, nồng độ mồi và nồng độ DNA. Tất cả các phản ứng đều có đối chứng âm và đối chứng dương để loại bỏ sai sót của thao tác. Cơ chế Phusion DNA polymerase: Dùng cho phản ứng PCR với khả năng tạo những mẫu dài với độ chính xác và tốc độ cao chỉ với một enzyme duy nhất ngay cả ở những đoạn gen khó nhân dòng nhất. Phusion DNA polymerase đem lại hiệu suất cao nhờ hoạt tính nhân dòng chiều 5’- 3’ (với mồi xuôi) và đọc sửa 3' - 5' (với mồi ngược) (đây là hoạt tính enzyme cắt mạch DNA từ tận cùng đầu mút theo chiều 3' - 5'). Khi bắt gặp một cặp base bổ sung không chính xác, DNA polymerase sẽ đảo ngược chiều đi của nó và cắt bỏ base không ăn khớp. Sau khi cắt đi base, polymerase có thể lắp lại chính xác base cần thiết và tiếp tục tái bản DNA. Phusion DNA polymerase là một lựa chọn lý tưởng để sử dụng cho các bộ khuếch 24
đại dài hoặc khó. Với tỷ lệ lỗi thấp hơn 50 lần so với Taq DNA polymerase và thấp hơn 6 lần so với Pyrococcus furiosus DNA polymerase, Phusion là một trong những polymerase ổn định nhiệt chính xác nhất hiện có [69]. Mỗi phản ứng PCR bao gồm 25 μL, sử dụng máy GeneAmp* PCR System 9700. Thành phần của phản ứng bao gồm: 5x buffer, dNTP 2 mM, Phusion DNA polymerase, mồi xuôi, mồi ngược, DDW, DNA; và chu trình nhiệt của phản ứng PCR: 98 ºC trong 30 giây; 35 chu kỳ (98 ºC trong 10 giây, T ºC trong 30 giây, 72 ºC trong 30 giây); 72 ºC trong 10 phút và giữ sản phẩm ở 4 ºC. Kiểm tra sản phẩm PCR: Đánh giá chất lượng bằng cách điện di sản phẩm PCR trên gel agarose 1,5% trong đệm TAE 1X, sử dụng thang chuẩn GeneRuler 100 bp DNA để xác định kích thước sản phẩm và chụp bằng máy soi Gel. 2.4.3. Tinh sạch và giải trình tự Để thu được kết quả giải trình tự chúng tôi tiến hành thu 20 µL sản phẩm PCR gửi đi hãng First Base (Malaysia) để tinh sạch và giải trình tự. Kết quả giải trình tự được hiển thị bằng phần mềm BioEdit version 7.2.6.1, qua đó xác định được trình tự gen của từng mẫu nghiên cứu. Mỗi loại nucleotide được thể hiện bằng một đỉnh với màu đặc trưng (A: màu xanh lá cây, C: màu xanh da trời, G: màu đen, T: màu đỏ), qua đó có thể xác định được trình tự nucleotide. 2.4.4. Xử lý số liệu và phân tích kết quả Sau khi thu được trình tự đoạn gen đích của các mẫu cần quan tâm, chúng tôi sử dụng phần mềm Sequencher 5.4.6 để chỉnh sửa chuỗi nucleotide, cắt bỏ những đoạn trình tự bị nhiễu loại bỏ khỏi chuỗi (thường là đoạn đầu và đoạn cuối). Tiếp theo các trình tự sẽ được sử dụng để so sánh với các mẫu đã có sẵn trên ngân hàng Genbank thông qua chương trình BLAST ( để xem xét về sự tương đồng. Kết hợp giữa các mẫu thu được cùng với các trình tự có sẵn trên ngân hàng Genbank, chúng tôi tiến hành sao sánh các trình tự bằng phầm mềm BioEdit version 7.2.6.1. Sau đó, xây dựng cây phát sinh chủng loại bằng nhiều phương pháp khác nhau (Maximum likelihood, UPGMA) thông qua phần mềm MEGA version X với giá trị bootstrap 1000 lần lặp lại. Dựa trên kết quả thu được từ cây phát sinh, tiến hành định danh nguồn gen Dây thường xuân dựa theo các phân nhánh với các trình tự đã lựa chọn tham chiếu. 25
CHƯƠNG 3. KẾT QUẢ NGHIÊN CỨU 3.1. Tách chiết DNA tổng số DNA tổng số của 43/43 mẫu tách chiết thành công khi sử dụng Kit GeneJet, sau đó được điện di trên gel agarose 1,2%. Kết quả bước đầu ghi nhận thông qua điện di như sau: Tất cả các mẫu đều quan sát được một băng DNA tổng số với kích thước tương ứng khoảng 23,1 kb của marker, băng rõ rét chứng tỏ DNA thu được có nồng độ cao, ít đứt gãy và đủ điều kiện để thực hiện các thí nghiệm tiếp theo. Băng điện di DNA tổng số của một số mẫu thực vật thể hiện ở Hình 3.1. Hình 3.1. Ảnh điện di DNA tổng số trên gel agarose 1,2% Làn M: Lamda DNA/HindIII marker. Kí hiệu trên các làn: mẫu DNA tổng số thu của mẫu thực vật có ký hiệu tương ứng, (-): Đối chứng âm. Định lương và đo độ tinh sạch của DNA tổng số các mẫu lá khô cho kết quả: Nồng độ DNA trung bình đạt 15,55 ng/μL ± 4,420, chỉ số hấp thụ quang đo ở bước sóng 260 và 289 nm có giá trị trung bình 1,983 ± 0,539. Số liệu chi tiết thống kê ở Bảng 3.1. Bảng 3.1. Nồng độ DNA tổng số của các mẫu nghiên cứu STT Ký hiệu mẫu Nồng độ trung bình (ng/µL) OD260/280 trung bình 1 H1 6,15 2,016 2 H2 11,70 2,071 3 H3 7,75 2,214 4 H4 11,20 2,154 5 H5 12,35 2,148 6 H6 4,10 1,952 7 HH 9,20 1,806 8 H16 10,70 1,372 9 H17 12,05 1,700 10 H18 6,35 2,702 11 H19 5,50 1,964 12 H20 11,65 1,371 13 H21 15,30 1,672 26
14 H23 7,45 2,569 15 H24 15,00 2,128 16 H25 14,55 1,441 17 H26 11,90 2,088 18 H27 12,85 2,295 19 H28 11,45 1,991 20 H30 15,15 1,870 21 H31 16,10 1,359 22 H32 15.55 1,467 23 H33 19,35 1,548 24 H34 18,85 1,508 25 H35 7,55 1,325 26 H36 12,55 1,540 27 H37 9,15 1,289 28 H38 10,20 1,299 29 H39 14,50 1,480 30 H40 5,60 1,750 31 H41 7,95 1,574 32 H42 7,15 1,644 33 H43 8,65 1,730 34 H44 10,75 1,667 35 H45 11,30 2,825 36 H46 15,70 2,635 37 H47 13,40 3,526 38 H48 17,25 3.017 39 H50 18,70 3,041 40 H51 17,70 2,565 41 H52 22,25 2,392 42 H53 15,50 2,135 43 H54 20,15 2,436 Trung bình 15,55 ± 4,420 1,983 ± 0,539 3.2. Kết quả tối ưu hóa quy trình nhân dòng đoạn gen matK bằng kỹ thuật PCR 3.2.1. Tối ưu quy trình PCR Chúng tôi tiến hành tối ưu các thành phần của phản ứng nhân dòng đoạn gen matK, bao gồm: nhiệt độ gắn mồi, nồng độ DNA, nồng độ mồi để đảm bảo có được một quy trình nhân dòng gen đặc hiệu và ổn định. 27
Kết quả tối ưu nhiệt độ gắn mồi Trong phản ứng PCR nhiệt độ gắn mồi là yếu tố quan trọng quyết định hiệu suất của PCR. Vì vậy, dựa vào khuyến cáo của hãng chúng tôi tiến hành tối ưu nhiệt độ trong dải nhiệt bao gồm 9 nhiệt độ khác nhau: 43,9; 45,6; 47,5; 49,8; 52,4; 55,1; 57,7; 60,1 và 62,1 oC; hai mẫu đối chứng luôn được thực hiện bao gồm: một mẫu đối chứng âm, một mẫu chứng dương. Mẫu đối chứng âm là mẫu không có DNA khuôn (DDW) dùng để kiểm soát quá trình nhiễm chéo trong phản ứng PCR. Mẫu đối chứng dương là DNA tổng số được tách chiết từ mẫu lá Dây thường xuân để nhân dòng đoạn gen GBSSI với cặp mồi 10F/11R. Mẫu đối chứng dương được sử dụng để xác định độ ổn định của các thành phần phản ứng nhằm đảm bảo khả năng PCR thành công. Sau phản ứng tối ưu nhiệt độ gắn mồi, chúng tôi sử dụng các sản phẩm PCR thành công là đối chứng dương cho các phản ứng về sau. Theo như kết quả điện di sản phẩm tối ưu nhiệt độ gắn mồi cho gen matK thể hiện trong Hình 3.2, cho thấy: Ở dải nhiệt độ gắn mồi từ 43,9 – 60,1 oC cho lên băng đặc hiệu. Trong đó nhiệt độ từ 49,8 – 57,7 oC cho lên băng sáng rõ đặc biệt là băng ở 55,1oC. Do đó, chọn 55,1 oC là nhiệt độ gắn mồi. Hình 3.2. Tối ưu nhiệt độ gắn mồi phản ứng nhân dòng gen matK Làn M: Thang chuẩn Gene Ruler 100 bp; Kí hiệu trên các làn: nhiệt độ gắn mồi (oC); (-): Đối chứng âm; (+): Đối chứng dương. Kết quả tối ưu nồng độ DNA Đối với phản ứng tối ưu nồng độ DNA, tôi chọn dải nồng độ: 1,25; 2,5; 5; 10; 20; 40 ng/µL đối với gen matK . Kết quả điện di cho thấy: Điện di sản phẩm PCR cho lên băng đặc hiệu với nồng độ DNA tổng số trong mẫu từ 1,25 - 40 ng/µL, băng sáng rõ ở nồng độ từ 2,5 đến 40 ng/µL, tuy nhiên nồng độ DNA khuôn tối ưu nhất là 2,5 - 10 ng/µL (Hình 3.3). 28
Hình 3.3. Tối ưu nồng độ DNA phản ứng nhân dòng gen matK Làn M: Thang chuẩn Gene Ruler 100 bp; Ký hiệu trên các làn: nồng độ DNA (ng/ µL); Làn (-): Đối chứng âm; Làn (+): Đối chứng dương Kết quả tối ưu nồng độ mồi: Để tăng độ lặp lại cho phản ứng, tôi tiến hành tối ưu nồng độ mồi ở 03 lô mẫu khác nhau với dải nồng độ 0,1; 0,3, 0,9 µM. Sản phẩm của phản ứng tối ưu nồng độ mồi được điện di trên gel agarose 1,5% đều cho các băng đặc hiệu. Từ 03 lô mẫu, tôi lựa chọn được tại nồng độ 0,3 µM phản ứng PCR cho hiệu suất cao nhất với gen matK. (Hình 3.4) Hình 3.4. Tối ưu nồng độ mồi phản ứng nhân dòng gen matK Làn M: Thang chuẩn Gene Ruler 100 bp; Ký hiệu các làn: nồng độ mồi (µM) tương ứng với 3 lô mẫu; Làn (-): Đối chứng âm; Làn (+): Đối chứng dương Như vậy, thông qua các phản ứng trên, chúng tôi xác định điều kiện tối ưu cho phản ứng PCR nhân dòng đoạn gen matK là: Gắn mồi ở 51,1 ºC, nồng độ DNA là 2,5-10 ng/µL và nồng độ mồi là 0,3 µM. 3.2.2. Kết quả nhân dòng gen matK từ các mẫu thực vật Chúng tôi tiến hành PCR với điều kiện phản ứng được trình bày chi tiết trong Bảng 3.2, với 43 mẫu DNA tổng số đã nhân dòng thành công. 29
Bảng 3.2. Các thành phần và chu trình nhiệt của phản ứng PCR nhân dòng đoạn gen matK Thành phần Nồng độ Thể tích Chu trình nhiệt hoạt động (µL) 5x buffer 1x 5,0 *Biến tính ban đầu: 98 ºC trong 30 giây. dNTP 2 mM 0,2 mM 2,5 *Lặp lại 35 chu kỳ: Phusion DNA polymerase 0,02 u/ μL 0,25 - Biến tính: 98 ºC trong 10 giây 2u/μL - Gắn mồi: 55,1 ºC trong 30 giây Mồi xuôi 0,3 µM 0,75 - Kéo dài chuỗi: 72 ºC trong 30 giây Mồi ngược 0,3 µM 0,75 * Tổng hợp cuối: 72 ºC trong 10 DDW 14,75 phút *Giữ sản phẩm ở 4 ºC DNA 0,5 ng/µL 1,0 Tổng thể tích 25 Sản phẩm được điện di trên gel agarose 1,5% (Hình 3.5). Chúng tôi ghi nhận 43/43 mẫu nghiên cứu cho sản phẩm PCR đặc hiệu, sáng rõ với kích thước tương ứng khoảng 950 bp so với thang chuẩn Gene Ruler 100 bp. Sản phẩm này, đủ điều kiện để gửi giải trình tự. Hình 3.5. Kết quả PCR nhân dòng đoạn gen matK Làn M: Thang chuẩn Gene Ruler 100 bp; Ký hiệu trên các làn: ký hiệu các mẫu phân tích; Làn (-): Đối chứng âm; Làn (+): Đối chứng dương 30
3.3. Giải trình tự Sản phẩm PCR sau khi giải trình tự bởi hãng First Base (Malaysia) được đọc thông qua phần mềm BioEdit ver 7.2.6.1 (Hình 3.6). 43/43 mẫu được giải trình tự vùng gen matK quan tâm. Chúng tôi nhận thấy chiều dài đoạn gen matK của các mẫu khoảng 920 bp khi chưa xử lý đoạn nhiễu. Kết quả này tương đối đồng đều giữa các mẫu và với kết quả điện di. Hình 3.6. Kết quả hiển thị giải trình tự của mẫu đại diện H4 của gen matK qua phần mềm BioEdit 3.4. Độ tương đồng của trình tự gen matK được khuếch đại Từ kết quả chạy chương trình BLAST, chúng tôi tiến hành chọn các trình tự H. nepalensis và H. helix làm nhóm nội và trình tự Tetrapanax papyrifer làm nhóm ngoại, thông tin chi tiết được trình bày trong Bảng 3.3. Bảng 3.3. Các trình tự tham chiếu lấy từ Genbank sử dụng trong nghiên cứu STT Tên loài Mã số Genbank 1 Hedera nepalensis var. sinensis GQ434260.1 [27] 2 Hedera helix AJ319073.1 [37] 3 Tetrapanax papyrifer GQ434267.1 [27] 31
Chúng tôi tiến hành chia nhóm các mẫu dựa trên dữ liệu so sánh nhận về từ chương trình BLAST (Bảng 3.4). Những mẫu có số nucleotide giống nhau 100% sẽ được xếp vào chung một nhóm để tinh gọn cây phát sinh chủng loại. Bảng 3.4. Phân nhóm các mẫu trong nghiên cứu STT Haplotype Số lượng mẫu Mẫu 1 N1 32 H4, H16, H17, H18, H19, H20, H21, H23, H24, H25, H26, H27, H28, H30, H31, H32, H33, H34, H35, H36, H37, H38, H39, H40, H41, H42, H43, H44, H50, H51, H53, H54 2 N2 7 H1, H2, H5, H6, H45, H46, H47 3 N3 4 H3, HH, H48, H52 Tổng: 43 mẫu Phản ứng nhân dòng đoạn gen matK sử dụng cặp mồi 390F/1326R thu được trình tự có kích thước khoảng 920 bp và nằm hoàn toàn trong gen matK có độ dài khoảng 1500 bp. Trong đó, haplotype N1 có trình tự tương đồng 100% với trình tự GQ434260.1 H. nepalensis var. sinensis. Haplotype N2 có trình tự tương đồng 99,88% với trình tự GQ434260.1 H. nepalensis var. sinensis. Haplotype N3 có trình tự tương đồng 100% với trình tự AJ319073.1 H. helix. Khoảng cách di truyền và số lượng nucleotide sai khác của 3 nhóm mẫu với các trình tự tham chiếu được trình bày trong Bảng 3.5. Bảng 3.5. Khoảng cách di truyền (phía dưới bên trái) và số lượng nucleotide sai khác (phía trên bên phải) giữa 03 haplotype với 03 trình tự tham chiếu [1] [2] [3] [4] [5] [6] [1] N1 - 1 2 0 2 18 [2] N2 0.00075 - 1 1 1 17 [3] N3 0.00150 0.00075 - 2 0 18 [4] H. nepalensis. 0.00000 0.00075 0.00150 - 2 18 GQ434260.1 [5] H. helix. AJ319073.1 0.00150 0.00075 0.00000 0.00150 - 18 [6] T. papyrifer. 0.01405 0.01327 0.01407 0.01405 0.01407 - GQ434267.1 32
Hình 3.7. So sánh trình tự đoạn gen matK của các haplotype nghiên cứu với các trình tự tham chiếu 33
Từ bảng khoảng cách di truyền có thể nhận thấy haplotype N1 có trình tự nucleotide giống hoàn toàn với trình tự H. nepalensis var. sinensis. GQ434260.1 trên Genbank và khác haplotype N2 1 nucleotide ở vị trí 782. Haplotype N3 có trình tự giống hoàn toàn với H.helix. AJ319073.1 và khác haplotype N1 2 nucleotide ở vị trí 606 và 782. Haplotype N2 khác N3 1 nucleotide ở vị trí 606 (Tổng số nucleotide trong trình tự là 792). Sự khác biệt về nucleotide và vị trí sai khác được thể hiện qua Hình 3.7. 3.5. Cây phát sinh chủng loại dựa trên vùng gen matK Trước khi tiến hành xây dựng cây phát sinh chủng loại, mô hình tiến hóa đặc trưng cho matK được tính toán bằng phần mềm MEGA X. Mô hình tối ưu được xác định là mô hình 3 tham số Tamura (T92) với phân phối Gamma là thích hợp nhất (BIC = 2456,978; AICc = 2385,904; -lnL = 1181,924; R = 0,91), phân tích bootstrap với 1000 lần lấy lại mẫu. Đây là mô hình tiến hóa tốt nhất vì có điểm BIC thấp nhất. Trong đó, R là độ lệch đồng hoán/dị hoán, lnL là giá trị khả năng tối đa Mức độ tin cậy được đánh giá theo giá trị bootstrap như sau: mức độ tin cậy cao: >85%; mức độ tin cậy trung bình: 65-85%; mức độ tin cậy thấp: <65%. Chúng tôi tiến hành xây dựng cây chủng loại bằng phương pháp UPMA (Hình 3.8) và Maximum Likelihood (Hình 3.9). Hình 3.8. Cây phát sinh chủng loại xây dựng bằng phương pháp UPGMA của 03 haplotype với 03 trình tự tham chiếu dựa trên chỉ thị matK Lịch sử tiến hóa đã được suy luận bằng phương pháp UPGMA. Cây tối ưu với tổng chiều dài nhánh = 0,01190231 được hiển thị. Tỷ lệ phần trăm của các cây sao chép trong đó các đơn vị phân loại liên kết với nhau trong thử nghiệm bootstrap 34
(1000 lần lặp lại) được hiển thị bên cạnh các nhánh. Khoảng cách tiến hóa được tính toán bằng phương pháp Khả năng tổng hợp tối đa và được tính theo đơn vị số lượng thay thế cơ sở trên mỗi vị trí. Phân tích này liên quan đến 6 trình tự nucleotide. Các vị trí mã hóa được bao gồm là 1 + 2 + 3 + Không mã hóa. Tất cả các vị trí không rõ ràng đã bị xóa cho từng cặp trình tự (tùy chọn xóa theo cặp). Có tổng cộng 792 nucleotide trong bộ dữ liệu cuối cùng. Các phân tích tiến hóa được tiến hành trong MEGA version X. Hình 3.9. Cây phát sinh chủng loại xây dựng bằng phương pháp Maximum Likelihood của 03 haplotype với 03 trình tự tham chiếu dựa trên chỉ thị matK Lịch sử tiến hóa đã được suy luận bằng cách sử dụng phương pháp Khả năng tối đa và mô hình 3 tham số Tamura. Cây có khả năng cao nhất được hiển thị. Tỷ lệ cây trong đó các đơn vị phân loại liên kết với nhau được hiển thị bên cạnh các nhánh. Cây ban đầu được lấy tự động bằng cách áp dụng thuật toán Neighbor-Join và BioNJ cho ma trận khoảng cách theo cặp được ước tính bằng cách sử dụng phương pháp Tối đa tổng hợp (MCL). Phân tích này liên quan đến 6 trình tự nucleotide. Các vị trí mã hóa được bao gồm là 1 + 2 + 3 + Không mã hóa. Có tổng cộng 792 nucleotide trong bộ dữ liệu cuối cùng. Các phân tích được tiến hành trong MEGA version X. Từ cây phân loài theo phương pháp UPGMA cho thấy với các nhóm nội, có hai nhánh chính: nhánh thứ nhất gồm N1, N2 và H. nepalensis và nhánh thứ hai gồm N3 và H. helix. Nhánh thứ nhất cho thấy N1 có mối quan hệ gần gũi với H. nepalensis với chỉ số bootstrap 63%, N2 có mối quan hệ gần gũi với H. nepalensis nhưng không đạt được sự ủng hộ cao với chỉ số bootstrap thấp: 52%. Haplotype N3 có mối quan hệ gần gũi với H. helix với chỉ số bootstrap cao (>85%), độ tin cậy cao. 35
Với cây phân loài được xây dựng theo phương pháp Maximum Likelihood, có thể nhận thấy haplotype N3 có mối quan hệ gần gũi với H. helix và haplotype N1 có quan hệ gần gũi với H. nepalensis với chỉ số bootstrap có mức độ tin cậy trung bình (>65%). Tuy nhiên, haplotype N2 có mối quan hệ gần gũi với N1 và H. nepalensis với chỉ số bootstrap 28%. Ngoài ra, chúng tôi cũng tiến hành xây dựng cây phát sinh chủng loại của 3 haplotype trong nghiên cứu với trình tự các loài trong chi Hedera được công bố trên Genbank. Cây phân loài được xây dựng theo phương pháp UPGMA để xác định mối quan hệ di truyền và tiến hóa của các loài Hedera. Hình 3.10. Cây phát sinh chủng loại xây dựng bằng phương pháp UPGMA của 03 haplotype với trình tự các loài Hedera dựa trên chỉ thị matK Lịch sử tiến hóa đã được suy luận bằng phương pháp UPGMA. Cây tối ưu với tổng chiều dài nhánh = 0,02826992 được hiển thị. Tỷ lệ phần trăm của các cây sao chép trong đó các đơn vị phân loại liên kết với nhau trong thử nghiệm bootstrap (1000 lần lặp lại) được hiển thị bên cạnh các nhánh. Khoảng cách tiến hóa được tính toán bằng phương pháp Khả năng tổng hợp tối đa và được tính theo đơn vị số lượng thay thế trên mỗi vị trí. Phân tích này liên quan đến 9 trình tự nucleotide. Các vị trí mã hóa được bao gồm là 1 + 2 + 3 + Không mã hóa. Tất cả các vị trí không rõ ràng đã bị xóa cho từng cặp trình tự (tùy chọn xóa theo cặp). Có tổng cộng 709 nucleotide trong bộ dữ liệu cuối cùng. Các phân tích tiến hóa đã được tiến hành trong MEGA version X. 36
Theo Hình 3.10, cây tách làm hai nhánh lớn ở các loài chi Hedera, nhánh thứ nhất gồm H. nepalensis, H.rhombea, N1, H. azorica, H. algeriensis, N2 và nhánh thứ hai gồm N2 và H. helix với chỉ số bootstrap 64%. Nhánh thứ nhất gồm hai nhánh phụ, nhánh phụ thứ nhất gồm H. nepalensis, H.rhombea và N1 với chỉ số bootstrap 65% (độ tin cậy trung bình) và nhánh phụ thứ hai gồm H. azorica, H.algeriensis (với độ tin cậy cao, bootstrap 100%) và N2 với chỉ số bootstrap 40%. 37
CHƯƠNG 4. BÀN LUẬN 4.1. Kết quả xây dựng quy trình phân tích đoạn gen matK 4.1.1. Tách chiết DNA tổng số 43/43 mẫu được tách DNA thành công theo quy trình Kit Gene Jet cho băng điện di sáng rõ, không bị đứt đoạn. Việc sử dụng Kit Gene Jet trong tách chiết DNA tổng số mang lại nhiều lợi ích trong quá trình thực nghiệm. Ưu điểm của tách kit bao gồm: Thứ nhất, tách chiết DNA tổng số chỉ từ một lượng nhỏ mẫu lá (không quá 20 mg). Thứ hai, DNA tách chiết từ kit sẽ cho hiệu suất của phản ứng nhân dòng đoạn gen đích cao (43/43 mẫu đều được PCR thành công), phù hợp với kết quả nghiên cứu của Nguyễn Thị Thu Thảo [11]. Điều này có thể giải thích là do DNA tổng số đảm bảo độ tinh sạch vì đã được loại bỏ một lượng đáng kể các hợp chất thứ cấp và các chất hóa học trong lá như protein, tanin, polysacarride, RNA, Các hợp chất này thường khó để phát hiện và loại bỏ khỏi có thể gây ức chế phản ứng PCR. Thứ ba, tiết kiệm thời gian hơn so với quy trình tách chiết thủ công. Quy trình mini-CTAB; CTAB cải tiến tiêu tốn khá nhiều thời gian và thường mất 2 ngày để tách chiết và thu hồi được DNA [82]. Không những vây, việc để tủa DNA khô trong tủ sấy có thể có nguy cơ bị nhiễm chéo gây ảnh hưởng đến kết quả của các thí nghiệm về sau. Cuối cùng là an toàn và tiện lợi hơn cho người thực hiện thí nghiệm do không phải tiếp xúc với các hóa chất độc hại như khi tách chiết theo quy trình thủ công (clorofom, β-mercaptoethanol, ) Mặc dù vậy, việc tách DNA theo kit GeneJet cũng có một số hạn chế đó là nồng độ DNA được tách chiết không cao (trung bình 15,50 ng/µL) và OD của một số mẫu vượt nằm ngoài khoảng 1,8 - 2,2. Tuy nhiên, các mẫu này vẫn nhân dòng gen matK 100%, cho băng điện di sáng rõ và đặc hiệu, đủ điều kiện sử dụng cho các phân tích gen tiếp theo. Như vậy, GeneJET Plant Genomic DNA Purification Mini Kit của Thermo Scientific là kit tách chiết DNA hiệu quả từ mẫu lá khô Dây thường xuân phục vụ phân tích với chỉ thị matK. Theo khuyến cáo từ một số nghiên cứu thì nên tách DNA từ mẫu mô tươi và non thay vì mẫu mô trưởng thành sẽ cho độ tinh sạch cao hơn do mẫu mô trưởng thành có chứa nồng độ cao của polysaccaride, polyphenol và các chất chuyển hóa thứ cấp khác [24, 30, 94]. 38
4.1.2. Khuếch đại đoạn gen matK Tối ưu phản ứng PCR là bước đầu tiên cần làm để đạt được hiệu suất nhân dòng gen cao nhất. Không chỉ vậy, tối ưu quy trình giúp chuẩn hoá các điều kiện phản ứng và tiết kiệm thời gian trong quá trình thí nghiệm. 3 yếu tố liên quan đến phản ứng được tối ưu là: nhiệt độ gắn mồi, nồng độ DNA khuôn và nồng độ mồi. Với gen matK, Cuénoud và cộng sự đã chọn 48 ºC làm nhiệt độ gắn mồi cho cặp mồi 390F/1326R khi phân tích các mẫu thuộc bộ Caryophyllales [29]. Nhiệt độ gắn mồi khác nhau ở các nghiên cứu này so với nghiên cứu của chúng tôi là do sự khác nhau về DNA polymerase, thậm chí có thể do ảnh hưởng bởi hệ thiết bị khác nhau. Chính vì vậy, tối ưu nhiệt độ gắn mồi cần được thực hiện đầu tiên để có quy trình PCR ổn định. Nhiệt độ gắn mồi là yếu tố quan trọng nhất giúp cho mồi bắt cặp thành công với DNA cũng là yếu tố quyết định phản ứng PCR có thực hiện được hay không. Đối với mẫu thực vật, nồng độ DNA khuôn cao thường ức chế phản ứng nhân dòng do sự tồn tại của các tạp chất còn tồn lưu cùng DNA khuôn. Qua quá trình thực nghiệm, chúng tôi nhận thấy kết quả nhân dòng gen matK đạt hiệu suất cao. Kết quả điện di sản phẩm PCR cho thấy các băng DNA lên rõ nét, kích thước giữa các mẫu đồng đều, không có băng phụ chứng tỏ phản ứng nhân dòng đặc hiệu. Có thể thấy, việc nhân bản mã vạch matK ở chi Hedera không gặp nhiều khó khăn, tỷ lệ khuếch đại thành công là 100%. Nguyên nhân có thể là do mức độ đa hình ở các đoạn trình tự giữa các loài không cao, có thể khuếch đại chỉ với một cặp mồi đặc hiệu. Điều này dẫn đến tỷ lệ các vị trí mang thông tin không đáng kể. Ngoài ra, trong quá trình thực nghiệm có một số mẫu cần PCR nhiều hơn một lần (2-3 lần) do mẫu DNA tổng số có một số chất chuyển hóa ảnh hưởng đến quá trình PCR và do kỹ thuật. Cặp mồi 390F/1326R sử dụng trong nghiên cứu này đã được ứng dụng trong nhiều nghiên cứu trước đó và được khuyến cáo làm mã vạch trong phân loại thực vật. Trong nghiên cứu của Lei và cộng sự (2014) trên 27 loài thực vật có độc thuộc 22 chi và 17 họ ở Trung Quốc, cặp mồi này được đánh giá là hiệu quả cao trong định danh loài [68]. Ngoài ra, Sun và cộng sự cũng nhân lên được đoạn gen matK dài 907 bp giúp phân biệt Helleborus với các chi khác [90]. Năm 2002, Cuénoud sử dụng cặp mồi 390F/1326R khuếch đại khoảng 930 bp trình tự matK giúp phân loại trong bộ Caryophyllales [29]. Độ dài đoạn gen matK được nhân lên bởi cặp mồi 390F/1326R của các nghiên cứu trên khá tương đồng với nghiên cứu của chúng tôi. 39
4.1.3. Giải trình tự và so sánh độ tương đồng 43/43 mẫu được giải trình tự thành công đoạn gen matK. Tuy nhiên, kết quả giải trình tự của một số mẫu bị nhiễu do đó cần thực hiện lại phản ứng PCR. Đa số các sản phẩm PCR được giải trình tự theo chiều mồi xuôi (390F), tuy nhiên có một số mẫu được đọc giải trình tự theo mồi ngược (1326R) vì kết quả trình tự đọc theo chiều 390F bị nhiễu. Điều này có thể giải thích là do gen matK có độ dài tương đối lớn, một số đoạn trình tự có độ biến thiên cao, trong quá trình bắt cặp và gắn thêm base nitơ có thể gây nhầm lẫn. Về độ tương đồng thì các mẫu nghiên cứu đều được đối chiếu với các trình tự trên Genbank nhằm tìm loài tương đồng, đồng thời đảm bảo rằng đoạn gen nhân lên đúng vùng trình tự quan tâm. Trong đó, haplotype N1 có trình tự tương đồng 100% với trình tự GQ434260.1 H. nepalensis var. sinensis. Haplotype N2 có trình tự tương đồng 99,88% với trình tự GQ434260.1 H. nepalensis var. sinensis. Haplotype N3 có trình tự tương đồng 100% với trình tự AJ319073.1 H. helix, trong đó trình tự 3 mẫu H3, H48, H52 thu thập tại Việt Nam giống 100% với trình tự HH đối chứng từ Vườn thực vật Hoa Nam, Trung Quốc. Các trình tự được khuếch đại bằng cặp mồi 390F/1326R có độ dài khoảng 920 bp đều thuộc vùng gen matK. Kết quả giải trình tự sau khi so sánh độ tương đồng trên chương trình BLAST đủ điều kiện làm dữ liệu phục vụ cho xây dựng cây phát sinh loài nhằm phân tích đa dạng di truyền nguồn gen Dây thường xuân ở miền Bắc Việt Nam. 4.2. Nghiên cứu đa dạng di truyền nguồn gen Dây thường xuân sử dụng mã vạch matK 4.2.1. Khoảng cách di truyền Bảng khoảng cách di truyền thể hiện vị trí sai khác và mối quan hệ tiến hóa giữa trình tự đoạn gen matK của 3 haplotype với 2 nhóm nội H. nepalensis. GQ434260.1, H. helix. AJ319073.1 và 1 nhóm ngoại T. papyrifer. GQ434267.1. Kết quả cho thấy nhóm N1 không có vị trí sai khác nào với H. nepalensis đối chứng, nhóm N2 có 01 vị trí sai khác với H. nepalensis đối chứng. Nhóm N3 không có vị trí sai khác nào với H. helix đối chứng. Theo Hình 3.7, nhóm N1 sai khác với nhóm N3 ở 2 vị trí (T>G ở vị trí 606 và G>A ở vị trí 782). Nhóm N2 sai khác với nhóm N1 ở 1 vị trí (G>A ở vị trí 782). Nhóm N2 sai khác với nhóm N3 ở 1 vị trí (T>G ở vị trí 606). Trong đó, đột biến thay thế ở vị trí 606 là dị hoán (từ pyrimidine sang purine) và ở vị trí 782 là đồng hoán (từ purine sang purine). Trong thực tế, đột biến thay thế base có xu hướng nghiêng về đột biến đồng hoán, cho nên trong số các đột 40
biến thay thế base tự phát thì tỷ lệ đột biến là 2 đồng hoán : 1 dị hoán. Vì vậy, đột biến dị hoán có trọng số cao hơn (có ý nghĩa hơn) trong nghiên cứu phát sinh loài. Các đột biến này đã hình thành 3 haplotype trong chi Hedera ở Việt Nam. Độ dài đoạn gen matK được sử dụng để so sánh BLAST và chạy ClustalW là 792, trong đó số nucleotide bảo thủ lên đến 790 (tỷ lệ đột biến là 0,25%). Tuy nhiên, từ bảng khoảng cách di truyền và cây phát sinh chủng loại, nhận thấy 2 vị trí đa hình này đều mang thông tin hữu ích cho việc phân loài. Haplotype N2 chỉ tồn tại ở Lào Cai và Lào Cai là tỉnh duy nhất xuất hiện cả 2 haplotype N2 và N3. Từ đó có thể nhận định Lào Cai là địa phương có điều kiện môi trường và địa lý phù hợp cho cả Dây thường xuân (haplotype N2) và Thường xuân (haplotype N3) sinh trưởng và phát triển. Ngoài ra, còn có thể kết luận chỉ thị matK giúp phân biệt haplotype N2 với các haplotype khác và góp phần định danh haplotype này ở Lào Cai. Haplotype N3 gồm 4 mẫu H3, HH, H48, H52 trong đó có 3 mẫu H3, H48, H52 được thu thập ở Việt Nam thuộc loài H. helix. 3 mẫu này đều là các mẫu nhập trồng, không phải loài bản địa và đã hoang dại hóa theo điều tra của Viện Dược liệu. N3 chỉ xuất hiện ở Sa Pa (Lào Cai) và Đà Lạt (Lâm Đồng). Điều này chứng tỏ 2 địa phương này có điều kiện khí hậu và địa lý phù hợp cho sự sinh trưởng và phát triển của H. helix. Vì vậy, nếu muốn trồng Thường xuân để bảo tồn giống và làm nguyên liệu phục vụ cho sản xuất thuốc thì nên cân nhắc 2 vùng này. Phân bố địa lý các haplotype cũng cho thấy N1 là haplotype phổ biến nhất với số lượng lớn (32/43 mẫu) xuất hiện ở ba tỉnh miền núi phía Bắc là Lai Châu, Hà Giang, Lạng Sơn. Theo điều tra của Viện Dược liệu và từ kết quả nghiên cứu của chúng tôi thì N1 thuộc loài H. nepalensis var.sinensis. Haplotype N1 gồm các mẫu sống trong môi trường tự nhiên. Điều này chứng minh rằng, hiện nay, H. nepalensis dễ sinh trưởng và phát triển ở các tỉnh miền núi phía Bắc. 4.2.2. Phân tích đa dạng di truyền nguồn gen Dây thường xuân ở miền Bắc Việt Nam Chúng tôi chọn UPGMA và Maximum Likelihood là hai phương pháp để xây dựng cây phát sinh loài. Nguyên lý của phương pháp UPGMA là xây dựng ma trận khoảng cách không có trọng số, so sánh điểm tương đồng giữa các trình tự. Các trình tự sẽ được ghép cặp với nhau, càng giống nhau thì càng tương đồng. Ưu điểm của phương pháp này là cho kết quả nhanh, phù hợp để xử lý một lượng lớn số liệu và cho biết khoảng cách di truyền tương đối giữa các loài. Tuy nhiên, phương pháp UPGMA không phản ánh được sự tiến hóa của gen vì không phải đột biến cũng có 41
trọng số bằng nhau. Để khắc phục nhược điểm của UPGMA, chúng tôi tiến hành phương pháp Maximum Likelihood. Phương pháp này sử dụng tất cả các thông tin tiến hóa đã biết bao gồm các thay thế riêng lẻ trong các chuỗi. Đối với mỗi vị trí, tất cả các cây có thể đều được đánh giá và cho điểm dựa trên số lượng thay đổi tiến hóa cần thiết để tạo ra thay đổi trình tự quan sát được. ML tính toán khả năng cho mỗi cây và xác định cây tiến hóa có xác suất xảy ra cao nhất. Vì vậy, cây phát sinh chủng loại của phương pháp này cung cấp thông tin chính xác và chi tiết hơn so với các phương pháp khác. Phương pháp này thường được dùng để kiểm chứng lại các cây phân loài đã được xây dựng từ các phương pháp khác. Nhưng nhược điểm của nó là tốc độ xử lý thông tin chậm và không khả thi khi phân tích lượng dữ liệu lớn. Với cả 2 cây phân loài theo phương pháp UPGMA và Maximum Likelihood, các nhóm mẫu phân nhánh cho kết quả tương đồng thể hiện sự tin cậy của các nhánh (có sự đồng thuận của cả 2 cây). Chỉ thị matK cho thấy có thể phân biệt được các loài khác chi trong cùng họ Araliaceae. Cụ thể trong nghiên cứu này, chúng tôi sử dụng T. papyrifer. GQ434267.1 làm nhóm ngoại. Kết quả cho thấy T. papyrifer tách nhánh tốt, trở thành một nhánh riêng biệt với các loài trong chi Hedera. Kết quả này góp phần chứng minh matK là một mã vạch phân tử tốt để phân biệt và định danh các loài khác chi, khác họ theo nhiều nghiên cứu trước đó. Với các nhóm nội, cụ thể, nhánh N3 (4 mẫu thuộc loài H. helix là H3, HH, H48 và H52) cho giá trị bootstrap lớn hơn 65% ở cả 2 cây phân loài là với mức độ ủng hộ cao; 32 mẫu thuộc nhóm N1 có quan hệ chặt chẽ với H. nepalensis var.sinensis đạt được mức độ tin cây trung bình ở cây Maximum Likelihood. 7 mẫu nhóm N2 có mối quan hệ gần gũi với N1 và H. nepalensis var.sinensis với mức độ tin cậy thấp ở cả hai cây. Điều này chứng tỏ khả năng tách nhánh của N2 khỏi nhánh của N1 và H. nepalensis var.sinensis là khá thấp. Theo phân loại hình thái các mẫu N2 đều thuộc loài H. nepalensis var.sinensis tuy nhiên các haplotype N2 không tương đồng 100% với trình tự H. nepalensis tham chiếu. Sự sai khác này có thể được giải thích là do có sự biến đổi của trình tự nucleotide do sự thay đổi của môi trường địa lý và khí hậu. Tuy chỉ số bootstrap không cao (52% ở cây UPGMA và 28% ở cây Maximum Likelihood) nhưng cây được chọn lại là cây có khả năng xuất hiện cao nhất trong tất cả các cây có thể được tạo thành. Vì vậy có thể kết luận haplotype N2 thuộc loài H. nepalensis. Kết quả phân loài của cây chủng loại giống với kết quả phân loại dựa trên đặc điểm hình thái (N1, N2: H. nepalensis 42
var.nepalensis và N3: H. helix). Vì vây, chúng tôi kết luận mã vạch matK có khả năng phân loại H. nepalensis var.sinensis với H. helix. Để có cơ sở chắc chắn hơn giúp định danh các loài Dây thường xuân, chúng tôi khuyến cáo cần kết hợp matK với các chỉ thị khác có tốc độ tiến hóa cao hơn để thu được kết quả đáng tin cậy hơn. Ngoài ra, cũng có thể dùng thêm các cặp mồi chồng chéo để khuếch đại toàn bộ gen matK (khoảng 1500 bp) nhằm cung cấp thêm các vị trí đa hình, phục vụ cho việc phân biệt các loài trong chi Hedera. Trên thế giới, đã có một số nghiên cứu về chi Hedera cũng sử dụng matK làm mã vạch phân tử để phân tích mối quan hệ di truyền và địa lý thực vật (thông tin trong Bảng 4.1). Bảng 4.1. Trình tự các mồi của gen matK được sử dụng trong các nghiên cứu về chi Hedera trên thế giới Mục tiêu phân Khu vực Trình tự mồi TLTK loại thu mẫu Địa lý thực vật Châu Âu K1: GGGTTGCCCGGGATTCGAAC [37] của cây thường và matK1: ATTAGGGCATCCCATTAGTA xuân (Hedera Morocco sp.) ở châu Âu: matK2: CTAGCACAAGAAAGTCGAAG phân biệt gen matK3’: GTACTTGCTCATGATCATGG qua không gian và thời gian matK4: TGCATGAAAGGATCCTTGAA matK5: ATATTTATGCACTTGCTCAT matK5b: AAAGGAAATATTGAATGAAT matK6b: GGATTTCTAACCATCTTGTT matK6: CCATGATCATGAGCAAGTGC K2: CAACGGTAGAGTACTCGGCTTTTA Phân tích phát Từ Hiệp matK5: TGTCATAACCTG CATTTTCC [36, 84] sinh gen và địa hội Ivy matK6: TGGGTTGCTAACTCAATGG sinh học của các Hoa Kỳ loài thường xuân và Bắc PsbA59R: (Hedera spp.) Mỹ AACCATCCAATGTAAAGACGGTTT matK8F: TCGACTTTCTTGTGCTAGAACTTT Năm 2002, Grivet. D. và R. J. Petit đã sử dụng 5 cặp mồi chồng chéo (K1/matK1, matK2/matK3’, matK4/matK5, matK5b/matK6b và matK6/K2) (Bảng 4.1) để nhân dòng đoạn gen trnK (chứa matK) từ các mẫu lá tươi của 27 quần thể thuộc 4 loài H. maroccana, H. maderensis ssp. Iberica, H. hibernica, H. helix ssp.helix. Vùng intron trnK cho 5 vị trí đa hình trên 2474 base, đều nằm trong exon matK, cho phép phân biệt giữa các haplotype G từ Tây Ban Nha (G1) và từ Balkans 43
(G2), và giữa haplotype I từ Morocco (I1) và từ Balkans (I2). Nhìn chung, năm vị trí đa hình cho phép xác định sáu haplotype (AJ319066, AJ319068, AJ319059, AJ319070, AJ319072, AJ319074) [37]. So sánh với nghiên cứu của chúng tôi, mã vạch matK cũng giúp phân biệt haplotype N2 (ở Lào Cai) với hai haplotype còn lại. Các kết quả này phần nào chứng minh khả năng xác định và phân biệt các haplotype của chỉ thị matK. Năm 2011, Green và cộng sự đã tiến hành nghiên cứu 27 mẫu, bao gồm tất cả 13 loài được công nhận về mặt phân loại trong chi Hedera cùng 5 loài khác dùng làm nhóm ngoại. Nghiên cứu này sử dụng vùng không mã hóa của gen matK kết hợp với các vùng không mã hóa khác trong gen lục lạp nhằm phân loại các loài thuộc chi Hedera. Mười hai vùng không mã hóa ở lục lạp cho 33 vị trí đa hình trong đó có một vị trí đa hình ở vùng không mã hóa của gen matK. Từ cây phân loại có thể nhận thấy khác nhau chủ yếu ở vị trí nhóm ngoài (Fatsia và Trevesia là nhóm chị em với Hedera). Các loài trong chi Hedera chia thành hai nhánh. Nhánh đầu tiên, nhỏ hơn bao gồm các phân loại từ lưu vực phía tây Địa Trung Hải, bao gồm Tây Bắc Châu Phi (H. maroccana), Quần đảo Canary (H. canariensis) và Bán đảo Iberia (H. helix subsp. Rhizomatifera McAllister và H. iberica). Nhánh thứ hai, lớn hơn chứa các loài từ lưu vực trung tâm và phía đông Địa Trung Hải (H. algeriensis, H. cypria, H. helix subsp. Caucasigena Kleop), miền bắc và trung tâm châu Âu (H.helix subsp. helix, H. hibernica), Macaronesia (H. azorica, H. maderensis K. Koch ex Rutherford) và Châu Á (H. colchica, H. nepalensis, H. pastuchovii, H.rhombea). Kết quả này cho thấy khi kết hợp vùng không mã hóa của gen matK với 11 vùng không mã hóa khác trong gen lục lạp có thể phân loại các loài ở các vùng địa lý khác nhau [36]. So sánh với nghiên cứu của chúng tôi, matK cho thấy khả năng phân loại H. nepalensis và H. helix nhưng chưa phân loại được một số loài trong chi Hedera như H. rhombea. Do vậy, cần phải kết hợp gen matK với một số mã vạch DNA khác để tăng khả năng phân biệt loài ở các vùng địa lý khác nhau. Trong một nghiên cứu khác ở Trung Quốc, Sui Xue-yi và cộng sự (2011) cũng sử dụng gen matK để tiến hành phân loại 13 mẫu trong đó có H. nepalensis var. sinensis và 12 loài khác bằng cách sử dụng cặp mồi KIM 3F/KIM 1R. Kết quả 11/13 mẫu PCR thành công, cây phân loại dựa trên sự kết hợp rbcL + matK giúp phân biệt H. nepalensis var. sinensis với Euonymus fortunei, Euonymus fortune, Sinomenium acutum, Cocculus trilobus và 6 loài thuộc chi Sabia [89]. Từ các kết 44
quả trên, nhận thấy khả năng phân loại chi Hedera với các loài khác họ của chỉ thị phân tử matK có sự tương đồng giữa các nghiên cứu trên thế giới. Theo nghiên cứu của Ackerfied và Wen (2003) về sự tiến hóa của chi Hedera từ dữ liệu lục lạp, chi Hedera có mức độ phân kỳ trình tự nucleotide thấp (Mức độ phân kỳ thể hiện tốc độ tiến hóa có thể tạo thành sự tách nhánh). Mức độ phân kỳ trong cpDNA thấp hơn nhiều so với nrDNA. Trong Hedera, không có sự khác biệt nào được tìm thấy giữa H. nepalensis var. sinensis, H. nepalensis var. nepalensis, H. colchica và H. rhombea, giữa H. iberica và H. canariensis và giữa H. helix f. poetarum và H. cypria. Sự khác biệt cao nhất trong chi là giữa cả H.iberica và H. canariensis và H. hibernica ở mức 0,472%. Đối với các loài Macaronesian của H. azorica, H. canariensis và H. maderensis, sự phân kỳ trình tự là cao nhất giữa H. azorica và H. canariensis (0,228%) [15]. Theo cây phát sinh loài xây dựng bằng phương pháp UPGMA của 3 nhóm mẫu nghiên cứu với trình tự các loài Hedera (Hình 3.10), không có sự khác biệt nào giữa H. nepalensis var. sinensis và H. rhombea. H. azorica và H. algeriensis có trình tự tương đồng 100% ở đoạn gen matK. Khác biệt cao nhất là giữa H. helix và các trình tự còn lại. Trong nghiên cứu này, kết quả giải trình tự và xây dựng cây cho thấy trình tự đoạn gen matK thuộc DNA lục lạp có độ bảo thủ cao, tỷ lệ đột biến trong trình tự thấp. Khoảng cách di truyền giữa các loài trong chi Hedera thấp (0,0015 giữa H.nepalensis và H. helix). Điều này chứng minh mức độ phân kỳ trình tự nucleotide trong đoạn gen matK của Hedera thấp, kết quả này khá tương đồng với nghiên cứu của Ackerfied và Wen (2003) về mức độ phân kỳ trong cpDNA. Một ứng dụng khác của mã vạch DNA là giải quyết tranh cãi về mặt hình thái. Trên thế giới, hiện nay phân loại H.nepalensis và H.sinensis hiện vẫn còn nhiều vấn đề tranh cãi. H.sinesis và H.nepalensis khác biệt di truyền như thế nào cũng là một câu hỏi cần lời giải. Phân loại hai loài này rất dễ nhầm lẫn do sự giống nhau của đặc điểm hình thái, chúng chỉ khác nhau về đặc điểm hình thái hoa. Lá của 2 loài này phân hóa rất mạnh, lá càng gần gốc càng xẻ thùy nhiều. Với cành mang hoa thì lá sẽ không sẻ thùy nhiều mà có hình mũi mác. Trong khi, lá hay được dùng làm thuốc, nếu chỉ dựa vào hình thái lá được thu thập trước khi ra hoa để phân loại thì sẽ dẫn đến sai sót. Còn nếu theo dõi đến khi cây ra hoa sẽ gây tốn thời gian. Năm 1929, tác giả Wien cho rằng loài H.nepalensis K. Koch là một tên đồng danh của H.sinensis. Tuy nhiên đến năm 2002, Jun Wen khi nghiên cứu về đặc điểm hình thái và di truyền của chi Hedera trên thế giới đã cho rằng loài H.nepalensis có 2 thứ 45
H.nepalensis var.sinensis và H.nepalensis var.nepalensis. Theo hình thái, H.nepalensis var.nepalensis và var.sinensis được phân biệt dựa trên hai đặc điểm bao gồm số lượng thùy (5 trong var.nepalensis và 3 trong var.sinensis) và số lượng thùy bên (nhiều trong var.nepalensis và hầu như không có trong var.sinensis). Tuy nhiên, một số mẫu của H.nepalensis var.sinensis cho thấy sự thay đổi về số lượng thùy lá (từ 3 đến 5). Sự trùng lặp xảy ra giữa H.nepalensis var.nepalensis và var.sinensis vì các đặc điểm được sử dụng để phân biệt giữa chúng không nhất quán [16]. Trong nghiên cứu của chúng tôi, sử dụng mã vạch matK thì loài Dây thường xuân thu thập ở miền Bắc Việt Nam là loài H.nepalensis var.sinensis. Vậy Dây thường xuân ở Việt Nam thuộc thứ loài H.nepalensis var.sinensis hay do trình tự đoạn gen matK chưa giúp phân biệt được giữa H.nepalensis var.nepalensis và var.sinensis như nghiên cứu trước đó của Ackerfied và Wen (năm 2003) [15]. Liệu H.nepalensis và H.sinensis là hai loài khác nhau hay chúng có quan hệ gần gũi và thuộc cùng một loài? Hiện nay, các trình tự tham chiếu trên Genbank cũng chưa có sự thống nhất về tên gọi giữa hai đối tượng này. Có một số trình tự tên tiêu đề là H.sinensis nhưng trong thông tin phân loại lại ghi là H.nepalensis var.sinensis. Điều này chứng tỏ tính đến thời điểm hiện tại vẫn còn nhiều tranh cãi về vị trí phân loại của hai đối tượng này. Nghiên cứu của chúng tôi chưa giải quyết được sự khác biệt về di truyền giữa 2 thứ loài này do không có đủ dữ liệu về trình tự của H.nepalensis var.nepalensis (cả trên Genbank). Vì vậy, chúng tôi kiến nghị nên thu thập thêm mẫu H.nepalensis var.nepalensis để có thể làm rõ những tranh cãi về mặt hình thái cũng như góp phần hoàn thiện hệ thống phân loại thực vật của chi Hedera. Thực vật dùng làm thuốc luôn cần xác định ở mức độ phân loại loài, đây là bước đầu tiên và quan trọng để đảm bảo chất lượng sản phẩm. Kết quả nghiên cứu của chúng tôi cho thấy trình tự matK rất bảo thủ, có khả năng phân biệt và định danh H.nepalensis với H.helix nên có ý nghĩa trong kiểm định dược liệu, tránh tình trạng dược liệu giả gây nguy hại đến sức khỏe người dùng. Ngoài ra, nghiên cứu chỉ ra rằng ở Việt Nam hiện nay có 2 loài thuộc chi Hedera là H.helix và H.nepalensis. Trong đó, H.nepalensis phân bố chủ yếu ở các tỉnh miền núi phía Bắc còn H.helix được tìm thấy ở Lào Cai và Lâm Đồng. Theo điều tra của Viện Dược liệu thì những mẫu H. helix là giống được nhập trồng, không phải loài bản địa và đã hoang dại hóa. Kết quả này sẽ là cơ sở phục vụ công tác bảo tồn và phát triển nguồn gen Dây thường xuân cũng như chọn giống và phân tích phát sinh vùng địa lý. 46
KẾT LUẬN VÀ KIẾN NGHỊ 1. Kết luận Từ kết quả nghiên cứu thu được, chúng tôi rút ra một số kết luận chính như sau: 1. Đã xây dựng được quy trình nhân dòng đoạn gen matK của Dây thường xuân. Đoạn gen matK của 43 mẫu Dây thường xuân đã được khuếch đại và giải trình tự thành công. 2. Đã xây dựng cây phát sinh chủng loại dựa vào chỉ thị matK. Cây phát sinh chủng loại được xây dựng dựa trên chỉ thị matK cho thấy chỉ thị này có khả năng phân loại giữa H. nepalensis với H. helix. Qua nghiên cứu này, chúng tôi xác định hiện nay tại Việt Nam tồn tại 2 loài thuộc chi Hedera đó là H. nepalensis và H.helix, trong đó H. nepalensis phân bố chủ yếu ở các tỉnh miền núi phía Bắc gồm: Lào Cai, Lạng Sơn, Lai Châu, Hà Giang và H. helix được tìm thấy ở Sa Pa (Lào Cai) và Đà Lạt (Lâm Đồng). 3. Xác định được 3 haplotype với chỉ thị matK trong đó haplotype N1 phổ biến nhất và phân bố ở các tỉnh miền núi phía Bắc Việt Nam. 2. Kiến nghị Hướng đến chiến lược bảo tồn, khai thác bền vững nguồn dược liệu tại Việt Nam, giúp đưa nguồn dược liệu chất lượng tốt tạo thành thành phẩm thuốc phục vụ cộng đồng trong phòng và điều trị bệnh hiệu quả, chúng tôi có một số kiến nghị như sau: 1. Tiếp tục thu thập thêm các mẫu thuộc chi Hedera để đánh giá toàn diện hơn nữa tính đa dạng và phân bố của chi này ở Việt Nam. 2. Tiến hành nghiên cứu về thành phần hóa học để tìm hoạt chất có hoạt tính dược lý kết hợp với nghiên cứu đa dạng nguồn gen để lựa chọn giống cây có chất lượng tốt nhất, từ đó có thể phát triển Dây thường xuân thành một dược liệu có giá trị y học và giá trị kinh tế cao. 47
TÀI LIỆU THAM KHẢO TIẾNG VIỆT 1. Nguyễn Tiến Bân (2003), Danh lục thực vật Việt Nam, NXB Nông nghiệp, Hà Nội, tập 2, tr.1076. 2. Đỗ Huy Bích và cộng sự (2006), Cây thuốc và động vật làm thuốc ở Việt Nam, tập 2, NXB Khoa học và Kỹ thuật, Hà Nội, tr. 739-743. 3. Võ Văn Chi (1999), Cây cỏ có ích ở Việt Nam, Nhà xuất bản Giáo Dục. 4. Võ Văn Chi (2012), Từ điển cây thuốc Việt Nam, NXB Y học, tr. 778-779. 5. Nguyễn Anh Diệp, Trần Ninh và Nguyễn Xuân Quýnh (2007), Nguyên tắc phân loại sinh vật, NXB Khoa học và Kĩ thuật. 6. Nguyễn Hiếu (2017), "Đa dạng sinh học ở Việt Nam, thực trạng và thách thức", 4-17. 7. Phạm Hoàng Hộ (2000), Cây cỏ Việt Nam, Nhà xuất bản Trẻ, tr. 551. 8. Đinh Đoàn Long và Đỗ Lê Thăng (2009), Cơ sở di truyền học phân tử và tế bào, NXB Đại học Quốc gia Hà Nội. 9. Đặng Ngọc Thanh và Trần Đức Lương (2018), "Thực trạng và xu hướng phát triển của phân loại học sinh vật", Tạp chí Khoa học và Công nghệ Việt Nam,(2A),62. 10. Nguyễn Đức Thành (2014), "Các kỹ thuật chỉ thị DNA trong nghiên cứu và chọn lọc thực vật", Tạp chí Sinh học,36 (3), tr. 265-294. 11. Nguyễn Thị Thu Thảo (2019), Lựa chọn quy trình tách chiết DNA tổng số và bước đầu phân tích đa dạng di truyền nguồn gen dây thường xuân (Hedera nepalensis K. Koch) ở Việt Nam dựa trên chỉ thị GBSSI. Khoa Y-Dược, ĐHQGHN. 12. Viện Dược Liệu (2016), Danh lục cây thuốc Việt Nam, NXB Khoa học và Kỹ thuật, tr. 303. 13. Viện Dược Liệu (2004), Cây thuốc và động vật làm thuốc ở Việt Nam, NXB Khoa học và Kỹ thuật. TIẾNG ANH 14. Abugalieva, S., et al. (2017), "Taxonomic assessment of Allium species from Kazakhstan based on ITS and matK markers", BMC plant biology,17 (2),258. 15. Ackerfield, J. and J. Wen (2003), "Evolution of Hedera (the ivy genus, Araliaceae): insights from chloroplast DNA data", International Journal of Plant Sciences,164 (4),593-602. 16. Ackerfield, J. and J. Wen (2002), "A morphometric analysis of Hedera L.(the ivy genus, Araliaceae) and its taxonomic implications", Adansonia,24 (2),197-212. 17. Adnan, M., et al. (2012), "Medicinal plants and their uses in selected temperate zones of Pakistani Hindukush-Himalaya", J Med Plants Res,6 (24),4113-4127. 18. Baharum, S.N. (2012), "Application of 16s rDNA and cytochrome b ribosomal markers in studies of lineage and fish populations structure of aquatic species", Molecular biology reports,39 (5),5225-5232.
19. Barratt, B., et al. (2003), "Morphospecies as a substitute for Coleoptera species identification, and the value of experience in improving accuracy", Journal of the Royal Society of New Zealand,33 (2),583-590. 20. Barthet, M.M. and K.W. Hilu (2007), "Expression of matK: functional and evolutionary implications", American Journal of Botany,94 (8),1402-1412. 21. Bashir Amad, N.M., Shumaila Bashir, Sadiq Azam, Ibrar Khan, Mohammad Ayub (2012), "Biological screening of Hedera nepalensis", Medicinal Plants Research,6 (39),5250-5257. 22. Bhagwat, R.M., et al. (2015), "Two new potential barcodes to discriminate Dalbergia species", PloS one,10 (11),e0142965. 23. Bhargava, M. and A. Sharma (2013), "DNA barcoding in plants: evolution and applications of in silico approaches and resources", Molecular phylogenetics evolution,67 (3),631-641. 24. Bošeľová, D., et al. (2016), "Comparative analysis of different methods of Hedera helix DNA extraction and molecular evidence of the functionality in PCR", Acta Fytotechnica et Zootechnica,19 (4),144-149. 25. Brown B., Emberson R.M. and Paterson A.M. (1999), "Mitochondria COI and II provide useful markers for Wiseana (Lepidoptera: Hepia idae) species identification", Bulletin of Entomological Research,89 (4),287-294. 26. Brown, W.M., M. George and A.C. Wilson (1979), "Rapid evolution of animal mitochondrial DNA", Proceedings of the National Academy of Sciences,76 (4),1967-1971. 27. Chen, S., et al. (2010), "Validation of the ITS2 region as a novel DNA barcode for identifying medicinal plant species", PloS one,5 (1), 28. Chiou, S.-J., et al. (2007), "Authentication of medicinal herbs using PCR- amplified ITS2 with specific primers", Planta medica,73 (13),1421-1426. 29. Cuénoud, P., et al. (2002), "Molecular phylogenetics of Caryophyllales based on nuclear 18S rDNA and plastid rbcL, atpB, and matK DNA sequences", American Journal of Botany,89 (1),132-144. 30. Dabo, S., E. Mitchell and U. Melcher (1993), "A method for the isolation of nuclear DNA from cotton (Gossypium) leaves", Analytical biochemistry,210 (1),34-38. 31. Dhivya Selvaraj, Rajeev Kumar Sarma and Ramalingam Sathishkumar (2008), "Phylogenetic analysis of chloroplast matK gene from Zingiberaceae for plant DNA barcoding", Bioinformation,3 (1),24. 32. Elizabeth and J. Czarapata (2005), "Invasive plants of the upper Midwest: an illustrated guide to their identification and control," Univ of Wisconsin Press,43 - 45. 33. Ford, C.S., et al. (2009), "Selection of candidate coding DNA barcoding regions for use on land plants", Botanical Journal of the Linnean Society,159 (1),1-11. 34. Frankham, R. (2005), "Genetics and extinction", Biological conservation,126 (2),131-140. 35. Gaston, K.J. and J.I. Spicer (2013), Biodiversity: an introduction, John Wiley & Sons.