Khóa luận Sàng lọc ảo hợp chất ức chế enzym tyrosinase từ hợp chất thiên nhiên Việt Nam

pdf 67 trang thiennha21 18/04/2022 3730
Bạn đang xem 20 trang mẫu của tài liệu "Khóa luận Sàng lọc ảo hợp chất ức chế enzym tyrosinase từ hợp chất thiên nhiên Việt Nam", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfkhoa_luan_sang_loc_ao_hop_chat_uc_che_enzym_tyrosinase_tu_ho.pdf

Nội dung text: Khóa luận Sàng lọc ảo hợp chất ức chế enzym tyrosinase từ hợp chất thiên nhiên Việt Nam

  1. ĐẠI HỌC QUỐC GIA HÀ NỘI KHOA Y DƯỢC NGUYỄN THỊ HƯƠNG GIANG SÀNG LỌC ẢO HỢP CHẤT ỨC CHẾ ENZYM TYROSINASE TỪ HỢP CHẤT THIÊN NHIÊN VIỆT NAM KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƯỢC HỌC Hà Nội – 2017
  2. ĐẠI HỌC QUỐC GIA HÀ NỘI KHOA Y DƯỢC NGUYỄN THỊ HƯƠNG GIANG SÀNG LỌC ẢO HỢP CHẤT ỨC CHẾ ENZYM TYROSINASE TỪ HỢP CHẤT THIÊN NHIÊN VIỆT NAM KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƯỢC HỌC Khĩa: QH.2012.Y Người hướng dẫn: TS. Lê Thị Thu Hường TS. Phạm Thế Hải Hà Nội – 2017
  3. Lời cảm ơn Tơi xin gửi lời cảm ơn sâu sắc tới TS. Lê Thị Thu Hường - Giảng viên Bộ mơn Dược liệu và Dược học cổ truyền, Khoa Y Dược, Đại học Quốc Gia Hà Nội, TS. Phạm Thế Hải - Giảng viên Bộ mơn Hĩa dược, Trường đại học Dược Hà Nội đã trực tiếp hướng dẫn, tận tình giúp đỡ và tạo điều kiện thuận lợi để tơi cĩ thể nghiên cứu và hồn thành khĩa luận này. Tơi xin chân thành cảm ơn ThS. Ninh Bảo Yến đã giúp đỡ tơi rất nhiều trong quá trình thực hiện khĩa luận, cũng như xin gửi lời cảm ơn đến tất cả quý thầy cơ tại Đại học Quốc Gia Hà Nội đã dạy dỗ, trang bị kiến thức cho tơi trong suốt 5 năm theo học tại trường. Tơi cũng xin cảm ơn gia đình, bạn bè đã luơn theo sát động viên, quan tâm và tạo điều kiện giúp tơi cĩ thể hồn thành khĩa luận này. Xin chân thành cảm ơn! Hà Nội, tháng 06 năm 2017 Sinh viên Nguyễn Thị Hương Giang
  4. Bảng ký hiệu, chữ viết tắt Asn Asparagin CSDL Cơ sở dữ liệu DHI 5,6-dihydroxyindol DHICA Acid 5,6-dihydroxyindol-2-cacboxylic Glu Acid glutamic HC Hợp chất His Histidin HQ Hydroquinon L-DOPA L-3,4-dihydroxyphenylalanin Phel Phenylalanin PPO Polyphenol Oxidase QSAR Quantitative Structure-Activity Relationships TTHĐ Trung tâm hoạt động TSPT Tham số phân tử Val Valin
  5. Danh mục các bảng Bảng 1: Các phân nhĩm chính trong CSDL 14 Bảng 2: Ái lực liên kết với đích của 21 hợp chất được dự đốn là cĩ khả năng ức chế tyrosinase 22
  6. Danh mục hình vẽ, đồ thị Hình 1: Quá trình oxy hĩa phenol thơng qua enzym tyrosinase 7 Hình 2: Các dạng oxi hĩa của enzym tyrosinase 7 Hình 3: Trung tâm hoạt động của enzym tyrosinase tương tác với Tropolon 8 Hình 4: Sơ đồ biểu diễn con đường sinh tổng hợp melanin 9 Hình 5: Mơ phỏng hệ thống sàng lọc ảo hợp chất ức chế enzym tyrosinase 16 Hình 6: Giá trị Tc của các chất trong CSDL tương ứng với 12 chất mẫu 19 Hình 7: Khoảng phân bố của giá trị Tc max 19 Hình 8: Phân bố giá trị Tc max theo từng chất mẫu 20 Hình 9: Cấu trúc VNPD_ID929 được vẽ lại bằng TOMOCOMD-CARDD 20 Hình 10: Phân bố các nhĩm chất 21 Hình 11: Phân bố năng lượng liên kết với trung tâm hoạt động của enzym 21 Hình 12: Mơ phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với VNPD_ID929 27 Hình 13: Mơ phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với VNPD_ID722 28 Hình 14: Mơ phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với VNPD_ID889 28 Hình 15: Mơ phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với VNPD_ID723 29 Hình 16: Mơ phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với VNPD_ID1157 30
  7. MỤC LỤC Lời cảm ơn Bảng ký hiệu, chữ viết tắt Danh mục các bảng Danh mục hình vẽ, đồ thị MỞ ĐẦU 1 Chương 1 - TỔNG QUAN 2 1.1. Tổng quan về sàng lọc ảo 2 1.1.1. Khái niệm 2 1.1.2. Quy trình sàng lọc ảo 2 1.1.3. Các kỹ thuật sàng lọc ảo 2 1.2. Tổng quan về enzym tyrosinase 6 1.2.1. Khái niệm enzym tyrosinase 6 1.2.2. Trung tâm hoạt động của enzym tyrosinase 7 1.2.3. Vai trị của tyrosinase 8 1.2.4. Các chất ức chế tyrosinase 9 1.3. Tổng quan về hợp chất thiên nhiên Việt Nam 12 1.3.1. Khái niệm hợp chất thiên nhiên 12 1.3.2. Vai trị của hợp chất thiên nhiên trong nghiên cứu và phát triển thuốc 12 1.3.3. Tiềm năng của hơp chất thiên nhiên Việt Nam 13 Chương 2 - NGUYÊN VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 14 2.1. Đối tượng, nguyên vật liệu và thiết bị nghiên cứu 14 2.1.1 Đối tượng nghiên cứu 14 2.1.2. Nguyên liệu 14 2.1.3. Thiết bị 15 2.2. Phương pháp nghiên cứu 15 2.2.1. Tìm kiếm đồng dạng 16 2.2.2. Mơ hình QSAR 17 2.2.3. Docking 17 2.2.4. Xử lý số liệu 18 Chương 3 - KẾT QUẢ VÀ BÀN LUẬN 19 3.1. Kết quả tìm kiếm đồng dạng 19 3.2. Kết quả mơ hình QSAR 20
  8. 3.3. Kết quả Docking 21 3.4. Bàn luận 23 3.4.1. Về phương pháp sàng lọc ảo 23 3.4.2. Về kết quả sàng lọc ảo 26 KẾT LUẬN VÀ KIẾN NGHỊ 31 Tài liệu tham khảo Phụ lục
  9. MỞ ĐẦU Hiện nay, khi xã hội ngày càng phát triển thì vấn đề về thẩm mỹ, làm đẹp của con người càng được chú ý hơn đặc biệt là vấn đề chăm sĩc da. Màu da của con người được quyết định bởi nhiều yếu tố, trong đĩ, quan trọng nhất là sự sản xuất và phân bố của sắc tố melanin bởi tế bào biểu bì tạo sắc tố [68]. Khi tế bào biểu bì tạo sắc tố hoạt động mạnh hơn sẽ sản sinh ra nhiều melanin và phân tán mạnh hơn, gây ra hiện tượng nám da, sạm da, tàn nhang và ung thư da [22]. Melanin được hình thành trong hạt sắc tố melanosom bởi hoạt động của enzym tyrosinase [63]. Vì vậy, hiện nay nhiều sản phẩm làm sáng da, chống nám sử dụng hoạt chất là các chất ức chế tyrosinase. Tuy nhiên, các chất cĩ hoạt tính ức chế tyrosinase đang được sử dụng hiện nay như Hydroquinon (HQ), Acid Kojic và Arbutin lại cĩ nhiều vấn đề liên quan đến độ an tồn và hiệu quả [17, 81]. Do vậy mà việc tìm kiếm các hợp chất mới ức chế tyrosinase cĩ độ an tồn và hiệu quả cao hơn đặc biệt là từ các hợp chất cĩ nguồn gốc thiên nhiên là một việc làm hết sức thiết thực và cấp bách. Phát hiện và tối ưu hĩa chất dẫn đường là một khâu quan trọng trong quá trình nghiên cứu và phát triển thuốc hiện đại. Lâu nay, các nghiên cứu này chủ yếu dựa vào phương pháp thực nghiệm “thử và lỗi” với nhược điểm là tốn thời gian, tiền bạc và cho hiệu quả thấp. Các phương pháp trợ giúp bởi máy tính (in silico) đã giúp ích nhiều cho việc phát hiện các hợp chất mới cĩ hoạt tính sinh học ngay cả trước khi chúng được tổng hợp hay phân lập thơng qua quá trình sàng lọc ảo. Sàng lọc ảo khơng những bổ sung cho các sàng lọc thật mà cịn giúp định hướng quá trình tổng hợp/phân lập các chất. Sàng lọc ảo tương đối rẻ, nhanh, cho phép làm việc với số lượng lớn lên tới hàng triệu hợp chất, điều khơng thể làm được trong các mơ hình thực nghiệm. Bên cạnh đĩ, Việt Nam cĩ nguồn dược liệu phong phú với hàng nghìn hợp chất đã được phân lập và tổng hợp các thơng tin liên quan lại thành một cơ sở dữ liệu (CSDL) cung cấp các thơng tin đầu vào hữu ích cho việc sàng lọc ảo. Cho đến thời điểm hiện tại, chưa cĩ bài báo nào cơng bố về một quy trình sàng lọc ảo để tìm kiếm các chất ức chế tyrosinase từ CSDL này. Do đĩ, việc sàng lọc CSDL các hợp chất phân lập từ dược liệu sẽ đĩng gĩp nhiều cho quá trình nghiên cứu và phát triển thuốc làm trắng da, chống nám tại Việt Nam. Trên cơ sở đĩ, đề tài “Sàng lọc ảo hợp chất ức chế enzym Tyrosinase từ hợp chất thiên nhiên Việt Nam” được thực hiện với mục tiêu: Phát hiện được các hợp chất cĩ khả năng ức chế tyrosinase mạnh thơng qua sàng lọc ảo các hợp chất phân lập từ thảo dược Việt Nam. 1
  10. Chương 1 - TỔNG QUAN 1.1. Tổng quan về sàng lọc ảo 1.1.1. Khái niệm Các khái niệm về sàng lọc ảo (virtual screening) xuất hiện vào những năm 60 của thế kỷ XX với các mơ hình của Hansch [28]. Thế nhưng, chỉ từ năm 1990 thì lĩnh vực này mới cĩ nhiều bước tiến và từ đĩ đến nay, ngày càng phát triển mạnh mẽ [41]. Sàng lọc ảo đề cập đến một loạt các kỹ thuật in silico (các kỹ thuật được thự hiện với sự trợ giúp của máy tính) được sử dụng để sàng lọc các CSDL hợp chất lớn nhằm lựa chọn một số lượng nhỏ hơn cho thử nghiệm sinh học. Mơ hình sàng lọc ảo khơng những bổ sung cho các mơ hình thực nghiệm mà cịn giúp định hướng quá trình tổng hợp/phân lập các chất. Ngồi ra sau khi được xây dựng, việc sử dụng các mơ hình này tương đối rẻ (tiết kiệm nguyên liệu thử), nhanh và cho phép làm việc với số lượng lớn lên tới hàng triệu hợp chất, một điều khơng thể làm được trong các mơ hình thực nghiệm. 1.1.2. Quy trình sàng lọc ảo Quá trình sàng lọc ảo gồm 5 bước như sau: 1) Lựa chọn đối tượng sàng lọc 2) Lựa chọn kỹ thuật 3) Sắp xếp các kỹ thuật theo thứ tự phù hợp 4) Sàng lọc 5) Phân tích kết quả. 1.1.3. Các kỹ thuật sàng lọc ảo Các kỹ thuật sàng lọc ảo hiện nay được phân vào 2 nhĩm chính là sàng lọc ảo dựa trên phối tử (Ligand-based Virtual Screening) và sàng lọc ảo dựa trên cấu trúc (Structure-based Virtual Screening). Sàng lọc ảo dựa trên phối tử được thực hiện trong trường hợp khơng cĩ cấu trúc 3D của protein, chỉ cĩ cấu trúc của phối tử. Các kỹ thuật cĩ thể sử dụng lúc này là kỹ thuật xây dựng phần cấu trúc mang hoạt tính (pharmacophore), kỹ thuật tìm kiếm đồng dạng (similarity searching), QSAR. Trong trường hợp cĩ cả cấu trúc 3D của protein và cấu trúc của phối tử, kỹ thuật sàng lọc ảo dựa vào cấu trúc sẽ được áp dụng, sử dụng kỹ thuật docking [47]. Hệ thống sàng lọc ảo được trợ giúp bởi máy tính gồm nhiều phễu lọc khác nhau, mỗi phễu lọc sử dụng một kỹ thuật sàng lọc khác nhau, được sắp xếp tuần tự hợp lý dựa vào thời gian mà máy tính cần cho mỗi thuật tốn và sự phức tạp của thơng tin đầu vào. Nghiên cứu sử dụng kết hợp 3 phễu lọc: Tìm kiếm đồng dạng, Mơ hình QSAR và Kỹ thuật docking. 2
  11. 1.1.3.1. Tổng quan về tìm kiếm đồng dạng a. Khái quát về tìm kiếm đồng dạng Kỹ thuật tìm kiếm đồng dạng (similarity searching) là kỹ thuật tìm kiếm các hợp chất cĩ cấu trúc tương tự với hợp chất mẫu (reference) trên cơ sở dữ liệu về cấu trúc của các hợp chất. Kỹ thuật được thực hiện dựa trên nguyên lý tính chất giống nhau, như vậy những phân tử cĩ cấu trúc giống nhau được hy vọng cĩ tính chất hoặc hoạt tính sinh học giống nhau [40]. Kỹ thuật tìm kiếm đồng dạng được đưa vào sử dụng rộng rãi kể từ thập niên 80, và được chứng minh là rất hữu ích trong lĩnh vực dược phẩm. Hiện nay, phương pháp tìm kiếm đồng dạng đã được xây dựng bởi nhiều nhĩm nghiên cứu trên thế giới. Sàng lọc ảo sử dụng kỹ thuật tìm kiếm đồng dạng cĩ thể tiến hành một cách nhanh chĩng, do đĩ, kỹ thuật này được sử dụng nhiều để sàng lọc các cơ sở dữ liệu lớn [70]. Hai yếu tố quan trọng tham gia vào quá trình tìm kiếm đồng dạng là các tham số phân tử đặc trưng cho các chất và thơng số sử dụng để thiết lập mối liên hệ so sánh giữa cặp phân tử (hệ số tương đồng). Sau khi so sánh cĩ thể sắp xếp các hợp chất trong CSDL theo thứ tự giảm dần về hệ số tương đồng so với các hợp chất mẫu. Khi cĩ được danh sách sắp xếp này, người nghiên cứu sử dụng một ngưỡng (cut-off) để lựa chọn tập hợp các hợp chất nằm trên cùng danh sách [30]. Tham số phân tử là giá trị đại diện cho mơ tả phân tử. Các mơ tả phân tử thường được định nghĩa dựa vào chiều của chúng. Mơ tả phân tử 1 chiều là các đặc tính như khối lượng phân tử, số lượng liên kết, đếm các mảnh cấu trúc. Mơ tả phân tử 2 chiều là mơ tả biểu diễn các cấu trúc theo kích thước, độ phân nhánh và hình dạng tổng thể, trong khi 3 chiều sử dụng các thơng tin tử cấu trúc khơng gian 3 chiều của phân tử. Mơ tả phân tử được sử dụng thường xuyên nhất là mơ tả phân tử 2D, là mơ tả nhị phân, mã hĩa sự cĩ mặt hoặc khơng của các mảnh cấu trúc [80]. Cĩ nhiều hệ số được xây dựng để biểu diễn sự giống nhau giữa một cặp cấu trúc, chẳng hạn như hệ số Tanimoto/Jaccard, hệ số Cosine/ Ochiai, hệ số Dice, hệ số Fossum, hệ số Simpson, hệ số Pearson/Stile, khoảng cách Euclide, khoảng cách Hamming, khoảng cách Soergel, khoảng cách Manhattan. Hệ số Tanimoto được sử dụng rộng rãi nhất cho các dữ liệu nhị phân. Nhiều nghiên cứu đã chỉ ra rằng, hệ số này cho kết quả tốt hơn so với nhiều hệ số khác [79]. 3
  12. b. Quy trình tìm kiếm đồng dạng Quá trình tìm kiếm đồng dạng gồm các bước chính sau: 1) Tính tốn tham số phân tử đặc trưng cho hợp chất, 2) Tính tốn hệ số tương đồng, 3) Sắp xếp các chất theo chiều giảm dần hệ số tương đồng, 4) Chọn ngưỡng. 1.1.3.2. Tổng quan về các mơ hình QSAR a. Khái quát về mơ hình QSAR Mơ hình QSAR (Quantitative Structure-Activity Relationships) là mơ hình biểu thị mối liên hệ định lượng giữa cấu trúc và hoạt tính của các hợp chất. Mơ hình QSAR được xây dựng dựa trên giả thuyết cấu trúc của một phân tử phải chứa những đặc điểm cấu trúc chịu trách nhiệm cho tính chất hĩa học, vật lý, sinh học. Mơ hình QSAR cho phép dự đốn tính chất của một phân tử mới dựa trên các hợp chất tương tự cĩ các tính chất đã được kiểm chứng. Mơ hình QSAR được biểu diễn dưới dạng một phương trình tốn học (Phương trình 1). Để cĩ thể xây dựng được các mơ hình này thì cả cấu trúc và hoạt tính đều phải được định lượng hĩa. Các cấu trúc được định lượng thơng qua các tham số phân tử (biến x). Các tham số phân tử là kết quả của một quá trình tốn học chuyển đổi các thơng tin trong cấu trúc phân tử thành một số đặc trưng cho cấu trúc phân tử ấy. Hoạt tính được sử dụng cĩ thể là hoạt tính hố học hay hoạt tính sinh học (biến Y) được đánh giá bằng các phương pháp nghiên cứu thực nghiệm. Một số đại lượng hoạt tính sinh học thường được dùng như: IC50 nồng độ ức chế 50% hoạt tính; MIC (Minimum Inhibitory Concentration): nồng độ ức chế tối thiểu; MBC (Minimum Bactericidal Concentration): nồng độ diệt khuẩn tối thiểu; EC50 (Effective Concentration): nồng độ 50% tác dụng tối đa; KI: Hằng số ức chế Phương trình 1: 푌 = + + ⋯ + 1( 1) 2( 2) 푛( 푛) Trong đĩ: Y: Biến đáp ứng (mang giá trị biểu thị tác dụng sinh học) x1, x2, xn: Các tham số đặc trưng cho cấu trúc f1, f2, fn: Các thuật tốn thể hiện trọng số của tham số phân tử x, được tính tốn bằng các phần mềm phân tích thống kê sử dụng kỹ thuật xác suất thống kê hay trí tuệ nhân tạo 4
  13. b. Quy trình xây dựng mơ hình QSAR Các bước để xây dựng mơ hình QSAR [76] gồm: 1) Xây dựng cơ sở dữ liệu; 2) Tính tốn tham số mơ tả phân tử đặc trưng cho cấu trúc; 3) Xây dựng mơ hình QSAR: Sử dụng các phương pháp xác suất thống kê và các kỹ thuật của trí tuệ nhân tạo để xây dựng mối liên hệ giữa các tham số phân tử và các giá trị đại lượng biểu diễn hoạt tính; 4) Đánh giá mơ hình; 5) Giải thích các kết quả và sử dụng mơ hình trong quá trình sàng lọc ảo. c. Hệ thống phân loại kếp hợp các mơ hình QSAR Dieterich đã nghiên cứu kết luận là một hệ thống phân loại phối hợp thường tốt hơn việc sử dụng các mơ hình đơn [18]. Sự thành cơng của các hệ thống phân loại kết hợp (Multiple classifier system) phụ thuộc vào hai yếu tố là sự đa dạng của các mơ hình đơn để kết hợp và cách kết hợp các đầu ra [54]. Cĩ nhiều cách để tạo nên sự đa dạng của các mơ hình đơn. Trong các nghiên cứu của mình, Kuncheva trình bày 4 cấp để tạo nên sự đa dạng của các mơ hình đơn [54]. Cấp độ 1 là thay đổi tập huấn luyện (training set). Cấp độ 2 là thay đổi tập hợp của các biến độc lập (independent variables). Các biến độc lập dùng để xây dựng các mơ hình QSAR là các tham số phân tử khác nhau đặc trưng cho cấu trúc. Cấp độ 3, sử dụng các kỹ thuật khác nhau để xây dựng các mơ hình đơn. Cấp độ cuối cùng là cách kết hợp các mơ hình đơn. Kuncheva và Whitaker đã tổng kết 10 cách để định lượng sự đa dạng giữa các mơ hình đơn sử dụng các hệ số đa dạng. Cĩ rất nhiều cách kết hợp các đầu ra như: Biểu quyết đa số phiếu [8], Biểu quyết với trọng số [54], Bagging (Boostrap AGGregatING) [8], Boosting [7], Stacking [8]. Mỗi cách kết hợp đầu ra sẽ cho kết quả với độ chính xác khác nhau. 1.1.1.4. Tổng quan về kỹ thuật docking a. Khái quát về docking Docking là phương pháp đưa cấu trúc của một chất (dạng cấu trúc khơng gian 3 chiều) vào một trung tâm tương tác của mục tiêu phân tử (đích tác dụng của thuốc) và tính tốn các giá trị tương tác để đánh giá khả năng tương tác của chất đĩ với mục tiêu phân tử. Mục đích của docking là xác định một cấu dạng tối ưu nhất cho phối tử (phân tử hay anion liên kết trực tiếp với trung tâm hoạt động được gọi là phối tử) và dự đốn chính xác hoạt động của phối tử để năng lượng tự do của phức hợp mục tiêu phân tử - phối tử là nhỏ nhất [51]. 5
  14. Khi cơ chất gắn lên một phân tử protein, hai điểm cần chú ý là sự phù hợp về hình dạng, kích thước và năng lượng tương tác giữa nĩ với protein. Sự phù hợp về hình dạng tương tự như cơ chế chìa khố - ổ khố nhưng trong thực tế, cả cơ chất và protein đều cĩ thể thay đổi cấu hình, đặc biệt protein là phân tử lớn và cĩ cấu trúc mềm dẻo. Quá trình này trong thực tế phức tạp hơn. Ngồi yêu cầu phù hợp về hình dạng, kích thước, giữa cơ chất và enzym cịn cĩ những tương tác khác như van der Waals, tương tác tĩnh điện, trong nhiều trường hợp cịn cĩ tương tác hố học. Nhưng do protein thường cĩ kích thước lớn và mềm dẻo, rất khĩ khảo sát hết tất cả khả năng cĩ thể nên trong docking, phân tử protein thường được đưa vào dưới dạng cấu trúc cứng (rigid), cơ chất chuyển động tương đối so với protein và thay đổi cấu hình. Một số phần mềm docking cũng cho phép thay đổi cấu hình trên một số amino acid. Hiện nay, cĩ rất nhiều phần mềm được sử dụng để docking: AutoDock [3], ICM-Docking [35], MOE (Molecular Operating Environment) [59], SwissDock [73] Cĩ 2 cách tiếp cận trong phương pháp docking: docking cơ học và docking tự động [64]. Docking cơ học trong trường hợp đã biết các nhĩm liên kết của phối tử và vị trí liên kết của mục tiêu. Sử dụng một số chương trình cho phép phối tử chuyển động trong vị trí liến kết và cố gắng lắp ghép chúng lại với nhau một cách phù hợp nhất ở trạng thái cứng. Docking tự động được tiến hành nhờ sử dụng các phần mềm tự động docking. Các chương trình này sẽ tự động quyết định việc làm thế nào để dock phối tử vào vị trí liên kết. Một chương trình docking gồm 2 phần chính: thuật tốn tìm kiếm cấu dạng, quay và dịch chuyển của phân tử trong vùng gắn và thuật tốn để đánh giá sự phù hợp của phối tử và receptor hoặc ái lực gắn giữa chúng. Docking yêu cầu thơng tin 3D của phân tử và hình dáng 3D của protein đích. Để tìm cấu hình phù hợp nhất cần liên hệ khơng gian cấu hình với các giá trị số đánh giá được khả năng gắn kết của cơ chất lên protein và sau đĩ áp dụng thuật tốn tìm kiếm. b. Quy trình docking Quy trình docking gồm 4 bước cơ bản: 1) Chuẩn bị protein; 2) Chuẩn bị cấu tử; 3) Mơ phỏng docking; 4) Giải thích kết quả. 1.2. Tổng quan về enzym tyrosinase 1.2.1. Khái niệm enzym tyrosinase Tyrosinase (EC 1.14.18.1) hay cịn gọi là enzym polyphenol oxidase (PPO), là một enzym monooxygenase cĩ chứa đồng tham gia vào hai phản ứng riêng biệt 6
  15. của quá trình chuyển hĩa melanin; một là hydroxyl hĩa monophenol thành O- diphenol, hai là oxi hĩa O-diphenol thành O-quinon (Hình 1) [9, 48]; sau đĩ, O- quinon tham gia một loạt các phản ứng để tạo thành melanin. Hình 1: Quá trình oxy hĩa phenol thơng qua enzym tyrosinase Enzym này được phân bố rộng rãi trong nấm, động vật và thực vật, nĩ đĩng vai trị quan trọng trong quá trình hình thành sắc tố. Enzym tyrosinase cĩ thể tồn tại ở 3 dạng là: oxy, deoxy, met-tyrosinase được biểu diễn qua sơ đồ trong Hình 2 [10, 45, 49]. Cả dạng met-tyrosinase và dạng oxy-tyrosinase đều cĩ hoạt tính diphenolase, trong khi chỉ cĩ dạng oxy-tyrosinase là cĩ hoạt tính monophenolase. Dạng deoxy- tyrosinase là dạng yếu, khơng ổn định; phản ứng với oxy để tạo thành dạng oxy- tyrosinase. Hình 2: Các dạng oxi hĩa của enzym tyrosinase 1.2.2. Trung tâm hoạt động của enzym tyrosinase Việc phân tích về trung tâm hoạt động là cần thiết cho quá trình xác định hợp chất ức chế enzym tyrosinae. Cấu trúc tinh thể tia X của enzym được tải về từ ngân hàng dữ liệu protein (ID: 2Y9X). Trung tâm hoạt động gồm cĩ túi enzym và 2 nguyên tử đồng nằm ở đáy túi, đĩng vai trị quan trọng trong cơ chế xúc tác của enzym. Mỗi 7
  16. nguyên tử đồng tạo liên kết phối trí với 3 phân tử histamin. Miệng túi được hình thành từ các chuỗi acid amin như Val283, Phel264, His244, Val248, Asn260 (Hình 3) [36]. Hình 3: Trung tâm hoạt động của enzym tyrosinase tương tác với Tropolon Như vậy, để một cấu tử thể hiện được vai trị ức chế enzym tyrosinase, nĩ cần phải chui được vào túi enzym của trung tâm hoạt động và khĩa được ion Cu2+ ở đáy túi enzym [83]. 1.2.3. Vai trị của tyrosinase Sắc tố là một trong những đặc điểm kiểu hình rõ ràng nhất trong thế giới tự nhiên. Trong các tế bào động vật hoặc thực vật, một sắc tố được định nghĩa là bất kỳ chất tạo màu do chúng phản xạ và hấp thụ một số sĩng ánh sáng đặc hiệu [57]. Trong các sắc tố sinh học đĩ, melanin (theo tiếng Hy Lạp cĩ nghĩa là đen) được phân bố rộng rãi nhất và được tìm thấy trong suốt quá trình phát sinh lồi, từ các vi sinh vật cho đến động vật, cĩ cả con người [66]. Ở người, melanin được tìm thấy chủ yếu trong da, tĩc, võng mạc [25]. Melanin được tiết ra bởi tế bào sắc tố phân bố ở lớp đáy của biểu bì. Vai trị của melanin là bảo vệ da khỏi tác hại của tia tử ngoại, đặc biệt là tia cực tím B bằng cách hấp thụ và tán xạ ánh sáng mặt trời và loại bỏ các gốc oxy hĩa tự do. Các rối loạn khác nhau ở da là kết quả của sự tích tụ quá mức sắc tố ở biểu bì. Tăng sắc tố cĩ thể do tăng tế bào tạo sắc tố hoặc do tăng hoạt động của các enzym hình thành sắc tố. Các tế bào biểu bì tạo sắc tố của động vật cĩ vú cĩ thể sản xuất hai loại melanin là eumelanin và pheomelanin. Eumelanin cĩ màu từ nâu đến đen, khơng tan trong hầu hết các dung mơi, liên kết chặt chẽ với protein thơng qua các liên kết đồng hĩa trị. Pheomelanin cĩ màu từ vàng đến đỏ, cĩ bộ khung được tạo bởi các tiểu đơn vị là các benzothiazin và cũng liên kết chặt chẽ với protein thơng qua các liên kết đồng 8
  17. hĩa trị. Tỷ lệ về số lượng và mật độ của hai melanin này sẽ quyết định màu sắc của da, mắt và tĩc [78]. Con đường hình thành sắc tố melanin được tĩm tắt trong Hình 4 [49, 65]. Bước đầu tiên và cũng là bước bắt buộc trong quá trình hình thành sắc tố là sự oxy hĩa tyrosin thành dopaquinon. Đây là bước giới hạn tốc độ trong quá trình sinh tổng hợp tyrosin do chuỗi phản ứng cịn lại cĩ thể tự diễn ra tại một giá trị pH sinh lý nhất định. Dopaquinon sinh ra được chuyển thành leukodopachrom, sau đĩ chuyển thành dopachrom. Cuối cùng eumelanin được hình thành thơng qua một loạt các phản ứng oxy hĩa từ các sản phẩm chuyển hĩa của dopachrom là 5,6-dihydroxyindol (DHI) và acid 5,6-dihydroxyindol-2-cacboxylic (DHICA). Trong trường hợp cĩ sự cĩ mặt của cystein hoặc glutathion, dopaquinon sẽ được chuyển hĩa thành cysteyldopa hoặc glutathionyldopa. Cysteinyldopa hoặc glutathionyldopa tiếp tục trải qua một loạt các phản ứng để tạo thành pheomelanin [12, 49]. Như vậy, tyrosinase tham gia vào phản ứng đầu của quá trình hình thành sắc tố da melanin. Chính vì thế mà các chất ức chế tyrosinase đã và đang được sử dụng rất rộng trong điều trị các bệnh tăng sắc tố và trong mỹ phẩm như một yếu tố làm trắng da. Hình 4: Sơ đồ biểu diễn con đường sinh tổng hợp melanin 1.2.4. Các chất ức chế tyrosinase 9
  18. Tyrosinase đĩng một vai trị quan trọng trong quá trình tổng hợp melanin, do đĩ ức chế enzym này làm giảm hình thành sắc tố da [56]. Vì thế việc tìm kiếm các chất ức chế tyrosinase ngày càng trở nên quan trọng trong các sản phẩm thuốc và mỹ phẩm sử dụng để ngăn ngừa và điều trị rối loạn sắc tố. 1.2.4.1. Các chất ức chế tyrosinase cĩ nguồn gốc thiên nhiên Polyphenol thực vật là nhĩm các hợp chất cĩ nhiều nhĩm chức phenol, tiêu biểu là flavonoid. Hơn 4000 flavonoid phân bố trong lá, hạt, vỏ cây và hoa đã được xác định. Ở thực vật các hợp chất này bảo vệ thực vật bằng cách chống lại tia cực tím và tác nhân gây bệnh [27]. Một số flavonoid như kaempferol, quercetin và morin thể hiện tác dụng ức chế tyrosinase, trong khi những chất khác, ví dụ catechin và rhamnetin, đĩng vai trị là các cơ chất của tyrosinase. Một số nghiên cứu cho thấy rằng flavonoid cĩ chứa nhĩm α-keto cĩ tác dụng ức chế tyrosinase mạnh [5]. Nhiều aldehyd và các hợp chất khác cũng được phân lập và xác định là cĩ tác dụng ức chế enzym tyrosinase như cinnamaldehyd, (2E) -alkenal, 2-hydroxy-4- methoxybenzaldehyd, anisaldehyd, cuminaldehyd và acid cumic [52]. Hoạt động ức chế tyrosinase của anisaldehyd và cuminaldehyd mạnh hơn khoảng 2,5 và 16 lần so với benzaldehyd. Một số alkanal cĩ tác dụng ức chế tyrosinase cĩ thể là do sự tương tác kỵ nước của chúng với các enzym, làm ảnh hưởng đến cấu trúc bậc 3 của enzym [15]. (2E) - alkenal ức chế quá trình oxy hĩa L-3,4-dihydroxyphenylalanin (L-DOPA) của tyrosinase là chất ức chế khơng cạnh tranh, và phần alkyl kỵ nước cĩ liên quan đến hoạt động ức chế của chúng [15]. Bên cạnh những thực vật bậc cao thì trong nấm cũng cĩ một số hợp chất cĩ tác dụng ức chế enzym tyrosinase. Acid dicacboxylic bão hịa được tạo thành bởi quá trình peroxy hĩa lipid và este hĩa acid béo bằng nấm men, vi nấm Pityrosporum ovale. Acid dicacboxylic này cĩ tác dụng gây độc nhất định trên các tế bào biểu bì tạo sắc tố của khối u ác tính ở da, mặc dù bình thường tế bào biểu bì tạo sắc tố khơng bị ảnh hưởng [69]. Acid kojic, 5-hydroxy-2- (hydroxymethyl)-γ-pyron, một chất chuyển hĩa của nấm được sản xuất bởi nhiều lồi thuộc chi Aspergillus và Penicillium. Acid kojic ức chế sự hình thành sắc tố từ phản ứng oxy hĩa L-DOPA, norepinephrin và dopamin dưới sự xúc tác của tyrosinase. Điều này cĩ nghĩa rằng acid kojic cĩ thể giảm chuyển hĩa O-quinon thành O-diphenol ngăn cản tạo thành các sắc tố [43]. 1.2.4.2. Các chất ức chế tyrosinase cĩ nguồn gốc tổng hợp 10
  19. Một lượng đáng kể các hợp chất cĩ nguồn gốc tổng hợp như hydroxylamin, các hợp chất chứa thiol, acid cacboxylic thơm, dẫn xuất của acid cinnamic, trihydroxy chalconas, peptid, acid alkylbenzoic [31], N-hydroxy-N’-phenyl ure và N-hydroxy- N’-phenyl thioure [16] cĩ tác dụng ức chế enzym tyrosinase. Tropolon (2-hydroxy-2,4,6-cycloheptatrien-1-on) là một trong những chất ức chế tyrosinase mạnh nhất. Nĩ cĩ cấu trúc tương tự như các cơ chất O-diphenolic của tyrosinase [42]. Resorcinol được gắn nhĩm thế ở vị trí 4 là các chất ức chế tyrosinase yếu. Trong các hợp chất này, tác dụng ức chế mạnh nhất đạt được khi thay thế nhĩm kỵ nước vào vị trí thứ 4, chẳng hạn như 4-hexyl resorcinol và 4-dodecyl resorcinol. 4- hexyl resorcinol là các chất ức chế tyrosinase hiệu quả nhất sử dụng trong các ngành cơng nghiệp thực phẩm vì nĩ hịa tan trong nước, ổn định, khơng độc hại, khơng gây đột biến và khơng gây ung thư, và chất này cũng đã được cơng nhận là an tồn trong việc kiểm sốt sự sẫm màu của lát táo cũng như khoai tây và bơ khi để ngồi khơng khí lâu [21]. 1.2.4.3. Các thuốc được phát hiện cĩ tác dụng ức chế tyrosinase Captopril, (S)-1-(3-mercapto-2-metyl-1-oxopropyl)-L-prolin, ức chế hoạt động monophenolase và diphenolase của tyrosinase [20]. Captopril được biết đến là chất tạo chelat với đồng [38]. Do đĩ, cĩ thể cho rằng captopril chủ yếu cĩ tác dụng ức chế là do tạo chelat với ion đồng ở vị trí hoạt động của tyrosinase. Một số thuốc khác cũng cĩ tác dụng ức chế hoạt động của tyrosinase, như penicillamin, được sử dụng trong điều trị bệnh Wilson [55], và methimazol là thuốc kháng tuyến giáp. Methimazol (1-methyl-2-mercaptoimidazol) ức chế cả hoạt động monophenolase và diphenolase của tyrosinase nấm. Methimazol ức chế hoạt động tyrosinase của nấm bằng hai cách: liên hợp với O-quinon, do đĩ ức chế rõ sự hình thành sắc tố, và tạo chelat với đồng tại vị trí hoạt động của tyrosinase [1]. 1.2.4.4. Một số chất ức chế đã được sử dụng HQ làm giảm 90% hoạt tính của tyrosinase [77], là một hĩa chất phổ biến cĩ trong mỹ phẩm và sản phẩm làm sáng da khơng cần đơn. Nĩ được coi là một trong các chất ức chế hiệu quả nhất quá trình sản xuất melanin ở cả in vitro và in vivo. HQ ảnh hưởng nghiêm trọng đến sức khỏe đặc biệt là sắc tố của mắt, và trong một số ít trường hợp HQ gây tổn thương giác mạc vĩnh viễn. Hiện tượng này đã được quan sát thấy ở các cơng nhân sản xuất HQ. HQ đã bị Cục quản lý Dược phẩm Hoa Kỳ cấm 11
  20. sử dụng trong các chế phẩm mỹ phẩm ở Châu Âu vì khơng an tồn khi sử dụng trong thời gian dài [17]. Arbutin, một hợp chất chuyển hĩa thứ cấp của cây dâu gấu (tên khoa học là Arctostaphylos uva-ursi), được sử dụng rộng rãi với hiệu quả làm sáng da. Arbutin tự nhiên tương đối an tồn tuy nhiên lại cĩ độ ổn định thấp và dễ dàng chuyển hĩa thành HQ. Vì thế, vào năm 2008, Hiệp hội Mỹ phẩm Châu Âu đã cấm sử dụng các đồng dạng của beta-arbutin [81]. 1.3. Tổng quan về hợp chất thiên nhiên Việt Nam 1.3.1. Khái niệm hợp chất thiên nhiên Hợp chất thiên nhiên ( natural products) là các chất hĩa học cĩ nguồn gốc từ thiên nhiên hoặc được chiết xuất từ các mơ của động vật, thực vật trên cạn; sinh vật biển; vi khuẩn lên men; vi sinh vật [37]. Hầu hết các hợp chất thiên nhiên cĩ hoạt tính sinh học là các chất chuyển hĩa thứ cấp cĩ cấu trúc rất phức tạp. 1.3.2. Vai trị của hợp chất thiên nhiên trong nghiên cứu và phát triển thuốc Thực vật được cấu thành bởi một hệ thống lớn và đa dạng các chất hĩa học, chúng cĩ thể cung cấp những hợp chất với cấu trúc cĩ độ phức tạp cao mà khơng thể tổng hợp được trong các phịng thí nghiệm. Những phân tử nhỏ này cung cấp nguồn hoặc là tiền chất cho phần lớn các hoạt chất được FDA chấp thuận và hiện đang là một trong những nguồn cảm hứng chính cho việc nghiên cứu và phát hiện thuốc mới. Cĩ nhiều chất dẫn đường cĩ nguồn gốc từ thực vật [62] (ví dụ morphin, cocain, digitalis, quinin, tubocurarin, nicotin, muscarin ). Một số đĩng vai trị trực tiếp là những loại thuốc hữu ích (ví dụ morphin và quinin), và một số khác là cơ sở cho tổng hợp các hoạt chất làm thuốc (ví dụ như thuốc gây mê cục bộ phát triển từ cocain). Gần đây trong lâm sàng, một số loại thuốc mới đã được phân lập từ thực vật bao gồm thuốc chống ung thư paclitaxel (Taxol) từ cây thủy tùng, và thuốc chống sốt rét artemisinin từ câu thanh hao hoa vàng. Nhiều thực vật bậc cao chứa các chất chuyển hĩa mới cĩ tính kháng khuẩn và kháng virus [26]. Ở những nước phát triển, các ca lâm sàng cĩ dử dụng hĩa trị liệu thường dùng các thuốc đã được sản xuất bằng hĩa tổng hợp in vitro; nhưng taxol và vincristin là ngoại lệ [46], chúng là các chất chuyển hĩa cĩ cấu trúc phức tạp, rất khĩ tổng hợp trong ống nghiệm. Nhiều loại thuốc tổng hợp và bán tổng hợp gây ra các phản ứng phụ nghiêm trọng, nhất là các thuốc dùng điều trị cho bệnh nhân ung thư với các tác dụng phụ biểu hiện trên da một cách rất nghiêm trọng. Các chất chuyển 12
  21. hĩa được phát hiện trong một số lồi thực vật cĩ thể tránh tác dụng phụ của thuốc tổng hợp vì chúng đã từng tích tụ trong các tế bào sống [29]. Một trong những hợp chất tinh khiết được phân lập đầu tiên trong lịch sử y học là morphin vào khoảng năm 1804 bởi Friedrich Serturner từ thuốc phiện. Vào thời điểm đĩ, thuốc phiện được gọi là thuốc gây nghiện, mặc dù nĩ đã được sử dụng nhiều trong điều trị giảm đau vào thời Trung cổ. Tiếp sau đĩ, thuốc kháng sốt rét, quinin đã được Pelletier và Caventou phân lập từ cây vỏ cây cinchona vào năm 1820. Loại vỏ cây này đã được sử dụng để điều trị sốt rét từ những năm 1600 và cũng là một phần của y học cổ truyền Nam Mỹ để điều trị bệnh sốt. Sự gia tăng tính kháng thuốc đối với quinin và dẫn chất của nĩ dẫn đến nhu cầu về thuốc sốt rét thay thế, đĩ là artemisinin được phân lập từ cây thanh hao hoa vàng. Ngồi ra cịn cĩ thuốc giảm đau aspirin là este của acid salicylic được tách chiết từ vỏ cây liễu, lá của cây này được người Ai Cập cổ đại sử dụng với tác dụng giảm đau và chống viêm. 1.3.3. Tiềm năng của hơp chất thiên nhiên Việt Nam Theo kết quả thống kê của Viện Dược liệu, tính đến năm 2017 đã ghi nhận được 5.117 lồi thực vật và nấm lớn, 52 lồi tảo biển, 408 lồi động vật và 75 lồi khống vật cĩ cơng dụng làm thuốc. Trong số đĩ, cĩ khoảng 70 lồi cĩ tiềm năng khai thác với tổng trữ lượng khoảng 18.000 tấn/năm như diếp cá (5.000 tấn), cẩu tích (1.500 tấn), lạc tiên (1.500 tấn), rau đắng đất (1.500 tấn) Đặc biệt, Việt Nam sở hữu nhiều lồi dược liệu quý, hiếm, đặc hữu như: Sâm Ngọc Linh, Ba kích, Châu thụ, Ngân đằng Kết quả này cho thấy nguồn dược liệu ở nước ta rất phong phú. Con số này cịn cĩ thể sẽ tăng thêm, nếu đi sâu điều tra cụ thể hơn một số nhĩm động – thực vật tiềm năng, mà trong đĩ số lồi Tảo, Rêu, Nấm và Cơn trùng làm thuốc mới được thống kê cịn quá ít. Chiến lược quốc gia phát triển ngành dược đến năm 2020 đã đặt mục tiêu phấn đấu sản xuất được 20% nhu cầu nguyên liệu cho sản xuất thuốc trong nước; thuốc sản xuất trong nước chiếm 80% tổng giá trị thuốc tiêu thụ trong năm, trong đĩ thuốc từ dược liệu chiếm 30%. 13
  22. Chương 2 - NGUYÊN VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 2.1. Đối tượng, nguyên vật liệu và thiết bị nghiên cứu 2.1.1 Đối tượng nghiên cứu Nghiên cứu được thực hiện trên cơ sở dữ liệu cấu trúc các hợp chất cĩ nguồn gốc từ thảo dược Việt Nam. Thơng tin của 1376 hợp chất được phân lập từ 311 lồi thực vật và nấm thuộc 114 họ thực vật tại Việt Nam đã được xác định cấu trúc trong 418 nghiên cứu trong nước (được cơng bố trên các tạp chí Dược liệu, Dược học, Hĩa học và Khoa học cơng nghệ) và quốc tế được tập hợp lại thành một CSDL. CSDL Cĩ các thơng tin về hợp chất (tên, biểu diễn cấu trúc dưới dạng SMILE, InChI và InChiKey), tên nguồn dược liệu (tên thơng thường, tên khoa học), địa chỉ thu hái, thời gian thu hái, bộ phận sử dụng, tác dụng dân gian, tác dụng dược lý được chứng minh và tài liệu tham khảo. Mỗi hợp chất trong CSDL được gán một số đăng ký VNPD_ID từ VNPD_ID1 tới VNPD_ID1376. Ngồi ra, mỗi cấu trúc cịn được phân loại, tính tốn các thơng số lý hĩa như khối lượng phân tử, AlogP, XlogP, số liên kết cho hydro, số liên kết nhận hydro CSDL Cĩ các hợp chất được được phân loại vào các nhĩm khác nhau, chủ yếu là lipid, phenylpropanoid và benzoid, được nêu cụ thể trong Bảng 1. Bảng 1: Các phân nhĩm chính trong CSDL Số lượng Nhĩm phân loại chính Tỷ lệ (%) hợp chất Lipid và các phân tử giống lipid 531 38,59 Phenylpropanoid và polyketid 364 26,45 Benzenoid 144 10,46 Hợp chất cĩ cấu trúc dị vịng 117 8,50 Hợp chất hữu cơ cĩ chứa oxy 80 5,81 Alkaloid và các dẫn xuất 60 4,36 Lignan, neolignan 60 4,36 Khác 20 1,46 Tổng 1376 100 2.1.2. Nguyên liệu - Mơ hình QSAR phân loại (Classify) và QSAR hoạt tính (Potency) đã được cơng bố trong nghiên cứu trước đây [34] 14
  23. - Cấu trúc tinh thể tia X của enzym tyrosinase (ID: 2Y9X) phân lập từ A.bisporus với chất ức chế Tropolon được tải về từ ngân hàng Protein Data Bank ( 2.1.3. Thiết bị - Máy tính Dell Vostro 3460, Ram 6GB, hệ điều hành Window 7, CPU Intel Core i5 Ivy Bridge với tốc độ xử lý 2.50GHz - Phần mềm: 1. CDK DescUI-1.4.6 [11] 2.TOMOCOMD-CARDD (TOpological MOlecular COMputer Design - Computer - Aided Racional Drug Design) [84] 3. Weka 3.6 (Waikato Environment for Knowledge Analysis) [75] 4. ChemBioDraw Ultra 12.0 [13] 5. UCSF Chimera 1.11.2 [14] 6. MOE 2009.10 (Molecular Operating Environment) [59] 7. Microsoft Office 2013 2.2. Phương pháp nghiên cứu Nghiên cứu sử dụng phương pháp sàng lọc các hợp chất ức chế tyrosinase sử dụng mơ hình sàng lọc ảo. Hệ thống sàng lọc được định hướng phát triển theo các bước giống Hình 5. Hệ thống này cĩ nhiều phễu lọc cho phép sàng lọc được những cơ sở dữ liệu lớn (hàng nghìn hợp chất) nhằm thu được một tập hợp nhỏ các hợp chất cĩ tiềm năng ức chế enzym tyrosinase. 15
  24. Hình 5: Mơ phỏng hệ thống sàng lọc ảo hợp chất ức chế enzym tyrosinase 2.2.1. Tìm kiếm đồng dạng Phễu lọc tìm kiếm tương đồng được sử dụng nhằm sàng lọc được các hợp chất cĩ độ tương đồng cao (trên 75%) với các hợp chất mẫu, cung cấp một số lượng nhỏ các chất cĩ chất lượng cao cho phễu lọc tiếp theo. Tham số phân tử MACCS [67] (là 1 mơ tả phân tử sử dụng 166 bit để mã hĩa thơng tin về nguyên tử, loại nguyên tử, vịng và các liên kết trong phân tử) được tính tốn bằng phần mềm CDK DescUI-1.4.6 trên tập hợp chất trong CSDL và tập hợp mẫu. Tập hợp chất mẫu trong nghiên cứu này là tập hợp các chất ức chế mạnh tyrosinase đã biết trước cấu trúc [33] (chi tiết cấu trúc hĩa học của các hợp chất mẫu được nêu trong Phụ lục 1). Sau đĩ, hệ số Tanimoto được tính tốn bằng ngơn ngữ R (là ngơn ngữ dành cho tính tốn và đồ họa thống kê) [39], dựa theo Cơng thức (2). Mỗi hợp chất của CSDL sẽ cĩ 12 hệ số tương đồng ứng với 12 chất mẫu (từ Ref1 tới Ref12). Nghiên cứu sử dụng quy tắc MAX để kết hợp các giá trị định lượng về sự tương đồng cấu trúc theo: Tc max = Maximum (Tc1, Tc2, Tc12). Sau đĩ, từng hợp chất trong CSDL được sắp xếp theo giá trị Tc max giảm dần. Các hợp chất được giữ lại cho quá trình sàng lọc tiếp theo khi cĩ giá trị Tc từ 0.75 trở lên. Cơng thức (2): = + − Trong đĩ: 16
  25. Tc: Hệ số Tanimoto Na: Số lượng các đặc tính xuất hiện trong cấu trúc A Nb: Số lượng các đặc tính xuất hiện trong cấu trúc B Nc: Số lượng các đặc tính xuất hiện trong cả 2 cấu trúc A và B 2.2.2. Mơ hình QSAR Các hợp chất được xác định là cĩ cấu trúc tương đồng với các hợp chất ức chế tyrosinase mạnh (kết quả sàng lọc sử dụng phễu lọc tìm kiếm độ tương đồng), sẽ được đánh giá khả năng ức chế sử dụng mơ hình QSAR. Đầu tiên, nghiên cứu sử dụng mơ hình QSAR phân loại (Classify) nhằm phân loại hợp chất thành cĩ tiềm năng ức chế hay khơng cĩ tiềm năng ức chế. Sau đĩ, các hợp chất được phân loại là cĩ tiềm năng ức chế, sẽ được sàng lọc qua mơ hình QSAR hoạt tính (Potency) để đánh giá khả năng ức chế tyrosinase mạnh hay yếu. Các hợp chất thu được từ phễu lọc tìm kiếm đồng dạng sẽ được tính tốn các tham số phân tử đặc trưng biểu thị mối quan hệ giữa đặc tính, cấu trúc và hoạt tính sinh học sử dụng phần mềm TOMOCOMD-CARDD. Danh sách các tham số phân tử và ý nghĩa các tham số phân tử này được liệt kê trong Phụ lục 2. Tập kiểm tra (testing set) được chuẩn bị từ danh sách kết quả các tham số phân tử vừa tính được sử dụng phần mềm WEKA 3.6. Tập huấn luyện (training set) cho mơ hình QSAR phân loại gồm 1072 hợp chất, trong đĩ cĩ 526 hợp chất cĩ hoạt tính và 546 hợp chất khơng cĩ hoạt tính ức chế tyrosinase. Tập huấn luyện cho QSAR hoạt tính gồm 257 chất cĩ hoạt tính mạnh và 141 chất cĩ hoạt tính trung bình-yếu [34]. Nghiên cứu sử dụng mơ hình QSAR là mơ hình hợp kết hợp giữa các mơ hình đơn cĩ độ chính xác cao được xây dựng từ việc áp dụng các thuật tốn thống kê và mơ hình học máy khác nhau. Sau đĩ, sử dụng thêm trình huấn luyện stacking để kết hợp đầu ra của các mơ hình đơn nhằm đạt kết quả tốt nhất. 2 mơ hình QSAR phân loại và QSAR hoạt tính được sử dụng đều là các mơ hình được nhĩm nghiên cứu của TS. Lê Thị Thu Hường đánh giá là tốt nhất [34], cĩ độ tin cậy cao, 95,43% và 93,72% tương ứng. 2.2.3. Docking Cuối cùng, các hợp chất được dự đốn là cĩ khả năng ức chế tyrosianse mạnh sẽ được dock với enzym tyrosinase (ID: 2Y9X) nhằm xác định năng lượng liên kết 17
  26. và tương tác với trung tâm hoạt động. Quá trình dock được thực hiện theo 3 bước như sau: Bước 1: Chuẩn bị cấu trúc enzym và cơ chất dưới dạng file .moe Cấu trúc tyrosinase từ file 2Y9X được loại bỏ phối tử (trong nghiên cứu này là Tropolon), các phân tử nước, các phân tử nền, giữ lại chuỗi A (dùng phần mềm UCSF Chimera 1.11.2), tinh chỉnh trung tâm hoạt động (dùng phần mềm MOE 2009.10) và được ghi lại dưới dạng file .moe. Cấu trúc của phối tử (các hợp chất trong CSDL đã được dự đốn là cĩ hoạt tính ức chế tyrosinase mạnh) được chuyển từ dạng 2D sang 3D (sử dụng phần mềm ChemBioDraw Ultra 12.0) và tối ưu hĩa sơ bộ dùng MOE 2009.10, sau đĩ ghi lại dưới dạng file .moe. Bước 2: Docking Sau khi lựa chọn trường lực (ForceField) và loại năng lượng cần tính tốn (ΔG), enzym và phối tử được dock với nhau tự động. Thuật tốn tìm kiếm được sử dụng là kết hợp thuật giải di truyền với tối ưu hĩa cục bộ. Các thơng số sử dụng mặc định của phần mềm. Bước 3: Xử lý kết quả Kết quả được đưa ra là một danh sách các cấu dạng liên kết của enzym và phối tử được sắp xếp theo thứ tự năng lượng liên kết tăng dần. Cấu dạng cĩ tương tác với trung tâm hoạt động của enzym đồng thời cĩ năng lượng liên kết nhỏ nhất sẽ được ưu tiên lựa chọn. 2.2.4. Xử lý số liệu Số liệu được xử lý bằng phương pháp thống kê, lọc sử dụng phần mềm Microsoft Office Excel 2013. 18
  27. Chương 3 - KẾT QUẢ VÀ BÀN LUẬN 3.1. Kết quả tìm kiếm đồng dạng Kết quả sau khi tính tốn hệ số tương đồng Tanimoto được lưu lại và xử lý bằng Microsoft Office Excel 2013 (Hình 6). Trong đĩ, các giá trị in đậm là các giá trị lớn nhất của hệ số Tanimoto được lựa chọn để sắp xếp độ tương đồng theo chiều giảm dần. Hình 6: Giá trị Tc của các chất trong CSDL tương ứng với 12 chất mẫu Giá trị Tc max của các hợp chất trong CSDL được phân bố như Hình 7. 75% hợp chất cĩ giá trị Tc max nằm trong khoảng từ 0,5-0,75. Dưới 15% hợp chất cĩ Tc max lớn hơn 0,75. HC 600 500 400 300 200 100 0 0,0-0,3 0,3-0,4 0,4-0,5 0,5-0,6 0,6-0,7 0,7-0,75 0,75-0,8 0,8-0,9 0,9-1,0 Tc max Hình 7: Khoảng phân bố của giá trị Tc max Các hợp chất cĩ độ tương đồng trên 75%, tương ứng với Tc max >0,75, sau đĩ được lọc bằng Excel và sắp xếp theo thứ tự giảm dần độ tương đồng. Sự phân bố Tcmax của các chất thu được lúc này được biểu diễn trong Hình 8. Gần 50% số hợp chất trong CSDL cĩ độ tương đồng với hợp chất mẫu Ref8 trong khi khơng cĩ hợp chất nào trong CSDL tương đồng với Ref6. Sau khi loại đi các hợp chất cĩ hệ số tương đồng dưới 0,75 thì 174 hợp chất cịn lại, chủ yếu tương đồng với Ref8 (116/174 hợp 19
  28. chất) và Ref9 (38/174 hợp chất). Khơng cĩ hợp chất nào trong CSDL cĩ độ tương đồng trên 0,75 với Ref2, Ref3, Ref4, Ref6, Ref7, Ref11 và Ref12. 700 643 600 500 461 400 300 200 116 88 100 53 62 32 38 26 4 0 0 5 0 2 8 0 0 0 2 8 0 0 2 0 Ref1 Ref2 Ref3 Ref4 Ref5 Ref6 Ref7 Ref8 Ref9 Ref10 Ref11 Ref12 Tc max Tc max>0.75 Hình 8: Phân bố giá trị Tc max theo từng chất mẫu Như vậy, 1376 hợp chất trong CSDL qua phễu lọc tìm kiếm tương đồng thu được 174 hợp chất (12,64% tổng số chất) cĩ độ tương đồng từ 0,75 được sắp xếp theo thứ tự giảm dần độ tương đồng. 3.2. Kết quả mơ hình QSAR 174 hợp chất thu được sau phễu lọc tìm kiếm đồng dạng sẽ được vẽ lại bằng phần mềm TOMOCOMD-CARDD và được lưu lại dưới dạng file *.net. Ví dụ về cấu trúc VNPD_ID929 được biểu diễn lại bằng TOMOCOMD-CARD như Hình 9. Hình 9: Cấu trúc VNPD_ID929 được vẽ lại bằng TOMOCOMD-CARDD 20
  29. 11 tham số phân tử phục vụ cho mơ hình QSAR phân loại và 14 tham số phân tử sử dụng cho mơ hình QSAR hoạt tính được tính tốn dựa trên 174 file *.net ở trên bằng phần mềm TOMOCOMD-CARDD. Kết quả các tham số phân tử thu được tương ứng với 2 mơ hình QSAR cuối cùng được biểu diễn trong Phụ lục 3. 174 hợp chất với độ tương đồng trên 75% tiếp tục được lọc qua mơ hình QSAR phân loại và QSAR hoạt tính thu được 41 hợp chất được dự đốn là cĩ hoạt tính ức chế tyrosinase và 34 hợp chất được dự đốn là cĩ hoạt tính ức chế tyrosinase mạnh (Phụ lục 4). 34 hợp chất được dự đốn là cĩ hoạt tính ức chế tyrosinase mạnh chủ yếu thuộc vào nhĩm flavonoid (7/34 hợp chất) và triterpenoid (13/34 hợp chất). Cụ thể phân loại 34 chất vào các nhĩm như Hình 10. Triterpenoid Flavonoid Stigmastan Terpene lacton Sesterterpenoid Ergostane steroid Naphthalen Stigmastane Steroid 0 2 4 6 8 10 12 14 Hình 10: Phân bố các nhĩm chất 3.3. Kết quả Docking Áp dụng phương pháp Docking 34/1376 hợp chất trong CSDL với trung tâm hoạt động của enzym tyrosinase được kết quả là danh sách các cấu dạng liên kết và năng lượng liên kết được trình bày cụ thể trong Phụ lục 5. 0 dG -1 -2 -3 -4 -5 -6 -7 -8 -9 Hình 11: Phân bố năng lượng liên kết với trung tâm hoạt động của enzym 21
  30. Phân tích kết quả Docking, tất cả 34 hợp chất đều cĩ khả năng chui vào túi enzym của trung tâm hoạt động (tất cả đều cĩ năng lượng liên kết âm với đích, từ - 8,7921 đến -3,8160 Kcal/mol) nhưng chỉ cĩ 21/34 hợp chất cĩ khả năng liên kết với ion Cu2+ nằm tại đáy túi trung tâm hoạt động của tyrosinase (Bảng 2). Trong đĩ, 13 hợp chất liên kết với cả 2 ion đồng của trung tâm hoạt động, 8 hợp chất được dự đốn là cĩ khả năng liên kết với 1 ion đồng của trung tâm hoạt động, cịn lại 13 hợp chất khơng tạo được liên kết phối trí với ion đồng và được dự đốn là khơng cĩ khả năng ức chế tyrosinase (Hình 11). Bảng 2: Ái lực liên kết với đích của 21 hợp chất được dự đốn là cĩ khả năng ức chế tyrosinase No Số đăng ký Hợp chất ΔG(Kcal/mol) Acid (24E)-3-oxo-lanosta-8,24-dien-26- 1 VNPD_ID46 -5,3657 oic Acid 20(R),24(E)-3-oxo-9β-lanosta- 2 VNPD_ID184 -5,8818 7,24-dien-26-oic 3 VNPD_ID395 6β-hydroxystigmast-4-en-3-on -6,3335 4 VNPD_ID577 Citrostadienol acetat -6,4105 5 VNPD_ID722 Epigallocatechin -8,6404 6 VNPD_ID723 Epigallocatechingallat -8,5137 7 VNPD_ID725 Ergosta-4,6,8(14),22-tetraen-3-on -5,7037 8 VNPD_ID889 Kaempferol -8,5998 9 VNPD_ID894 Kaempferol 3-O-β-D-glucopyranosid -8,7538 10 VNPD_ID921 Leoheteronin -5,4323 11 VNPD_ID922 Leoheteronin A -6,2830 12 VNPD_ID923 Leoheteronin B -5,3499 13 VNPD_ID929 Luteolin -8,7921 14 VNPD_ID940 Lup-20(29)-en-3β-yl acetat -5,8188 15 VNPD_ID1023 Neosarmentol III -3,8160 16 VNPD_ID1157 Quercetin -7,7230 17 VNPD_ID1166 Quercetin 3-O-α-L-rhamnopyranosid -8,1534 18 VNPD_ID1256 Stigmast-4-en-3-on -5,6756 19 VNPD_ID1257 Stigmasta-4-en-3,6-dion -6,3540 20 VNPD_ID1286 Taraxeryl acetat -5,4154 21 VNPD_ID1365 α-spinasteron -5,2966 22
  31. 3.4. Bàn luận 3.4.1. Về phương pháp sàng lọc ảo Việc ứng dụng các kỹ thuật máy tính (sàng lọc ảo) trong quá trình nghiên cứu và phát triển thuốc đang là một xu thế chung của các ngành cơng nghiệp dược phẩm trên tồn thế giới. Số lượng các bài báo về sàng lọc ảo tăng lên hàng năm, chứng tỏ lĩnh vực này đang rất được quan tâm. Điều này cĩ thể giải thích là do các kỹ thuật sàng lọc ảo cĩ nhiều ứng dụng trong nghiên cứu về thiết kế thuốc, phát triển các hợp chất ức chế trên đích sinh học khác nhau, điển hình như các đích phân tử cho những bệnh đang được quan tâm hiện nay như ung thư, bệnh do ký sinh trùng, bệnh HIV Vì thế, áp dụng các kỹ thuật sàng lọc ảo sẽ giúp Việt Nam tiếp cận và theo kịp với các kỹ thuật mới trên thế giới. Mặt khác, trong nghiên cứu này, quá trình sàng lọc ảo được áp dụng trên CSDL mà nhĩm nghiên cứu đã xây dựng được. Việc sàng lọc CSDL này là một hướng đi nhanh và hiệu quả nhất cho việc phát triển một thuốc mới vì các hợp chất trong CSDL đã được xác định, phân lập từ thảo dược ở Việt Nam (tránh được giai đoạn tổng hợp). Để sàng lọc được ngân hàng này nhanh và chính xác, việc thiết lập một quy trình sàng lọc ảo một cách hệ thống, cĩ nhiều phễu lọc khác nhau là rất cần thiết. Phương pháp sàng lọc ảo chất ức chế tyrosinase sử dụng các mơ hình tốn học mới cĩ tính chính xác cao, được xây dựng sử dụng mơ hình hợp (multiclassifiers), và hệ thống trình sàng lọc ảo (cĩ nhiều phễu lọc) cho phép phát hiện các hợp chất ức chế enzym tyrosinase mới cĩ hoạt tính cao chỉ từ cấu trúc phân tử. Bên cạnh những ưu điểm trên, sàng lọc ảo cũng cịn gặp một số khĩ khăn như sự khác biệt giữa mơ hình hĩa và thực tế diễn ra trong cơ thể con người, sự chính xác trong việc xác định cấu trúc 3D của protein, hay việc sử dụng quá nhiều phễu lọc cũng cĩ thể gây tăng sai số cho quá trình. Chính vì vậy, việc phối hợp các kỹ thuật in silico, in vivo, in vitro là rất cần thiết. Về kỹ thuật tìm kiếm đồng dạng Việc sử dụng mơ tả 2D để mơ tả phân tử vừa đơn giản, dễ thực hiện, vừa tiết kiệm thời gian. Mơ tả phân tử 2D thường ổn định hơn so với mơ tả phân tử 3D vì mơ tả 2D chỉ mang một giá trị duy nhất trong khi mơ tả 3D cĩ thể mang nhiều giá trị do độ linh động về cấu dạng. Vì thế, sử dụng mơ tả phân tử 2D sẽ làm tăng hiệu quả cho quá trình tính tốn. Trong khĩa luận này, vân tay điện tử MACCS (Molecular ACCESS System) được sử dụng để biểu diễn cho các phân tử trong CSDL và các hợp 23
  32. chất mẫu. MACCS là một mơ tả cấu trúc 2D, sử dụng 166 bit để mã hĩa thơng tin về nguyên tử, loại nguyên tử, vịng và các liên kết trong phân tử. MACCS được tính tốn bằng phần mềm CDK DescUI-1.4.6 sử dụng dữ liệu đầu vào là SMILE (là ngơn ngữ dùng để biểu diễn cấu trúc hĩa học và các phản ứng). Bên cạnh những ưu điểm của một mơ tả 2D, việc sử dụng MACCS để mơ tả phân tử cịn cĩ một số hạn chế. MACCS là vân tay từ điển (điều này cĩ nghĩa là một từ điển cố định về các mảnh cấu trúc sẽ được sử dụng trong quá trình mã hĩa hợp chất), như vậy, nếu hợp chất cĩ chứa mảnh cấu trúc khơng được định nghĩa trong từ điển thì mảnh cấu trúc đĩ sẽ khơng xuất hiện trong kết quả mơ tả phân tử nhận được, gây ra sai số cho mơ tả. Hệ số Tanimoto được sử dụng để biểu diễn sự giống nhau giữa các chất của CSDL được sàng lọc và chất mẫu. Đây là hệ số tương đồng được sử dụng rộng rãi nhất trong lĩnh vực hĩa tin do thuật tốn đơn giản, dễ thực hiện và nhanh chĩng và hiệu quả hơn so với các hệ số tương đồng khác. Tuy nhiên, trong các nghiên cứu về so sánh các hệ số tương đồng đã chỉ ra rằng, việc sử dụng kết hợp các hệ số tương đồng sẽ mang lại hiệu quả cao hơn cho quá trình sàng lọc [4]. Hoặc việc xây dựng nên một vân tay mẫu (model fingerprint), là dấu vân tay được kết hợp từ dấu vân tay của các hợp chất mẫu cũng là một cách làm tăng hiệu quả cho quá trình tìm kiếm. Qua quá trình sàng lọc ảo dựa vào đồng dạng, 12,64% số hợp chất đạt yêu cầu đã được lựa chọn, việc làm này đã tiết kiệm được thời gian cho quá trình sàng lọc dựa vào đồng dạng, cung cấp các chất đầu vào cĩ tiềm năng cao hơn cho các phễu lọc sau. Như vậy, đây là một phễu lọc vơ cùng hữu ích, tiết kiệm được thời gian và cơng sức cho quá trình sàng lọc. Về kỹ thuật sàng lọc sử dụng mơ hình QSAR QSAR hiện nay đang là một kỹ thuật được ứng dụng trong rất nhiều các lĩnh vực như dược phẩm, y học, hĩa học Cĩ rất nhiều nghiên cứu trên thế giới sử dụng mơ hình QSAR để sàng lọc các hoạt chất chống ung thư phổi [85], điều trị bệnh Parkinson, điều trị các bệnh đái tháo đường, HIV [58] Trong nước hiện nay cũng đã bắt đầu sử dụng mơ hình QSAR trong nghiên cứu phát triển thuốc như Thái Khắc Minh và cộng sự đã xây dựng thành cơng mơ hình QSAR các hợp chất ức chế topoisomerase I và các chất chống ung thư [74]. Tuy nhiên, các nghiên cứu sử dụng mơ hình QSAR hầu hết chỉ sử dụng mơ hình đơn, cĩ rất ít các nghiên cứu sử dụng hệ thống phân loại hợp (kết hợp đầu ra của các mơ hình đơn) trong khi hệ thống phân loại hợp là một dụng cụ rất hiệu quả trong các nghiên cứu QSAR. 24
  33. Nghiên cứu này sử dụng mơ hình phân loại hợp QSAR trong các cơng bố trước đĩ của TS. Lê Thị Thu Hường cùng nhĩm nghiên cứu [34]. Nhĩm nghiên cứu đã xây dựng rất nhiều mơ hình đơn và mơ hình hợp với các thuật tốn khác nhau để mơ tả mối liên quan định lượng giữa cấu trúc và tác dụng của hợp chất ức chế enzym tyrosinase. Các mơ hình lần lượt được đánh giá. Kết quả cho thấy, việc sử dụng mơ hình hợp mang lại hiệu quả cao hơn so với việc sử dụng mơ hình đơn trong việc dự đốn hợp chất cĩ tác dụng ức chế tyrosinase. Đồng thời, các mơ hình được xây dựng dựa trên tập huấn luyện bao gồm rất nhiều hợp chất (1027 hợp chất) làm tăng độ chính xác của mơ hình. Chính vì thế mà việc áp dụng mơ hình hợp QSAR vào nghiên cứu này đã mang lại hiệu quả cao cho quá trình sàng lọc. Tuy nhiên, mơ hình QSAR khơng phải là mơ hình sẵn cĩ, để xây dựng được mơ hình, cần phải cĩ thơng tin về cấu trúc, hĩa học, thực nghiệm của tập hợp các chất được dùng làm tập huấn luyện, đồng thời phải cĩ hiểu biết về phân tích thống kê, mơ hình học máy khá phức tạp. Về kỹ thuật docking Docking là một kỹ thuật phổ biến hiện nay để mơ phỏng các tương tác giữa protein với protein hoặc giữa protein và phối tử, được ứng dụng để thiết kế thuốc dựa vào cấu trúc, tối ưu hĩa hợp chất dẫn đường, hay nghiên cứu cơ chế tác dụng của các thuốc Tuy nhiên, docking cĩ nhược điểm là cần cĩ thơng tin về cấu trúc 3D của protein, cấu dạng của cơ chất và protein đều cĩ thể bị thay đổi, giữa cơ chất và enzym cịn cĩ các tương tác khác như tương tác van der Waals, tương tác tĩnh điện, trong nhiều trường hợp cịn cĩ tương tác hĩa học khác. Hơn 60 phần mềm docking được phát triển trong suốt 2 thập kỷ qua bao gồm cả phần mềm thương mại và phần mềm học thuật như là DOCK [19], AutoDock [3], MOE [59], GOLD [23] Trong đĩ, các phần mềm thương mại được đánh giá là cĩ độ chính xác cao hơn so với các phần mềm học thuật. MOE 2009.10 là một phần mềm docking thương mại với hàm tính tốn cĩ độ chính xác cao nằm trong top đầu [60]. Vì thế, các kết quả docking nhận được trong nghiên cứu này đều cĩ độ chính xác cao. Đây cũng là lý do vì sao docking được thực hiện bằng phần mềm MOE 2009.10 trong nghiên cứu này. Tyrosinase tồn tại trong thực vật, động vật, nấm và vi khuẩn. Tyrosinase tiêu biểu nhất là tyrosinase được phân lập từ các lồi vi khuẩn Streptomyces, từ nấm Neurospora crassa và Agaricus bisporus. Ngày nay, enzym nội bào từ A.bisporus là 25
  34. enzym thương mại sẵn cĩ duy nhất. Tyrosinase từ A.bisporus đã được chứng minh là cĩ tính tương đồng cao với tyrosinase của động vật cĩ vú và con người, vì thế nĩ được sử dụng như mơ hình trong hầu hết các nghiên cứu về tăng sắc tố da [44]. Chính vì lý do này mà nghiên cứu lựa chọn cấu trúc tinh thể của tyrosinase từ A.bisporus để phục vụ cho bước sàng lọc dựa vào cấu trúc (docking). 3.4.2. Về kết quả sàng lọc ảo Tất cả 34 hợp chất được dock với tyrosinase đều cĩ nhĩm hydroxy phenol (cĩ độ phân cực cao) hoặc nhĩm keto (gần nối đơi hoặc liên kết trực tiếp với nguyên tử oxy). Các phân tử oxy cĩ độ âm điện lớn cĩ khả năng tạo phức chelat với ion đồng, tuy nhiên, tùy thuộc vào cấu trúc của từng hợp chất, mà cấu dạng tạo thành khi liên kết vào trung tâm hoạt động của enzym cĩ cho phép phân tử oxy cĩ độ âm điện lớn đĩ nằm vào đúng vị trí để tương tác với ion đồng hay khơng. Điều này giải thích vì sao 2 hợp chất cùng cĩ nhĩm hydroxy phenol tại vị trí meta và para nhưng cĩ chất tạo được 4 liên kết với ion đồng (VNPD_ID929), cĩ chất lại chỉ tạo được 2 liên kết (VNPD_ID1157). Hay 2 hợp chất cùng cĩ nhĩm keto liên kết trực tiếp với nguyên tử oxy, nhưng 1 chất thì tạo được 1 liên kết với ion đồng (VNPD_ID940), trong khi chất cịn lại khơng tạo được liên kết với ion đồng (VNPD_ID938). Trong số 34 hợp chất đã tiến hành nghiên cứu docking, cĩ 21/34 hợp chất cho kết quả là cĩ tác dụng ức chế tyrosinase mạnh. 16/21 hợp chất chưa cĩ bất kỳ nghiên cứu nào về tác dụng ức chế tyrosinase. Cụ thể, VNPD_ID725 mới được nghiên cứu và chứng minh tác dụng phịng ngừa tổn thương thận gia đoạn sớm trên chuột [82], tác dụng gây độc tế bào và gây độc dịng tế bào ung thư [72]. VNPD_ID922 được chứng minh là cĩ tác dụng ức chế cholinesterase [32]. VNPD_ID940 đã được nghiên cứu và chứng minh là cĩ khả năng kích ứng da mạnh [2]. VNPD_ID1256 đã được chứng minh là cĩ hoạt tính ức chế sự tăng trưởng của Mycobacterium tuberculosis [24]. Các hợp chất cịn lại mới chỉ được nghiên cứu và phân lập, chưa được nghiên cứu về bất kỳ tác dụng sinh học nào. Như vậy, 16 hợp chất chưa được chứng minh hoạt tính ức chế tyrosinase này là các hợp chất tiềm năng cần được nghiên cứu thêm. 5 trong số 21 hợp chất được dự đốn là cĩ tác dụng ức chế tyrosinase mạnh đã được chứng minh hoạt tính ức chế tyrosinase trong các cơng bố trước đây. Cả 5 hợp chất này đều là 5 hợp chất thuộc nhĩm flavonoid, là nhĩm chất cĩ rất nhiều hợp chất đã được chứng minh tác dụng ức chế tyrosinase, trong phân tử cĩ 1 đến 2 nhĩm hydroxy phenol. Các nhĩm hydoxy phenol này cĩ tính phân cực mạnh nên khi đi vào trung tâm hoạt động của enzym cĩ thể tạo phức với ion đồng nằm ở đáy túi, gây bất 26
  35. hoạt enzym theo cơ chế cạnh tranh. Cụ thể, tương tác của 5 hợp chất này với trung tâm hoạt động của enzym như sau: a. VNPD_ID929. Luteolin Hình 12: Mơ phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với VNPD_ID929 Theo kết quả nghiên cứu trên mơ hình docking thì VNPD_ID929 được dự đốn là cĩ khả năng ức chế tyrsionase mạnh do cĩ nhĩm m-hydroxy và p-hydroxy khi đi sâu vào trung tâm hoạt động của enzym sẽ bị de-proton hĩa tạo nên hai cực âm cĩ điện tích phân bố đều trên hai nguyên tố oxy. Nhờ đĩ mà cả 2 nguyên tố oxy đều tạo phức chelat với 2 ion Cu2+. Đồng thời, các liên kết hydro cũng được hình thành giữa 2 vịng thơm của VNPD_ID929 và His263, phân tử oxy tại vị trí para- của VNPD_ID929 nhận điện tử từ His61. Đồng thời, VNPD_ID929 tương tác với trung tâm hoạt động của enzym với mức năng lượng nhỏ nhất ΔG = -8,7921 Kcal/mol. Như vậy, VNPD_ID929 là chất cĩ khả năng chui vào trung tâm hoạt động của enzym, tương tác với 2 ion đồng, và được giữ lại bởi các liên kết hydro nên cĩ thể dự đốn VNPD_ID929 cĩ khả năng ức chế tyrosinase mạnh nhất. Trên thực tế, VNPD_ID929 được tìm thấy trong rất nhiều lồi thực vật ở Việt Nam, trong đĩ chưa thấy cĩ nghiên cứu về tác dụng ức chế tyrosinase từ dịch chiết của các lồi thực vật này. Tuy nhiên, đã cĩ nghiên cứu chứng minh tác dụng ức chế tyrosinase của chất này trên thế giới [6, 50, 53]. b. VNPD_ID722. Epigallocatechin 27
  36. Hình 13: Mơ phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với VNPD_ID722 Từ kết quả của mơ hình sàng lọc ảo, VNPD_ID722 được dự đốn cĩ tác dụng ức chế tyrosinase. So với VNPD_ID929, VNPD_ID722 tạo thêm được liên kết hydro do mạch chính của Asn260 nhận điện tử từ hydro liên kết với nhĩm methyl của hợp chất. Như vậy, VNPD_ID722 cĩ khả năng ổn định tại trung tâm hoạt động của enzym hơn so với VNPD_ID929. Tuy nhiên, năng lượng liên kết với trung tâm hoạt động của VNPD_ID722 lớn hơn VNPD_ID929, ΔG = -8,6404 Kcal/mol. VNPD_ID722 được tìm thấy trong cây trơm leo (Byttneria aspera C., Sterculiaceae) (cĩ tác dụng dân gian là giúp phụ nữ cĩ thai dễ sinh nở) và cây vừng (Sesamum indicum, Pedaliaceae) (đã được chứng minh là cĩ khả năng ức chế enzym amylase, điều trị đái tháo đường), nhưng chưa thấy cĩ nghiên cứu ức chế tyrosinase từ dịch chiết cây này tại Việt Nam. Hợp chất này đã được chứng minh tác dụng ức chế tyrosinase với nồng độ ức chế 50% bằng 0,5 lần so với acid kojic trong các cơng bố trước đĩ [61]. c. VNPD_ID889. Kaempferol Hình 14: Mơ phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với VNPD_ID889 28
  37. Kết quả nghiên cứu trên mơ hình sàng lọc ảo cho thấy, VNPD_ID889 cĩ nhĩm chức p-hydroxy tạo phức chelat với 2 ion đồng nằm dưới đáy túi của trung tâm hoạt động của enzym. Tương tự như VNPD_ID929, VNPD_ID889 cũng tạo được 2 liên kết hydro với His263 và His61 giúp ổn định hơn cấu trúc của phức hợp. 2 liên kết phối trí với ion đồng, đồng thời, VNPD_ID889 cĩ mức năng lượng ΔG = -8,5998 Kcal/mol cao hơn so với VNPD_ID929 cho thấy khả năng ức chế tyrosinase của VNPD_ID889 thấp hơn so với VNPD_ID929. VNPD_ID889 đã được nghiên cứu và chứng minh tác dụng ức chế tyrosinase với nồng độ ức chế 50% là 0,23mM cao hơn so với VNPD_ID929 (0,19mM) [71]. d. VNPD_ID723. Epigallocatechingallat Hình 15: Mơ phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với VNPD_ID723 VNPD_ID723 khi đi vào sâu trong trung tâm hoạt động, 2 nhĩm m-hydroxy và p-hydroxy của VNPD_ID723 tạo phức chelat với 2 ion Cu2+ do đĩ VNPD_ID723 cĩ khả năng ức chế tyrosinase. Mức năng lượng dự đốn được là ΔG = -8,5137 Kcal/mol. So với VNPD_ID929, VNPD_ID723 chỉ tạo được 2 liên kết với 2 ion Cu2+, nhưng lại tạo được 4 liên kết hydro với các chuỗi His244, His85, Glu322 và Arg268. VNPD_ID723 được tìm thấy trong lá trà xanh (Camellia sinensis L.) với tác dụng kháng khuẩn, kháng nấm, kìm hãm sự phát triển của tế bào ung thư. Ngồi ra, đã cĩ nghiên cứu về tác dụng ức chế ức chế tyrosinase của VNPD_ID723 và một số hợp chất cùng nhĩm với hợp chất này, kết quả cho thấy chúng đều thể hiện tác dụng ức chế tyrosinase [61]. 29
  38. e. VNPD_ID1157. Quercetin Hình 16: Mơ phỏng cấu dạng của phức hợp trung tâm hoạt động enzym với VNPD_ID1157 Dựa vào kết quả quá trình docking, VNPD_ID1157 được dự đốn là cĩ khả năng ức chế tyrsionase. Do cấu dạng của đáy túi enzym, VNPD_ID1157 chỉ cĩ thể tạo được cấu dạng mà tại đĩ chỉ cĩ nhĩm m-hydroxy tạo liên kết phối trí với 2 ion Cu2+. Năng lượng liên kết ghi lại được là ΔG = -7,7230 Kcal/mol. VNPD_ID1157 được tìm thấy trong nhiều lồi thực vật ở Việt Nam như mục ký ngũ hùng (Dendrophthoe pentandra L.), đảng sâm bắc (Codonopsis pilosula F.), đại bi (Blumea balsamifera L.), bồ kết (Gleditsia australis) Các nghiên cứu về hoạt tính ức chế tyrosinase của VNPD_ID1157 cũng đã được thực hiện, kết quả cho thấy VNPD_ID1157 cĩ hoạt tính ức chế tyrosinase mạnh gấp 2 lần so với acid kojic [71]. 30
  39. KẾT LUẬN VÀ KIẾN NGHỊ KẾT LUẬN Từ kết quả của quá trình sàng lọc ảo trên CSDL các hợp chất thiên nhiên Việt Nam, chúng tơi rút ra kết luận sau: 1. Từ 1376 hợp chất trong CSDL, 174 hợp chất được xác định là cĩ cấu trúc tương đồng với các hợp chất ức chế mạnh thơng qua phễu lọc tìm kiếm tương đồng. 2. 41 hợp chất được dự đốn là cĩ khả năng ức chế thơng qua mơ hình QSAR phân loại, 34 hợp chất được dự đốn là ức chế mạnh sử dụng mơ hình QSAR hoạt tính 3. Cả 34 hợp chất đều cĩ năng lượng liên kết âm trên các nghiên cứu docking. Phân tích các hợp chất cĩ năng lượng liên kết âm trên docking, đã phát hiện được 21 hợp chất cĩ khả năng ức chế tyrosinase mạnh. KIẾN NGHỊ Để tiếp tục phát triển các kết quả nghiên cứu của khĩa luận trong tìm kiếm các hợp chất thiên nhiên Việt Nam cĩ hoạt tính ức chế enzym tyrosinase, chúng tơi xin đưa ra các đề xuất sau: 1. Chiết tách, phân lập các hợp chất đã được dự đốn thơng qua hệ thống sàng lọc ảo. 2. Tiến hành thử hoạt tính sinh học để kiểm chứng lại các kết luận của quá trình sàng lọc ảo. 31
  40. Tài liệu tham khảo [1]. Andrawis A., Kahn V. (1986), "Effect of methimazole on the activity of mushroom tyrosinase", Biochem J, 235(1), 91-96. [2]. Asif M. S., Sabir W. A. (2003), "Irritant potential of some constituents from the seeds of Caesalpinia bonducella (L.) Fleming", Journal of Asian Natural Products Research, 5(1), 35-41. [3]. AutoDock, The Scripps Research Institute. [4]. Aysha Al K., Maciej H., John H. (2009), "Comparison of Nonbinary Similarity Coefficients for Similarity Searching, Clustering and Compound Selection", Chem. Inf. Model., 49, 1193-1201. [5]. Badria F. A., Gayyar M. A. (2001), "A new type of tyrosinase inhibitors from natural products as potential treatments for hyperpigmentation", Boll Chim Farm, 140(4), 267-271. [6]. Balyan R., Kudugunti SK., Hamad HA., Yousef MS., Moridani MY. (2015), "Bioactivation of luteolin by tyrosinase selectively inhibits glutathione S- transferase", Chemico Biological Interactions, 240, 208-218. [7]. Battiti R., Colla A. M. (1994), "Democracy in neural nets: voting schemes for classification", Neural Networks 7, 691-708. [8]. Breiman L. (1996), "Bagging predictors", Machine Learning, 24(2). [9]. Canovas F. G., Garcia-Carmona F., Sanchez J. V., Pastor J. L., Teruel J. A. (1982), "The role of pH in the melanin biosynthesis pathway", J Biol Chem, 257(15), 8738- 8744. [10]. Casanola-Martin G. M., Le-Thi-Thu H., Marrero-Ponce Y., Castillo-Garit J. A., Torrens F., Rescigno A., Abad C., Khan M. T. (2014), "Tyrosinase enzyme: An overview on a pharmacological target", Curr Top Med Chem, 14(12), 1494-1501. [11]. CDK Descriptor Calculator GUI v1.4.6, Rajarshi Guha. [12]. Chang T. S. (2009), "An updated review of tyrosinase inhibitors", Int J Mol Sci, 10(6), 2440-2475. [13]. ChemBioDraw Ultra 12.0 CambridgeSoft (2010), PerkinElmer. [14]. Chimera v1.11.2 - Extensible Molecular Modeling System (2016), Resource for Biocomputing, Visualization, and Informatics. [15]. Conrad J. S., Dawso S. R., Hubbard E. R., Meyers T. E., Strothkamp K. G. (1994), "Inhibitor binding to the binuclear active site of tyrosinase: temperature, pH, and solvent deuterium isotope effects", Biochemistry, 33(19), 5739-5744. [16]. Criton M., Le Mellay-Hamon V. (2008), "Analogues of N-hydroxy-N'-phenylthiourea and N-hydroxy-N'-phenylurea as inhibitors of tyrosinase and melanin formation", Bioorganic & Medicinal Chemistry Letters, 18(12), 3607-3610. [17]. DeCaprio A. P. (1999), "The toxicology of hydroquinone relevance to occupational and environmental exposure", Crit Rev Toxicol, 29(3), 283-330. [18]. Dietterich T. G (2000), Ensemble methods in machine learning, Springer-Verlag, Berlin Heidenberg. [19]. DOCK, Irwin "Tack" Kuntz's Group, University of California, San Francisco. [20]. Espin J. C., Wichers H. J. (2001), "Effect of captopril on mushroom tyrosinase activity in vitro", Biochim Biophys Acta, 1544, 289-300. [21]. Frankos V. H., Schmitt D. F., Haws L. C., McEvily A. J., Iyengar R., Miller S. A., Munro I. C., Clydesdale F. M., Forbes A. L., Sauer R. M. (1991), "Generally recognized as safe (GRAS) evaluation of 4-hexylresorcinol for use as a processing
  41. aid for prevention of melanosis in shrimp", Regul Toxicol Pharmacol, 14(2), 202- 212. [22]. Frenk.E (1995), "Treatment of melasma with depigmenting agents ", Martin Dunitz, London. [23]. Genetic Optimization for Ligand Docking (GOLD), The Cambridge Crystallgraphic Data Centre. [24]. Girma M. W., Scott G. F., Fangqiu Z., Barbara N. T. (2003), "Inhibitory effect of sterols from Ruprechtia triflora and diterpenes from Calceolaria pinnifolia on the growth of Mycobacterium tuberculosis", Planta Med, 69, 628-631. [25]. Gottesberge A. M. (1988), "Physiology and Pathophysiology of Inner Ear Melanin", Pigment Cell Research, 1(4), 238-249. [26]. Gutzeit H. O., Ludwig-Müller J. "Biological Functions and Practical Applications", Plant Natural Products: Synthesis. Wiley Blackwell. [27]. Hammerstone J. F., Lazarus S. A., Schmitz H. H. (2000), "Procyanidin content and variation in some commonly consumed foods", The Journal of Nutrition, 130(8), 2086-2092. [28]. Hansch C., Fujita T. (1964), "A method for the correlation of biological activity and chemical structure.", J. Am. Chem. Soc., 86, 1616-1626. [29]. Hany A., El-Shemy, Ahmed M. Aboul-Enein, Kounosuke F. (2007), "Willow Leaves' Extracts Contain Antitumor Agents Effective against Three Cell Types", PLoS ONE, 2(1), 178. [30]. Hert J., Willett P., Wilton D. J., Acklin P., Azzaoui K., Jacoby E., Schuffenhauer A. (2004), "Comparison of fingerprint-based methods for virtual screening using multiple bioactive reference structures", J Chem Inf Comput Sci, 44(3), 1177-1185. [31]. Huang X.-H., Chen Q.-X., Wang Q., Song K.-K., Wang J., Sha L., Guan X. (2006), "Inhibition of the activity of mushroom tyrosinase by alkylbenzoic acids", Food Chem, 94, 1-6. [32]. Hung TM, Luan TC, Vinh BT, Cuong TD, Min BS (2011), "Labdane-type diterpenoids from Leonurus heterophyllus and their cholinesterase inhibitory activity", Phytother Res, 25(4), 611-615. [33]. Huong Le-Thi-Thu, Gerardo M. Casađola-Martín, Yovani Marrero-Ponce, Antonio Rescigno, Concepciĩn Abad, Mahmud Tareq Hassan Khan (2014), "A Rational Workflow for Sequential Virtual Screening of Chemical Libraries on Searching for New Tyrosinase Inhibitors", Medicinal Chemistry, 14. [34]. Huong Le-Thi-Thu, Isis Bonet Cruz, Yovani Marrero-Ponce, Nam Nguyen-Hai, Hai Pham-The, Hai Nguyen-Thanh, Tung Bui Thanh, Gerardo M. Casađola-Martin (2015), "Multi-Criteria Decision Making: The Best Choice for the Modeling of Chemicals Against Hyper-Pigmentation?", Current Bioinformatics, 10(5), 13. [35]. Internal Coordinate Mechanics (ICM) (2014), MolSoft LLC. [36]. Ismaya W.T., Rozeboom H.J., Weijn A., Mes J.J., Fusetti F., Wichers H.J., Dijkstra B.W. (2011), "Crystal structure of PPO3, a tyrosinase from Agaricus bisporus, in deoxy-form that contains additional unknown lectin-like subunit, with inhibitor Tropolone", Biochemistry, 50(24), 5477–5486. [37]. James R. H. (2003), Natural Products: The Secondary Metabolites, UKRoyal Society of Chemistry. [38]. Jay D., Cuellar A., Zamorano R., Munoz E., Gleason R. (1991), "Captopril does not scavenge superoxide: captopril prevents O2- production by chelating copper", Arch Biochem Biophys, 290(2), 463-467.
  42. [39]. John F., Robert A. (2005), Using the R Statistical Computing Environment to Teach Social Statistics Courses, Department of Sociology, McMaster University. [40]. Johnson M.A., Maggiora G.M. (1990), Concepts and Applications of Molecular Similarity, John Wiley & Sons, New York. [41]. Jonsdottir S. O., Jorgensen F. S., Brunak S. (2005), "Prediction methods and databases within chemoinformatics: emphasis on drugs and drug candidates", Bioinformatics, 21(10), 2145-2160. [42]. Kahn V., Andrawis A. (1985), "Inhibition of mushroom tyrosinase by tropolone", Phytochemistry, 24, 905-908. [43]. Kahn V. (1995), "Effect of kojic acid on the oxidation of DL-DOPA, norepinephrine, and dopamine by mushroom tyrosinase", Pigment Cell Res, 8(5), 234-240. [44]. Kamal U. Zaidi, Ayesha S. Ali, Sharique A. Ali (2014), "Purification and Characterization of Melanogenic Enzyme Tyrosinase from Button Mushroom", Enzyme Research. [45]. Kanteev M., Goldfeder M., Fishman A. (2015), "Structure-function correlations in tyrosinases", Protein Sci, 24(9), 1360-1369. [46]. Karl-Hein A., Memmert K. (2008), Natural Compounds as Drugs, Basel. Boston. BerlinBirkhauser. [47]. Kenneth M. Merz, Dagmar Ringe, Charles H. Reynolds (2010), Drug design: Structure and ligand-based approaches, Cambridge University Press. [48]. Khan M. T. H. (2007), "Molecular design of tyrosinase inhibitors: A critical review of promising novel inhibitors from synthetic origins", Pure and Applied Chemistry, 79(12). [49]. Kim Y. J., Uyama H. (2005), "Tyrosinase inhibitors from natural and synthetic sources: structure, inhibition mechanism and perspective for the future", Cell Mol Life Sci, 62(15), 1707-1723. [50]. Kima Y. J., Uyama H. (2005), "Tyrosinase inhibitors from natural and synthetic sources: structure, inhibition mechanism and perspective for the future", Cellular and Molecular Life Sciences, 62(1707-1723). [51]. Kitchen D. B., Decornez H., Furr J. R., Bajorath J. (2004), "Docking and scoring in virtual screening for drug discovery: methods and applications", Nat Rev Drug Discov, 3(11), 935-949. [52]. Kubo I., Kinst-Hori I. (1999), "2-Hydroxy-4-methoxybenzaldehyde: a potent tyrosinase inhibitor from African medicinal plants", Planta Med, 65(1), 19-22. [53]. Kubo I., Kinsy-Hori I., Chaudhuri S. K., Kubo Y., Sánchez Y., T. Ogura (2000), "Flavonols from Heterotheca inuloides: tyrosinase inhibitory activity and structural criteria", Bioorg. Med. Chem., 8(1749-1755). [54]. Kuncheva L. I. (2004), Combining Pattern Classifiers, Wiley Interscience. [55]. Lovstad R. A. (1976), "Effect of penicillamine on the conversion of dopa to dopachrome in the presence of tyrosinase or ceruloplasmin", Biochem Pharmacol, 25(5), 533-535. [56]. Maeda K., Fukuda M. (1991), "In vitro effectiveness of several whitening cosmetic components in human melanocytes", J. Soc. Cosmet. Chem, 42, 361-368. [57]. Mc Quarrie D. A., Simon J. D. (1997), Physical Chemistry: A Molecular Approach, University Science Books. [58]. McGee T. D. Jr., Yi H. A. , Allen W. J., Jacobs A., Rizzo R. C. (2017), "Structure- based identification of inhibitors targeting obstruction of the HIVgp41 N-heptad repeat trimer", Bioorg Med Chem Lett, 7, 503-506.
  43. [59]. Molecular Operating Environment (MOE) (2009.10), Chemical Computing Group: Suite 910, 1010 Sherbrooke St. W, Montreal, Quebec H3A 2R7, Canada. [60]. Nataraj S. P., Khajamohiddin S., Jack T. (2017), "Software for molecular docking: a review", Biophys Rev. [61]. No JK., Soung DY., Kim YJ., Shim KH., Jun YS., Rhee SH., Yokozawa T., Chung HY. (1999), "Inhibition of tyrosinase by green tea components", Life Science, 65(21), 241-246. [62]. Odugbemi T. (2008), A Textbook of Medicinal Plants from Nigeria, University of Lagos Press. [63]. Ortonne J. P., Nordlund J. J. (1998), "Mechanisms that cause abnormal skin color", The Pigmentary System: Physiology and Pathophysiology. Oxford University Press, 489-502. [64]. Patrick G. (2006), "Computer in medicinal chemistry", An introduction to medicinal chemistry. Oxford University Press, UK. [65]. Pawelek J. M. (1991), "After dopachrome?", Pigment Cell Res, 4(2), 53-62. [66]. Prota G. (1998), "Progress in the chemistry of melanins and related metabolites", Medicinal Research Reviews, 8(4), 525-556. [67]. Release 2000.2, MDL Information MACCS Drug Data Report. [68]. Sánchez-Ferrer A., Rodríguez-Lĩpez J. N., Garcia-Canovas F., Garcia-Carmona (1995), "Tyrosinase: a comprehensive review of its mechanism", Biochimica et Biophysica Acta, 1247(1), 1-11. [69]. Schallreuter K. U., Wood J. W. (1990), "A possible mechanism of action for azelaic acid in the human epidermis", Arch Dermatol Res, 282(3), 168-171. [70]. Sheridan R. P., Kearsley S. K. (2002), "Why do we need so many chemical similarity search methods?", Drug Discov Today, 7(17), 903-911. [71]. Solimine J., Garo E., Wedler J., Rusanov K., Fertig O., Hamburger M., Atanassov I., Butterweck V. (2016), "Tyrosinase inhibitory constituents from a polyphenol enriched fraction of rose oil distillation wastewater", Science Direct, 108, 13-19. [72]. Supakorn A., Cholpisut T., Kwanjai K., Kasem S., Somdej K. (2017), "A new xanthone from the fungus Apiospora montagnei", Natural Product Research. [73]. SwissDock, Molecular Modeling Group of the Swiss Institute of Bioinformatics, Lausanne, Switzerland. [74]. Thai KM, Bui QH, Tran TD, Huynh TN (2012), "QSAR modeling on benzo[c]phenanthridine analogues as topoisomerase I inhibitors and anti-cancer agents.", Medicinal Chemistry, 17(5), 5690-5712. [75]. Tony C. Smith, Eibe Frank (2016), "Introducing Machine Learning Concepts with WEKA", Statistical Genomics - Methods and Protocols. Springer, New York, 353- 378. [76]. VanWaterbeemd H. (1995), Chemometric methods in molecular design, Wiley-VCH, New York. [77]. Verallo-Rowell V. M., Verallo V., Graupe K., Lopez-Villafuerte L., Garcia-Lopez M. (1989), "Double-blind comparison of azelaic acid and hydroquinone in the treatment of melasma", Acta Derm Venereol Suppl, 143, 58-61. [78]. Walter C., Quevedo Jr, Thomas B. Fitzpatrick, Kowichi Jimbow (1985), "Human skin color: Origin, variation and significance", Journal of Human Evolution, 14(1), 43- 56. [79]. Willet P., Barnard J.M., Downs G.M. (1998), "Chemical similarity searching", Journal of Chemical Information and Computer Sciences, 38(6), 983-996.
  44. [80]. Willett P. (2011), Similarity searching using 2D structural fingerprints, Springer Protocols, New York. [81]. Yagi A., Kanbara T., Morinobu N. (1987), "Inhibition of mushroom-tyrosinase by aloe extract", Planta Med, 53(6), 515-517. [82]. Ying-Yong Z., Li Z., Jia-Rong M., Xiao-Hong C., Rui-Chao L., Yongmin Z., Wen-Ji S. (2011), "Ergosta-4,6,8(14),22-tetraen-3-one isolated from Polyporus umbellatus prevents early renal injury in aristolochic acid-induced nephropathy rats", Journal of Pharmacy and Pharmacology, 63(1581-1586). [83]. Yong-Doo P., You-Jeong L., Hwa-Sun H., Myong-Joon H., Jun-Mo Y. (2012), "Complex Inhibition of Tyrosinase by Thiol-Composed Cu2+ Chelators: A Clue for Designing Whitening Agents", Journal of Biomolecular Structure and Dynamics, 24(2), 131-138. [84]. Yovani M. P., Francisco T. "Novel 2D TOMOCOMD-CARDD Descriptors: Atom- based Stochastic and non-Stochastic Bilinear Indices and their QSPR Applications ". [85]. Zang S. Z., Yang Y. R., Zhao S. S., Li Y. X., Gao X. Y., Zhong C. L. (2017), "In silico insight into EGFR treatment in patients with lung carcinoma and T790M mutations", Ther Med, 13(5).
  45. Phụ lục Phụ lục 1: Cấu trúc hĩa học các hợp chất mẫu ức chế mạnh tyrosinase Ref1. Acid kojic Ref2. L-mimosin Ref3. L-Tropolon Ref4. N- cyclopenthyl-N- nitrosohydroxyl- Ref5. Methyl este của amin acid gentisic Ref6.Kurarinon Ref7. Phenyl- Ref8. 8´-epi-cleomiscosin thioure A Ref9. Isolongifolen-4-on Ref11. N-(2,4- Ref10. 4'- dihydroxybenzyl)-3,5- Ref12. 3-Hydroxy-4-methoxy Prenyloxyresveratr dihydroxybenzylbenzami benzaldehyd thiosemicarbazon ol d hemihydrat
  46. Phụ lục 2.a: Tham số phân tử sử dụng cho mơ hình QSAR phân loại No TSPT Ý nghĩa Lực Nguyên tử Chỉ Cĩ nguyên Đếm Khơng 1 VEqh1 vander ngoại lai số tử hydro bước: ngẫu Waals bậc 2 1 nhiên Lực Nguyên tử Chỉ Khơng cĩ Đếm Khơng 2 VHq2 vander ngoại lai liên số nguyên tử bước: ngẫu Waals kết với hydro bậc 2 hydro 2 nhiên Lực Nguyên tử Chỉ Khơng cĩ Đếm Khơng 3 VHq14 vander ngoại lai liên số nguyên tử bước: ngẫu Waals kết với hydro bậc 2 hydro 14 nhiên Khả năng Nguyên tử Chỉ Khơng cĩ Đếm Khơng 4 PHq5 phân cực ngoại lai liên số nguyên tử bước: ngẫu kết với hydro bậc 2 hydro 5 nhiên Khả năng Nguyên tử Chỉ Khơng cĩ Đếm Khơng 5 PHq15 phân cực ngoại lai liên số nguyên tử bước: ngẫu kết với hydro bậc 2 hydro 15 nhiên Độ âm Nguyên tử Chỉ Khơng cĩ Đếm Khơng 6 KEq2 điện ngoại lai số nguyên tử bước: ngẫu Muliken bậc 2 hydro 2 nhiên Độ âm Nguyên tử Chỉ Khơng cĩ Đếm Khơng 7 GEq11 điện ngoại lai số nguyên tử bước: ngẫu Paulin bậc 2 hydro 11 nhiên Khối Nguyên tử Chỉ Khơng cĩ Đếm Ngẫu 8 MHq1s lượng ngoại lai liên số nguyên tử bước: nhiên phân tử kết với hydro bậc 2 hydro 1 Độ âm Nguyên tử Chỉ Cĩ nguyên Đếm Ngẫu 9 KEqh3s điện ngoại lai số tử hydro bước: nhiên Muliken bậc 2 1 Độ âm Nguyên tử Chỉ Cĩ nguyên Đếm Ngẫu 10 KEqh8s điện ngoại lai số tử hydro bước: nhiên Muliken bậc 2 8 Độ âm Nguyên tử Chỉ Khơng cĩ Đếm Ngẫu 11 KEq0s điện ngoại lai số nguyên tử bước: nhiên Muliken bậc 2 hydro 0 Phụ lục 2.b: Tham số phân tử sử dụng cho mơ hình QSAR hoạt tính No TSPT Ý nghĩa Khối Tất cả nguyên Chỉ Cĩ nguyên Đếm Khơng 1 Mqh13 lượng tử số tử hydro bước: ngẫu phân tử bậc 2 13 nhiên Khối Tất cả nguyên Chỉ Khơng cĩ Đếm Khơng 2 Mq15 lượng tử số nguyên tử bước: ngẫu phân tử bậc 2 hydro 15 nhiên
  47. Độ âm Nguyên tử Chỉ Khơng cĩ Đếm Khơng 3 KEq5 điện ngoại lai số nguyên tử bước: ngẫu Muliken bậc 2 hydro 5 nhiên Độ âm Nguyên tử Chỉ Khơng cĩ Đếm Khơng 4 KEq11 điện ngoại lai số nguyên tử bước: ngẫu Muliken bậc 2 hydro 11 nhiên Khối Tất cả nguyên Chỉ Cĩ nguyên Đếm Ngẫu 5 Mqh1s lượng tử số tử hydro bước: nhiên phân tử bậc 2 1 Khối Tất cả nguyên Chỉ Cĩ nguyên Đếm Ngẫu 6 Mqh4s lượng tử số tử hydro bước: nhiên phân tử bậc 2 4 Khối Tất cả nguyên Chỉ Cĩ nguyên Đếm Ngẫu 7 Mqh6s lượng tử số tử hydro bước: nhiên phân tử bậc 2 6 Khối Nguyên tử Chỉ Khơng cĩ Đếm Ngẫu 8 MHq4s lượng ngoại lai liên số nguyên tử bước: nhiên phân tử kết với hydro bậc 2 hydro 4 Khối Nguyên tử Chỉ Cĩ nguyên Đếm Ngẫu 9 MHq5s lượng ngoại lai liên số tử hydro bước: nhiên phân tử kết với hydro bậc 2 5 Khối Nguyên tử Chỉ Cĩ nguyên Đếm Ngẫu 10 MHq8s lượng ngoại lai liên số tử hydro bước: nhiên phân tử kết với hydro bậc 2 8 Độ âm Nguyên tử Chỉ Cĩ nguyên Đếm Ngẫu 11 KEqh2s điện ngoại lai số tử hydro bước: nhiên Muliken bậc 2 2 Độ âm Nguyên tử Chỉ Cĩ nguyên Đếm Ngẫu 12 KEqh9s điện ngoại lai số tử hydro bước: nhiên Muliken bậc 2 9 Độ âm Nguyên tử Chỉ Khơng cĩ Đếm Ngẫu 13 KEq14s điện ngoại lai số nguyên tử bước: nhiên Muliken bậc 2 hydro 14 Độ âm Nguyên tử Chỉ Cĩ nguyên Đếm Ngẫu 14 GEqh3s điện ngoại lai số tử hydro bước: nhiên Paulin bậc 2 3
  48. Phụ lục 3.a: Kết quả các tham số phân tử sử dụng trong QSAR phân loại VHq1 PHq PHq1 MHq1 Dự VEqh1 VHq2 KEq2 GEq11 KEqh3s KEqh8s KEq0s Số đăng ký 4 5 5 s đốn 3920.86 0 0 0 0 334.03 1083185.92 0 100.02 104.49 120.16 InA VNPD_ID1 4152.19 0 0 0 0 344.06 595335.51 0 118.97 123.65 146.86 InA VNPD_ID7 5442.34 0 0 0 0 410.82 595548.69 0 131.05 146.10 173.57 InA VNPD_ID25 6809.59 0 0 0 0 654.79 1245847.11 0 155.17 169.99 213.62 InA VNPD_ID27 3766.62 0 0 0 0 367.37 744111.07 0 80.56 94.39 106.81 InA VNPD_ID28 851.19 0 0 0 0 126.96 992198.27 0 19.48 20.48 26.70 Act VNPD_ID38 1032.11 0 0 0 0 187.08 4206578.88 0 17.68 21.51 26.70 Act VNPD_ID45 1367.25 0 0 0 0 243.81 2053367.30 0 27.04 34.27 40.05 Act VNPD_ID46 3069.65 0 0 0 0 253.84 537386.37 0 76.36 83.77 93.46 InA VNPD_ID53 3069.65 0 0 0 0 253.84 537386.37 0 76.36 83.77 93.46 InA VNPD_ID54 2888.74 0 0 0 0 240.49 536833.74 0 82.49 85.47 93.46 InA VNPD_ID55 1367.25 0 0 0 0 113.52 295432.18 0 31.25 36.42 40.05 InA VNPD_ID90 1960.42 0 0 0 0 160.30 137009.86 0 61.86 67.60 66.75 InA VNPD_ID112 2734.51 0 0 0 0 200.35 138123.91 0 68.83 77.54 80.11 InA VNPD_ID120 4255.99 0 0 0 0 404.19 1615078.65 0 104.75 110.59 133.51 InA VNPD_ID167 3947.54 0 0 0 0 347.22 314976.20 0 76.52 99.98 106.81 InA VNPD_ID173 2064.23 0 0 0 0 173.65 138106.36 0 36.70 47.63 53.40 InA VNPD_ID176 4255.99 0 0 0 0 387.52 850949.05 0 102.13 111.10 133.51 InA VNPD_ID181 1702.39 0 0 0 0 250.52 1221374.03 0 37.19 40.67 53.40 Act VNPD_ID183 1367.25 0 0 0 0 243.80 2085946.51 0 27.02 34.24 40.05 Act VNPD_ID184 516.05 0 0 0 0 93.54 786199.27 0 10.03 11.21 13.35 Act VNPD_ID194 4128.46 0 0 0 0 734.74 3808546.01 0 81.13 90.33 106.81 InA VNPD_ID230 4128.46 0 0 0 0 734.74 3646141.20 0 81.50 90.09 106.81 InA VNPD_ID232 3947.54 0 0 0 0 420.69 588241.54 0 75.84 101.38 106.81 InA VNPD_ID237 1702.39 0 0 0 0 126.88 55403.95 0 45.28 52.33 53.40 InA VNPD_ID240
  49. 2734.51 0 0 0 0 240.49 537377.60 0 61.73 70.41 80.11 InA VNPD_ID248 6293.54 0 0 0 0 618.05 1678858.43 0 156.58 165.21 200.28 InA VNPD_ID249 3250.57 0 0 0 0 287.26 2370315.01 0 69.34 79.86 93.46 InA VNPD_ID250 2915.43 0 0 0 0 213.70 138676.55 0 62.70 75.84 80.11 InA VNPD_ID260 1032.12 0 0 0 0 183.68 639733.19 0 21.53 23.38 26.70 Act VNPD_ID291 1032.12 0 0 0 0 183.68 745742.81 0 19.32 22.80 26.70 Act VNPD_ID297 1367.26 0 0 0 0 217.10 953823.42 0 27.66 32.80 40.06 Act VNPD_ID298 1032.12 0 0 0 0 183.68 1243720.48 0 17.24 23.81 26.70 Act VNPD_ID313 1367.26 0 0 0 0 207.07 896665.07 0 26.72 32.01 40.06 Act VNPD_ID314 2734.51 0 0 0 0 260.55 2369753.60 0 60.84 68.22 80.11 InA VNPD_ID323 7298.97 0 0 0 0 775.12 2238180.62 0 187.72 193.62 240.33 InA VNPD_ID324 335.14 0 0 0 0 33.41 99518.34 0 9.36 8.43 13.35 InA VNPD_ID337 6166.00 0 0 0 0 711.36 1651350.16 0 121.67 150.77 173.57 InA VNPD_ID340 5985.09 0 0 0 0 651.23 1080451.30 0 122.22 150.03 173.57 InA VNPD_ID341 5442.34 0 0 0 0 584.47 1626129.97 0 145.29 158.61 173.57 InA VNPD_ID343 3766.63 0 0 0 0 273.83 266388.10 0 81.72 96.83 106.81 InA VNPD_ID347 6139.31 0 0 0 0 644.76 1937142.05 0 135.59 149.81 186.92 InA VNPD_ID348 2734.51 0 0 0 0 230.45 996929.03 0 62.47 71.26 80.11 InA VNPD_ID358 2399.37 0 0 0 0 207.07 265256.51 0 50.09 60.18 66.76 InA VNPD_ID366 2399.37 0 0 0 0 207.07 265256.51 0 50.09 60.18 66.76 InA VNPD_ID369 851.20 0 0 0 0 126.96 1649843.85 0 18.72 18.73 26.70 Act VNPD_ID395 670.28 0 0 0 0 66.83 490597.77 0 18.48 15.87 26.70 InA VNPD_ID412 2037.54 0 0 0 0 160.30 137009.87 0 66.46 67.61 66.76 InA VNPD_ID419 4256.00 0 0 0 0 467.63 887704.14 0 101.96 113.53 133.52 InA VNPD_ID442 4745.37 0 0 0 0 484.38 1367972.62 0 139.37 136.23 160.22 InA VNPD_ID451 4256.00 0 0 0 0 471.02 765632.99 0 99.18 115.39 133.52 InA VNPD_ID462 4075.08 0 0 0 0 457.67 765080.36 0 105.31 117.10 133.52 InA VNPD_ID463
  50. 4075.08 0 0 0 0 420.94 1488024.74 0 106.47 109.96 133.52 InA VNPD_ID465 5107.20 0 0 0 0 584.56 2793216.88 0 129.19 136.57 160.22 InA VNPD_ID467 4410.22 0 0 0 0 434.29 1233986.41 0 129.80 129.80 146.87 InA VNPD_ID493 4410.22 0 0 0 0 464.39 3673028.59 0 123.06 123.74 146.87 InA VNPD_ID495 3739.94 0 0 0 0 394.16 970680.25 0 94.99 104.27 120.17 InA VNPD_ID517 4772.06 0 0 0 0 461.00 668316.42 0 107.60 118.32 146.87 InA VNPD_ID528 5288.11 0 0 0 0 527.83 3982651.78 0 117.06 126.15 160.22 InA VNPD_ID571 1032.12 0 0 0 0 183.69 522846.29 0 22.28 22.39 26.70 Act VNPD_ID577 5469.03 0 0 0 0 581.16 6105169.93 0 109.85 129.54 160.22 InA VNPD_ID579 8331.08 0 0 0 0 952.17 5273928.78 0 217.13 219.35 267.03 Act VNPD_ID580 335.14 0 0 0 0 33.42 145132.74 0 9.78 7.57 13.35 InA VNPD_ID582 2915.43 0 0 0 0 367.29 499030.31 0 49.73 80.04 80.11 InA VNPD_ID587 3766.63 0 0 0 0 313.97 2626003.15 0 82.96 95.50 106.81 Act VNPD_ID615 2580.29 0 0 0 0 450.88 3023907.85 0 50.10 57.13 66.76 Act VNPD_ID616 2553.60 0 0 0 0 247.21 1932322.48 0 71.52 69.58 80.11 InA VNPD_ID625 2372.68 0 0 0 0 193.72 491389.90 0 75.36 74.46 80.11 InA VNPD_ID627 4772.06 0 0 0 0 484.30 806826.30 0 107.82 129.02 146.87 InA VNPD_ID637 2553.60 0 0 0 0 237.17 2494809.43 0 68.41 69.97 80.11 InA VNPD_ID644 4410.22 0 0 0 0 434.29 1488033.51 0 121.10 123.31 146.87 InA VNPD_ID646 516.06 0 0 0 0 93.54 752514.79 0 9.53 13.28 13.35 Act VNPD_ID648 5777.48 0 0 0 0 651.40 1854733.48 0 140.78 145.59 186.92 InA VNPD_ID651 5469.03 0 0 0 0 654.64 3461984.25 0 118.92 126.76 160.22 InA VNPD_ID653 3223.88 0 0 0 0 367.45 970118.84 0 86.49 92.62 106.81 InA VNPD_ID661 6216.43 0 0 0 0 644.76 1281324.63 0 154.19 166.94 200.28 InA VNPD_ID664 5469.03 0 0 0 0 614.50 1009562.84 0 119.51 141.98 160.22 Act VNPD_ID699 2526.91 0 0 0 0 146.95 49881.51 0 94.44 87.05 93.46 Act VNPD_ID722 4229.31 0 0 0 0 337.27 509289.94 0 145.00 143.31 146.87 Act VNPD_ID723
  51. 516.06 0 0 0 0 93.54 1445432.62 0 9.39 11.02 13.35 Act VNPD_ID725 3250.57 0 0 0 0 257.16 997490.44 0 71.88 83.15 93.46 InA VNPD_ID735 1856.63 0 0 0 0 190.32 204659.53 0 61.42 66.60 66.76 InA VNPD_ID761 670.28 0 0 0 0 56.81 277853.10 0 17.81 16.25 26.70 InA VNPD_ID766 2372.68 0 0 0 0 173.65 137018.64 0 81.09 80.96 80.11 InA VNPD_ID770 6474.46 0 0 0 0 668.15 2013541.01 0 151.32 163.21 200.28 InA VNPD_ID791 4256.00 0 0 0 0 447.56 697974.56 0 95.53 111.83 133.52 InA VNPD_ID797 5107.20 0 0 0 0 474.35 1489147.55 0 123.47 133.25 160.22 InA VNPD_ID798 2372.68 0 0 0 0 263.96 760934.81 0 60.49 61.24 80.11 InA VNPD_ID799 6293.54 0 0 0 0 654.80 1330693.45 0 158.79 167.09 200.28 InA VNPD_ID825 4128.46 0 0 0 0 327.24 1213360.58 0 70.13 92.39 106.81 InA VNPD_ID855 3069.66 0 0 0 0 233.78 1203737.70 0 78.17 84.69 93.46 InA VNPD_ID856 2399.37 0 0 0 0 230.38 871428.02 0 50.40 58.25 66.76 InA VNPD_ID861 4745.37 0 0 0 0 477.75 3673037.37 0 137.69 137.09 160.22 InA VNPD_ID868 6628.68 0 0 0 0 698.25 4354956.61 0 173.17 178.23 213.63 InA VNPD_ID869 6628.68 0 0 0 0 698.25 4200446.40 0 173.12 178.45 213.63 InA VNPD_ID870 4926.28 0 0 0 0 491.10 3673590.00 0 131.56 135.39 160.22 InA VNPD_ID871 5931.71 0 0 0 0 611.42 1864302.74 0 158.17 161.53 200.28 InA VNPD_ID875 1702.40 0 0 0 0 190.32 205203.40 0 40.66 51.55 53.41 InA VNPD_ID880 3894.17 0 0 0 0 380.89 1372092.99 0 111.80 112.89 133.52 InA VNPD_ID882 2218.46 0 0 0 0 203.75 996367.62 0 54.89 59.86 66.76 InA VNPD_ID883 4410.22 0 0 0 0 464.39 2860858.08 0 119.47 120.27 146.87 InA VNPD_ID887 2707.83 0 0 0 0 247.21 2368657.10 0 87.73 84.98 93.46 Act VNPD_ID889 6112.62 0 0 0 0 671.55 4354395.21 0 164.67 166.58 200.28 InA VNPD_ID890 6112.62 0 0 0 0 671.55 4345414.23 0 164.24 166.87 200.28 InA VNPD_ID892 7144.74 0 0 0 0 835.17 5714172.37 0 186.23 192.81 226.98 InA VNPD_ID893 4410.22 0 0 0 0 464.39 3673028.59 0 123.06 123.74 146.87 Act VNPD_ID894
  52. 5777.48 0 0 0 0 648.16 4015608.73 0 151.76 153.06 186.92 InA VNPD_ID896 6112.62 0 0 0 0 671.55 4199884.99 0 164.62 166.80 200.28 InA VNPD_ID898 7479.88 0 0 0 0 825.21 4550266.78 0 187.42 194.73 240.33 InA VNPD_ID899 6112.62 0 0 0 0 671.55 4085944.56 0 160.59 162.81 200.28 InA VNPD_ID900 4410.22 0 0 0 0 464.39 3673028.59 0 123.06 123.74 146.87 InA VNPD_ID901 2372.68 0 0 0 0 193.72 491389.90 0 75.68 74.88 80.11 InA VNPD_ID911 4075.08 0 0 0 0 320.60 945604.06 0 121.06 125.90 133.52 InA VNPD_ID912 3378.11 0 0 0 0 280.55 944490.01 0 118.69 115.96 120.17 InA VNPD_ID913 2734.51 0 0 0 0 230.46 996929.03 0 63.38 71.50 80.11 InA VNPD_ID916 1548.17 0 0 0 0 267.20 3761684.24 0 24.55 33.38 40.06 Act VNPD_ID921 1548.17 0 0 0 0 267.20 3513991.17 0 25.04 32.56 40.06 Act VNPD_ID922 1548.17 0 0 0 0 267.20 3761684.24 0 24.55 33.38 40.06 Act VNPD_ID923 2372.68 0 0 0 0 203.75 995823.76 0 75.64 74.92 80.11 Act VNPD_ID929 1186.34 0 0 0 0 150.35 2328060.66 0 26.29 28.64 40.06 InA VNPD_ID935 1032.12 0 0 0 0 183.69 805909.96 0 21.51 22.64 26.70 Act VNPD_ID938 1032.12 0 0 0 0 183.69 805909.96 0 21.51 22.64 26.70 Act VNPD_ID940 516.06 0 0 0 0 93.54 1094008.75 0 9.17 13.60 13.35 Act VNPD_ID943 4410.22 0 0 0 0 424.26 756369.76 0 123.35 125.59 146.87 InA VNPD_ID948 6112.62 0 0 0 0 631.41 1280771 0 164.91 168.64 200.27 InA VNPD_ID950 5107.19 0 0 0 0 517.72 822396 0 116.63 131.51 160.22 InA VNPD_ID952 4410.22 0 0 0 0 471.02 1367963 0 124.73 122.87 146.86 InA VNPD_ID961 3713.25 0 0 0 0 380.80 580937 0 112.20 117.92 133.51 InA VNPD_ID964 4229.30 0 0 0 0 364.13 513296 0 131.87 132.28 146.86 InA VNPD_ID966 1702.39 0 0 0 0 190.32 870313 0 45.55 53.43 53.40 InA VNPD_ID974 2037.54 0 0 0 0 203.67 293300 0 59.08 70.25 66.75 InA VNPD_ID975 1856.62 0 0 0 0 146.94 478951 0 66.64 64.94 66.75 InA VNPD_ID992 3894.16 0 0 0 0 350.78 513287 0 117.24 118.93 133.51 InA VNPD_ID1021
  53. 1032.11 0 0 0 0 183.68 639794 0 21.53 23.35 26.70 Act VNPD_ID1022 851.19 0 0 0 0 116.92 1566778 0 17.83 17.30 26.70 Act VNPD_ID1023 5080.50 0 0 0 0 561.33 2473787 0 133.59 136.50 173.57 InA VNPD_ID1027 5080.50 0 0 0 0 561.33 2882248 0 133.07 137.17 173.57 InA VNPD_ID1028 6112.62 0 0 0 0 671.54 4199884 0 164.64 166.67 200.27 InA VNPD_ID1031 3559.02 0 0 0 0 380.80 970127 0 101.11 105.97 120.16 InA VNPD_ID1038 6809.59 0 0 0 0 711.60 4200999 0 167.01 176.61 213.62 InA VNPD_ID1056 3069.65 0 0 0 0 273.91 2369762 0 75.46 81.56 93.46 InA VNPD_ID1057 2372.68 0 0 0 0 233.856 2368648 0 73.09 71.62 80.11 Act VNPD_ID1157 3069.65 0 0 0 0 273.91 2369762 0 75.46 81.56 93.46 InA VNPD_ID1158 5261.42 0 0 0 0 604.62 4638087 0 147.92 149.39 173.57 InA VNPD_ID1159 3250.57 0 0 0 0 287.26 2625441 0 74.45 83.85 93.46 InA VNPD_ID1163 4410.22 0 0 0 0 454.36 3593743 0 128.85 127.52 146.86 Act VNPD_ID1166 4410.22 0 0 0 0 444.32 3596169 0 127.58 127.29 146.86 InA VNPD_ID1167 1005.42 0 0 0 0 40.05 26.31 0 43.88 40.05 40.05 InA VNPD_ID1177 3069.65 0 0 0 0 273.91 2369762 0 75.46 81.56 93.46 InA VNPD_ID1178 5777.48 0 0 0 0 628.09 2135679 0 148.55 153.01 186.92 InA VNPD_ID1179 6447.76 0 0 0 0 684.89 4199893 0 179.25 180.15 213.62 InA VNPD_ID1188 1186.34 0 0 0 0 163.61 204641 0 32.16 39.89 40.05 InA VNPD_ID1193 3920.85 0 0 0 0 434.21 1363076 0 88.27 95.24 120.16 InA VNPD_ID1220 1032.11 0 0 0 0 183.68 745795 0 19.31 22.80 26.70 Act VNPD_ID1237 516.05 0 0 0 0 93.5424 1137237 0 9.79 10.67 13.35 Act VNPD_ID1256 1032.11 0 0 0 0 187.08 3203544 0 18.96 21.02 26.70 Act VNPD_ID1257 335.14 0 0 0 0 33.41 145132 0 9.78 7.57 13.35 InA VNPD_ID1261 1883.31 0 0 0 0 140.23 55956 0 39.15 50.63 53.40 InA VNPD_ID1272 2218.45 0 0 0 0 217.02 205764 0 49.15 63.19 66.75 InA VNPD_ID1277 516.05 0 0 0 0 93.54 759970 0 9.21 14.50 13.35 Act VNPD_ID1285
  54. 1032.11 0 0 0 0 183.68 640057 0 21.53 23.35 26.70 Act VNPD_ID1286 4591.14 0 0 0 0 427.57 825738 0 117.36 123.73 146.86 InA VNPD_ID1290 4591.14 0 0 0 0 437.61 1695386 0 117.09 121.32 146.86 InA VNPD_ID1291 3096.34 0 0 0 0 287.26 594290 0 59.05 64.09 80.11 InA VNPD_ID1292 5442.34 0 0 0 0 628.01 4740552 0 145.25 150.61 173.57 InA VNPD_ID1306 1702.39 0 0 0 0 190.32 205203 0 40.66 51.54 53.40 InA VNPD_ID1333 1367.25 0 0 0 0 113.52 55395 0 30.65 38.98 40.05 InA VNPD_ID1334 5492.76 0 0 0 0 547.98 1686539 0 156.46 155.29 186.92 InA VNPD_ID1346 3894.16 0 0 0 0 380.88 1372092 0 111.79 112.88 133.51 InA VNPD_ID1347 5596.56 0 0 0 0 578.00 1906974 0 152.19 155.73 186.92 InA VNPD_ID1353 1032.11 0 0 0 0 183.68 639733 0 21.53 23.35 26.70 Act VNPD_ID1359 516.05 0 0 0 0 93.54 503618 0 10.92 10.46 13.35 Act VNPD_ID1365 2372.68 0 0 0 0 263.95 760934 0 60.50 61.30 80.11 InA VNPD_ID1376 335.14 0 0 0 0 33.41 145132 0 9.78 7.57 13.35 InA VNPD_ID1277
  55. Phụ lục 3.b: Kết quả các tham số phân tử sử dụng cho QSAR hoạt tính Dự Mqh13 Mq15 KEq5 KEq11 Mqh1s Mqh4s Mqh6s MHq4s MHq5s MHq8s KEqh2s KEqh9s KEq14s GEqh3s Số đăng ký đốn 131685078 74088271 712.08 56841 2825.65 3372.32 3360.76 0 0 0 88.77 94.27 87.51 79.43 S VNPD_ID38 373453496 1193264631 2377.55 581442 4400.03 5280.82 5273.15 0 0 0 144.71 149.12 146.16 122.24 S VNPD_ID45 1533293874 12378636791 4138.51 2699307 2548.92 3448.42 3442.58 0 0 0 72.61 73.17 70.24 62.20 S VNPD_ID46 1533320515 12378637176 4148.54 2699317 2837.14 3643.92 3638.08 0 0 0 85.96 87.80 83.59 74.45 S VNPD_ID395 1162052157 6273089776 2197.42 1139077 2683.94 3388.09 3384.54 0 0 0 76.25 75.54 75.62 63.79 S VNPD_ID184 10620049931 26758296968 2056.95 731761 3961.26 4437.93 4377.85 0 0 0 24.57 22.21 22.26 18.10 S VNPD_ID889 2909158858 17909224772 7621.09 4183298 4097.22 5100.51 5099.83 0 0 0 128.32 125.75 116.45 104.67 S VNPD_ID291 2836022685 17744905691 7283.66 4093242 4232.24 5130.62 5119.54 0 0 0 130.70 131.62 122.00 109.38 S VNPD_ID297 14987773481 58863895874 2087.05 1134929 3760.13 4172.67 4120.28 0 0 0 20.97 16.41 14.65 16.40 S VNPD_ID298 16626229863 72510013454 4307.45 4804225 3574.19 3831.24 3812.51 0 0 0 22.46 21.69 22.19 15.10 S VNPD_ID313 13092624188 47121046803 4033.62 2348752 3951.36 4390.86 4330.74 0 0 0 34.71 26.26 29.96 23.06 S VNPD_ID314 9756695042 18365704529 3468.33 1396777 6055.01 6544.12 6462.95 0 0 0 44.29 36.52 42.34 31.40 W VNPD_ID194 12606146239 39484602362 4053.69 2386017 4053.81 4494.19 4422.95 0 0 0 34.71 27.00 30.83 23.05 S VNPD_ID577 10145561706 24822910898 1485.01 899297 3437.80 3800.14 3746.21 0 0 0 10.96 10.06 10.04 8.48 W VNPD_ID580 9777906029 26758296968 2056.95 731761 3982.16 4452.97 4393.05 0 0 0 24.57 22.24 22.26 18.10 S VNPD_ID894 8861068916 16429060102 2187.39 853021 5148.81 5413.57 5380.36 0 0 0 24.11 20.52 26.04 16.36 S VNPD_ID921 11845020449 29142532582 2849.62 1091034 5343.80 5787.69 5733.84 0 0 0 34.22 28.29 33.56 23.43 S VNPD_ID648 12098154429 30964150331 2859.66 1422634 4377.65 5366.84 5318.38 0 0 0 23.56 18.05 23.55 14.79 S VNPD_ID923 12529630471 28194141940 2689.08 1025654 6778.03 7236.51 7183.31 0 0 0 34.84 27.42 33.18 22.72 S VNPD_ID722 8460353217 24620320777 2384.51 1884905 3467.66 3713.94 3690.83 0 0 0 21.25 18.73 18.94 15.76 S VNPD_ID723 9525594734 20294261923 1836.20 598060 3858.81 4201.60 4179.36 0 0 0 24.75 22.96 22.48 18.66 S VNPD_ID725 5482676829 22758157933 14086.49 6008624 7485.25 8573.54 8542.75 0 0 0 228.88 223.20 208.35 184.51 W VNPD_ID610 10787512983 44417106573 6501.96 4110534 3985.05 4373.73 4315.56 0 0 0 73.75 61.60 63.02 50.29 W VNPD_ID616 9374403388 30845147647 6294.48 3456660 3831.85 4116.98 4076.84 0 0 0 60.29 55.19 55.85 42.41 W VNPD_ID1022 9088766776 17679132586 1685.69 860767 3540.24 3906.57 3861.21 0 0 0 10.81 9.93 11.31 8.13 S VNPD_ID922
  56. 8115827494 21497708815 2337.89 983494 3234.24 3488.52 3453.79 0 0 0 35.56 29.67 26.25 25.12 W VNPD_ID691 20527387875 81392843648 1725.83 1653363 3384.49 3639.04 3634.14 0 0 0 11.82 9.56 8.72 7.95 S VNPD_ID929 10254377398 46529267021 5267.47 4298340 2945.79 3185.11 3152.75 0 0 0 34.89 28.43 30.60 21.22 S VNPD_ID938 10109370857 44775836172 5006.59 4014868 2945.79 3207.34 3176.37 0 0 0 35.04 29.12 30.56 21.55 S VNPD_ID940 10254377398 46529267021 5267.47 4298340 2945.79 3185.11 3152.75 0 0 0 34.89 28.43 30.60 21.22 S VNPD_ID943 10563405602 27705137299 2097.08 921843 3982.15 4427.01 4376.85 0 0 0 24.57 21.74 19.81 18.08 S VNPD_ID1166 11668490781 30097541263 2097.08 921843 4003.05 4445.83 4398.53 0 0 0 24.57 21.74 19.76 18.08 S VNPD_ID1023 12952167120 35321509200 1765.96 1251386 3562.95 3936.29 3903.61 0 0 0 11.69 9.72 9.78 7.83 S VNPD_ID1157 10853746070 27919918470 2056.95 731831 3961.25 4404.70 4360.32 0 0 0 24.57 22.21 22.24 18.10 W VNPD_ID183 8046722520 32881762267 2107.12 1791351 1868.28 2067.34 2075.11 0 0 0 21.88 19.19 16.90 15.09 S VNPD_ID1237 9109233974 16832538718 2187.39 853081 5251.25 5547.39 5513.71 0 0 0 24.11 20.52 26.01 16.36 S VNPD_ID1256 8758505004 22844311402 1685.69 1300833 3396.00 3657.98 3632.82 0 0 0 10.96 10.32 11.34 8.28 S VNPD_ID1257 10864877386 40850307413 3865.96 3657304 3653.92 3917.76 3890.38 0 0 0 21.77 21.52 22.86 16.09 S VNPD_ID1285 11636676456 30200099420 1685.69 869296 3521.16 3950.56 3915.20 0 0 0 11.69 10.24 10.34 7.87 S VNPD_ID1286 10663164059 27610612228 2056.95 732132 3961.25 4457.91 4404.77 0 0 0 24.57 22.20 22.29 18.10 S VNPD_ID1359 9824639912 2165445877 1244.20 576065 3437.80 3707.88 3692.81 0 0 0 11.19 10.17 9.64 9.15 S VNPD_ID1365
  57. Phụ lục 4: Kết quả của quá trình sàng lọc qua phễu lọc mơ hình QSAR Xếp hạng Phân Hoạt STT Số đăng ký Tc độ tương đồng loại tính 1 VNPD_ID992 0.966666667 1 InA - 2 VNPD_ID1277 0.916666667 2 InA - 3 VNPD_ID880 0.913043478 3 InA - 4 VNPD_ID1333 0.913043478 3 InA - 5 VNPD_ID167 0.904761905 4 InA - 6 VNPD_ID1 0.9 5 InA - 7 VNPD_ID297 0.894736842 6 Act S 8 VNPD_ID1237 0.894736842 6 Act S 9 VNPD_ID798 0.88372093 7 InA - 10 VNPD_ID869 0.88372093 7 InA - 11 VNPD_ID975 0.88 8 InA - 12 VNPD_ID240 0.875 9 InA - 13 VNPD_ID577 0.868421053 10 Act S 14 VNPD_ID343 0.860465116 11 InA - 15 VNPD_ID664 0.860465116 11 InA - 16 VNPD_ID825 0.860465116 11 InA - 17 VNPD_ID870 0.860465116 11 InA - 18 VNPD_ID871 0.860465116 11 InA - 19 VNPD_ID1291 0.860465116 11 InA - 20 VNPD_ID1376 0.857142857 12 InA - 21 VNPD_ID938 0.842105263 13 Act S 22 VNPD_ID1257 0.842105263 13 Act S 23 VNPD_ID791 0.840909091 14 InA - 24 VNPD_ID1056 0.840909091 14 InA - 25 VNPD_ID1290 0.840909091 14 InA - 26 VNPD_ID587 0.84 15 InA - 27 VNPD_ID974 0.84 15 InA - 28 VNPD_ID1256 0.837837838 16 Act S 29 VNPD_ID1365 0.837837838 16 Act S 30 VNPD_ID517 0.837209302 17 InA - 31 VNPD_ID890 0.837209302 17 InA - 32 VNPD_ID900 0.837209302 17 InA - 33 VNPD_ID1179 0.837209302 17 InA - 34 VNPD_ID1220 0.837209302 17 InA - 35 VNPD_ID1272 0.833333333 18 InA - 36 VNPD_ID571 0.829787234 19 InA - 37 VNPD_ID913 0.828571429 20 InA - 38 VNPD_ID395 0.825 21 Act S 39 VNPD_ID722 0.825 21 Act S 40 VNPD_ID340 0.822222222 22 InA -
  58. 41 VNPD_ID341 0.822222222 22 InA - 42 VNPD_ID580 0.822222222 22 Act W 43 VNPD_ID53 0.820512821 23 InA - 44 VNPD_ID181 0.818181818 24 InA - 45 VNPD_ID462 0.818181818 24 InA - 46 VNPD_ID653 0.818181818 24 InA - 47 VNPD_ID875 0.818181818 24 InA - 48 VNPD_ID892 0.818181818 24 InA - 49 VNPD_ID45 0.815789474 25 Act S 50 VNPD_ID291 0.815789474 25 Act S 51 VNPD_ID1286 0.815789474 25 Act S 52 VNPD_ID1359 0.815789474 25 Act S 53 VNPD_ID495 0.813953488 26 InA - 54 VNPD_ID646 0.813953488 26 InA - 55 VNPD_ID868 0.813953488 26 InA - 56 VNPD_ID887 0.813953488 26 InA - 57 VNPD_ID894 0.813953488 26 Act S 58 VNPD_ID898 0.813953488 26 InA - 59 VNPD_ID901 0.813953488 26 InA - 60 VNPD_ID929 0.813953488 26 Act S 61 VNPD_ID948 0.813953488 26 InA - 62 VNPD_ID950 0.813953488 26 InA - 63 VNPD_ID1031 0.813953488 26 InA - 64 VNPD_ID1188 0.813953488 26 InA - 65 VNPD_ID314 0.80952381 27 Act S 66 VNPD_ID528 0.808510638 28 InA - 67 VNPD_ID579 0.808510638 28 InA - 68 VNPD_ID799 0.804878049 29 InA - 69 VNPD_ID249 0.804347826 30 InA - 70 VNPD_ID442 0.804347826 30 InA - 71 VNPD_ID7 0.8 31 InA - 72 VNPD_ID38 0.8 31 Act S 73 VNPD_ID90 0.8 31 InA - 74 VNPD_ID1023 0.8 31 Act S 75 VNPD_ID1353 0.8 31 InA - 76 VNPD_ID324 0.795454545 32 InA - 77 VNPD_ID463 0.795454545 32 InA - 78 VNPD_ID248 0.794871795 33 InA - 79 VNPD_ID723 0.794871795 33 Act S 80 VNPD_ID313 0.794871795 33 Act S 81 VNPD_ID323 0.794871795 33 InA - 82 VNPD_ID940 0.794871795 33 Act S 83 VNPD_ID1022 0.794871795 33 Act S 84 VNPD_ID1057 0.794871795 33 InA -
  59. 85 VNPD_ID1178 0.794871795 33 InA - 86 VNPD_ID176 0.791666667 34 InA - 87 VNPD_ID465 0.790697674 35 InA - 88 VNPD_ID797 0.790697674 35 InA - 89 VNPD_ID1159 0.790697674 35 InA - 90 VNPD_ID1346 0.790697674 35 InA - 91 VNPD_ID112 0.783783784 35 InA - 92 VNPD_ID260 0.783783784 35 InA - 93 VNPD_ID627 0.783783784 35 InA - 94 VNPD_ID644 0.783783784 35 InA - 95 VNPD_ID725 0.783783784 35 Act S 96 VNPD_ID911 0.783783784 35 InA - 97 VNPD_ID25 0.782608696 36 InA - 98 VNPD_ID348 0.782608696 36 InA - 99 VNPD_ID1193 0.782608696 36 InA - 100 VNPD_ID1334 0.782608696 36 InA - 101 VNPD_ID347 0.780487805 37 InA - 102 VNPD_ID896 0.780487805 37 InA - 103 VNPD_ID1167 0.777777778 38 InA - 104 VNPD_ID28 0.775510204 39 InA - 105 VNPD_ID952 0.775510204 39 InA - 106 VNPD_ID54 0.775 40 InA - 107 VNPD_ID55 0.775 40 InA - 108 VNPD_ID889 0.775 40 Act S 109 VNPD_ID250 0.775 40 InA - 110 VNPD_ID358 0.775 40 InA - 111 VNPD_ID366 0.775 40 InA - 112 VNPD_ID369 0.775 40 InA - 113 VNPD_ID582 0.775 40 InA - 114 VNPD_ID610 0.775 40 InA - 115 VNPD_ID735 0.775 40 InA - 116 VNPD_ID856 0.775 40 InA - 117 VNPD_ID916 0.775 40 InA - 118 VNPD_ID1158 0.775 40 InA - 119 VNPD_ID1163 0.775 40 InA - 120 VNPD_ID1261 0.775 40 InA - 121 VNPD_ID1277 0.775 40 InA - 122 VNPD_ID637 0.772727273 41 InA - 123 VNPD_ID651 0.772727273 41 InA - 124 VNPD_ID935 0.772727273 41 InA - 125 VNPD_ID27 0.770833333 42 InA - 126 VNPD_ID899 0.770833333 42 InA - 127 VNPD_ID120 0.769230769 43 InA - 128 VNPD_ID861 0.769230769 43 InA -
  60. 129 VNPD_ID883 0.769230769 43 InA - 130 VNPD_ID183 0.76744186 44 Act W 131 VNPD_ID230 0.76744186 44 InA - 132 VNPD_ID232 0.76744186 44 InA - 133 VNPD_ID298 0.76744186 44 Act S 134 VNPD_ID616 0.76744186 44 Act W 135 VNPD_ID661 0.76744186 44 InA - 136 VNPD_ID766 0.76744186 44 InA - 137 VNPD_ID855 0.76744186 44 InA - 138 VNPD_ID882 0.76744186 44 InA - 139 VNPD_ID921 0.76744186 44 Act S 140 VNPD_ID922 0.76744186 44 Act S 141 VNPD_ID923 0.76744186 44 Act S 142 VNPD_ID964 0.76744186 44 InA - 143 VNPD_ID966 0.76744186 44 InA - 144 VNPD_ID1021 0.76744186 44 InA - 145 VNPD_ID1038 0.76744186 44 InA - 146 VNPD_ID1292 0.76744186 44 InA - 147 VNPD_ID1347 0.76744186 44 InA - 148 VNPD_ID893 0.765957447 45 InA - 149 VNPD_ID1157 0.763157895 46 Act S 150 VNPD_ID419 0.763157895 46 InA - 151 VNPD_ID625 0.763157895 46 InA - 152 VNPD_ID648 0.763157895 46 Act S 153 VNPD_ID770 0.763157895 46 InA - 154 VNPD_ID912 0.763157895 46 InA - 155 VNPD_ID943 0.763157895 46 Act S 156 VNPD_ID46 0.761904762 47 Act S 157 VNPD_ID184 0.761904762 47 Act S 158 VNPD_ID412 0.761904762 47 InA - 159 VNPD_ID691 0.761904762 47 InA - 160 VNPD_ID451 0.760869565 48 InA - 161 VNPD_ID961 0.760869565 48 InA - 162 VNPD_ID761 0.76 49 InA - 163 VNPD_ID1177 0.75862069 50 InA - 164 VNPD_ID194 0.756756757 51 Act W 165 VNPD_ID1285 0.756756757 51 Act S 166 VNPD_ID173 0.756097561 52 InA - 167 VNPD_ID237 0.756097561 52 InA - 168 VNPD_ID337 0.756097561 52 InA - 169 VNPD_ID493 0.756097561 52 InA - 170 VNPD_ID1027 0.756097561 52 InA - 171 VNPD_ID1028 0.756097561 52 InA - 172 VNPD_ID467 0.755555556 53 InA -