Khóa luận Ứng dụng mô tả phân tử ISIDA trong thiết kế các hợp chất ức chế enzyme histone deacetylase 2 trong điều trị ung thư

pdf 54 trang thiennha21 6770
Bạn đang xem 20 trang mẫu của tài liệu "Khóa luận Ứng dụng mô tả phân tử ISIDA trong thiết kế các hợp chất ức chế enzyme histone deacetylase 2 trong điều trị ung thư", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfkhoa_luan_ung_dung_mo_ta_phan_tu_isida_trong_thiet_ke_cac_ho.pdf

Nội dung text: Khóa luận Ứng dụng mô tả phân tử ISIDA trong thiết kế các hợp chất ức chế enzyme histone deacetylase 2 trong điều trị ung thư

  1. ĐẠI HỌC QUỐC GIA HÀ NỘI KHOA Y DƢỢC ĐOÀN VIỆT NGA ỨNG DỤNG PHƢƠNG PHÁP THIẾT KẾ VÀ PHÂN TÍCH DỮ LIỆU IN SILICO (ISIDA) TRONG THIẾT KẾ HỢP CHẤT ACID HYDROXAMIC MỚI ỨC CHẾ HDAC2 KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƢỢC HỌC Hà Nội – 2018
  2. ĐẠI HỌC QUỐC GIA HÀ NỘI KHOA Y DƢỢC Người thực hiện: ĐOÀN VIỆT NGA ỨNG DỤNG PHƢƠNG PHÁP THIẾT KẾ VÀ PHÂN TÍCH DỮ LIỆU IN SILICO (ISIDA) TRONG THIẾT KẾ HỢP CHẤT ACID HYDROXAMIC MỚI ỨC CHẾ HDAC2 KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƢỢC HỌC Khóa: QH.2013.Y Người hướng dẫn: 1. TS. LÊ THỊ THU HƢỜNG 2. TS. PHẠM THẾ HẢI Hà Nội – 2018 @ School of Medicine and Pharmacy, VNU
  3. LỜI CẢM ƠN Trước hết, tôi xin tỏ lòng biết ơn sâu sắc và gửi lời cảm ơn chân thành tới TS. Lê Thị Thu Hƣờng, công tác tại bộ môn Dược liệu và Dược học cổ truyền - khoa Y Dược Trường Đại học Quốc gia Hà Nội là người thầy tận tình trực tiếp chỉ bảo, động viên, hướng dẫn để tôi hoàn thành luận văn của mình. Tôi xin chân thành cảm ơn TS. Phạm Thế Hải công tác tại Trường Đại học Dược Hà Nội đã giúp đỡ tôi trong suốt thời gian qua. Bên cạnh đó, tôi cũng xin gửi lời cảm ơn tới lãnh đạo, thầy cô Khoa Y Dược, Đại học Quốc gia Hà Nội đã giúp đỡ, tạo điều kiện để tôi được làm khóa luận, được học tập, nghiên cứu, rèn luyện tại Khoa suốt 5 năm học qua. Sau cùng, tôi xin bày tỏ lòng biết ơn sâu sắc tới gia đình, anh chị em và bạn bè luôn sát cánh, đồng hành, ủng hộ động viên tôi trong quá tình học tập, nghiên cứu hoàn thành luận văn. Dù đã rất cố gắng nhưng kiến thức, kỹ năng và thời gian thực hiện còn hạn hẹp, tôi khó tránh khỏi những thiếu sót. Tôi rất mong nhận được những ý kiến đóng góp của các thầy cô để khóa luận của tôi được hoàn thiện hơn. Tôi xin chân thành cảm ơn. Hà Nội, Ngày 25 tháng 4 năm 2018 Sinh viên Đoàn Việt Nga @ School of Medicine and Pharmacy, VNU
  4. GIẢI THÍCH CHỮ VIẾT TẮT CCC Tính phù hợp hệ số tương quan CSDL Cơ sở dữ liệu HDAC Histone deacetylase HDAC2 Histone deacetylase 2 IC50 Nồng độ ức chế 50% MAE Sai số tuyệt đối MLR Phương pháp hồi quy tuyến tính đa biến PS Tập kiểm tra Q2 Hệ số tương quan chéo 2 Hệ số xác định cho tập kiểm tra Q LOO QSAR Tương quan định lượng giữa cấu trúc – tác dụng RMSE Sai số toàn phương SAHA Suberoylanilide hydroxamic acid TS Tập huấn luyện TSPT Tham số phân tử @ School of Medicine and Pharmacy, VNU
  5. DANH MỤC CÁC HÌNH Hình1.1: Quá trình acetyl hóa histone / deacetyl hóa được điều chỉnh bởi các enzyme HAT và HDAC. 5 Hình 1.2: Cấu tạo trung tâm hoạt động của HDAC 5 Hình 1.3: Mối liên quan của các dạng HDAC khác nhau tới quá trình sinh trưởng phát triển của tế bào . 9 Hình 1.4: Cấu trúc một số dãy acid hydroxamic được tổng hợp 13 ở Việt Nam 13 Hình 2.1: Cấu trúc hóa học của 45 dẫn xuất của acid hydroxamic 20 thu thập được 20 Hình 2.2: Các bước xây dựng mô hình QSAR và ứng dụng mô hình trong thiết kế và dự đoán 22 Hình 2.3: Cơ chế đếm mảnh cấu trúc trong mô tả phân tử ISIDA 23 Hình 2.4: Biểu di n công thức N- 5-hydroxypyridin-2-yl acetamide theo chương trình tô màu và gắn nhãn 24 Hình 2.5: Hai loại mảnh cấu trúc theo chuỗi và nhánh với các phân loại: nguyên tử và liên kết, chỉ nguyên tử, chỉ liên kết 25 Hình 3.1: Các mảnh cấu trúc sử dụng trong mô hình QSAR 29 Hình 3.2: Các mảnh cấu trúc quan trọng được lựa chọn trong mô hình M1, M2 và M3 phản ánh mối tương quan định lượng giữa cấu trúc và hoạt tính sinh học ức chế enzyme HDAC2 34 @ School of Medicine and Pharmacy, VNU
  6. DANH MỤC CÁC BẢNG Bảng 1.1: Các chất ức chế HDAC đang thử nghiệm lâm sàng 11 Bảng 2.1: Giá trị IC50 thực nghiệm của 45 hợp chất trong CSDL 21 Bảng 3.1: Các thông số đánh giá chéo và độ thích hợp của các mô hình tuyến tính trên tập TS 31 Bảng 3.2: Tính toán khả năng dự đoán của mô hình tuyến tính trên tập PS 32 Bảng 3.3: Cấu trúc và giá trị dự đoán IC50 của các hợp chất mới thiết kế 36 Bảng 3.4: Dẫn xuất của khung 4a 37 @ School of Medicine and Pharmacy, VNU
  7. MỤC LỤC MỞ ĐẦU 1 CHƢƠNG 1. TỔNG QUAN 3 1.1. Thực trạng mắc bệnh ung thư và tử vong do ung thư 3 1.1.1. Thực trạng mắc bệnh ung thư và tử vong do ung thư trên thế giới 3 1.1.2. Thực trạng mắc bệnh ung thư và tử vong do ung thư ở Việt Nam 3 1.2. Tổng quan HDAC 4 1.2.1. Khái niệm histon deacetylase 4 1.2.2. Phân loại các histon deacetylase 6 1.2.3. Mối liên quan giữa ung thư và hoạt động bất thường của HDAC2 7 1.3. Các chất ức chế histon deacetylase 10 1.3.1 Trên thế giới 10 1.3.2. Tại Việt Nam 11 1.3.3. Cấu trúc các chất ức chế HDAC 13 1.3.4. Cơ chế tác dụng của các chất ức chế HDAC 14 1.4. Mô hình tƣơng quan định lƣợng tính chất – tác dụng (QSAR) 15 1.4.1. Lịch sử QSAR 15 1.4.2. Đại cương về QSAR 15 1.4.3. Quy trình xây dựng mô hình QSAR 16 CHƢƠNG 2. NGUYÊN LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU 20 2.1. Nguyên liệu 20 2.1.1. Cơ sở dữ liệu (CSDL) 20 2.2. Phương pháp nghiên cứu 21 2.2.1. Phương pháp thiết kế và dự đoán hợp chất thiết kế mới bằng mô hình QSAR từ mảnh cấu trúc 21 2.2.2. Tính toán tham số phân tử 23 2.2.3. Thiết kế tập huấn luyện và tập kiểm tra 25 2.2.4. Xây dựng mô hình 26 2.2.5. Đánh giá mô hình 26 CHƢƠNG 3. KẾT QUẢ VÀ BÀN LUẬN 27 3.1. Kết quả 27 3.1.1. Các mô hình QSAR thu được 27 3.1.2. Đánh giá mô hình 30 3.1.3. Ứng dụng trong thiết kế hợp chất mới và dự đoán hoạt tính 34 @ School of Medicine and Pharmacy, VNU
  8. 3.2. Bàn luận 37 3.2.1. Về phương pháp tính toán tham số phân tử 37 3.2.2. Về mô hình QSAR 37 3.2.3. Về thiết kế hợp chất mới 38 3.2.4. Kết quả dự đoán khả năng ức chế HDAC2 của các hợp chất acid hydroxamic mới 38 CHƢƠNG 4. KẾT LUẬN VÀ KIẾN NGHỊ 40 TÀI LIỆU THAM KHẢO @ School of Medicine and Pharmacy, VNU
  9. MỞ ĐẦU Theo báo cáo thống kê của tổ chức Y tế giới WHO , ung thư là căn bệnh giết người hàng đầu thế giới mỗi năm với khoảng 14 triệu ca mới phát hiện và 8,2 triệu trường hợp tử vong số liệu tính đến hết năm 2012, theo báo cáo số 297, cập nhật tháng 6 năm 2014 . Dự báo, số lượng bệnh nhân mắc mới sẽ tăng lên hơn 70% trong 2 thập kỷ tới. So với thế giới, Việt Nam thuộc nhóm các nước đứng thứ 2 vì tỉ lệ mắc ung thư [27]. Trước tình hình đó, việc nghiên cứu và phát triển các thuốc mới chống lại ung thư luôn là mối quan tâm hàng đầu của các nhà khoa học, trong đó có Việt Nam. Tuy nhiên, quá trình nghiên cứu phát triển thuốc nói chung và các thuốc điều trị ung thư nói riêng hiện nay vẫn chủ yếu dựa trên các phương pháp thực nghiệm thử-lỗi với nhược điểm là tốn thời gian, tiền bạc và cho hiệu quả thấp [30]. Ngoài ra, các thuốc điều trị ung thư hiện đang còn nhiều hạn chế. Do đó yêu cầu cấp bách đặt ra là phải nghiên cứu và phát triển thuốc chống ung thư mới, có tác dụng chọn lọc trên đích phân tử nhằm phát huy tối đa hiệu quả, ít độc hơn. Nhờ những tiến bộ trong di truyền học và sinh học phân tử, Histon deacetylase (HDAC) được chỉ ra là một trong những đích tác dụng phân tử cho điều trị ung thư, trong đó HDAC2 thuộc nhóm I được đánh giá là một đích phân tử quan trọng do có biểu hiện quá mức trong quá trình deacetyl hoá các histon xảy ra ở hầu hết các dòng tế bào ung thư người [14, 66]. Vì vậy, các chất ức chế HDAC2 đang trở thành các tác nhân chống ung thư đầy triển vọng [6, 8, 43]. Hiện nay, trên thế giới và Việt Nam đã có nhiều nghiên cứu xác định, phát hiện và thử hoạt tính của hợp chất ức chế HDAC2 có nguồn gốc tự nhiên và tổng hợp hóa học [3-5]. Trong các nhóm chất ức chế HDAC2, các acid hydroxamic là nhóm chất được quan tâm chú ý và tập trung nghiên cứu nhiều nhất vì có cấu trúc đơn giản, có khả năng tổng hợp với điều kiện của Việt Nam. Acid hydroxamic có nhóm –NHOH tạo được phức bền với Zn2+ ở trung tâm hoạt động của HDAC2 mang lại hoạt tính ức chế enzyme mạnh. Để vừa tiết kiệm thời gian công sức cũng như tính đặc hiệu, nghiên cứu đã lựa chọn thực hiện theo phương pháp thiết kế thuốc hợp lý dựa trên khung cấu trúc acid hydroxamic. Trong những năm gần đây, nghiên cứu sàng lọc hợp chất ức chế HDAC2 dựa trên các phương pháp trợ giúp bởi máy tính, hay còn gọi là phương pháp in silico đã trở thành một hướng đi mới, đầy tiềm năng [48]. Các mô hình in silico là các mô hình toán học thể hiện mối quan hệ định lượng giữa cấu trúc và hoạt tính @ School of Medicine and Pharmacy, VNU 1
  10. (QSAR – Quantitive Structure Activity relationships), được ứng dụng chủ yếu trong dự đoán hoạt tính và cơ chế tác dụng, sàng lọc virtual screening các hợp chất có hoạt tính từ các cơ sở dữ liệu hợp chất. Tuy nhiên ngày nay, thay vì phải sàng lọc hàng triệu hợp chất từ các thư viện để tìm ra hợp chất dẫn đường-điểm khởi đầu cho thiết kế thuốc, phương pháp dựa trên mảnh cấu trúc FBDD- Fragment based drug discovery bắt đầu với tập hợp các phân tử cấu trúc nhỏ dựa trên cấu tạo của đích và đồng thời các mảnh cấu trúc này sẽ được ứng dụng trong thiết kế hợp chất mới. Một trong số các FBDD sử dụng phổ biến hiện nay là mô tả phân tử thiết kế và phân tích dữ liệu in silico (ISIDA-In Silico design and Data Analysis . Với mô tả phân tử ISIDA, quá trình thiết kế thuốc mới trong điều trị ung thư sẽ được tối ưu hóa do ứng dụng linh hoạt mô tả trong sàng lọc, dự đoán và thiết kế hợp chất mới. Từ các vấn đề nêu trên, mục tiêu chung của nghiên cứu này là “Ứng dụng mô tả phân tử ISIDA trong thiết kế các hợp chất ức chế enzyme histone deacetylase 2 trong điều trị ung thư”. Với mục tiêu cụ thể: - Xây dựng được các mô hình toán học QSAR sử dụng mô tả phân tử ISIDA định lượng giữa cấu trúc và hoạt tính ức chế HDAC2. - Đánh giá mô hình QSAR theo các thông số thống kê - Ứng dụng mô hình xây dựng được trong sàng lọc, dự đoán và thiết kế hợp chất mới. @ School of Medicine and Pharmacy, VNU 2
  11. CHƢƠNG 1. TỔNG QUAN 1.1.Thực trạng mắc bệnh ung thƣ và tử vong do ung thƣ 1.1.1. Thực trạng mắc bệnh ung thư và tử vong do ung thư trên thế giới Ung thư đang là một trong những căn bệnh dẫn đến tử vong hàng đầu trên toàn thế giới. Theo báo cáo của Tổ chức Y tế Thế giới-WHO, trong năm 2012, có khoảng 14 triệu trường hợp ung thư được phát hiện mới và có đến 8,2 triệu ca tử vong liên quan đến ung thư . Trong số đó, các ca tử vong do các ung thư chủ yếu là: ung thư phổi 1,59 triệu ca , ung thư gan 745000 ca , ung thư dạ dày 723000 ca , ung thư đại trực tràng 694000 ca , ung thư vú 521000 ca , ung thư thực quản (400000 ca) [33]. Dự kiến, số lượng các ca ung thư mới sẽ có khả năng tăng khoảng 70% trong vòng hai thập kỉ tới, số trường hợp ung thư hàng năm sẽ tăng từ 14 triệu trong 2012 lên 22 triệu trong vòng hai thập kỉ tới . Hơn 60% số các ca ung thư mới hàng năm trên thế giới xảy ra ở Châu Phi, Châu Á, Trung và Nam Mỹ, chiếm 70% số các ca tử vong ung thư thế giới [33]. 5 yếu tố nguy cơ hàng đầu về hành vi và chế độ ăn uống có liên quan đến 30% trường hợp tử vong do ung thư đó là: chỉ số khối cơ thể cao béo phì , ăn ít rau quả tươi, ít tập thể dục, nghiện thuốc lá hoặc rượu. Ngoài ra, các bệnh nhi m virus HBV, HCV và một số type Human Papilloma Virus HPV là nguyên nhân của trên 20% số các ca tử vong ung thư ở các nước thu nhập thấp và thu nhập trung bình [38]. 1.1.2. Thực trạng mắc bệnh ung thư và tử vong do ung thư ở Việt Nam Vào năm 2012, số lượng các ung thư gặp phổ biến ở Việt Nam trên nam giới là gan 16.815 ca, phổi 16.082 ca, dạ dày 9.406 ca, đại trực tràng 4.561 ca và mũi họng 3.301 ca; các ung thư gặp phổ biến ở nữ giới là: vú 11.067 ca, phổi 5.783 ca, gan 5.182 ca, cổ tử cung 5.146 ca và dạ dày 4.797 ca [64]. Tổng số ca tử vong do ung thư là 91.600 ca, trong đó: số nam giới tử vong do ung thư là 58.200 ca: ung thư gan chiếm 26,9%, phổi 24,4%, dạ dày 14,5%, miệng - thực quản 5,8%, đại trực tràng 5,2% và do ung thư khác là 23,2%; số nữ giới tử vong do ung thư là 33.400 ca: ung thư phổi chiếm 14,5%, gan 13,7%, vú 12,5%, dạ dày 12,1%, đại trực tràng 8% và do ung thư khác là 39,3% [64]. @ School of Medicine and Pharmacy, VNU 3
  12. 1.2. Tổng quan HDAC 1.2.1. Khái niệm histon deacetylase Nhi m sắc thể được cấu thành bởi: ADN, protein histon và protein không phải histon [29]. Đơn vị cơ bản của nhi m sắc thể là nucleosom. Mỗi nucleosom gồm 146 cặp base ADN được gói trong một protein histon octame [34] tạo bởi 4 thành phần: H2A, H2B, H3, H4 [15]. Vào năm 1964, Allfrey VG, Faulkner R, Mirsky AE [7] đã khám phá ra quá trình acetyl hóa thuận nghịch của protein histone và ý nghĩa của biến đổi sau phiên mã này với điều hòa biểu hiện gen. Các nhà khoa học đã chỉ ra rằng các đầu amino của protein histon thường bị biến đổi bởi các quá trình methyl hóa, phosphoryl hóa hoặc acetyl hóa sau dịch mã. Quá trình acetyl hoá là một trong những cơ chế điều hoà chính của biểu thị gen, là chìa khóa làm thay đổi cấu trúc nhi m sắc thể và biến đổi sau phiên mã. Deacetyl hóa histone là quá trình ngược lại của acetyl hóa, làm tăng tương tác ion giữa histon tích điện dương và ADN tích điện âm, giúp đóng xoắn bằng cách cho cấu trúc chromatin nhỏ gọn hơn và ngăn chặn sự sao chép gen vì đã làm hạn chế khả năng tiếp cận của các yếu tố phiên mã. Ngoài ra, acetyl hóa histone còn liên kết với các chức năng bộ gen khác như lắp ráp chromatin, sửa chữa DNA và tái tổ hợp. Kiểm soát quá trình biểu thị gen này phụ thuộc vào sự cân bằng giữa hoạt động của enzym histon acetylase và enzym histon deacetylase, nhờ vào sự điều hoà quá trình acetyl hoá lysin ở phần đuôi histon [10]. Ngoài ra, quá trình acetyl hóa cũng liên quan đến rất nhiều protein không histone non-histone proteins) với bản chất có vai trò như một chất nền đóng vai trò quan trọng trong việc quy định sự biểu hiện gen cũng như các protein khác trong các con đường điều tiết sự tăng sinh tế bào, di chuyển tế bào, chu trình chết của tế bào và tạo mạch. Histon acetyltransferase (HAT) là enzym acetyl hóa nhóm -NH2 trong gốc lysin đầu N tận của histon, làm trung hòa điện tích dương trên lysin, do đó giảm khả năng tương tác của histon với ADN tích điện âm tạo cấu trúc mở chromatin. Vì vậy, sự acetyl hóa histon tạo điều kiện cho quá trình phiên mã, dịch mã xảy ra hình 1.1b [10, 28]. Histon deacetylase HDAC là enzym có tác dụng đối lập với HAT. HDAC loại bỏ nhóm acetyl từ acetyl lysin Ac-Lys ở đầu N tận của histon, làm đóng xoắn chromatin, do đó ức chế quá trình phiên mã Hình 1.1 . @ School of Medicine and Pharmacy, VNU 4
  13. Hình1.1: Quá trình acetyl hóa histone / deacetyl hóa đƣợc điều chỉnh bởi các enzyme HAT và HDAC. (Nguồn: www.quora.com) Trung tâm hoạt động HDAC gồm 2 phần chính Hình 1.2 : ion Zn2+ là coenzyme của HDAC và kênh enzym dạng túi hình ống. Cấu trúc rất linh động, có thể biến đổi phù hợp với chiều dài cơ chất khác nhau. Trên miệng túi có một vành nhỏ được tạo nên từ một vài vòng xoắn protein, phần vành này sẽ tương tác với nhóm nhận diện bề mặt HDAC [40, 61]. Hình 1.2: Cấu tạo trung tâm hoạt động của HDAC (Nguồn: PNAS (2004) 101, 15064-15069) @ School of Medicine and Pharmacy, VNU 5
  14. 1.2.2. Phân loại các histon deacetylase Tính đến nay, các nhà khoa học đã chỉ ra 18 loại HDAC khác nhau, được chia thành 4 nhóm (I-IV trong đó các HDAC phụ thuộc vào Zn2+ thuộc nhóm I, II và IV được gọi là các HDAC “kinh điển” và thường được sử dụng để sàng lọc và thiết kế các chất ức chế HDAC mới [36, 40, 46, 67]. Nhóm I: HDAC1, HDAC2, HDAC3, HDAC8. Các enzym này có ở phần nhân của nhiều loại tế bào. Các HDACs nhóm I có kích thước nhỏ, thường biểu hiện ở khắp mọi nơi trong các mô khác nhau của trên người và thường đóng một vai trò chính trong sự tồn tại của tế bào, sự sinh trưởng phát triển và sự khác biệt. Nhóm II gồm nhóm IIa và nhóm IIb. Trong đó nhóm IIa có HDAC4, HDAC5, HDAC7, HDAC9, nhóm IIb có HDAC6, HDAC10. Các enzym này biểu thị mô đặc trưng, có khả năng di chuyển giữa bào tương và nhân. Nhóm III: Các protein điều hoà chuỗi thông tin 2 SIRT : SIRT 1 – 7, chúng có ở bào tương, ty thể và nhân. Nhóm IV: HDAC11, có ở phần nhân của nhiều loại tế bào. Các enzym nhóm I, II và IV phụ thuộc vào Zn2+. Nhóm III là các enzym có cấu trúc phụ thuộc NAD [54, 67]. Nhóm I (HDAC1, 2, 3, 8) có cấu trúc tương đồng với Rdp3 ở tế bào nấm men S.cerevisiae, có chức năng ức chế phiên mã, chỉ hoạt động khi nằm trong phức hợp protein. HDAC nhóm I có ở nấm men, động vật có vú và thực vật. Ở động vật có vú, các HDAC này được chia thành 2 phân nhóm là HDAC1/2 và HDAC3. - HDAC1 và 2 có cấu trúc khá tương đồng 82% . Vùng xúc tác nằm ở đầu N tạo nên phần chính của protein. Các cofactor là cần thiết cho hoạt động của HDAC. HDAC1, 2 hoạt động khi nằm trong phức hợp như phức hợp SIN 3, NuRD/NRD/Mi2 và CoREST. Phosphoryl hóa serin trên HDAC1, 2 điều hòa hoạt động của chúng và tạo nên phức hợp với các cofactor khác [24, 53]. - HDAC3 được tìm thấy trong phức hợp với N-coR (nuclear receptor copressor và phức hợp với SMRT. Khoảng 68% vùng các acid amin của HDAC3 cần thiết cho cả hoạt tính deacetyl hóa và ức chế phiên mã [53]. - HDAC8 không được xếp vào phân nhóm nào vì nó chủ yếu có ở động vật có xương sống. Hoạt động của HDAC8 giảm khi phosphoryl hóa bởi protein kinase A [53, 57]. Nhóm II gồm HDAC 4,5,7,9 nhóm IIa và HDAC6,10 nhóm IIb tương đồng với HDAC1 trong tế bào nấm men. HDAC nhóm II có kích thước phân tử lớn và khác biệt so với HDAC nhóm I do có đầu N tham gia váo quá trình ức chế @ School of Medicine and Pharmacy, VNU 6
  15. phiên mã. Nhóm này chứa tín hiệu định vị ngoài nhân NES nên có thể di chuyển từ nhân ra bào tương và ngược lại [31]. Nhóm III gồm SIRT1-7 tương tự Sir2 ở tế bào nấm men. HDAC nhóm III này không liên quan đến các nhóm khác, chúng có ở trong nhân SIRT 1,6,7 , bào tương SIRT2 hoặc ty thể SIRT 3,4,5 . Nhóm HDAC III ít được nghiên cứu ở người, nhưng được xác định có cơ chế hoạt động phụ thuộc cofactor NAD+ [53].` Nhóm IV gồm HDAC11 chỉ có ở người . Nghiên cứu hệ thống loài thấy rằng HDAC11 liên quan gần hơn với HDAC3,8 nên có thể giả định HDAC11 liên quan mật thiết với HDAC nhóm I hơn là nhóm II. HDAC11 có vùng xúc tác ở đầu N và có thể bị ức chế bởi trapoxin dẫn chất của TSA . HDAC11 chưa được tìm thấy trong các phức hợp HDAC đã biết để có thể xác định chức năng sinh học [31, 53]. HDAC không chỉ điều hòa các protein histon mà rất nhiều protein không histon cũng bị ảnh hưởng bởi hoạt tính của các HDAC. Thuật ngữ các chất ức chế HDAC để chỉ các chất có khả năng ức chế HDAC nhóm I, II và IV [50, 65]. 1.2.3. Mối liên quan giữa ung thư và hoạt động bất thường của HDAC2 Ngày càng có nhiều bằng chứng cho thấy sự biểu hiện gen, kiểm soát bởi thay đổi biểu sinh là rất quan trọng đối với sự khởi đầu và tiến triển của rất nhiều bệnh trong đó có ung thư. Thay đổi biểu sinh làm thay đổi biểu hiện gen mà cấu trúc DNA không thay đổi, do đó, dẫn đến bệnh tật - trái ngược với đột biến DNA – vì thế có tiềm năng đảo ngược bởi các enzyme nhắm mục tiêu chịu trách nhiệm dược lý trong sửa đổi di truyền ngoại sinh. HDACs có mặt trong hầu hết các mô và cho thấy biểu hiện quá mức hoạt động của enzyme, tăng mạnh phản ứng deacetyl hóa đuôi histon và cấu trúc sợi nhi m sắc. Sự có mặt quá nhiều, chức năng và tăng sinh các HDAC nhóm I và II có liên quan tới khối u ác tính bao gồm ung thư biểu mô tế bào T [11] cũng như sự tăng biểu hiện của nhóm I HDAC1, HDAC2 và HDAC3 được xác định là yếu tố cần thiết cho sự gia tăng và phát triển của tế bào ung thư thông qua các bằng chứng thực nghiệm, tiền lâm sàng và lâm sàng về các ảnh hưởng sinh học liên quan đến sự thay đổi trong hoạt động của HDAC. Ngoài ra, HDAC nhóm I có mặt trong các khối u ác tính và huyết học có xu hướng tương quan với tiên lượng xấu hơn, với biểu hiện tăng cao HDAC2 [63]. Ngược lại, sự biểu hiện các HDAC nhóm II 4,5, 6, 7 và 10 có xu hướng liên quan đến tiên lượng tốt hơn như tế bào ung thư phổi. Đó là lý do mà mối tương quan giữa HDAC và ung thư chưa thật rõ ràng, tuy nhiên lựa chọn ức chế HDAC nhóm I là chiến lược điều trị ung thư hiệu quả hơn cả. Hình 1.3 cho thấy các nhóm @ School of Medicine and Pharmacy, VNU 7
  16. HDAC khác nhau có các tác động khác nhau: chu trình tự chết, biệt hóa, điều hòa vòng đời tế bào, di chuyển, tính cảm ứng với điều trị hóa học và sinh mạch. Histone deacetyleasa 2 HDAC2 thuộc HDAC nhóm I. HDAC2 hoạt động như một chất ức chế phiên mã thông qua loại bỏ nhóm lysine ở đầu N của protein histon H2A, H2B, H3 và H4 . Tuy nhiên HDAC2 không liên kết với ADN nên chúng sẽ được chọn lọc bởi các yếu tố phiên mã như YY1, SP1/SP3, gen ức chế khối u p53 và BRCA1. HDAC2 cũng có thể được gắn vào ADN như là một phần của phức hợp CoREST, mSin3 và NuRD. Những phức hợp là mục tiêu với các trình tự gen đặc hiệu bằng các tương tác với các yếu tố phiên mã trình tự đặc hiệu [19]. Phức hợp chứa HDAC2 cũng liên quan đến gen điều chỉnh phiên mã qua thụ thể trung gian. Những phức hợp chứa gen biến đổi biểu sinh khác, chẳng hạn như MeCp2 – là một protein có nhóm liên kết methyl. Các enzyme vận chuyển nhóm methyl DNA DNMT1, DNMT3A và DNMT3B, sự methyl transferases histone SUVAR39H1 và G9a và histon bị bỏ đi nhóm methyl LSD1 , cho thấy một cách khác mà HDAC2 quy định biểu hiện gen và sửa chữa nhi m sắc [39]. HDAC2 cũng quy định biểu hiện gen thông qua sự deacetyl của yếu tố phiên mã cụ thể bao gồm STAT3 và SMAD7. HDAC2 là một chìa khóa quan trọng của gen điều hòa chu kỳ tế bào, quá trình tế bào tự tiêu diệt, kết dính tế bào và di cư. Cùng với HDAC1, HDAC2 quy định việc phiên mã của các gen liên quan đến quá trình tạo máu, biệt hóa tế bào biểu mô, phát triển tim và tế bào thần kinh [55]. Các đột biến có thể có ở HDAC2 xuất hiện ở tế bào soma. HDAC2 bị đột biến trong các khối u lẻ tẻ và trong các khối u phát sinh ở người có ung thư biểu mô đại trực tràng không polyp di truyền. Đột biến này do sự cắt bỏ 9 adenin ở exon tạo thành protein không hoạt động. Sự biểu hiện các dạng đột biến của HDAC2 gây ra sự kháng với tác dụng của các chất ức chế HDAC. Việc thiếu các biểu hiện và chức năng HDAC2 tạo nên sự tăng điều chỉnh gen thúc đẩy tăng trưởng khối u [25, 42]. HDAC2 liên quan đến nhiều bệnh ung thư khác nhau: @ School of Medicine and Pharmacy, VNU 8
  17. Hình 1.3: Mối liên quan của các dạng HDAC khác nhau tới quá trình sinh trƣởng phát triển của tế bào (Nguồn: Future medicinal chemistry (2012) 4, 1439-1460). Việc điều hòa về biểu hiện hoạt động HDAC2 có liên quan đến sự phát triển ung thư. HDAC2 biểu hiện quá mức trong các loại ung thư khác nhau bao gồm cả đại tràng, dạ dày, cổ tử cung, ung thư tuyến tiền liệt, ung thư phổi không tế bào nhỏ và ung thư biểu mô tế bào gan. HDAC2 biểu hiên quá mức liên quan đến ung thư một phần thông qua việc chọn lọc sai lầm của nó và sự im lặng của các gen ức chế khối u. Sự ức chế của gen p21WAF1 ức chế khối u ở vùng khởi động và có thể được đảo ngược bởi việc điều trị bằng thuốc ức chế HDAC [52]. Biểu hiện HDAC2 tương quan với tiên lượng xấu khi bệnh ở giai đoạn tiên triển trong ung thư đại trực tràng, tuyến tiền liệt, dạ dày và biểu mô tế bào gan. Ung thư đại tràng: Các nghiên cứu cho thấy trong loại khối u này sự phiên mã HDAC2 được điều chỉnh bởi tín hiệu beta-catenin-TCF-myc đã bị xóa bỏ trong bệnh ung thư đại tràng. HDAC2 biểu hiện quá mức tương quan với tiên lượng xấu và bệnh ở giai đoạn tiến triển trong ung thư đại trực tràng. Tuy nhiên, Ropero và các cộng sự tìm thấy một sự đột biến bất hoạt của HDAC2 trong ung thư đại tràng với bất ổn microsatellite [47]. @ School of Medicine and Pharmacy, VNU 9
  18. Ung thư vú: HDAC2 gây lão hóa trong tế bào ung thư vú. Hơn nữa sự mất hoạt tính của HDAC2 kéo theo quá trình chết tế bào apoptosis của tamoxifen trong estrogen / progesterone tế bào ung thư vú dương tính [41]. Bệnh ung thư tuyến tiền liệt: Theo nghiên cứu của Weichert và các cộng sự thấy rằng HDAC2 được biểu hiện mạnh mẽ trong hơn 70% các trường hợp phân tích ung thư tuyến tiền liệt. Sự gia tăng trong biểu hiện HDAC2 có liên quan với tăng cường tăng sinh tế bào khối u. Ung thư biểu mô tế bào gan: HDAC2 quy định chu kỳ tế bào và sự phân chia của HDAC2 gây ra ngừng chuyển pha G1/S trong chu kỳ tế bào. Trong quá trình chuyển đổi G1/S,sự phân chia đích của HDAC2 có tính chọn lọc gây ra các biểu hiện của p16 INK4a và p21 WAF1/Cip1 , và đồng thời ức chế sự biểu hiện của cyclin D1, CDK4 và CDK2. Do đó, sự ức chế HDAC2 dẫn đến sự giảm điều chỉnh của gen đích E2F/DP1 thông qua việc giảm sự phosphoryl hóa protein PRB [9]. Bệnh phổi tắc nghẽn mãn tính COPD : giảm hoạt động và biểu hiện HDAC2 được tìm thấy trong bệnh phổi tắc nghẽn mãn tính COPD . Việc giảm hoạt động của HDAC2 làm tăng điều hòa các gen liên quan đến phản ứng viêm và kháng corticosteroid trong COPD [9]. 1.3. Các chất ức chế histon deacetylase 1.3.1 Trên thế giới Từ những năm 1970, Yoshida và cộng sự đã phát hiện ra dẫn chất hydroxamat tự nhiên đầu tiên có tác dụng ức chế trực tiếp HDAC là Trichostatin A TSA , vốn là chất có tác dụng chống nấm . Sau đó, dựa trên hiểu biết về mối liên quan giữa HDAC và ung thư đồng thời xác định được cấu trúc 3D của các HDAC, một số chất ức chế HDAC có nguồn gốc tự nhiên hoặc tổng hợp hóa học đã được nghiên cứu và thử nghiệm trên lâm sàng để ứng dụng trong điều trị ung thư. Cho đến nay, nhiều chất ức chế HDAC UHDAC đã được công bố và có thể chia thành các nhóm cấu trúc: acid hydroxamic, benzamides, acid béo mạch ngắn và peptide vòng [16]. Trong các nhóm chất ức chế HDAC, các acid hydroxamic là nhóm chất được quan tâm chú ý và tập trung nghiên cứu nhiều nhất bởi cấu trúc đơn giản, d tổng hợp và có nhóm -NHOH tạo được phức bền với Zn+2 ở trung tâm hoạt động của HDAC, đáp ứng được chức năng gắn kết với nhóm kẽm và giúp tăng hoạt tính ức chế enzym. Hiện nay, FDA đã phê duyệt một acid hydroxamic UHDAC điển hình là vorinostat suberoylanilide hydroxamic acid, Zolinza vào năm 2006 sử dụng trong điều trị u lympho da tế bào. Một hợp chất UHDA khác là depsipeptide @ School of Medicine and Pharmacy, VNU 10
  19. romidepsin, Istodax cũng được FDA cấp phép lưu hành vào năm 2009 để điều trị CTCL và điều trị ung thư hạch tế bào T ngoại vi. Nhiều chất ức chế enzym HDAC khác cũng đang được thử nghiệm lâm sàng nhằm phát triển liệu pháp điều trị ung thư dựa trên đích này Bảng 1.1 [8, 49]. Bảng 1.1: Các chất ức chế HDAC đang thử nghiệm lâm sàng Nhóm Hợp chất Pha thử nghiệm Butyrat I, II AN-9 tiền thuốc I, II Acid carboxylic Acid valproic I, II Phenyl butyrat I SAHA Đã c/m I, II PXD101 II NVP-LAQ824 I LBH-589 II, III Acid hydroxamic ITF-2357 II SB-939 I CRA 024781 I JNJ-16241199 I SNDX-275 I, II (MS-275) Các benzamid CI-994 I, II MGCD-0103 II Peptid vòng Depsipeptid (FK228) I, II Tuy nhiên, mỗi nhóm nêu trên đều có những hạn chế nhất định như: các acid hydroxamic bị chuyển hoá nhanh, độ ổn định còn kém; các benzamide có thể là nguyên nhân dẫn đến tác dụng phụ của các thuốc an thần ; các peptid vòng khó tạo thành về mặt hoá học và FK-228 có phần gắn kết với ion Zn2+ chứa thiol [37]. 1.3.2. Tại Việt Nam Một số nghiên cứu tìm kiếm hợp chất ức chế HDAC2 đã được thực hiện và công bố trên các tạp chí trong nước và quốc tế. Tất cả các nghiên cứu trên đều được thực hiện bởi nhóm nghiên cứu của GS.TS. Nguy n Hải Nam thuộc Đại học Dược @ School of Medicine and Pharmacy, VNU 11
  20. Hà Nội. Hiện nhóm chủ yếu tập trung thiết kế và tổng hợp hóa dược các hợp chất dị vòng là dẫn xuất của acid hydroxamic, gần 50 hợp chất mới được tổng hợp và thử hoạt tính [3-5, 17, 44]. a) b) c) d) e) f) @ School of Medicine and Pharmacy, VNU 12
  21. g) Hình 1.4: Cấu trúc một số dãy acid hydroxamic đƣợc tổng hợp ở Việt Nam 1.3.3. Cấu trúc các chất ức chế HDAC Cấu trúc các chất ức chế HDAC thường gồm 3 phần chính hình 1.5): - Nhóm khóa hoạt động cap group hay nhóm nhận diện bề mặt SRG : là các vòng thơm hoặc peptid vòng, thường tham gia vào quá trình nhận diện với bề mặt amino acid . Đã có nhiều nghiên cứu thay đổi vùng nhóm khóa hoạt động này trước đây như thêm nhóm thế halogen, vòng diazol, thiazol dựa trên sườn cấu trúc SAHA, Như đã được chứng minh thì vùng nhóm khóa hoạt động cần phải có sự xuất hiện các hydrocacbon thơm, có thể thêm các nhóm thế halogen, cacbonyl, methyl, triflourmethyl ceton hoặc liên kết không no để tăng mức độ ức chế. - Vùng cầu nối linker : thường là các nhóm sơ nước, gồm các hydrocacbon thân dầu mạch thẳng hoặc vòng, có thể no hoặc không no, có vai trò tạo liên kết Van der Waals với kênh enzym. - Nhóm kết thúc gắn với kẽm Zinc binding group - ZBG): nhóm tạo chelat với kẽm trong vùng trung tâm hoạt động của HDAC2 do đó tăng mức độ tương tác và khả năng ức chế enzyme. Trong khung cấu trúc hydroxamic, –NHOH chịu trách nhiệm chính cho vai trò này. @ School of Medicine and Pharmacy, VNU 13
  22. Hình 1.5: Cấu trúc chung của các chất ức chế HDAC (a) và khung cấu trúc acid hydroxamic đảm nhiệm vai trò nhóm kết thúc (b) Như vậy, các phần trong cấu trúc của các chất ức chế HDAC đều tham gia vào quá trình hình thành liên kết với enzym và phát huy tác dụng. Chúng tôi sẽ thiết kế các hợp chất mới bằng cách thay đổi nhóm khóa hoạt động và vùng cầu nối, giữ cố định nhóm kết thúc mang cấu trúc acid hydroxamic. 1.3.4. Cơ chế tác dụng của các chất ức chế HDAC Cơ chế tác dụng của các chất ức chế HDAC đối với ung thư là do khả năng tác động lên nhiều giai đoạn quan trọng của chu trình tế bào, từ đó làm mất sự điều hòa trong tế bào ác tính. Một trong những yếu tố được coi là then chốt, quyết định hoạt tính chống ung thư của các hợp chất này là thúc đẩy sự biệt hóa, ức chế chu trình tế bào và thúc đẩy sự chết tế bào. Ngoài ra, hoạt hóa đáp ứng mi n dịch và ức chế sự tạo mạch cũng là vai trò rất quan trọng của các UHDAC, gián tiếp ức chế sự phát triển của các khối u. Ngoài ra các chất ức chế HDAC ngăn cản các đuôi histon có nhóm acetyl tiến đến vị trí xúc tác. Với vai trò sinh học của HDAC và các nghiên cứu về các chất UHDAC cho thấy đấy là mục tiêu quan trọng cần hướng tới trong điều trị ung thư. Do đó, việc tìm kiếm các hợp chất mới có khung cấu trúc acid hydroxamic có tiềm năng ức chế HDAC2 là một hướng đi đúng đắn nhằm tìm kiếm các hợp chất mới với khả năng ức chế cao hơn, ít độc tinh, cải thiện được sinh khả dụng của các nhà khoa học [2]. @ School of Medicine and Pharmacy, VNU 14
  23. 1.4. Mô hình tương quan định lượng tính chất – tác dụng (QSAR) 1.4.1. Lịch sử QSAR Vào năm 1868, Crum-Brown và Frasher đã nhận xét rằng tác dụng sinh học là hàm số của cấu trúc hóa học và đây cũng chính là khởi nguồn của phương pháp xây dựng mối quan hệ định lượng giữa cấu trúc hóa học và hoạt tính sinh học (QSAR- Quantitative Structure-Activity Relationships). Đến năm 1893, Richet đã cho rằng sự khác nhau về tác dụng sinh học là do sự thay đổi về tính chất lí hóa. Đến năm 1935, phương trình Hammett được coi là mô hình đầu tiên biểu di n mối quan hệ hoạt tính và cấu trúc: Log  Với K, Ko là hằng số acid,  là hằng số Hammett, thông số hóa lý đặc trưng cho khả năng hút hoặc đấy điện tử của nhóm thế. Tuy nhiên, mô hình QSAR thực sự được nghiên cứu bởi C.L. Corwin Hansch từ những năm 60 của thế kỉ 20. Mô hình QSAR Hansch thường sử dụng phương pháp hồi quy tuyến tính đa biến để biểu thị mối tương quan giữa các tham số hóa lí và hoạt tính sinh học, ví dụ: Log (1/C) = k1 + k2 2+ k3 Trong đó: C là nộng độ mol mà tại đó hoạt chất thể hiện hoạt tính sinh học, : hằng số kỵ nước, : hằng số thế Hammett; k1, k2, k3 là các hệ số hồi quy. Kể từ đây, phương trình QSAR đã được xây dựng bằng những phương pháp, kĩ thuật xây dựng đa dạng đã ra đời và đóng vai trò quan trọng trong nghiên cứu và phát triển dược phẩm. 1.4.2. Đại cương về QSAR Về mặt toán học, mô hình QSAR biểu di n mối tương quan định lượng giữa cấu trúc phân tử và hoạt tính thông qua phương trình: Y = f(x1) + f(x2) + + f(xn) (1.4.2) Trong đó, Y là biến phụ thuộc, phản ánh hoạt tính sinh học của các hợp chất. Giá trị của Y được xác định thông qua các nghiên cứu thực nghiệm cho giá trị cụ thể, ví dụ như nồng độ ức chế 50% hoạt tính của enzym (IC50), MIC (Minimum Inhibitory Concentration): nồng độ ức chế tối thiểu, hay nồng độ kìm khuẩn tối thiểu (dùng trong vi sinh); MBC (Minimum Bactericidal Concentration): nồng độ diệt khuẩn tối thiểu; EC50 (Effective Concentration): nồng độ 50% tác dụng tối đa Y cũng có thể nhận giá trị rời rạc, ví dụ như có hay không có hoạt tính, hoạt tính mạnh hay yếu. Các biến x trong mô hình QSAR được gọi là các tham số phân @ School of Medicine and Pharmacy, VNU 15
  24. tử (TSPT), mô tả một đặc điểm cấu trúc nào đó của phân tử hóa học. Hàm f là một hàm mô tả mối tương quan giữa Y và các biến x. Để xây dựng được hàm f, cần áp dụng các thuật toán thống kê (statistical) hoặc học máy (machine learning). Một số kỹ thuật thống kê thường được sử dụng trong xây dựng mô hình QSAR có thể kể đến như mạng neuron nhân tạo (Artificial Neural Network); hồi quy đa biến tuyến tính (Multiple Linear Regression), phân tích thành phần chính (Principal Component Analysis) 1.4.3. Quy trình xây dựng mô hình QSAR Các bước để xây dựng mô hình QSAR [59] gồm:1) Xây dựng cơ sở dữ liệu (CSDL ; 2 Tính toán tham số mô tả phân tử đặc trưng cho cấu trúc bằng sử dụng các phần mềm giúp biểu di n và tính toán; 3) Xây dựng mô hình QSAR: Sử dụng các phương pháp xác suất thống kê và các kỹ thuật của trí tuệ nhân tạo để xây dựng mối liên hệ giữa các tham số phân tử (TSPT) và các giá trị đại lượng biểu di n hoạt tính; 4) Đánh giá mô hình; 5 Giải thích các kết quả và sử dụng mô hình trong quá trình sàng lọc ảo nếu có thể . Xây dựng cơ sở dữ liệu: CSDL thường là cấu trúc của các hợp chất hoá học đã được chứng minh hoạt tính sinh học in vitro. Để hạn chế các yếu tố gây sai số cho mô hình, CSDL thường sẽ được làm sạch dựa trên sự tương đồng về cấu trúc, về protocol, Các giá trị sinh học được hiệu chỉnh, mang tính đại diện và có ý nghĩa thống kê. Tính toán tham số mô tả phân tử đặc trưng cho cấu trúc: Đây là quá trình chuyển đổi toán học và lôgic chuyển đổi thông tin cấu trúc hóa học mã hóa thành dạng số giúp máy tính có thể “hiểu” được. Thiết kế tập huấn luyện và tập kiểm tra: CSDL được chia thành tập huấn luyện TS-Training set chiếm 75%, được sử dụng để xây dựng mô hình và tập kiểm tra PS-Prediction set để đánh giá khả năng dự đoán của các mô hình đã xây dựng được. Xây dựng mô hình QSAR: sử dụng các phương pháp xác suất thống kê và các kỹ thuật của trí tuệ nhân tạo để xây dựng mối liên hệ giữa các TSPT và giá trị đại lượng biểu di n hoạt tính. Đánh giá mô hình: Đánh giá mô hình là giai đoạn quan trọng liên quan đến khả năng ứng dụng của mô hình. Mô hình cần có độ khớp, độ ổn định thông qua đánh giá nội trên tập TS và khả năng dự đoán tốt thông qua đánh giá ngoại trên tập PS dựa trên các thông số thống kê. Để đánh giá mô hình QSAR, các kĩ thuật hay được sử dụng đó là: đánh giá nội hay đánh giá chéo; đánh giá ngẫu nhiên Y; đánh @ School of Medicine and Pharmacy, VNU 16
  25. giá bằng cách chia tệp dữ liệu thành các hợp chất để huấn luyện hay kiểm tra và đánh giá ngoại bằng cách áp dụng mô hình trên tập dữ liệu ngoại [18]. Đánh giá nội: Độ khớp hay độ tuyến tính được đánh giá thông qua giá hệ số xác định R2, R2 càng cao thì mức độ khớp (tuyến tính) của mô hình với các giá trị thực nghiệm càng tốt; r2> 0,8 thì mô hình mới có ý nghĩa. Công thức tính hệ số xác định như sau: ^ ∑ 2 yi yi R = 1- ∑ (yi y) ^ Trong đó n là số các quan sát của tập huấn luyện; yi, y i , lần lượt là giá trị thực tế, giá trị dự đoán của biến phụ thuộc ở quan sát thứ i; y là giá trị thực tế trung bình của biến phụ thuộc. Khả năng Fit của mô hình được xác định thông qua sai số toàn phương trung bình (RMSE- root mean square errors). Giá trị RMSE cho biết độ sai lệch giữa giá trị thực nghiệm và giá trị dự đoán của mô hình: √ ∑ Trong đó y và lần lượt là giá trị hoạt tính sinh học thực nghiệm và dự đoán của các hợp chất trên tập TS, ym làu trung bình hoạt tính thực nghiệm, n là số lượng phân tử hợp chất của tập TS đang kiểm tra. Một mô hình dự đoán tốt thì giá trị RMSE nên thấp hơn 0.5 [56]. MAE: sai số tuyệt đối MAE-root mean square errors được định nghĩa là sự khác biệt lớn nhất của giá trị y thực tế so với y dự đoán [13]. | | 2 2 Độ ổn định được đánh giá thông qua hệ số tương quan chéo Q LOO, Q LOO được đánh giá dựa trên phương pháp tham số chéo (cross validation leave one out) bằng cách lần lượt loại 1 quan sát ra khỏi tập huấn luyện, giữ nguyên các biến đã lựa chọn và tính toán lại các thông số của mô hình. Q2 càng gần 1, tính tổng quát hóa của mô hình càng cao, mô hình càng ổn định. Thông thường, yêu cầu Q2 > 0,7 thì mô hình mới bền vững. Công thức hệ số tương quan chéo tính như sau: ^ ∑ 2 yi yi /i Q = 1 - ∑ @ School of Medicine and Pharmacy, VNU 17
  26. Trong đó n là số các quan sát tập huấn luyện; yi, là giá trị thực tế của quan sát ^ thứ i; yi /i giá trị dự đoán của biến phụ thuộc ở quan sát thứ i sử dụng mô hình đã loại biến i; y là giá trị thực tế trung bình của biến phụ thuộc. Đánh giá ngoại: Để đánh giá ngoại mô hình đã xây dựng được tức là đánh giá khả năng dự đoán chính xác của mô hình, do đó đầu tiên cần phải so sánh đó sai khác của giá trị hoạt tính quan sát thực tế và giá trị dự đoán trên tập PS thông qua giá trị sai số toàn phương trung bình RMSE. Tuy nhiên, khi dự đoán của các mô hình được tính toán trên nhiều đặc tính khác nhau biến đáp ứng cần phải được so sánh, RMSE bị một nhược điểm đó là giá trị của nó phụ thuộc vào số lượng các đặc tính được xem xét, do đó sự so sánh này không có ý nghĩa. Chính vì lý do này, khả năng dự đoán ngoại được đánh giá 2 2 thông qua giá trị Q F, Q F càng lớn mô hình càng cho thấy độ tuyến tính của tập kiểm tra và do vậy chứng tỏ khả năng dự đoán của mô hình cao. ^ ∑ y y 2 i i QF1 = 1 – ∑ (yi y) 2 ∑ QF 2 = 1 - ∑ ^ ∑ y 2 QF3 = 1 - ∑ (yi y) Trong đó nTR ; nEXT tương ứng là số các quan sát tập huấn luyện và kiểm tra; yi, , lần lượt là giá trị thực tế, giá trị dự đoán của biến phụ thuộc ở quan sát thứ i; y EXT và TR là giá trị thực tế trung bình của biến phụ thuộc trên tập PS và TS [62]. Ngoài ra, đánh giá mô hình cũng dựa trên một số các thông số thống kê có ý nghĩa khác như hệ số phân phối Fisher, tính phù hợp của hệ số tương quan CCC- concordance correlation coefficient), Cuối cùng, mô hình MLR được đánh giá tương quan ngẫu nhiên tương phản 2 2 bằng kiểm tra ngẫu nhiên Y với 2 hệ số r scr và q scr. Nếu đỉnh trục Y không vượt 2 2 quá 0.3–0.4 đối với r scr và 0.05 đối với q scr thì mô hình tự do trong tương quan, các biến độc lập không ảnh hưởng lẫn nhau và ảnh hưởng đến kết quả dự đoán của mô 2 2 hình. Quá trình tính toán giá trị r scr và q scr được lặp lại 2000 lần. @ School of Medicine and Pharmacy, VNU 18
  27. Giải thích đƣợc cơ chế (nếu có thể) Mô hình cần được giải thích về vai trò của các biến trong mô hình, qua đó giúp định hướng thiết kế các hợp chất mới từ các mô tả phân tử đóng góp hoạt tính có mặt trong mô hình. @ School of Medicine and Pharmacy, VNU 19
  28. CHƢƠNG 2. NGUYÊN LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU 2.1. Nguyên liệu 2.1.1. Cơ sở dữ liệu (CSDL) Cơ sở dữ liệu (CSDL): gồm 45 hợp chất ức chế HDAC2 lựa chọn từ dữ liệu xây dựng bởi 6 bài báo khoa học đã công bố trước đó cùng với giá trị IC50 được xác định bằng phương pháp giống nhau (sử dụng Kit định lượng Bioscence®) [17, 31, 32, 45, 58]. Các giá trị IC50 thu thập được đều đã được hiệu chỉnh, lấy giá trị trung bình đại diện có ý nghĩa thống kê và độ tin cậy cao thông qua nhiều bước lọc bằng cách loại bỏ các giá trị nằm ngoài khoảng giới hạn [giá trị trung bình ± độ lệch chuẩn (SD)]. Công thức hóa học mô tả như hình 2.1 và giá trị IC50 tương ứng được nêu trong bảng 2.1. Hình 2.1: Cấu trúc hóa học của 45 dẫn xuất của acid hydroxamic thu thập đƣợc @ School of Medicine and Pharmacy, VNU 20
  29. Bảng 2.1: Giá trị IC50 thực nghiệm của 45 hợp chất trong CSDL STT IC50 STT IC50 STT IC50 STT IC50 STT IC50 (µM) (µM) (µM) (µM) (µM) 1 0,308 10 0,116 19 0,175 28 0,310 37 0,120 2 0,284 11 0,152 20 0,254 29 0,190 38 0,150 3 0,891 12 0,086 21 1,399 30 0,192 39 0,320 4 0,460 13 0,120 22 0,3618 31 0,160 40 0,260 5 0,358 14 0,179 23 0,002 32 0,060 41 2,457 6 0,870 15 0,117 24 0,199 33 0,030 42 1,987 7 1,779 16 0,447 25 0,189 34 0,030 43 2,015 8 0,116 17 0,472 26 0,381 35 0,080 44 0,105 9 0,152 18 0,267 27 0,270 36 0,160 45 5,784 2.2. Phƣơng pháp nghiên cứu 2.2.1. Phương pháp thiết kế và dự đoán hợp chất thiết kế mới bằng mô hình QSAR từ mảnh cấu trúc Tóm tắt quy trình thực hiện theo sơ đồ sau: @ School of Medicine and Pharmacy, VNU 21
  30. Chuẩn bị CSDL Tính toán và lựa chọn TSPT Huấn luyện mô hình luyện Huấn Xây dựng và lựa chọn mô hình toán học QSAR/ biểu thức Kém Mô hình được huấn luyện và đánh giá chéo thông qua tập TS Kém Tốt Ki ể m tra mô hình mô m tra Kiểm tra khả Kém năng dự đoán trên tập TS Sử dụng mô hình cho thiết kế phối tử và dự đoán hoạt tính của các phối tử chưa biết Hình 2.2: Các bƣớc xây dựng mô hình QSAR và ứng dụng mô hình trong thiết kế và dự đoán (Nguồn: Int J Mol Sci (2010) 11, 3846-3866) @ School of Medicine and Pharmacy, VNU 22
  31. 2.2.2. Tính toán tham số phân tử Đây là bước chuyển đổi thông tin từ một mảnh cấu trúc thành một dãy số có khả năng thể hiện đặc tính của phân tử ấy thông qua quá trình biến đổi toán học logic [59]. Trong nghiên cứu này, chúng tôi đã lựa chọn và sử dụng mô tả mảnh cấu trúc ISIDA bởi tính linh hoạt và nhiều đặc điểm nổi trội của phần mềm này. Phần mềm ISIDA Fragmentor2015 được phát triển bởi Phòng thí nghiệm Hóa học, Viện Hóa học, Đại học Strasbourg, Pháp [22] cho phép người dùng đếm số lần xuất hiện của các mảnh cấu trúc trong hợp chất có hoạt tính với nguyên lí cơ bản là mảnh cấu trúc xuất hiện càng nhiều thì vai trò đóng góp cho hoạt tính càng cao và trọng số của mảnh cấu trúc đó trong phương trình QSAR càng cao. Hình 2.3: Cơ chế đếm mảnh cấu trúc trong mô tả phân tử ISIDA (Nguồn: ISIDA Manufactor 2012) Các cấu trúc trong CSDL được lưu dưới dạng tệp cấu trúc (SDF-Structure Data File . Chương trình ISIDA Mô tả phân tử thiết kế in silico và phân tích dữ liệu tính mô tả các mảnh cấu trúc từ SDF bằng cách sử dụng ChemFinder, IsisBase hoặc bất kì cơ sở dữ liệu hóa học khác. Chương trình mô tả ISIDA ưu điểm hơn các mô tả khác ở khả năng đếm số lượng mảnh cấu trúc có hoạt tính có mặt trong phân tử, tính trình tự đặc trưng và nhóm ở nhánh nguyên tử tăng cường thậm chí là một mảnh cấu trúc mới tùy theo mục đích, sử dụng các kí hiệu dán nhãn mang đặc tính mảnh cấu trúc gán trên các vector để xây dựng mô hình sàng lọc và thiết kế hợp chất mới. Đầu tiên trong mô tả ISIDA, các mảnh cấu trúc được biểu di n thông qua cơ chế tô màu theo bất kì cách nào kí hiệu, tính thân dầu, độ pH đảm bảo liên quan giữa màu sắc và tính chất hóa học; gán nhãn dựa trên giá trị điện thế; gán nhãn dựa trên đặc tính dược học vòng thơm, liên kết O với một N, với H, hình 2.4 . @ School of Medicine and Pharmacy, VNU 23
  32. Hình 2.4: Biểu diễn công thức N-(5-hydroxypyridin-2-yl) acetamide theo chƣơng trình tô màu và gắn nh n (Nguồn: ISIDA Property labelled fragment descriptors, 2nd Strasbourg Summer School on Chemoinformatics, VVF Obernai, France) Không những thế, ISIDA còn cho phép người dùng xây dựng và đánh giá các dạng phương trình toán học liên quan giữa cấu trúc và hoạt tính tương tự như Excel, STATICTICA hoặc các kỹ thuật học máy khác. Bước tiếp theo, sử dụng ngôn ngữ lập trình Pascal tìm kiếm và đếm sự có mặt các mảnh cấu trúc đã biểu di n tính năng trong phân tử. Có 2 loại mảnh cấu trúc được sử dụng trong tính toán: “chuỗi” I và “nguyên tử tăng cường” hay còn gọi là “có nhánh” II với giới hạn chiều dài đếm mảnh cấu trúc là từ 2 đến 15 nguyên tử. Trong mỗi loại mảnh tìm kiếm, mảnh cấu trúc được biểu di n theo ba cách: Nguyên tử và liên kết AB , nguyên tử A và liên kết B Hình 2.5 . @ School of Medicine and Pharmacy, VNU 24
  33. O OH O O O N N C OH HO N N O C O HO O N CHUỖI NHÁNH I II Nguyên tử và liên kết (AB) O=C-C-N; C-C-N; C-N; O=C-C; C=O; C- C (-C) (-O) (=O) C Nguyên tử (A) C (C) (O) (O) or O C C N; C C N; C N; O C C; C O; C C Csp2(Csp3)(Osp3)(Osp2) Liên kết (B) = - -; - -; -; = -; =; - C (-) (-) (=) Hình 2.5: Hai loại mảnh cấu trúc theo chuỗi và nhánh với các phân loại: nguyên tử và liên kết, chỉ nguyên tử, chỉ liên kết (Nguồn: ISIDA Fragmentor 2015) 2.2.3. Thiết kế tập huấn luyện và tập kiểm tra Tập huấn luyện (TS-training set) bao gồm 30 phân tử (chiếm 75% CSDL), được lựa chọn ngẫu nhiên, sử dụng xây dựng mô hình và tập kiểm tra (PS-test set) với 15 phân tử còn lại để đánh giá khả năng dự đoán chính xác của các mô hình đã xây dựng được. @ School of Medicine and Pharmacy, VNU 25
  34. 2.2.4. Xây dựng mô hình Sử dụng kỹ thuật phân tích hồi quy tuyến tính đa biến MLR-Multiple Linear Regression trong chương trình STATISTICA v8.1 [20] để xác định tương quan hoạt tính ức chế với tính toán mô tả ISIDA. 2.2.5. Đánh giá mô hình Đối với riêng mô hình MLR được xây dựng với nhiều tập hợp tham số phân tử khác nhau và các mô hình tốt nhất được đánh giá dựa trên các thông số thống kê và đánh giá chéo [12]. Đánh giá nội trên tập TS cho biết độ khớp, độ mạnh của mô hình thông qua các thông số thống kê: r2-hệ số tương quan, 0 < r2 < 1, trong phương trình hồi quy tuyến tính đa biến giá trị r2 cần đạt trên 0.80; sai số toàn phương trung bình (RMSE- root mean square errors); sai số tuyệt đối MAE-mean absolute errors ; tính phù hợp của hệ số tương quan CCC-concordance correlation coefficient , giá trị có ý nghĩa thống kê phải cao hơn 0.85 [51]; F là phân phối Fisher, r2 càng lớn thì F càng lớn. Bên cạnh đó, độ ổn định của mô hình thông qua đánh giá chéo trên tập TS 2 2 bằng các hệ số q LOO hệ số leave-one-out), q LMO hệ số leave-more-out) [21]. Đánh giá ngoại mô hình MLR trên tập PS để kiểm tra khả năng dự đoán 2 2 2 chính xác: RMSEext và MAEext, Q F1, Q F2, và Q F3 (giá trị ngưỡng cho phép là 2 0.7), CCCext và rm giá trị ngưỡng thấp nhất là 0.5 [35, 60]. Cuối cùng, mô hình MLR được đánh giá tương quan ngẫu nhiên tương phản 2 2 bằng kiểm tra ngẫu nhiên Y với 2 hệ số r scr và q scr. Sau khi đánh giá mô hình, nếu các mô hình đạt độ ổn định và khả năng dự đoán cao thì sẽ được ứng dụng trong sàng lọc dự đoán hoạt tính các hợp chất đã biết, thiết kế các hợp chất mới từ các mảnh cấu trúc có mặt trong mô hình trên khung hydroxamic và dự đoán hoạt tính IC50 của các hợp chất này bằng chính các mô hình MLR đã xây dựng đó. @ School of Medicine and Pharmacy, VNU 26
  35. CHƢƠNG 3. KẾT QUẢ VÀ BÀN LUẬN 3.1. Kết quả 3.1.1. Các mô hình QSAR thu được Mô hình QSAR là mô hình biểu thị mối liên hệ định lượng giữa cấu trúc và hoạt tính của các hợp chất. Mô hình QSAR được biểu di n dưới dạng một phương trình toán học 1.4.2 . QSAR sử dụng các TSPT, các kỹ thuật xác suất thống kê và trí tuệ nhân tạo để xây dựng các mô hình. QSAR được xây dựng dựa trên giả thuyết là cấu trúc của một phân tử phải chứa những đặc điểm cấu trúc liên quan tới tính chất hóa học, vật lý, sinh học và dựa trên khả năng các mô tả phân tử. Bởi các mô hình QSAR, hoạt tính sinh học của một phân tử mới hoặc chưa được kiểm nghiệm có thể được suy ra từ cấu trúc của các hợp chất tương tự trong đó tính chất của chúng đã được kiểm nghiệm. Phương pháp QSAR xây dựng các mô hình toán học nhằm dự đoán hoạt tính của các hợp chất dựa trên cấu trúc hóa học của chúng, là các kỹ thuật nhằm dự đoán các kết quả trước khi các thử nghiệm được tiến hành trong phòng thí nghiệm. QSAR cung cấp thông tin dự đoán về kết quả có thể có của một thử nghiệm nào đó và khả năng mới này cung cấp các yếu tố liên quan để thiết lập thứ tự ưu tiên cho một chất mới cho các thử nghiệm. Như vậy, để có thể xây dựng được các mô hình này thì cả cấu trúc và hoạt tính đều phải được định lượng hóa. Trong nghiên cứu này, các cấu trúc được định lượng thông qua các TSPT biến x , biến Y là giá trị logIC50 với IC50 là nồng độ ức chế 50% hoạt tính của enzym HDAC2, được đánh giá bằng các phương pháp nghiên cứu thực nghiệm sử dụng Kit định lượng Bioscence®. Giá trị logIC50 thu được bằng cách xử lí dữ liệu IC50 bằng phần mềm Microsoft Excell 2007, lấy giá trị trung bình đại diện có ý nghĩa thống kê và độ tin cậy cao thông qua nhiều bước lọc bằng cách loại bỏ các giá trị nằm ngoài khoảng giới hạn [giá trị trung bình ± độ lệch chuẩn (SD)]. IC50 càng nhỏ hoạt tính ức chế enzym HDAC2 của chất đó càng mạnh. - Phân chia tập huấn luyện và tập kiểm tra Sử dụng phương pháp phân chia ngẫu nhiên chia 45 hợp chất trong CSDL thành 34 hợp chất chiếm 75% CSDL được phân vào tập huấn luyện, sử dụng xây dựng các mô hình; 11 hợp chất 25% CSDL được phân vào tập kiểm tra để đánh giá khả năng ngoại suy của mô hình. - Tính toán TSPT ISIDA là phần mềm cho phép biểu di n và đếm số mảnh cấu trúc có hoạt @ School of Medicine and Pharmacy, VNU 27
  36. tính xuất hiện với tần số cao trong các hợp chất có hoạt tính mạnh, mảnh cấu trúc xuất hiện càng nhiều tương ứng đóng góp hoạt tính càng mạnh. Hai loại mảnh cấu trức được sử dụng: “chuỗi” I và “nguyên tử tăng cường” hay còn gọi là dạng “nhánh” II . Có 3 loại AB, A và B cho mỗi loại mảnh. Đối với mảnh loại I, ISIDA biểu di n theo 3 dạng: chuỗi gồm cả nguyên tử và liên kết AB , chỉ có nguyên tử A và chỉ số liên kết B . Liên kết ngắn nhất và tất cả các liên kết từ một nguyên tử đến các nguyên tử khác đều được biểu di n. Tương ứng với mỗi loại chuỗi, số lượng nguyên tử nhỏ nhất nmin và lớn nhất nmax được xác định. Do đó, đối với mỗi dạng tìm kiếm, phần mềm lập tức hình thành chuỗi chứa n nguyên tử nmin n nmax , với nmin 2 và nmax 15. Số lượng chuỗi có độ dài chuỗi khác nhau tương ứng từ nmin = 2 tới nmax = 15 là 105 cho mỗi dạng AB, A, B do đó tổng số ta thu được 315 mảnh loại chuỗi. Đối với loại “nguyên tử tăng cường” hay “nhánh” đại diện cho các nguyên tử được lựa chọn và môi trường xung quanh nó bao gồm các nguyên tử và liên kết bên cạnh AB , hoặc chỉ có nguyên tử A hoặc chỉ gồm liên kết B , do đó loại mảnh này sẽ có 4 loại đối với một nguyên tử. - Xây dựng mô hình Kỹ thuật sử dụng là hồi quy tuyến tính đa biến: Y = ao + aiNi +   Ở đây : ai là các hệ số đóng góp của mảnh cấu trúc, Ni là số lượng mảnh cấu trúc loại i. ao là hệ số tự do của mảnh cấu trúc độc lập trong mô hình là mảnh cấu trúc hydroxamic)  = cmDm có thể được tính toán để mô tả thêm bất kì đặc tính riêng biệt khác của phân tử bằng cách sử dụng mô tả ngoại Dm topological, điện tích,. ; bình thường mặc định = 0. Hệ số ai được tính bằng cách tìm giá trị nhỏ nhất của hiệu Y tính toán và Y thực nghiệm n 2 U[ ai] =  wi (Yexp,i – Ycalc,i) => min i 1 Ở đây: n là số phân tử hợp chất trong tập TS wi là trọng số Yexp và Ycalc lần lượt là Y thực nghiệm và Y được tính toán theo công thức 1 . Kết quả, phần mềm đã xây dựng 1276 mô hình khác nhau từ 319 loại mảnh cấu trúc đã được mô tả ở trên. Như vậy, số lượng mô tả phân tử lớn hơn nhiều so @ School of Medicine and Pharmacy, VNU 28
  37. với số lượng các hợp chất trong tập huấn luyện; do đó cần phải lựa chọn các biến để xây dựng các phương trình hồi quy đa tuyến tính có ý nghĩa thống kê. - Lựa chọn TSPT thích hợp: Không phải tất cả các biến đều được đưa vào mô hình, mặc dù sự góp mặt của đầy đủ các biến độc lập làm tăng hệ số tương quan r2 nhưng nó chỉ tốt khi gây ảnh hưởng có ý nghĩa thống kê tới biến phụ thuộc. Trong ISIDA, có hai chiến lược lựa chọn biến: forward stepwise đưa vào từng bước và backward stepwise giảm dần từng bước bằng kỹ thuật Variable Selection Suite (VSS). Nguyên lý của việc lựa chọn biến là tính toán các hệ số của các biến mô tả phân tử trong mô hình và đánh giá mức độ ảnh hưởng và ý nghĩa thống kê của các hệ số tới biến phụ thuộc. Trọng số càng cao thì mô tả phân tử đó càng có ý nghĩa. Kết quả, chúng tôi đã tìm được các biến V1 – V24 là vân tay cấu trúc đại diện cho các mảnh cấu trúc được mã hoá thành tham số nhận các giá trị 0 và 1 ứng với sự xuất hiện của chúng trong phân tử có ảnh hưởng cao đến biến phụ thuộc. Hình 3.1: Các mảnh cấu trúc sử dụng trong mô hình QSAR - Các mô hình MLR thu được Lập mô hình với số biến đã chọn bằng phương pháp hồi qui đa biến tuyến tính MLR bằng phần mềm STATISTICA 10.0. MLR là kỹ thuật rất phổ biến trong thực tế, là tổ hợp tuyến tính giữa các biến phụ thuộc Y với nhiều biến độc lập x . Trong nghiên cứu này x chính là các TSPT đặc trưng cho cấu trúc các hợp chất @ School of Medicine and Pharmacy, VNU 29
  38. trong CSDL, Y là giá trị logIC50 với IC50 là nồng độ ức chế 50% hoạt tính của enzyme HDAC2. Phân tích hồi quy bao hàm cả ý nghĩa “ước tính” Estimating hay “dự đoán” Predictive vì sau khi sự tương quan tuyến tính giữa x và Y được thiết lập bởi một biểu thức toán học cụ thể người ta có thể ước tính hay dự đoán giá trị của Y từ một giá trị của x. Đường biểu di n biểu thức toán học ấy được gọi là đường hồi qui của Y theo x. 24 biến mô tả phân tử ISIDA đã lựa chọn được sắp xếp thành ba tập mô tả phân tử. Đối với mỗi tập hợp mô tả phân tử, ta thu được một mô hình QSAR tương ứng: M1 M2 M3 3.1.2. Đánh giá mô hình 3.1.2.1. Đánh giá nội trên tập huấn luyện TS Như chúng tôi đã trình bày, CSDL được chia ra thành TS và PS. Tất cả các hợp chất trong mỗi tập dữ liệu ban đầu được xáo trộn ngẫu nhiên để tránh trật tự có thể xảy ra khi chuẩn bị dữ liệu. Đánh giá chéo cross – validation được áp dụng để kiểm tra các mô hình đã phát triển. Tập dữ liệu mẹ được chia thành các tập con với hệ số chia k, sử dụng k-1 tập để xây dựng mô hình và kiểm tra lại mô hình với tập con còn lại. Vì CSDL các hợp chất có cấu trúc acid hydroxamic đã thu thập được không lớn, do đó chúng tôi đánh giá chéo với giá trị k = 1 hay nói cách khác sử dụng toàn bộ tập TS để đồng thời xây dựng mô hình cũng như kiểm tra mô hình. Các giá trị thực nghiệm và kết quả dự đoán của mô hình MLR cho tập TS được đưa ra trong bảng 3.1 dưới đây. @ School of Medicine and Pharmacy, VNU 30
  39. Bảng 3.1: Các thông số đánh giá chéo và độ thích hợp của các mô hình tuyến tính trên tập TS 2 2 2 2 r Q LOO RMSE MAE CCC r (scr) q (scr) F M1 0,81 0,76 0,52 0,41 0,89 0,13 -0,34 17,8 M2 0,79 0,77 0,49 0,38 0,85 0,14 -0,31 18,5 M3 0,82 0,80 0,54 0,43 0,90 0,13 -0,35 19,0 Độ khớp Độ khớp được đánh giá thông qua hệ số tương quan r2, tính phù hợp hệ số tương quan CCC, sai số toàn phương RMSE và sai số tuyệt đối MAE giữa giá trị IC50 thực nghiệm và giá trị dự đoán theo mô hình của các hợp chất trong tập TS. Xét tổng quát ở cả 3 mô hình đều cho giá trị r2 gần xấp xỉ và lớn hơn 0,80 do đó các mô hình xây dựng được đều đạt độ tuyến tính tốt, trong đó mô hình M3 có độ tuyến tính cao nhất với giá trị của hệ số tương quan là 0,82. RMSE đạt khi nhỏ hơn 0,5 như vậy, mô hình M2 có độ khớp tốt nhất với sai lệch giữa giá trị dự đoán và thực tế là nhỏ nhất, các mô hình M1 và M3 mặc dù lần lượt là 0,52 và 0,54 nhưng đối với mô hình MLR thì đây là các số liệu chấp nhận được và vẫn có ý nghĩa. Sự phù hợp hệ số tương quan CCC định lượng sự đồng thuận giữa hai phép đo cho cùng một biến phụ thuộc để đánh giá khả năng tái sử dụng mô hình, độ tin cậy lẫn nhau giữa những người đánh giá. Giá trị CCC nằm trong khoảng -1 đến 1, với giá trị đồng thuận tuyệt đối là 1. Nhận xét giá trị CCC của cả 3 mô hình đều lớn hơn 0,8, trong đó mô hình M3 có giá trị CCC tốt nhất là 0,90. Với giá trị CCC trên tập TS như vậy có thể khẳng định khả năng tái sử dụng mô hình cao và mức độ sai lệch giữa các kiểm tra giá trị Y và X sẽ không nhiều. Độ chính xác Độ chính xác được đánh giá dựa trên phương pháp đánh giá chéo thông qua giá 2 2 trị Q LOO. Giá trị Q LOO cho biết khả năng dự đoán chính xác của các mô hình dựa trên những thí nghiệm đã làm hay nói một cách cụ thể hơn, đối với xây dựng QSAR thì tập TS có vai trò “huấn luyện” chứa các hợp chất mà mô hình đã biết hoạt tính sinh học. Đối 2 với mô hình MLR, để đạt độ chính xác thì giá trị Q LOO > 0,7. 2 Giá trị Q LOO ở mô hình M1 là 0,76 và khi thay đổi các biến từ V2 –V8 theo xu hướng kéo dài mạch C, tăng dần độ bất bão hòa, thêm các nguyên tố có độ âm 2 điện cao như Cl, O, N, S ta được mô hình M2, M3 với q LOO tương ứng tăng 0,01 và 0,04. @ School of Medicine and Pharmacy, VNU 31
  40. Bên cạnh đó, thông số kiểm tra ngẫu nhiên Y cho các mô hình M1, M2, M3 với giá trị r2 scr cao nhất là 0,14 M2 và q2 scr cao nhất là -0,31 với mô hình M2; kết quả này chứng tỏ ở cả 3 mô hình không có tương quan, ảnh hưởng lẫn nhau giữa các biến độc lập. Từ đó có thể khẳng định độ mạnh, độ ổn định và độ khớp tốt của cả 3 mô hình MLR. 3.1.2.2. Đánh giá ngoại trên tập kiểm tra PS Kết quả đánh giá ngoại trên tập kiểm tra được thể hiện trong bảng 3.2 Bảng 3.2: Tính toán khả năng dự đoán của mô hình tuyến tính trên tập PS 2 2 2 Q F1 Q F2 Q F3 RMSEext MAEext CCC M1 0,77 0,78 0,81 0,39 0,31 0,84 M2 0,76 0,79 0,76 0,40 0,32 0,80 M3 0,80 0,79 0,82 0,37 0,29 0,85 Khả năng dự đoán ngoại là tính chính xác của mô hình trong dự đoán biến phụ thuộc Y đối với các thí nghiệm tương lai hay nói cách khác là sử dụng các hợp chất trong tập PS. Đây là các hợp chất mà mô hình chưa gặp để kiểm tra tính chính xác trong dự đoán của các mô hình đã xây dựng được. Khả năng dự đoán 2 2 được đánh giá thông qua giá trị Q F, Q F càng lớn mô hình càng cho thấy độ tuyến tính của tập kiểm tra và do vậy chứng tỏ khả năng dự đoán chính xác cao 2 2 2 nhất của các mô hình. Ba giá trị Q F1, Q F2, Q F3 ở đây lần lượt là hiệu của 1 với tỷ lệ tổng bình phương phần dư chia cho tổng bình phương sai số trung bình trên tập TS, PS và trên cả 2 tập. ^ ∑ y y 2 i i QF1 = 1 – ∑ (yi y) 2 ∑ QF 2 = 1 - ∑ ^ ∑ 2 y QF3 = 1 - ∑ (yi y) Trong đó nTR ; nEXT tương ứng là số các quan sát tập huấn luyện và kiểm tra; yi, , lần lượt là giá trị thực tế, giá trị dự đoán của biến phụ thuộc ở quan sát thứ i; y và là giá trị thực tế trung bình của biến phụ thuộc trên tập PS và TS. Dựa trên các chỉ tiêu thông số đánh giá đã nêu, cả ba mô hình đều đạt yêu 2 2 2 2 cầu thậm chí giá trị Q rất cao, mô hình M3 cho kết quả tốt nhất với Q F1, Q F2, Q F3 @ School of Medicine and Pharmacy, VNU 32
  41. lần lượt là 0,80; 0,79; 0,82. Các giá trị này chứng tỏ khả năng dự đoán hoạt tính sinh học tốt của cả 3 mô hình đối với các hợp chất mới mà mô hình chưa từng gặp, nhất là mô hình M3. Như vậy, cả ba mô hình đều đạt trên cả đánh giá nội và đánh giá ngoại đồng nghĩa với việc các mô hình QSAR này sẽ tiếp tục được ứng dụng trong bước sàng lọc, dự đoán và thiết kế hợp chất mới tiếp theo. 3.1.2.3. Giải thích cơ chế Đây là bước quan trọng để từ đó định hướng thiết kế hợp chất mới. Cả ba mô hình M1, M2, M3 xây dựng được trên 3 tập mảnh cấu trúc khác nhau đều cho kết quả tốt, từ đó ta hoàn toàn tìm ra được các biến có ảnh hưởng tới hoạt tính sinh học. Ở đây, nghiên cứu sẽ chỉ ra, giải thích cụ thể vai trò của mảnh cấu trúc mang hoạt tính và chức năng thực sự của mô tả mảnh cấu trúc ISIDA. Dựa trên các mô hình MLR đã được xây dựng và đánh giá, việc tìm ra chính xác các mảnh cấu trúc có đóng góp như thế nào tới hoạt tính ức chế HDAC2 đều dựa trên các con số toán học. Các phân tử được bôi xám có hệ số giá trị âm CNV- coefficient of negatives values trong mô hình, đồng nghĩa đây là các yếu tố tăng cường hoạt động ức chế giảm giá trị IC50 . Ngược lại, hệ số có giá trị dương CPV- coefficients with positive value làm tăng giá trị IC50 do đó giúp chỉ ra các mảnh cấu trúc làm giảm hoạt tính ức chế. Xét trên cả các trọng số phân tử Kết hợp cả 3 mô hình, chúng tôi đã tìm ra 9 mảnh cấu trúc giữ vai trò quan trọng nhất đóng góp vào hoạt tính ức chế HDAC2 Hình 3.2 . @ School of Medicine and Pharmacy, VNU 33
  42. Hình 3.2: Các mảnh cấu trúc quan trọng đƣợc lựa chọn trong mô hình M1, M2 và M3 phản ánh mối tƣơng quan định lƣợng giữa cấu trúc và hoạt tính sinh học ức chế enzyme HDAC2 3.1.3. Ứng dụng trong thiết kế hợp chất mới và dự đoán hoạt tính 3.1.3.1. Thiết kế hợp chất mới Từ 9 mảnh cấu trúc trên, dựa trên khung hydroxamic đã lựa chọn, tiến hành tổ hợp các mảnh cấu trúc này để tạo thành các nhóm thế mới dẫn tới cho các hợp chất mới một các tự động bằng Thuật giải di truyền [1]. Kết quả, chỉ trong một thời gian ngắn, cách mảnh cấu trúc được lắp ghép nhanh chóng với mọi trường hợp xảy ra, giúp tạo ra hàng nghìn hợp chất. Thuật giải di truyền dựa trên cơ chế của chọn lọc tiến hóa trong tự nhiên: “Trong mọi thế hệ, một tập mới các sinh vật được tạo ra bằng cách lai ghép những nhân tố thích hợp nhất với môi trường của những sinh vật trong thế hệ cũ cùng với sự xuất hiện đột biến ngẫu nhiên của các cá thể trong thế hệ mới”. Vận dụng cơ chế này, đầu tiên thuật toán sẽ mã hoá tất cả các tham số của cấu trúc ban đầu trong một nhi m sắc thế - biểu di n bằng một vec tơ. Từ nhi m sắc thể ban đầu này, tạo ngẫu nhiên một quần thể. Quần thể này được đánh giá và từ đó các nhi m sắc thể thích nghi nhất tức là có hàm mục tiêu Q2 cao nhất được chọn làm khung để tạo ra quần thể tiếp theo. Quy trình này làm tăng Q2 của toàn bộ nhi m sắc thể bằng cách truyền các đặc tính cấu trúc thuận lợi từ một quần thể này sang một quần thể khác. Sau một số chu kỳ tìm kiếm và đánh giá, cuối cùng ta sẽ tìm được một nhi m sắc thể mô hình phù hợp với giá trị Q2 cao nhất. @ School of Medicine and Pharmacy, VNU 34
  43. Các bước thực hiện thuật giải di truyền: 1 . Khởi tạo một quần thể ban đầu file đầu vào được lưu dưới dạng file.mdd chứa các dữ liệu về tên, các mô tả phân tử được tính toán bằng phần mềm Dragon 6.0, giá trị log IC50 của các hợp chất trong tập huấn luyện . 2 . Xác định hàm mục tiêu fitness cho mỗi cá thể trong quần thể. Hàm mục tiêu trong nghiên cứu này là giá trị Q2. 3 . Tạo ra quần thể mới bằng cách lai ghép chéo crossver từ các cá thể hiện tại có chọn lọc selection , đồng thời tạo ra các đột biến mutation trong quần thể mới theo một xác suất nhất định. Quá trình này thực hiện thông qua cài đặt giải thuật di truyền Genetic Algorithm set up . 4 . Các cá thể trong quần thể mới được sinh ra thay thế cho các cá thể trong quần thể cũ. 5 . Nếu điều kiện dừng, giải thuật dừng lại và trả về cá thể tốt nhất cùng với giá trị hàm mục tiêu của nó. Sau đó, các khung cấu trúc này được lọc lần thứ nhất bằng việc kiểm tra xem các cấu trúc này đã từng được công bố trước đó hay chưa bằng cách tìm cấu trúc đồng dạng theo SMILES trên trang web 3.1.3.2. Sử dụng mô hình QSAR đã xây dựng được để dự đoán hoạt tính Bước lọc thứ hai là dự đoán hoạt tính IC50 của các hợp chất được thiết kế bằng chính những mô hình đã xây dựng được. Sử dụng phần mềm ISIDA phiên bản 2.0 tính toán các tham số phân tử của các biến, thay vào các mô hình QSAR M1, M2, M3 đã xây dựng được, lấy trung bình cộng các kết quả IC50 dự đoán. Từ các cấu trúc mới đã tính toán, lọc ra các cấu trúc có giá trị IC50 dự đoán tốt và quan trọng là các cấu trúc thiết kế này phải có khả năng tổng hợp phù hợp điều kiện thực tế. @ School of Medicine and Pharmacy, VNU 35
  44. Bảng 3.3: Cấu trúc và giá trị dự đoán IC50 của các hợp chất mới thiết kế Dự đoán IC Ký hiệu Cấu trúc 50 (μM) 1a 1,60125 2a 3.10026 3a 0,96005 4a 0,30018 5a 1,11231 6a 4,62709 SAHA 0,11265 Từ 6 khung mới được thiết kế, chọn ra khung có tác dụng ức chế HDAC2 tốt nhất Có IC50 được dự đoán là thấp nhất là 4a. Thiết kế một số nhóm thế khả thi dựa trên các mảnh định hướng thiết kế nhằm tạo dẫn chất của 4a là 4b và 4c Bảng 3.4 . @ School of Medicine and Pharmacy, VNU 36
  45. Bảng 3.4: Dẫn xuất của khung 4a STT R Dự đoán IC50 (μM) 4a H 0,30018 4b 5-F 1,01279 4c 5-Cl 0,52685 3.2. Bàn luận 3.2.1. Về phương pháp tính toán tham số phân tử Trước đấy, một số phần mềm tính toán tham số phân tử đã được sử dụng rộng rãi để tính toán chuyển đổi các hợp chất trong CSDL sang dạng mô tả phân tử như DRAGON, TOMOCOMD-CARDD. Các phần mềm tính toán TSPT này chỉ ứng dụng trong xây dựng mô hình. Phần mềm tính toán DRAGON cho phép tính toán 4885 TSPT khác nhau, các cấu trúc cần mô tả được biểu di n dưới dạng SMILES sau đó được mã hóa theo thông tin mô tả: tham số OD đếm số nguyên tử như số lượng C,O,N ; tham số 1D mô tả dạng chuỗi, số lượng mảnh, nhân thơm, ; tham số 2D mô tả vị trí, thứ tự các nguyên tử cũng như liên kết và cuối cùng tham số 3D mô tả đặc điểm không gian của phân tử [26]. Danh sách mã hóa được xây dựng sẵn, sau khi mô tả, vân tay tìm kiếm điện tử sẽ đếm sự xuất hiện của các mô tả TSPT trong cấu trúc và từ đó xác định sự đóng góp của các TSPT trong mô hình định lượng. Việc xác định các TSPT có vai trò tăng cường hoạt tính chỉ giúp định hướng trong thiết kế, sau đó cần sử dụng phần mềm ChemDraw vẽ các mảnh cấu trúc có thể có dựa trên mô tả DRAGON sẵn có và thiết kế, lắp ghép các mảnh cấu trúc trên để hình thành các hợp chất mới. Trong khi đó, mô tả phân tử ISIDA cho phép tìm kiếm theo mảnh cấu trúc hóa học (theo biểu di n SMILES), xây dựng mô hình với các biến là các mảnh cấu trúc chính xác và sau đó trực tiếp lắp ghép các mảnh cấu trúc để thiết kế hợp chất mới. Chính vì vậy, phương pháp tính toán TSPT bằng phần mềm ISIDA giúp rút ngắn thời gian, con đường xây dựng mô hình QSAR cũng như đi đến thiết kế hợp chất có hoạt tính sinh học mới. 3.2.2. Về mô hình QSAR Hiện nay, xây dựng mô hình QSAR đang là một bước quan trọng trong quá @ School of Medicine and Pharmacy, VNU 37
  46. trình nghiên cứu phát triển, ứng dụng ở nhiều lĩnh vực như dược phẩm, y học, hóa học, sinh học Bước nghiên cứu này là sự kết hợp của các kỹ thuật tính toán TSPT, kỹ thuật xác suất thống kê và trí tuệ nhân tạo để xây dựng và đánh giá các mô hình, giúp tối ưu hóa mô hình nhằm tìm ra biểu thức định lượng gần sát nhất với giá trị thực tế mối quan hệ giữa biến phụ thuộc và các TSPT. Mô hình được xây dựng với 24 mảnh cấu trúc được mô tả theo đặc điểm cấu trúc cũng như tính chất hóa học do đó đảm bảo tính chính xác khi biểu di n TSPT. Kỹ thuật hồi quy tuyến tính đa biến là một kĩ thuật đơn giản, mô hình QSAR xây dựng được sẽ d dàng chỉ ra được vai trò đóng góp của biến thay đổi tới biến phụ thuộc. Tuy nhiên, ở nghiên cứu mới chỉ dừng lại ở xây dựng mô hình QSAR, thiết kế hợp chất mới và dự đoán khả năng ức chế HDAC2 thông qua tính toán giá trị IC50 mà chưa kết hợp với đánh giá tính giống thuốc cũng như docking do đó không xác định được khả năng gắn kết tương tác với đích phân tử cũng như dược động học của các hợp chất mới. Bên cạnh đó, CSDL sử dụng để xây dựng mô hình còn hạn chế về số lượng vì chỉ thu thập được từ 6 bài báo đảm bảo được hai điều kiện tìm kiếm là cấu trúc acid hydroxamic và đích phân tử HDAC2. 3.2.3. Về thiết kế hợp chất mới Thiết kế thuốc hợp lý dựa trên mảnh cấu trúc là một chiến lược giúp rút ngắn được thời gian, cho hiệu quả tác động tới đích phân tử cao và chọn lọc hơn. Bằng việc xác định 9 mảnh cấu trúc có đóng góp cao tới hoạt tính ức chế HDAC2, nghiên cứu đã nhanh chóng thực hiện thiết kế tự động thay đổi vùng cầu nối và nhận diện bề mặt, giữ nguyên vùng cấu trúc acid hydroxamic tạo phức với Zn2+. Với mô tả phân tử ISIDA, các mảnh cấu trúc được định lượng biểu di n trong mối liên quan trực tiếp tới biến đáp ứng trong mô hình QSAR cũng như khả năng sử dụng trực tiếp để thiết kế hợp chất mới do đó việc thiết kế hợp chất mới được chính xác và nhanh chóng hơn. Đây chính là ưu điểm vượt trội hơn của mô tả phân tử này so với các mô tả phân tử khác. Tuy nhiên, trong các nghiên cứu thiết kế hợp chất mới, ngoài thiết kế dựa trên mảnh cầu trúc một cách định lượng thì cần kết hợp phương pháp thiết kế thủ công dựa trên các mảnh tương đồng về cấu trúc để đảm bảo xảy ra mọi trường hợp có thể có của hợp chất mới. 3.2.4. Kết quả dự đoán khả năng ức chế HDAC2 của các hợp chất acid hydroxamic mới So với 45 hợp chất có khả năng ức chế HDAC2 trong CSDL đã biết, giá trị IC50 dự đoán của các hợp chất mới được lựa chọn cuối cùng Bảng 3.3 nằm trong @ School of Medicine and Pharmacy, VNU 38
  47. khoảng giá trị IC50 của các hợp chất đã biết trong CSDL. Đây là giá trị dự đoán sàng lọc ban đầu trước khi đánh giá dược động học và tổng hợp, do đó các giá trị IC50 dự đoán là phù hợp, không có sự chênh lệch quá lớn khi so với SAHA – một phân tử thuốc đang được sử dụng trong điều trị ung thư . Tác dụng sinh học của một phân tử hợp chất còn phụ thuộc vào khả năng liên kết với đích phân tử, dược động học. Chính vì vậy, đây mới chỉ là bước đầu tìm ra phân tử tốt nhất để tiến hành các đánh giá và thử hoạt tính tiếp theo. @ School of Medicine and Pharmacy, VNU 39
  48. CHƢƠNG 4. KẾT LUẬN VÀ KIẾN NGHỊ KẾT LUẬN Dựa trên cơ sở lý thuyết về cấu trúc hợp chất ức chế HDAC2 để lựa chọn khung cơ sở acid hydroxamic kết hợp sử dụng mô tả mảnh cấu trúc ISIDA, chúng tôi đã rút ra những kết luận sau 1. Xây dựng thành công 3 mô hình toán học QSAR sử dụng kỹ thuật MLR, định lượng mối quan hệ giữa giá trị IC50 trong ức chế hoạt động của enzyme HDAC2 và mảnh cấu trúc ISIDA: M1 M2 M3 2. Cả ba mô hình đều được đánh giá có độ tuyến tính và khả năng dự đoán cao thông qua các thông số thống kê. 3. Ứng dụng mô hình xây dựng được trong thiết kế hợp chất mới có khả năng ức chế HDAC2 và sử dụng chính những mô hình xây dựng được để dự đoán hoạt tính và sàng lọc. Dựa trên mô hình MLR, nghiên cứu đã tìm ra 9 mảnh cấu trúc có liên quan cao nhất tới hoạt tính. Các mảnh cấu trúc này được sắp xếp đảm nhiệm vai trò vùng nhận diện và vùng cầu nối trong cấu trúc acid hydroxamic. Kết quả đã tìm ra được 6 hợp chất có cấu trúc acid hydroxamic mới, chưa từng được công bố trước đó với giá trị IC50 dự đoán không quá cao và đặc biệt, dẫn xuất 4a có giá trị IC50 tương đương SAHA-một thuốc ức chế HDAC đang lưu hành trên thị trường. Như vậy, nghiên cứu đã giúp định hướng một cách nhanh chóng, tập trung được các mảnh cấu trúc đảm nhận vai trò hoạt tính chính, loại bỏ được các dạng cấu trúc làm giảm sự ức chế HDAC2, từ đó giúp hình thành được các khung cấu trúc cho bước thiết kế hợp chất mới hiệu quả, đặc hiệu hơn, góp phần rút ngắn thời gian và chi phí cho điều trị ung thư trúng đích. @ School of Medicine and Pharmacy, VNU 40
  49. KIẾN NGHỊ Để tiếp tục phát triển các kết quả nghiên cứu, chúng tôi đưa ra các kiến nghị sau: 1. Đánh giá ban đầu đặc tính Dược động học thông qua các quy tắc 5 của Lipinski để sàng lọc cơ bản khả năng khuếch tán qua màng sinh học 2. Đánh giá tác động ảo các hợp chất thiết kế mới với đích phân tử HDAC2 bằng phần mềm Docking 3. Nghiên cứu tổng hợp, thử nghiệm đánh giá hoạt tính sinh học ức chế HDAC2 của các hợp chất thiết kế mới trên các mô hình in vitro và in vivo. @ School of Medicine and Pharmacy, VNU 41
  50. TÀI LIỆU THAM KHẢO 1. Nguy n Thị Thúy Hoài et al. (2009), "Thuật giải di truyền và ứng dụng", Tuyển tập Báo cáo Hội nghị Sinh viên nghiên cứu khoa học lần thứ 6, 266-270. 2. Nguy n Hải Nam (2012), Một số mục tiêu phân tử và ứng dụng trong nghiên cứu phát triển thuốc điều trị ung thư hiện nay, Nhà xuất bản Y học, Hà Nội, 103-186. 3. Đào Thị Kim Oanh et al. (2011), "Tổng hợp N1-(benzo[d]thiazo8l-2-yl)-N4- hydroxysuccinamid và dẫn chất hướng ức chế histon deacetylase", Tạp chí Dược học. 51 (4), 47-51. 4. Đào Thị Kim Oanh et al. (2011), "Tổng hợp N1-(benzo[d]thiazol-2-yl)-N6- hydroxyadipamid và dẫn chất hướng ức chế histon deacetylase", Tạp chí Dược học 2011. 51 (7), 55-59. 5. Đào Thị Kim Oanh et al. (2011), "Tổng hợp N1-(benzo[d]thiazol-2-yl)-N8- hydroxyoctandiamid và dẫn chất hướng ức chế histon deacetylase", Tạp chí Dược học. 51 (8), 45-49. 6. A.H. B (2013), "A structure–activity relationship survey of histone deacetylase (HDAC) inhibitors", Chemometrics and Intelligent Laboratory Systems. 125, 132-138. 7. Allfrey VG et al. (1964), "Acetylation and methylation of histones and their possible role in the regulation of RNA synthesis", Natl. Acad. SciUSA. 51 (786- 794). 8. Andrianov V et al. (2008), "Novel amide derivatives as inhibitors of histone deacetylase: Design, synthesis and SAR", European Journal of Medicinal Chemistry. 44 (3), 1067-1085. 9. Bae HJ et al. (2014), "HDAC2 (histone deacetylase 2)", Atlas Genet Cytogenet Oncol Haematol. 18, 594-597. 10. Bernstein B. E et al. (2000), "Genomewide studies of histone deacetylase function in yeast", Proc Natl Acad Sci U S A. 97 (25), 13708-13713. 11. Beumer JH et al. (2010), "Role of histone deacetylases andtheir inhibitors in cancer biology and treatment", Curr. Clin. Pharmacol. 5 (3), 196-208. 12. Castillo-Garit J. A et al. (2008), "Estimation of ADME properties in drug discovery: Predicting Caco-2 cell permeability using atom-based stochastic and non-stochastic linear indices", J. Pharm. Sci. 97, 1946-1976. @ School of Medicine and Pharmacy, VNU
  51. 13. Chaurasia K et al. (2005), "Performance Evaluation and Comparison of Different Noise, apply on PNGImage Format used in Deconvolution Wiener filter (FFT) Algorithm", Evolving Trends in Engineering and Technology. 4, 8-14. 14. D K. et al. (1985), "Method for detecting the 3-hydroxymyristic acid component of the endotoxins of gram-negative bacteria in compost samples", Am Ind Hyg Assoc J. 46 (12), 741-746. 15. De Ruijter A. J et al. (2003), "Histone deacetylases (HDACs): characterization of the classical HDAC family", Biochem J. 370 (3), 737-749. 16. Di Micco S et al. (2013), "Structural basis for the design and synthesis of selective HDAC inhibitors", Bioorganic & Medicinal Chemistry Letters. 21 (13), 3795–3807. 17. Dung D.T.M et al. (2015), "Novel 2-oxoin-3-substitutedindoline-based N- hydroxypropenamides as histone deacetylase inhibitors and antitumor agents", Medicinal Chemistry. 11 (8), 725-735. 18. E.M. de Haas et al. (2011), "Internal and external validation of the long-term QSARs for neutral organics to fish from ECOSAR", SAR and QSAR in Environmental Research. 22, 545–559. 19. Edward et al. (2000), "Histone deacetylase transcriptional control and cancer", Journal of cenlular Physyology. 184 (1), 1-16. 20. F. Provost et al. (1997), Analysis and visualization of classifier performance: comparison under imprecise class and cost distribution, Third International Conference on Knowledge Discovery and Data Mining., Newport Beach, California. 21. Farzin Hadizadeh et al. (2013), "Quantitative Structure-Activity Relationship Studies of 4-Imidazolyl- 1,4-dihydropyridines as Calcium Channel Blockers", Iranian journal of basic medical sciences. 16 (8), 910-916. 22. Fiorella Ruggiu et al. (2015), "ISIDA Fragmentor2015 ", User Manual 23. Fiorella Ruggiu et al. (2010), ISIDA Property-labelled fragment descriptors, 2nd Strasbourg Summer School on Chemoinformatics, VVF Obernai, France. 24. Galasinski S. C et al. (2002), "Phosphatase inhibition leads to histone deacetylases 1 and 2 phosphorylation and disruption of corepressor interactions", J Biol Chem. 277 (22), 19618-19626. 25. H. L. Y. et al. (2014), "Antitumor effects in hepatocarcinoma of isoform- selective inhibition of HDAC2", Cancer Res. 74 (17), 4752-4761. @ School of Medicine and Pharmacy, VNU
  52. 26. ngày truy cập 27. ngày truy cập 28. Johnstone et al. (2002), "Histone-deacetylase inhibitors: novel drugs for the treatment of cancer", Nat Rev Drug Discove. 1 (4), 287-299. 29. Johnstone et al. (2002), "Histone-deacetylase inhibitors: novel drugs for the treatment of cancer", Nat Rev Drug Discove. 1 (4), 287-299. 30. Kamb A. et al. (2007), "Why is cancer drug discovery so difficult?", Nat Rev Drug Discove. 6 (2), 115-120. 31. Kim H.-J et al. (2011), "Histone deacetylase inhibitors: molecular mechanisms of action and clinical trials as anti-cancer drugs", American Journal of Translational Research. 3 (2), 166-179. 32. L. H. T. T. (2015), "Novel 2-oxoindoline-based hydroxamic acids: Synthesis, cytotoxicity and inhibition of histone deacetylation", Tetrahedron Letters Tetrahedron Letters. 56 (16), 6425–6429. 33. Lindsey A et al. (2015), "Global cancer statistics, 2012", CA Cancer J Clin. 65, 87-108. 34. M D. et al. (2005), "Prospects: histone deacetylase inhibitors", J Cell Biochem. 96 (2), 293-304. 35. M. L et al. (2011), "QSAR Models Using a Large Diverse Set of Estrogens", J. Chem. Inf. Comput. Sci. 2001, 186-195. 36. M. Y. (1990), "Structural specificity for biological activity of trichostatin A, a specific inhibitor of ,mammalian cell cycle with potent differentiation – inducing activity in friend leukemia cells", The Journals of Antibiotics. 63 (9), 1101-1106. 37. Marson C. M et al. (2007), "Structure-activity relationships of aryloxyalkanoic acid hydroxyamides as potent inhibitors of histone deacetylase", Bioorg Med Chem Lett. 17 (1), 136-141. 38. Martel C et al. (2012), "Global burden of cancers attributable to infections in 2008: a review and synthetic analysis", The Lancet Oncology. 13 (6), 607-615. 39. McGirt LY et al. (2006), "Successful treatment of recalcitrant chronic idiopathic urticaria with sulfasalazine", Arch Dermatol. 142 (10), 1337–1342. 40. Minucci S et al. (2006), "Histone deacetylase inhibitors and the promise of epigenetic (and more) treatments for cancer", Nat Rev Cancer. 6 (1), 38-51. @ School of Medicine and Pharmacy, VNU
  53. 41. Müller Berit Maria et al. (2013), "Differential expression of histone deacetylases HDAC1, 2 and 3 in human breast cancer - overexpression of HDAC2 and HDAC3 is associated with clinicopathological indicators of disease progression", BMC Cancer. 13, 215-220. 42. N. S. B. H. (2014), HDAC2 histone deacetylase 2, Atlas Genet Cytogenet Oncol Haematol 43. Nicola Chessum et al (2015), "Chapter One - Recent Advances in Cancer Therapeutics", Progress in medicinal chemistry. 54, 1-63. 44. Oanh Dao Thi Kim et al. (2011), "Benzothiazole-containing hydroxamic acids as histone deacetylase inhibitors and antitumor agents", Bioorganic & Medicinal Chemistry Letters. 21 (24), 7509-7512. 45. P C (2011), "Synthesis and Importance of Bulky Aromatic Cap of Novel SAHA Analogs for HDAC Inhibition and Anticancer Activity", Bulletin of the Korean Chemical Society. 32 (6), 1891-1896. 46. Park H et al. (2010), "A Structure-Based Virtual Screening Approach toward the Discovery of Histone Deacetylase Inhibitors: Identification of Promising Zinc-Chelating Groups", Chem. Med. 5 (4), 591-597. 47. Pawan Kaler et al. (2008), "HDAC2 deficiency sensitizes colon cancer cells to TNFα-induced apoptosis through inhibition of NF-κB activity", Experimental Cell Research. 314 (7), 1507–1518. 48. Peppercorn M. A (1984), "Sulfasalazine. Pharmacology, clinical use, toxicity, and related new drug development", Ann Intern Med. 101 (3), 377-386. 49. Pingyuan Wang et al. (2009), "Sulfamides as novel histone deacetylase inhibitors", Bioorganic and Medicinal Chemistry Letters. 17, 1123-1128 50. Price S et al. (2007), "Identification and optimisation of a series of substituted 5-(1H-pyrazol-3-yl)-thiophene-2-hydroxamic acids as potent histone deacetylase (HDAC) inhibitors", Bioorganic & Medicinal Chemistry Letters. 17 (2), 370-375. 51. Roberto et al. (2009), Molecular Descriptors for Chemoinformatics, Vol. 41, 640-45. 52. Ropero et al. (2007), "The role of histone deacetylases (HDACs) in human cancer", Molecular Oncology. 1, 19-25. 53. Ruijter A. J et al. (2003), "Histone deacetylases (HDACs): characterization of the classical HDAC family", Biochem J. 370 (3), 737-749. @ School of Medicine and Pharmacy, VNU
  54. 54. S D. et al. (2009), "Design, synthesis, and evaluation of biphenyl-4-yl- acrylohydroxamic acid derivatives as histone deacetylase (HDAC) inhibitors", Eur J Med Chem, 1-13. 55. Sento E et al. (2007), "Histone deacetylases and cancer", Oncogene. 26, 5420- 5432. 56. Somoza J. R et al. (2004), "Structural snapshots of human HDAC8 provide insights into the class I histone deacetylases", Structure. 12 (7), 1325-1334. 57. Somoza J. R et al. (2004), "Structural snapshots of human HDAC8 provide insights into the class I histone deacetylases", Structure. 12 (7), 1325-1334. 58. T. F. (2013), "Synthesis and biological characterization of spiro[2H-(1,3)- benzoxazine-2,40-piperidine] based histone deacetylase inhibitors", European Journal of Medicinal Chemistry. 64, 273-284. 59. Todeschini R et al. (2000), Handbook of Molecular Descriptors 1st, Vol. 11, Federal Republic of Germany. 60. V Consonni et al. (2009), "Comments on the definition of the Q 2 parameter for QSAR validation", J Chem Inf Model. 48, 1669–1678. 61. Verdin E. (2006), Histone Deacetylases Transcriptional Regulation and Other Cellular Functions, Cancer Drug Discovery and Development. 62. Viviana Consonni et al. (2009), "Comments on the Definition of the Q2 Parameter for QSAR Validation", J. Chem. Inf. Model. 49, 1669–1678. 63. Weichert W (2009), "HDAC expression and clinical prognosis in human malignancies", Cancer Lett. 280 (2), 168-176. 64. WHO (2014), Cancer Country Profiles, Vietnam, . 65. Witt O et al. (2009), "HDAC family: What are the cancer relevant targets", Cancer Lett. 277 (1), 8-21. 66. Yoshiyuki H. et al. (2012), "Anti-tumor activity of new orally bioavailable 2- amino-5-(thiophen-2-yl)benzamide-series histone deacetylase inhibitors, possessing an aqueous soluble functional group as a surface recognition domain", Bioorganic & Medicinal Chemistry Letters. 22 (5), 1926-1930. 67. Zhang L et al. (2015), "Trend of Histone Deacetylase Inhibitors in Cancer Therapy: Isoform Selectivity or Multitargeted Strategy", Medicinal research reviews. 35 (1), 63-84. @ School of Medicine and Pharmacy, VNU