Khóa luận Xây dựng mô hình toán học dự đoán khả năng thẩm thấu qua da dựa trên cấu trúc phân tử

pdf 58 trang thiennha21 18/04/2022 5010
Bạn đang xem 20 trang mẫu của tài liệu "Khóa luận Xây dựng mô hình toán học dự đoán khả năng thẩm thấu qua da dựa trên cấu trúc phân tử", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfkhoa_luan_xay_dung_mo_hinh_toan_hoc_du_doan_kha_nang_tham_th.pdf

Nội dung text: Khóa luận Xây dựng mô hình toán học dự đoán khả năng thẩm thấu qua da dựa trên cấu trúc phân tử

  1. ĐẠI HỌC QUỐC GIA HÀ NỘI KHOA Y DƢỢC Người thực hiện: ĐỖ TRẦN LONG XÂY DỰNG MÔ HÌNH TOÁN HỌC DỰ ĐOÁN KHẢ NĂNG THẨM THẤU QUA DA DỰA TRÊN CẤU TRÚC PHÂN TỬ KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƢỢC HỌC Khóa: QH.2013.Y Người hướng dẫn: TS. LÊ THỊ THU HƢỜNG Hà Nội - 2018
  2. LỜI CẢM ƠN Lời đầu tiên, em xin được gửi lời cảm ơn tới Ban giám đốc Đại học Quốc Gia Hà Nội, các phòng ban đã cho phép em được thực hiện khóa luận tốt nghiệp. Em xin được cảm ơn các thầy giáo, cô giáo khoa Y Dược Đại học Quốc Gia Hà Nội đã truyền đạt cho em những kiến thức, kĩ năng để trở thành một dược sĩ. Bằng cả tấm lòng, em xin gửi lời cảm ơn chân thành tới TS. Lê Thị Thu Hƣờng (Bộ môn Dược liệu – Khoa Y dược Đại học Quốc Gia Hà Nội), người đã dìu dắt em vào con đường nghiên cứu khoa học; đã tận tình chỉ bảo, truyền đạt kinh nghiệm nghiên cứu, kinh nghiệm sống cho em; đã không quản ngại khó khăn, dồn tâm huyết, sức lực để tôi luyện, rèn giũa cho em kĩ năng và đạo đức nghiên cứu dù em còn nhiều thiếu sót, nhiều lần vấp ngã. Cô là tấm gương sáng cho thế hệ học trò chúng em học tập. Cuối cùng, con xin cảm ơn bố mẹ đã sinh thành, nuôi dạy con nên người; cảm ơn mẹ đáng kính đã luôn bên con, ủng hộ con; cảm ơn chị gái và bạn bè đã luôn dõi theo em trên mỗi chặng đường. Em xin chân thành cảm ơn! Hà Nội, ngày 9 tháng 5 năm 2018 Sinh Viên Đỗ Trần Long @ School of Medicine and Pharmacy, VNU
  3. DANH MỤC KÝ HIỆU VIẾT TẮT Tên viết tắt Tên Tiếng Anh Tên Tiếng Việt ANN Artificial Neural Mạng nơ-ron nhân tạo Networks CSDL Cơ sở dữ liệu IVRT In vitro release testing Thử nghiệm giải phóng thuốc in vitro Kow Hệ số phân chia octanol- nước Kp Hệ số thẩm thấu qua da LSEs Living skin equivalent Mô hình tương đương models với da người sống MLR Multiple Linear Phương pháp hồi quy Regression tuyến tính đa biến OD Outside diameter Đường kính ngoài PCA Principal Component Phân tích thành phần Analysis chính PDMS Polydimethylsiloxan Q Q2 Hệ số tương quan chéo 2 Q ext Hệ số xác định cho tập kiểm tra QSAR Quantitative Structure – Tương quan định lượng Activity Relationship cấu trúc – tác dụng R2 Hệ số xác định @ School of Medicine and Pharmacy, VNU
  4. Te Test set Tập kiểm tra Tr Training set Tập huấn luyện TSPT Tham số phân tử @ School of Medicine and Pharmacy, VNU
  5. DANH MỤC HÌNH VẼ Hình 1.1. Thiết bị Franz và chi tiết các bộ phận 2 Hình 1.2. Cấu tạo gồm hai phần chính của thiết bị Franz 3 Hình 2.1. Các bước xây dựng mô hình QSAR 20 Hình 3.1. Miền ứng dụng của mô hình QSAR đối với các chất 26 @ School of Medicine and Pharmacy, VNU
  6. DANH MỤC BẢNG Bảng 1.1. Thuật toán tính hệ số thấm (Kp) được công bố bởi Flynn (1990) 10 Bảng 1.2. Các nghiên cứu về khả năng thẩm thấu qua da của các hợp chất được công bố sau 1990 11 Bảng 2.1. Giá trị log Kp các hợp chất xây dựng mô hình QSAR 18 Bảng 3.1. Thông số thống kê của các mô hình QSAR log Kp 24 @ School of Medicine and Pharmacy, VNU
  7. MỤC LỤC DANH MỤC KÝ HIỆU VIẾT TẮT DANH MỤC HÌNH VẼ DANH MỤC BẢNG ĐẶT VẤN ĐỀ 1 CHƢƠNG 1 - TỔNG QUAN 2 1.1. Thiết bị Franz 2 1.1.1. Vai trò của thiết bị Franz trong thí nghiệm đo khả năng thẩm thấu qua da 2 1.1.2. Cấu tạo của thiết bị Franz 3 1.1.3. Cách hoạt động của thiết bị Franz 4 1.2. Tính thấm qua da 4 1.2.1. Khó khăn khi nghiên cứu khả năng thẩm thấu qua da 4 1.2.2. Các phương pháp đánh giá khả năng thẩm thấu của các chất hóa học qua da 5 1.2.3. Mối quan hệ định lượng cấu trúc-tác dụng (QSAR) và khả năng thẩm thấu qua da 7 1.2.4. Quá trình phát triển của QSAR trong nghiên cứu tính thấm qua da 8 1.3. Tổng quan về mối quan hệ định lượng cấu trúc-tác dụng của hợp chất (QSAR) 11 1.3.1. Khái niệm và nguyên lý chung của QSAR 11 1.3.2. Xây dựng và đánh giá mô hình QSAR 13 CHƢƠNG 2 - NGUYÊN LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU 18 2.1. Nguyên liệu 18 2.1.1. Cơ sở dữ liệu 18 2.1.2. Phần mềm sử dụng 19 2.2. Phương pháp nghiên cứu 19 2.2.1 Tính toán tham số mô tả phân tử 19 2.2.2. Phân chia tập huấn luyện / Tập kiểm tra 20 @ School of Medicine and Pharmacy, VNU
  8. 2.2.3. Xây dựng mô hình QSAR 20 2.2.4. Đánh giá mô hình 22 CHƢƠNG 3 – KẾT QUẢ VÀ BÀN LUẬN 23 3.1. Kết quả 23 3.1.1. Mô hình toán học thu được 23 3.1.2. Đánh giá mô hình 24 3.1.3. Đánh giá mô hình theo 5 tiêu chí của OECD 25 3.2. Bàn luận 27 3.2.1. Về phương pháp 27 3.2.2. Về kết quả của thu được 28 3.2.3. So sánh với các mô hình khác trên thế giới 30 KẾT LUẬN VÀ KIẾN NGHỊ 31 TÀI LIỆU THAM KHẢO 32 @ School of Medicine and Pharmacy, VNU
  9. ĐẶT VẤN ĐỀ Da là cơ quan có diện tích lớn nhất của cơ thể con người (bao phủ 1,5- 2,3m2 diện tích bề mặt và chiếm khoảng 16% trọng lượng cơ thể). Nó có cấu tạo phức tạp nhiều lớp, bao gồm: biểu bì, bì và lớp mỡ dưới da cùng các thành phần phụ (lông, móng, tuyến bã, tuyến mồ hôi) hình thành hệ da. Da người đóng vai trò như một lớp bảo vệ cơ thể khỏi môi trường xung quanh, với chức năng chính là điều chỉnh sự xâm nhập của các chất lạ vào cơ thể. Vai trò là một hàng rào bảo vệ này của da đã thu hút sự quan tâm rất lớn trong giới khoa học vì thông qua đó, các nhà khoa học có thể phát triển nhiều nghiên cứu có tính ứng dụng cao [14]. Khả năng thẩm thấu của các hợp chất qua da đã được khai thác từ khá lâu trước đây, ví dụ như phát triển thuốc bôi ngoài da, miếng dán ngoài da Ngoài ra, tính thấm qua da cũng dự đoán các độc tính có thể có của hoá chất hay mỹ phẩm tiếp xúc với da người. Để hỗ trợ cho việc phát triển các thuốc dùng ngoài da cũng như nghiên cứu độc chất và mỹ phẩm, nhiều mô hình da người đã được đề xuất, trong đó mô hình thiết bị Franz được sử dụng phổ biến nhất. Tuy nhiên mô hình này triển khai không đơn giản, đòi hỏi tốn kém thời gian và chi phí cũng như hoá chất máy móc. Do đó từ hơn một thập kỷ qua, giới khoa học sử dụng công cụ tính toán để dự đoán độ hấp thu qua da của hoá chất. Một trong các cách tiếp cận được khai thác nhiều là sử dụng mô hình liên quan định lượng giữa cấu trúc hoá học với độ thẩm thấu qua da. Các mô hình toán học biểu diễn quan hệ định lượng cấu trúc-tác dụng QSAR (Quantitative structure-activity relationship) là giải pháp ứng dụng hiệu quả để giải quyết vấn đề này. Qua đó, mục tiêu chung của nghiên cứu này là “Xây dựng mô hình toán học dự đoán khả năng thẩm thấu qua da dựa trên cấu trúc phân tử”. Với mục tiêu cụ thể: 1. Xây dựng mô hình QSAR nhằm dự đoán khả năng thẩm thấu qua da thông qua của các hợp chất. 2. Phân tích và đánh giá mô hình tìm được theo 5 tiêu chí của tố chức Hợp tác và Phát triền Kinh tế thế giới (OECD). @ School of Medicine and Pharmacy, VNU 1
  10. CHƢƠNG 1 - TỔNG QUAN 1.1. Thiết bị Franz 1.1.1. Vai trò của thiết bị Franz trong thí nghiệm đo khả năng thẩm thấu qua da Thử nghiệm đo lường sự giải phóng thuốc từ một dạng thuốc được cho là điều cơ bản để phát triển các sản phẩm thuốc. Xác định cụ thể kỹ thuật được sử dụng bởi chính dạng liều lượng và đường phân phối mong muốn của thuốc. Đối với các dạng thuốc rắn, thử nghiệm về độ tan của thuốc đã được sử dụng trong 50 năm qua. Gần đây, đối với sản phẩm thuốc bán rắn, thử nghiệm giải phóng thuốc in vitro (IVRT) là một phương tiện để đánh giá tính giải phóng của thuốc. Tỷ lệ giải phóng in vitro có thể phản ánh hiệu quả kết hợp của một số thông số vật lý và hóa học, bao gồm độ hòa tan và kích thước hạt và các đặc tính lưu biến của dạng liều [18]. Phương pháp IVRT phổ biến nhất sử dụng thiết kế buồng mở như hệ thống thiết bị khuếch tán Franz và có thể được sử dụng với màng tổng hợp, cấu trúc mô hoặc mẫu sinh học, chẳng hạn như da người [18]. Hình 1.1. Thiết bị Franz và chi tiết các bộ phận @ School of Medicine and Pharmacy, VNU 2
  11. 1.1.2. Cấu tạo của thiết bị Franz Thiết bị Franz là các thiết bị giải phóng riêng biệt được làm từ hai phần thủy tinh borosilicate. Phần trên có thể được gọi là nắp thiết bị, đỉnh của thiết bị, buồng cấp, hoặc khoang cấp. Phần dưới thường được gọi là phần thân của thiết bị, hay còn được gọi là buồng thụ thể. Hình 1.2. Cấu tạo gồm hai phần chính của thiết bị Franz Buồng trên hay buồng cấp được nối với buồng dưới hay còn là buồng thụ thể bằng một khớp. Màng ngăn qua đó thẩm thấu hoặc vận chuyển chất được đặt ở giữa khớp và giữ bằng một chiếc kẹp. Các thiết bị có vỏ bọc có thể được nối với nguồn nước để kiểm soát nhiệt độ. Các thiết bị không có vỏ bọc có thể được đặt trong máy sấy khô, bồn nước hoặc môi trường được kiểm soát nhiệt độ nếu cần. Mặc dù các thiết bị có vỏ đắt hơn nhưng lại được sử dụng phổ biến hơn bởi vì chúng có thể dễ dàng kiểm soát nhiệt độ. Các thiết bị Franz thường sử dụng các máy khuấy V-Series. Nhưng nếu chỉ sử dụng một thiết bị Franz đơn lẻ trong thí nghiệm in vitro thì cũng có thể sử dụng máy khuấy thí nghiệm thông thường. Tay lấy mẫu, ống dẫn, ống thoát nước nóng, và lưu lượng được tùy chỉnh của các thiết bị Franz tiêu chuẩn được làm từ ống OD 6mm có độ dày thành 1,0mm. Dung sai của ống được nhà sản xuất ống đưa ra, đường kính bên trong của ống là khoảng 4mm. Các xi lanh với có kích thước kim tiêm @ School of Medicine and Pharmacy, VNU 3
  12. OD 2mm có thể dễ dàng được sử dụng để lấy mẫu thiết bị Franz. Lượng lấy mẫu tiêu chuẩn của thiết bị Franz hiện chưa có quy chuẩn rõ ràng nên được lấy một lượng càng nhỏ càng tốt [14]. 1.1.3. Cách hoạt động của thiết bị Franz Các sản phẩm được thử nghiệm được đặt ở buồng cấp. Màng ngăn tách buồng cấp chứa mẫu thử nghiệm với buồng thụ thể chứa đầy các chất trung gian. Muối Phosphate Buffered Saline (PBS) thường được lựa chọn đầu tiên làm chất trung gian, mặc dù nó có thể không khả thi khi sử dụng trong một số trường hợp [18]. Sự thẩm thấu của thuốc bán rắn qua màng được theo dõi bằng cách lấy mẫu từ buồng thụ thể theo thời gian và kiểm tra. Tại các thời điểm xác định trước, một lượng chất trung gian được lấy ra từ buồng thụ thể để phân tích, thường là bằng HPLC. Chất trung gian sẽ được bù vào với mỗi lần lấy mẫu như vậy. Buồng dưới chứa chất lỏng từ đó các mẫu được lấy theo các khoảng thời gian đều đặn để phân tích. Thử nghiệm này nhằm xác định lượng thẩm thấu qua màng tại mỗi thời điểm. Buồng được duy trì ở nhiệt độ không đổi 37oC. Tùy thuộc vào phương tiện, khả năng thấm của từng chất nhất định được xác định thông qua phân tích thiết bị Franz có thể thay đổi đáng kể (có lẽ từ 10 đến 50 lần). Kết quả thử nghiệm trên thiết bị Franz không nhất thiết phải dự đoán hiệu quả của một cấu trúc; mà có thể là xác định liệu cấu trúc đó có tác nhân hoạt động qua da hay không [24]. 1.2. Tính thấm qua da 1.2.1. Khó khăn khi nghiên cứu khả năng thẩm thấu qua da Rào cản chính đối với khả năng thẩm thấu qua da là lớp sừng, và sự xâm nhập của một hợp chất được xác định chủ yếu bởi cấu trúc hóa học của nó. Ngoài ra có nhiều yếu tố khác đóng vai trò trong việc ảnh hưởng đến sự thẩm thấu qua da bao gồm (i) cách sử dụng hoặc tiếp xúc với các hợp chất trên bề mặt da, (ii) các cách thức làm thay đổi tính chất rào cản của tầng lớp sừng, (iii) quy trình xảy ra trong các mô, (iv) các yếu tố sinh học. Lớp sừng nằm trên bề mặt ngoài của da, là một lớp tế bào chết chứa đầy keratin được bao quanh bởi một hệ thống ngoại bào giàu lipid. Trong cơ thể người, nó bao gồm 10 và 25 lớp tế bào chết, kéo dài, các tế bào sừng ở trong một hệ thống @ School of Medicine and Pharmacy, VNU 4
  13. lipid kép. Lớp sừng chỉ dày 7–16 µm ở hầu hết các vùng của cơ thể nhưng dày 400–600 µm ở lòng bàn tay và bàn chân. Tầng lớp sừng bao gồm 40% protein trong đó 80% là keratin. Chủng loại và lượng lipid có trong lớp sừng phụ thuộc vào từng vùng của cơ thể có thể làm ảnh hưởng lớn đến tính thấm qua da [13]. Nhiều nỗ lực đã được thực hiện để phát triển các phương pháp tiếp cận thực nghiệm đo lường sự hấp thu qua da. Hầu hết các dữ liệu hiện nay đã thu được bằng các thí nghiệm in vitro, trong khi dữ liệu in vivo thu được bằng các xét nghiệm sinh học .Về tỷ lệ chuyển hóa qua da của các loại thuốc khác nhau thì thường được nghiên cứu nhiều nhất bằng cách tiến hành các thí nghiệm trong in vitro, đơn giản hơn nhiều so với các phép đo trên lâm sàng. Mức độ thẩm thấu có thể được đo bằng : i. Sự chuyển hóa thuốc trong động vật hoặc người thử nghiệm. ii. Sử dụng da được cắt bỏ từ người hoặc động vật. iii. Sử dụng mô hình màng tổng hợp trong thí nghiệm in vitro. Da người có từ nhiều nguồn khác nhau như từ phẫu thuật thẩm mỹ và phẩu thuật cắt bớt, đã được sử dụng trong thí nghiệm in vitro. Da từ các loài động vật bao gồm lợn, chuột, lợn, rắn, thỏ và các loài khác được lựa chọn thay thế phù hợp cho da người. Trong số các loại, da của lợn và chuột thường được sử dụng phổ biến nhất vì có nhiều điểm chung với da người. Mặc dù da động vật cho thấy sự thẩm thấu các hóa chất trong nghiên cứu rất tốt, nhưng nó không có sự phức tạp như lớp sừng ở da người. 1.2.2. Các phương pháp đánh giá khả năng thẩm thấu của các chất hóa học qua da Các phương pháp ex vivo và in vitro để thử nghiệm tính thẩm thấu của da được thiết lập và công bố rộng rãi [2, 3]. Chúng được sử dụng phổ biến trong nhiều lĩnh vực nghiên cứu. Da người từ nhiều nguồn khác nhau, bao gồm phẫu thuật thẩm mỹ và phẩu thuật cắt bỏ đã được sử dụng để đánh giá ex vivo về khả năng thẩm thấu qua da [2, 3, 8]. Việc sử dụng các loại da động vật khác nhau cũng là một thành phần được chấp nhận phổ biến trong các nghiên cứu thẩm thấu qua da trong thí nghiệm in vitro. Da từ các loài động vật bao @ School of Medicine and Pharmacy, VNU 5
  14. gồm lợn, chuột, khỉ, rắn và những loài khác đã được coi như là một sự thay thế thích hợp cho da người [1, 4]. Trong đó, da từ lợn và chuột thường được sử dụng rộng rãi nhất, vì chúng có các rào cản tương tự để thẩm thấu các phân tử gần giống với da người [1, 4, 17]. Mặc dù da động vật có thể cung cấp các đặc tính rào cản và tạo ra các đặc điểm thẩm thấu tương tự như da người, nhưng chúng không thể mang đầy đủ tính chất phức tạp của da người nói chung, và đặc tính rào cản của lớp sừng nói riêng. Vì vậy, một số nhà nghiên cứu đã nỗ lực phát triển da nhân tạo có đặc điểm tương đương với da người để giảm bớt các vấn đề như vậy. Một số loại da nhân tạo đã được sử dụng thành công trong cấy ghép da và trong điều trị phẫu thuật bỏng [21]. Da nhân tạo có các vùng ưa nước và kỵ nước và do đó mang đầy đủ các đặc điểm của lớp sừng trên da người. Các mô hình tương đương với da người (LSEs) cũng được sử dụng để đánh giá khả năng thẩm thấu qua da. Chúng bao gồm các màng da như: biểu bì tái tạo được phát triển trong nuôi cấy mô và được sử dụng làm phương pháp thay thế cho các mô động vật. Nói chung, các mô này yếu hơn và có ít hơn đáng kể các rào cản như ở da người khi chúng được xây dựng với hàm lượng Ceramide 1 và 3 thấp hơn bình thường ở da người. Một số nhà nghiên cứu đã chỉ ra rằng chúng có thể cung cấp các đặc điểm thẩm thấu tương tự cho da người nhưng trong nhiều trường hợp, chúng vượt quá mức ước lượng thấm qua da [10, 11, 22, 28]. Khi không có da người hoặc da động vật, hoặc khi thực hiện thí nghiệm với một số lượng lớn, đặc biệt là đối với các thí nghiệm sàng lọc, màng tổng hợp thường được sử dụng thay thế. Các màng nhân tạo hay được sử dụng nhất là polydimethylsiloxan (PDMS) và cellulose axetat. Màng PDMS là rào cản đồng nhất đã được chứng minh giống với các đặc tính rào cản của lớp sừng và đã sử dụng phổ biến trong các thí nghiệm [5, 36]. Màng cellulose acetate cũng được sử dụng tương tự trong các thí nghiệm để mô phỏng tính thẩm thấu của tế bào. Cấu trúc xốp của nó được so sánh như các đường nước và nang trong da mà qua đó các phân tử có thể thẩm thấu [7]. Tuy nhiên, các màng này đã được chứng minh thường làm tăng đáng kể khả năng thẩm thấu của các chất nên việc sử dụng chúng đã bị giới hạn. Có rất nhiều các cách thức thử nghiệm @ School of Medicine and Pharmacy, VNU 6
  15. tính rào cản để xác định khả năng thẩm thấu qua da. Để đánh giá mối quan hệ giữa các phương pháp khác nhau, khả năng thẩm thấu tương đối thông qua các màng của cùng một hợp chất sẽ được so sánh. Trong thực tế, có ít dữ liệu so sánh cho mục đích này tồn tại. Để phá vỡ vấn đề này, mối quan hệ định lượng giữa cấu trúc-tác dụng dựa trên các dữ liệu có thể được mang ra so sánh. Các mối quan hệ định lượng cấu trúc-tác dụng (QSARs) thống kê khả năng thẩm thấu qua da của một loạt các hóa chất ngoại sinh với các thông số hóa lý đã biết khi được xác định bằng thực nghiệm. Tuy nhiên, có một số phản đối do những hạn chế của việc phát triển mô hình thống kê, một số thống kê khi xây dựng cần được cân nhắc [25]. 1.2.3. Mối quan hệ định lượng cấu trúc-tác dụng (QSAR) và khả năng thẩm thấu qua da Mô hình QSAR thống kê sự liên hệ giữa hoạt tính sinh học của một loạt các hợp chất với tính chất hóa lý và hoặc cấu trúc của chúng [20]. Như vậy, nó cung cấp các mô hình tiên đoán để ước tính hoạt động sinh học được nghiên cứu. Trải dài hơn một thế kỷ, phần lớn công việc trong lĩnh vực này đã tập trung chủ yếu vào việc tối ưu hóa hoạt động của thuốc và dự đoán độc tính. Với mục đích của luận văn này để nghiên cứu dự đoán khả năng thẩm thấu qua da của các chất [25]. Khả năng thẩm thấu của một hợp chất qua da được xác định bằng nhiều phương pháp. Trong đó, đầu tiên có định luật Fick bao gồm lưu lượng và hệ số thấm như sau [25]: J: Lưu lượng thẩm thấu Dm: Hệ số khuyếch tán Kp: Hệ số thẩm thấu ∆Cm: Chênh lệch nồng độ giữa 2 bên của màng t: Độ dày của màng @ School of Medicine and Pharmacy, VNU 7
  16. 1.2.4. Quá trình phát triển của QSAR trong nghiên cứu tính thấm qua da.  Trước 1990: Những nghiên cứu liên quan đến tính thấm của các hợp chất qua da đối với tính chất hóa lý của chúng đã được thực hiện trong ít nhất ba mươi năm. Tuy nhiên, đặc biệt trong các nghiên cứu trước đây, hiếm khi các mô hình dự báo định lượng (tức là QSPR) được thực hiện. Phần lớn các nghiên cứu dựa trên việc phân tích các chuỗi phân tử tương đồng hoặc có liên quan chặt chẽ. Thông thường chỉ có một số lượng nhỏ các hợp chất được đánh giá. Nhiều nghiên cứu trong số này cho thấy mối quan hệ tuyến tính với khả năng kỵ nước, tức là tăng tính kỵ nước có liên quan đến việc tăng cường độ thẩm thấu của da [31, 32]. Một số nghiên cứu thì cho thấy mối quan hệ dạng parabol của độ thẩm thấu qua da với tính kỵ nước, đặc biệt là khi lựa chọn các hợp chất bao gồm những chất có tính kỵ nước cao [32]. Qua những nghiên cứu này, cho thấy rằng có thể áp dụng được các mô hình QSAR cho độ thẩm thấu qua da, mỗi mô hình được thiết lập riêng cho một nhóm chất hóa học cụ thể, hoặc một loạt các hợp chất.  Tập dữ liệu Flynn (1990) và các phân tích QSAR sau đó: Nỗ lực để phát triển cách tiếp cận mô hình QSAR toàn diện hơn và phổ biến hơn về dự đoán khả năng thẩm thấu qua da được tạo điều kiện thuận lợi nhờ công bố bởi Flynn vào năm 1990 của 97 hệ số thấm cho 95 hợp chất bằng thí nghiệm in vitro qua da người. Nó cung cấp một cơ sở dữ liệu lớn đầu tiên và là lớn nhất cho đến gần đây. Tại thời điểm này, cần lưu ý rằng trong khi các dữ liệu này được đo bằng cách sử dụng da người trong thí nghiệm in vitro, kho dữ liệu này được biên tập từ 15 nguồn tài liệu khác nhau. Do đó, không thể tránh khỏi rằng những dữ liệu này chứa rủi ro sai lệch giữa các thử nghiệm là cao, do sự biến đổi giữa các phòng thí nghiệm, đặc biệt là sự biến đổi phát sinh từ việc sử dụng da từ các nguồn khác nhau và vị trí của phần da đó trên cơ thể. Về phát triển QSAR cho dự đoán tính thấm của da, cơ sở dữ liệu của Flynn là một mốc quan trọng [25]. Trong nghiên cứu ban đầu của Flynn (1990) một số thuật toán để dự đoán khả năng thẩm thấu qua da được đề xuất [6]. Cách tiếp cận được thực @ School of Medicine and Pharmacy, VNU 8
  17. hiện dựa trên nguyên lý tính thấm của da phần lớn do chức năng phân vùng giữa các lớp nước và không chứa nước, và do đó nó có thể được mô tả bởi hệ số phân chia octanol-nước (Kow) và cũng bị ảnh hưởng bởi kích thước phân tử. Flynn đã trình bày một cách tiếp cận đơn giản với các thuật toán cho những hợp chất có trọng lượng phân tử thấp và cao. Các thuật toán chỉ đơn giản chỉ ra rằng các hợp chất rất ưa nước và kỵ nước có độ thẩm thấu da thấp và cao tương ứng, và log Kow khác nhau phụ thuộc vào mô hình QSAR có thể được sử dụng để dự đoán tính thấm của da đối với các hợp chất có trọng lượng phân tử cao và thấp. Không có biện pháp thống kê phù hợp nào được cung cấp tại thời điểm này [6, 25]. @ School of Medicine and Pharmacy, VNU 9
  18. Bảng 1.1. Thuật toán tính hệ số thấm (Kp) được công bố bởi Flynn (1990) Các hợp chất có trọng Các hợp chất có trọng lượng phân tử thấp lượng phân tử cao (>150 ( 3 Log Kp = -0,5 Log Kow > 3,5 Log Kp = -1,5 Các dữ liệu được công bố bởi Flynn (1990) đã được phân tích sau đó bởi rất nhiều nhà nghiên cứu được trình bày trong bảng 1.2 [6, 25, 27]. Potts and Guy (1992) đã chứng minh việc sử dụng log Kow kết hợp với trọng lượng phân tử (MW) hoặc thể tích phân tử để dự đoán độ thấm của da và so sánh với Flynn (1990). Đối với 93 hợp chất, công thức sau được công bố [25, 27]: Log Kp = 0.71 log Kow – 0.0061 MW – 6.3 (n = 93; r2 = 0.67; s : không công bố; F : không công bố) Trong đó: n là số quan sát r là hệ số tương quan s là sai số chuẩn của ước tính F là số liệu thống kê của Fisher @ School of Medicine and Pharmacy, VNU 10
  19. Bảng 1.2. Các nghiên cứu về khả năng thẩm thấu qua da của các hợp chất được công bố sau 1990 Tên tác giả Số chất R2 Mô hình Potts và Guy 93 0,67 Tuyến tính Pugh và Hadgraft 24 0,935 Tuyến tính Lien và Gao 22 0,96 Tuyến tính Barratt 60 0,90 Tuyến tính Potts và Guy 37 0,94 Tuyến tính Abraham 46 0,96 Tuyến tính Hostynek and Magee 20 0,80 Tuyến tính Roy và cộng sự 60 0,64 Tuyến tính Abraham và cộng sự 53 0,96 Tuyến tính Gute và cộng sự 60 0,67 Tuyến tính Minghetti và cộng sự 14 0,749 Tuyến tính Dearden và cộng sự 91 0,83 Tuyến tính Poulin và Krishnan 47 0,95 Mô hình dựa trên Kp Ghafourian và Fooladi 39 0,94 Tuyến tính Gonzalez và Helguera 38 0,92 Tuyến tính Pannier và cộng sự 37 0,97 Lôgic mờ Pannier và cộng sự 54 0,95 Lôgic mờ Degim và cộng sự 38 0,997 ANN Moody và MacPherson 65 0,89 Tuyến tính Majumdar và cộng sự 62 0,934 Tuyến tính 1.3. Tổng quan về mối quan hệ định lƣợng cấu trúc-tác dụng của hợp chất (QSAR) 1.3.1. Khái niệm và nguyên lý chung của QSAR QSAR là một hàm số biểu thị mối quan hệ định lượng giữa cấu trúc phân tử và hoạt tính sinh học hoặc hóa học của hợp chất có dạng tổng quát như sau: @ School of Medicine and Pharmacy, VNU 11
  20. Y = f1(x1) + f2(x2) + + fn(xn) Trong đó, Y là biến đáp ứng sinh học hoặc hóa học thường thu được từ thực nghiệm và thể hiện bằng giá trị log Kp với Kp là hệ số thẩm thấu qua da. Các biến x1, x2, xn là các đại lượng được sử dụng để mô tả cấu trúc phân tử hợp chất gọi là các tham số phân tử (molecular descriptors). Đến nay đã có hàng ngàn tham số phân tử (TSPT) được sử dụng trong nghiên cứu xây dựng mô hình QSAR. Các TSPT này thu được bằng thực nghiệm hoặc tính toán bằng lý thuyết bởi các phần mềm chuyên dụng như Dapt, Dragon, Padell, MOE, Hyperchem. Các mô hình QSAR được xây dựng trên nguyên lý cơ bản là cấu trúc của mỗi phân tử chứa các yếu tố quyết định đặc tính sinh học, vật lý, hóa lý của nó; do đó, các hợp chất có cấu trúc giống nhau thường có hoạt tính tương tự nhau [26]. Từ năm 1868, Crum-Brown và Fraser đã đưa ra nhận định tác dụng sinh học là hàm số của cấu trúc hóa học:  f (C) Đến năm 1893, Richet đã rằng sự khác nhau về tác dụng sinh học là do sự thay đổi về tính chất hóa học hay lý hóa [33]:  f ( C) Đây là hai tư tưởng nền tảng để thiết lập các mô hình QSAR sau này. Năm 1900, Meyer và Overton tìm ra mối quan hệ tuyến tính giữa mức độ thân dầu và hoạt tính của thuốc gây mê [29]. Và đến năm 1935, phương trình Hammett ra đời, được coi là phương trình đầu tiên biểu diễn mối quan hệ định lượng hoạt tính-cấu trúc [29]: Log  Với K, Ko là hằng số acid,  là hằng số Hammett (thông số hóa lý đặc trưng cho khả năng hút hoặc đấy điện tử của nhóm thế). @ School of Medicine and Pharmacy, VNU 12
  21. Từ những năm 60 của thế kỉ XX, mô hình QSAR thực sự được nghiên cứu bởi Corwin Herman Hansch. Mô hình QSAR Hansch là phương trình hồi quy nhiều tham số biểu thị mối quan hệ giữa hoạt tính sinh học và các thông số hóa lý: 2 Log (1/C) = -k1 + k2 + k3  +k4 Es + k5 Trong đó: C biểu thị đáp ứng sinh học; là hằng số thế kỵ nước;  là hằng số thế Hammett; Es là hằng số thế Taft và k1, k2, k3, k4, k5 là các hệ số phân tích hồi quy Từ đó đến nay, số lượng nghiên cứu về xây dựng các mô hình QSAR được công bố tăng đột biến và các phương pháp xây dựng, ứng dụng mô hình QSAR ngày càng đa dạng. 1.3.2. Xây dựng và đánh giá mô hình QSAR Mô hình QSAR được xây dựng và đánh giá gồm 5 bước như sau: Bước 1: Chuẩn bị cơ sở dữ liệu Cơ sở dữ liệu (CSDL) để xây dựng các mô hình QSAR thường là hoạt tính, độc tính, đặc tính dược động học của các hợp chất được công bố trong các nghiên cứu khoa học tạo thành dữ liệu toàn cầu (global database). CSDL cho một mô hình QSAR cụ thể sẽ bao gồm cấu trúc phân tử của dãy chất và hoạt tính của chúng, thường gặp nhất là hoạt tính thu được bằng thực nghiệm in vitro [15]. CSDL ban đầu được chia thành tập huấn luyện (training set) và tập kiểm nghiệm (test set). Tập huấn luyện chiếm khoảng 80-90% CSDL ban đầu và được sử dụng để xây dựng mô hình QSAR [19]. Tập kiểm nghiệm được sử dụng để đánh giá mô hình. Bước 2: Tính toán tham số phân tử Cấu trúc phân tử hợp chất được vẽ bằng các phần mềm như Chemdraw, hoặc bằng chức năng tích hợp trong các phần mềm xây dựng mô hình QSAR chuyên dụng. Từ các cấu trúc này, tham số phân tử (TSPT) mô tả thông tin cấu trúc 1D, 2D, 3D của hợp chất được tính toán bằng phần mềm máy tính. @ School of Medicine and Pharmacy, VNU 13
  22. Một số phần mềm thường được sử dụng để tính toán các TSPT hiện nay là Dragon, Padell, MOE, Hyperchem, Cùng với sự phát triển của QSAR, ngày càng nhiều nhóm TSPT được tính toán để mô tả chi tiết, chính xác hơn cấu trúc của hợp chất. Phiên bản cập nhật Dragon 7.0 (2017) có thể tính toán được đến 5270 TSPT. Các TSPT có thể được phân loại thành 3 nhóm như sau: Tham số phân tử 1D: Những TSPT có thể thu được từ công thức tổng quát của hợp chất (khối lượng phân tử, số nhóm thế, số nguyên tử C hoặc là những TSPT tính toán từ sự tổng hợp các nguyên tử thành phần như chỉ số khúc xạ, độ phân cực. Trong đó hệ số phân bố n-octal/nước là tham số thường sử dụng để đánh giá sinh khả dụng, khả năng thấm qua màng tế bào của hợp chất. Tham số phân tử 2D: Những TSPT để mô tả hình dạng, trật tự liên kết của các nguyên tử trong cấu trúc của hợp chất. Ví dụ số liên kết - , số vòng thơm, số liên kết H. Tham số phân tử 3D: Những TSPT mô tả cấu trúc không gian hợp chất, được xác định bằng hệ trục tọa độ nguyên tử thành phần, bao gồm các TSPT như mô men lưỡng cực (dipole moment), diện tích bề mặt cực (polar surface area), thể tích van der Waals Bước 3: Xử lí số liệu Để xây dựng được một mô hình QSAR một cách thuận tiện và đảm bảo tính tin cậy, dữ liệu ban đầu cần được xử lí sơ bộ. Công việc này có thể bao gồm loại bỏ các giá trị nằm ngoài (outlier), chuẩn hóa đơn vị, chuyển đổi hàm thức (logarit hóa, mũ hóa, nghịch đảo, ). Những công việc này giúp loại bỏ các TSPT gây nhiễu khi xây dựng mô hình. Bước 4: Xây dựng mô hình QSAR Ngày nay, nhiều phương pháp xây dựng mô hình QSAR được phát triển và ứng dụng phổ biến. Tuy nhiên, không có phương pháp nào được coi là hiệu quả nhất. Một phương pháp có thể phù hợp để xây dựng mô hình QSAR này nhưng có thể sẽ không hiệu quả khi xây dựng các mô hình QSAR @ School of Medicine and Pharmacy, VNU 14
  23. khác vì mỗi CSDL, mỗi mối quan hệ cấu trúc-hoạt tính sẽ có sự phụ thuộc khác nhau giữa biến TSPT và biến đáp ứng [15]. Có hai dạng mô hình QSAR chính: một là mô hình QSAR định lượng, biến đầu ra là biến liên tục; hai là mô hình QSAR định tính, biến đầu ra là giá trị nhị phân có hoặc không, âm tính hoặc dương tính (còn gọi là mô hình QSAR phân loại). Đối với dạng thứ nhất, các phương pháp xây dựng mô hình thường áp dụng là hồi quy đa biến tuyến tính - Multiple Linear Regression (MLR), bình phương tối thiểu từng phần - Partial Least Squares (PLS), phân tích thành phần chính - Principal Component Analysis (PCA). Các phương pháp thường dùng để xây dựng mô hình QSAR phân loại là mạng nơ-ron nhân tạo - Artificial Neural Networks (ANN), phân tích cụm (Cluster Analysis), thuật toán k láng giềng gần nhất (k-nearest neighbors algorithm). Các phương pháp này có thể có nguyên tắc lựa chọn biến giống hoặc khác nhau tuy nhiên đều nhằm mục đích chung là TSPT nào có ảnh hưởng nhiều nhất đến hoạt tính của phân tử sẽ được ưu tiên đưa vào mô hình trước; nhờ đó, giá trị biến đáp ứng dự đoán được sẽ gần với giá trị thực nghiệm nhất. Bước 5: Đánh giá mô hình QSAR Đánh giá mô hình là giai đoạn quan trọng liên quan đến khả năng ứng dụng của mô hình. Đánh giá mô hình thường sử dụng 5 nguyên tắc của OECD [23]. Nguyên tắc 1: Có đích xác định (defined end-points). Đích là những giá trị thực nghiệm về hoạt tính sinh học thu được từ CSDL. Nếu toàn bộ CSDL đều sử dụng một protocol để xác định giá trị của đích, thì mô hình xây dựng được có độ tin cậy cao, có thể dùng để dự đoán hoạt tính các hợp chất mới (nếu thực nghiệm dùng theo quy trình này). Còn nếu CSDL sử dụng nhiều protocol khác nhau thì mô hình sẽ không có độ tin cậy cao. @ School of Medicine and Pharmacy, VNU 15
  24. Nguyên tắc 2: Các thuật toán sử dụng được mô tả rõ ràng. Các thuật toán sử dụng để xây dựng mô hình cần được mô tả rõ ràng, có khả năng ứng dụng để xây dựng các mô hình khác. Nguyên tắc 3: Có miền cấu trúc ứng dụng xác định. Miền cấu trúc ứng dụng là khoảng không gian cấu trúc được xác định bởi các hợp chất trong tập huấn luyện để xây dựng mô hình. Những hợp chất thuộc tập huấn luyện nếu có cấu trúc nằm ngoài miền cấu trúc ứng dụng sẽ ảnh hưởng đến độ chính xác của mô hình. Những hợp chất thuộc tập dự đoán, nếu có cấu trúc nằm ngoài miền này sẽ cho kết quả dự đoán không chính xác. Các phương pháp xác định miền ứng dụng thường gặp như: phương pháp đòn bẩy, phương pháp ba lân cận gần nhất, Nguyên tắc 4: Có độ khớp, độ ổn định, và khả năng dự đoán tốt. Độ khớp hay độ tuyến tính được đánh giá thông qua giá hệ số xác định R2, R2 càng cao thì mức độ khớp (tuyến tính) của mô hình với các giá trị thực nghiệm càng tốt. R2> 0,6 thì mô hình mới có ý nghĩa. Công thức tính hệ số xác định như sau: ^ ∑ y y 2 i i R = 1- ∑ (yi y) ^ Trong đó n là số các quan sát của tập huấn luyện; yi, y i , lần lượt là giá trị thực tế, giá trị dự đoán của biến phụ thuộc ở quan sát thứ i; là giá trị thực y tế trung bình của biến phụ thuộc. Độ ổn định được đánh giá thông qua hệ số tương quan chéo Q2, Q2 được đánh giá dựa trên phương pháp tham số chéo (cross validation leave one out) bằng cách lần lượt loại một quan sát ra khỏi tập huấn luyện, giữ nguyên các biến đã lựa chọn và tính toán lại các thông số của mô hình. Q2 càng gần 1, tính tổng quát hóa của mô hình càng cao, mô hình càng ổn định. Thông thường, yêu cầu Q2 > 0,5 thì mô hình mới bền vững. Công thức hệ số tương quan chéo tính như sau: @ School of Medicine and Pharmacy, VNU 16
  25. ^ ∑ y y 2 i i /i Q = 1 - ∑ (yi y) Trong đó n là số các quan sát tập huấn luyện; yi, là giá trị thực tế của ^ quan sát thứ i; yi /i giá trị dự đoán của biến phụ thuộc ở quan sát thứ i sử dụng mô hình đã loại biến i; y là giá trị thực tế trung bình của biến phụ thuộc. 2 2 Khả năng dự đoán ngoại được đánh giá thông qua giá trị Q ext, Q ext càng lớn mô hình càng cho thấy độ tuyến tính của tập kiểm tra và do vậy chứng tỏ khả năng dự đoán của mô hình cao. ^ ∑ yi yi 2 Qext = 1 - ∑ ^ Trong đó n là số các quan sát tập kiểm tra; yi, y , lần lượt là giá trị thực tế, giá trị dự đoán của biến phụ thuộc ở quan sát thứ i; y là giá trị thực tế trung bình của biến phụ thuộc. Nguyên tắc 5: Giải thích được cơ chế (nếu có thể). Mô hình cần được giải thích về vai trò của các biến trong mô hình, qua đó giúp định hướng thiết kế các hợp chất mới. Tuy nhiên việc giải thích các biến này nhiều khi gặp phải khó khăn vì cơ chế của chúng phức tạp đòi hỏi những hiểu biết chuyên sâu về hóa lượng tử. Bên cạnh đó có nhiều biến chưa có các tài liệu tham khảo, do đó chưa đủ cơ sở để giải thích. @ School of Medicine and Pharmacy, VNU 17
  26. CHƢƠNG 2 - NGUYÊN LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU 2.1. Nguyên liệu 2.1.1. Cơ sở dữ liệu Cơ sở dữ liệu (CSDL): gồm 93 hợp chất lựa chọn từ dữ liệu trên các bài báo đã được công bố [6, 9, 12, 16, 27, 30]. Bảng 2.1. Giá trị log Kp các hợp chất xây dựng mô hình QSAR Log K Log K LogK Log K STT p STT p STT p STT p (cm/h) (cm/h) (cm/h) (cm/h) 1 -4,544 25 -4,886 49 -1,226 73 -2,444 2 -2,203 26 -2,661 50 -1,229 74 -4,576 3 -3,453 27 -1,957 51 -2,068 75 -3,678 4 -1,754 28 -1,967 52 -1,457 76 -3,745 5 -2,186 29 -2,480 53 -3,264 77 -3,268 6 -1,964 30 -1,500 54 -1,440 78 -4,174 7 -2,367 31 -2,844 55 -1,290 79 -3,201 8 -2,079 32 -3,138 56 -1,480 80 -2,770 9 -2,093 33 -3,300 57 -1,260 81 -3,208 10 -3,417 34 -1,222 58 -1,785 82 -3,469 11 -4,410 35 -1,099 59 -2,031 83 -4,585 12 -3,995 36 -2,574 60 -2,238 84 -3,041 13 -3,910 37 -1,222 61 -3,349 85 -3,051 14 -1,770 38 -1,727 62 -4,398 86 -5,185 15 -2,223 39 -2,222 63 -2,347 87 -3,347 16 -1,987 40 -1,882 64 -1,796 88 -2,953 17 -2,140 41 -1,546 65 -3,222 89 -3,620 18 -4,379 42 -1,221 66 -4,149 90 -2,496 19 -1,426 43 -1,442 67 -2,824 91 -2,678 20 -2,461 44 -2,249 68 -3,347 92 -3,180 21 -2,222 45 -1,757 69 -2,821 93 -2,444 22 -4,301 46 -1,548 70 -4,125 23 -3,886 47 -1,804 71 -3,742 24 -5,623 48 -1,444 72 -3,222 @ School of Medicine and Pharmacy, VNU 18
  27. 2.1.2. Phần mềm sử dụng - Phần mềm vẽ cấu trúc hóa học: Marvin Sketch 17.27, ChemDraw Pro 8.0 - Phần mềm tính toán TSPT: Dragon 6.0. - Phần mềm xây dựng mô hình QSAR: MobyDigs Professional 1.1. - Phần mềm xử lý số liệu: SPSS 22.0, Excel 2010. 2.2. Phƣơng pháp nghiên cứu 2.2.1 Tính toán tham số mô tả phân tử Tham số mô tả phân tử là kết quả của một quá trình toán học và logic chuyển đổi thông tin được mã hóa trong cấu trúc hóa học thành một số có khả năng đặc trưng cho phân tử đấy. Để thực hiện tính toán, tất cả các cấu trúc của CSDL được chuyển đổi thành hệ thống đơn giản hóa với đầu vào được biểu diễn dưới dạng dòng SMILES (Simplified Molecular Input Line Entry System) bằng việc sử dụng phần mềm ChemDraw Pro 8.0. Căn cứ vào các mã code, 3764 mô tả phân tử thuộc họ 0D, 1D và 2D được tính toán bằng phần mềm Dragon phiên bản 6.0 [35]. Tham số mô tả phân tử là một số thu được từ một quá trình toán học và lôgic chuyển đổi thông tin được mã hóa trong cấu trúc hóa học [35]. Trong nghiên cứu này, các tham số được tính toán sử dụng phần mềm Dragon [35]. Dragon là một phần mềm được phát triển bởi công ty Talete của Italia vào năm 1993, được sử dụng rất rộng rãi hiện nay trong các nghiên cứu hóa tin và thiết kế thuốc. Dragon tính toán được hơn 5000 TSPT khác nhau . Các mô tả phân tử thường được phân loại dựa vào chiều thông tin mô tả cấu trúc. (i) Tham số 0D mô tả thành phần cấu tạo nên cấu trúc, còn được gọi là các tham số đếm nguyên tử, như số lượng C, N (ii) Tham số 1D mô tả cấu trúc dưới dạng chuỗi, như vân tay cấu trúc (fingerprint), hay số lượng các mảnh cấu trúc, như số lượng nhân thơm, nhóm carboxylic (iii) Tham số 2D mô tả cấu trúc dưới dạng hình học topo, cho phép xác định chính xác thứ tự, vị trí của nguyên tố hay mảnh cấu trúc trong phân tử. Các tham số 2D thường được tính toán dựa trên lý thuyết về graph. (iii) Tham số 3D mô tả đặc điểm cấu trúc của phân tử trong không gian. Các tham số 3D có thể được tính toán dựa trên @ School of Medicine and Pharmacy, VNU 19
  28. các phương pháp lý thuyết như MoRSE, GETAWAY, tính toán lượng tử, mô tả bề mặt hoặc thể tích phân tử Trong nghiên cứu này chúng tôi lựa chọn tham số phân tử 2D để mô tả cấu trúc các hợp chất. Bởi so với các mô tả phân tử 3D thì mô tả phân tử 2D không cần tới các thông tin về cấu trúc 3D của phân tử, có tính ổn định cao hơn do các hợp chất được mô tả dưới dạng 3D thường có độ linh động về cấu dạng. 2.2.2. Phân chia tập huấn luyện / Tập kiểm tra Sau khi tính toán mô tả phân tử, 93 chất có trong CSDL được chia ngẫu nhiên thành tập huấn luyện (Tr - training set) và tập kiểm tra (Te – test set). Tập huấn luyện gồm 77 chất (chiếm 83,8% CSDL) được sử dụng cho việc xây dựng (huấn luyện) mô hình. Tập huấn luyện cho phép phát hiện mối quan hệ có khả năng dự đoán. Còn tập kiểm tra bao gồm các phân tử mà mô hình chưa bao giờ gặp được sử dụng để đánh giá độ mạnh và khả năng ngoại suy của các mô hình xây dựng được. 2.2.3. Xây dựng mô hình QSAR Xây dựng các mô hình QSAR trên các nhóm chất khác nhau, các đích tác dụng khác nhau cơ bản đều trải qua năm bước được tóm tắt như hình 2.1 [40]. Chuẩn bị Tính toán Xử lý cơ sở dữ liệu tham số phân tử số liệu Đánh giá Xây dựng mô hình QSAR mô hình QSAR Hình 2.1. Các bước xây dựng mô hình QSAR Tập huấn luyện gồm 83,8% số hợp chất trong CSDL được lựa chọn ngẫu nhiên để xây dựng mô hình QSAR. Các hợp chất còn lại được xếp vào tập kiểm nghiệm để đánh giá mô hình. Các mô hình được xây dựng bằng các @ School of Medicine and Pharmacy, VNU 20
  29. phương pháp hồi quy đa biến tuyến tính (MLR) sử dụng phần mềm SPSS 22.0, lựa chọn TSPT bằng phương pháp thuật giải di truyền (Genetic algorithm) sử dụng phần mềm MobyDigs Professional 1.1, sau đó đánh giá để lựa chọn mô hình tốt nhất. Lựa chọn tham số phân tử bằng phương pháp thuật giải di truyền sử dụng phần mềm MobyDigs Professional 1.1. Sau đó xây dựng mô hình QSAR trên tập huấn luyện bằng phương pháp MLR sử dụng phần mềm SPSS 22.0 để xác định tương quan hoạt tính ức chế với tham số mô tả phân tử Dragon. Lựa chọn TSPT thích hợp: tất cả các biến không phải được đưa hết vào mô hình. Mặc dù việc thêm biến độc lập vào làm tăng hệ số tương quan R2, nhưng nó chỉ tốt khi chúng có liên hệ mạnh với biến phụ thuộc. Mô hình được chọn ứng với mô hình có Q2 cao nhất. Thực hiện thuật giải di truyền để chọn mô hình có các biến tối ưu bằng phần mềm MobyDigs Professional 1.1. Thuật giải di truyền dựa trên cơ chế của chọn lọc tiến hóa trong tự nhiên: “Trong mọi thế hệ, một tập mới các sinh vật được tạo ra bằng cách lai ghép những nhân tố thích hợp nhất với môi trường của những sinh vật trong thế hệ cũ cùng với sự xuất hiện đột biến ngẫu nhiên của các cá thể trong thế hệ mới”. Vận dụng cơ chế này, đầu tiên thuật toán sẽ mã hoá tất cả các tham số của cấu trúc ban đầu trong một nhiễm sắc thế - biểu diễn bằng một vec tơ. Từ nhiễm sắc thể ban đầu này, tạo ngẫu nhiên một quần thể. Quần thể này được đánh giá và từ đó các nhiễm sắc thể thích nghi nhất (tức là có hàm mục tiêu Q2 cao nhất) được chọn làm khung để tạo ra quần thể tiếp theo. Quy trình này làm tăng Q2 của toàn bộ nhiễm sắc thể bằng cách truyền các đặc tính cấu trúc thuận lợi từ một quần thể này sang một quần thể khác. Sau một số chu kỳ tìm kiếm và đánh giá, cuối cùng ta sẽ tìm được một nhiễm sắc thể (mô hình) phù hợp với giá trị Q2 cao nhất. Các bước thực hiện thuật giải di truyền: (1): Khởi tạo một quần thể ban đầu (file đầu vào được lưu dưới dạng file.mdd chứa các dữ liệu về tên, các mô tả phân tử được tính toán bằng phần mềm Dragon 6.0, giá trị log Kp của các hợp chất trong tập huấn luyện). @ School of Medicine and Pharmacy, VNU 21
  30. (2): Xác định hàm mục tiêu (fitness) cho mỗi cá thể trong quần thể. Hàm mục tiêu trong nghiên cứu này là giá trị Q2. (3): Tạo ra quần thể mới bằng cách lai ghép chéo (crossver) từ các cá thể hiện tại có chọn lọc (selection), đồng thời tạo ra các đột biến (mutation) trong quần thể mới theo một xác suất nhất định. Quá trình này thực hiện thông qua cài đặt giải thuật di truyền (Genetic Algorithm set up). (4): Các cá thể trong quần thể mới được sinh ra thay thế cho các cá thể trong quần thể cũ. (5): Nếu điều kiện dừng, giải thuật dừng lại và trả về cá thể tốt nhất cùng với giá trị hàm mục tiêu của nó. Lập mô hình với số biến đã chọn bằng phương pháp hồi qui đa biến tuyến tính (MLR) bằng phần mềm SPSS 22.0. MLR là một trường hợp rất phổ biến trong thực tế, là tổ hợp tuyến tính giữa các biến phụ thuộc (Y) với nhiều biến độc lập (x). Trong nghiên cứu này x chính là các TSPT đặc trưng cho cấu trúc các hợp chất trong CSDL, Y là giá trị log Kp với Kp là hệ số thẩm thấu qua da. Phân tích hồi qui bao hàm cả ý nghĩa “ước tính” (Estimating) hay “dự đoán” (Predictive) vì sau khi sự tương quan tuyến tính giữa x và Y được thiết lập bởi một biểu thức toán học cụ thể người ta có thể ước tính hay dự đoán giá trị của Y từ một giá trị của x. Đường biểu diễn biểu thức toán học ấy được gọi là đường hồi qui của Y theo x. 2.2.4. Đánh giá mô hình Để đánh giá một cách đầy đủ một mô hình QSAR, Tổ chức Hợp tác và Phát triển Kinh tế thế giới (OECD) đã đưa ra 5 tiêu chí như sau: Tiêu chí 1: Có đích cụ thể. Tiêu chí 2: Thuật toán rõ ràng. Tiêu chí 3: Miền cấu trúc ứng dụng xác định. Tiêu chí 4: Có thước đo phù hợp để đánh giá độ chính xác, độ bền vững, khả năng dự đoán. Tiêu chí 5: Giải thích cơ chế tác dụng nếu có thể. @ School of Medicine and Pharmacy, VNU 22
  31. CHƢƠNG 3 – KẾT QUẢ VÀ BÀN LUẬN 3.1. Kết quả 3.1.1. Mô hình toán học thu được Mô hình QSAR là mô hình biểu thị mối liên hệ định lượng giữa cấu trúc và hoạt tính của các hợp chất. Mô hình QSAR được biểu diễn dưới dạng một phương trình toán học. QSAR sử dụng các TSPT, các kỹ thuật xác suất thống kê và trí tuệ nhân tạo để xây dựng các mô hình. QSAR được xây dựng dựa trên giả thuyết là cấu trúc của một phân tử phải chứa những đặc điểm cấu trúc liên quan tới tính chất hóa học, vật lý, sinh học và dựa trên khả năng các mô tả phân tử. Bởi các mô hình QSAR, hoạt tính sinh học của một phân tử mới hoặc chưa được kiểm nghiệm có thể được suy ra từ cấu trúc của các hợp chất tương tự trong đó tính chất của chúng đã được kiểm nghiệm[34]. Phương pháp QSAR xây dựng các mô hình toán học nhằm dự đoán hoạt tính của các hợp chất dựa trên cấu trúc hóa học của chúng, là các kỹ thuật nhằm dự đoán các kết quả trước khi các thử nghiệm được tiến hành trong phòng thí nghiệm. QSAR cung cấp thông tin dự đoán về kết quả có thể có của một thử nghiệm nào đó và khả năng mới này cung cấp các yếu tố liên quan để thiết lập thứ tự ưu tiên cho một chất mới cho các thử nghiệm[34]. Các mô hình QSAR được xây dựng từ 93 hợp chất trong CSDL. Cấu trúc hóa học được trình bày tại phụ lục và giá trị log Kp của 93 hợp chất trong CSDL được trình bày tại bảng 2.1. Sử dụng phần mềm Dragon 6.0 tính toán được 3764 TSPT cho mỗi phân tử trong CSDL. Sau khi xử lí loại bỏ TSPT gây nhiễu, 1152 TSPT còn lại được kiểm tra quan hệ phi tuyến với biến đáp ứng log Kp. Sử dụng chức năng lựa chọn ngẫu nhiên của phần mềm SPSS 22.0, 77 hợp chất được lựa chọn vào tập huấn luyện, 16 hợp chất còn lại được lựa chọn vào tập kiểm nghiệm. Xây dựng các mô hình QSAR trên tập huấn luyện lần lượt bằng các phương pháp MLR, GA thu được kết quả như sau: @ School of Medicine and Pharmacy, VNU 23
  32. Kết quả mô hình MLR xây dựng được như sau: Log Kp = -2.49869 - 3.18926 x nR07 - 0.06478 x CATS2D_04_LL - 0.97246 x B03[O-O] + 1.25602 x B06[N-O] - 0.19308 x F02[C-N] + 0.50869 x MLOGP Đơn vị Kp: cm/h 3.1.2. Đánh giá mô hình Thông số thống kê của 10 mô hình tốt nhất được tóm tắt trong bảng 3.1. Bảng 3.1. Thông số thống kê của các mô hình QSAR log Kp 2 2 2 Ký hiệu mô hình R Q Q ext M1 84,37 78,94 73,55 M2 84,38 78,94 73,56 M3 84,36 78,92 73,56 M4 84,37 78,92 73,48 M5 82,30 78,58 64,25 M6 82,30 78,58 64,20 M7 82,28 78,56 64,15 M8 82,28 78,56 64,22 M9 83,26 78,56 57,59 M10 83,26 78,55 57,59 2 2 2 Nhận xét: Cả 10 mô hình đều có các thông số R , Q , Q ext thỏa mãn yêu cầu thống kê. Trong đó mô hình M2 có độ chính xác và độ bền vững cao 2 2 2 với các giá trị R , Q , Q ext cao nhất (đánh giá ngoại tốt), vừa đảm bảo tính chính xác, độ bền vững cao, vừa có kết quả đánh giá ngoại đáng tin cậy. Thông số mô hình M2 tốt nhất: R2 = 84.38% @ School of Medicine and Pharmacy, VNU 24
  33. Q2 = 78.94 % 2 Q ext = 73.56% Ta có R2 = 0,84 chứng tỏ độ chính xác của mô hình khá cao vượt xa trên mức yêu cầu tối thiểu là 0,6, Q2 = 0,79 cho thấy mô hình có độ ổn định tốt cũng như khả năng dự đoán nội tốt. Khả năng dự đoán ngoại 73,56% cho thấy mô hình có khả năng dự đoán hoạt tính tốt. Như vậy mô hình thoả mãn các tiêu chí đánh giá nội và ngoại về độ chính xác, độ ổn định và khả năng dự đoán tốt. 3.1.3. Đánh giá mô hình theo 5 tiêu chí của OECD Tiêu chí 1: Có đích cụ thể Mục đích của tiêu chí này để đảm bảo mô hình QSAR xây dựng nhằm dự đoán một giá trị cụ thể log Kp trên một tác dụng, hoạt tính cụ thể, trong một điều kiện cụ thể. Áp dụng đánh giá: Các mô hình được xây dựng nhằm dự đoán giá trị log Kp thể hiện khả năng thẩm thấu qua da của các chất dựa trên cấu trúc phân tử, với đơn vị của giá trị Kp là cm/h. Tiêu chí 2: Thuật toán rõ ràng Tiêu chí này nhằm đảm bảo mô hình QSAR được xây dựng dựa trên một thuật toán cụ thể. Tính lặp lại cuả mô hình phụ thuộc vào điều kiện này. Một số mô hình mang tính chất thương mại hóa không được công bố thuật toán sử dụng. Tuy nhiên, đây có thể trở thành vấn đề rào cản pháp lý bởi kết quả của mô hình không thể được công bố độc lập mà không có thuật toán trình bày cụ thể. Áp dụng đánh giá: Các TSPT tính toán bởi phần mềm Dragon 6.0 được liệt kê và định nghĩa đầy đủ. Các mô hình được xây dựng bằng thuật toán MLR. Thuật toán này là thuật toán thống kê thường quy được áp dụng phổ biến trong xây dựng các mô hình QSAR. @ School of Medicine and Pharmacy, VNU 25
  34. Tiêu chí 3: Miền cấu trúc ứng dụng xác định Để đạt được khả năng dự đoán tốt trong sàng lọc ảo, việc xác định được miền ứng dụng của mô hình QSAR là vô cùng cần thiết. Miền ứng dụng là khoảng không gian cấu trúc bao gổm trong mô hình. Chỉ những dự đoán đối với các hợp chất có cấu trúc nằm trong miền cấu trúc này mới đáng tin cậy. Miền ứng dụng được xây dựng dựa trên mối quan hệ giữa phần dư chuẩn (Standardized Residual) và giá trị “đòn bẩy” (Leverage) (ký hiệu là h) tính được cho từng hợp chất. Biểu đồ dưới đây (Hình 3.1) cho thấy mối quan hệ giữa phần dư chuẩn và giá trị h. Chỉ số h cho biết một chất có ảnh hưởng tới không gian cấu trúc của biến như thế nào. Giá trị giới hạn của h gọi là h*, h* là một ngưỡng quan trọng để tham chiếu các dự đoán bởi mô hình QSAR cho hợp chất trong Tr và Te được tính toán theo công thức: h* = 3p/N, trong đó p là số biến độc lập trong mô hình (3.1), N là số lượng quan sát trong tập huấn luyện. Miền ứng dụng được xác định là phần giới hạn bởi khung vuông ± 3 phần dư chuẩn đối và h* bằng 0.6. Application Domain 4 3 2 1 0 -1 Standerized Residuals Standerized -2 -3 -4 0.0 0.1 0.2 0.3 0.4 0.5 0.6 Leverage Standerized residuals (Te) Standerized residuals (Tr) Hình 3.1. Miền ứng dụng của mô hình QSAR đối với các chất Áp dụng đánh giá: Sau khi tính toán tập huấn luyện, ta thấy 77/77 hợp chất đều nằm trong miền ứng dụng. Với tập kiểm tra, toàn bộ 16 hợp chất đều @ School of Medicine and Pharmacy, VNU 26
  35. nằm trong miền ứng dụng, do đó có thể thấy các dự đoán của mô hình đối với tập kiểm tra là hoàn toàn đáng tin cậy. Tiêu chí 4: Có thước đo phù hợp để đánh giá độ chính xác, độ bền vững, khả năng dự đoán Đây là tiêu chí chung, có tính chất bao hàm một số tiêu chí khác. Các giá trị R2, Q2 và khả năng dự đoán nội, khả năng dự đoán ngoại, chính là những thước đo phù hợp và phổ biến để đánh giá chất lượng mô hình QSAR được các nhà nghiên cứu QSAR đề xuất sử dụng. Áp dụng đánh giá: Từ kết quả đã trình bày, các mô hình xây dựng được không chỉ đạt yêu cầu thống kê, đảm bảo tính chính xác và bền vững (R2 = 0.8438, Q2 = 0.7894) mà còn có độ chính xác dự đoán nội, dự đoán ngoại cao 2 (Q ext =0.7356). Tiêu chí 5: Giải thích cơ chế tác dụng nếu có thể Đây là tiêu chí không bắt buộc. Theo quan điểm của các nhà nghiên cứu QSAR, không phải bao giờ mô hình QSAR cũng đưa ra được một hay nhiều cơ chế tác dụng. Điều này không có nghĩa là mô hình đó không có khả năng ứng dụng. Tiêu chí này đưa ra không phải để loại bỏ các mô hình không chỉ rõ cơ chế tác dụng, mà chỉ nhằm đảm bảo nếu mô hình có chỉ ra được cơ chế tác dụng cụ thể nào đấy, thì cơ chế này cần được chỉ ra cùng với sự công bố của mô hình. Áp dụng đánh giá: Mục tiêu của nghiên cứu này là xây dựng các mô hình QSAR dự đoán khả năng thẩm thấu qua da dựa trên cấu trúc phân tử, không nhằm mục đích phân tích cơ chế tác dụng. 3.2. Bàn luận 3.2.1. Về phương pháp QSAR hiện nay đang là một kỹ thuật được ứng dụng trong rất nhiều các lĩnh vực như dược phẩm, y học, hóa học Kỹ thuật này sử dụng các TSPT, các kỹ thuật xác suất thống kê và trí tuệ nhân tạo để xây dựng các mô hình. Mô hình xây dựng bằng phương pháp hồi quy đa biến tuyến tính, lựa @ School of Medicine and Pharmacy, VNU 27
  36. chọn tham số phân tử bằng giải thuật di truyền. Phương pháp này giúp tối ưu hóa mô hình nhằm tìm ra mô hình biểu thị tốt nhất mối quan hệ giữa biến đáp ứng là các tham số phân tử [34]. Từ mô hình xây dựng được chúng ta có thể giảm được tôi đa thời gian cũng như chi phí trong việc nghiên cứu và phát triển thuốc. Dựa trên CSDL các hợp chất đã được công bố, có thể nhanh chóng tìm ra các hợp chất phù hợp cho mục tiêu nghiên cứu tiếp theo. Bên cạnh đó xây dựng mô hình QSAR còn môt số hạn chế như CSDL thu thập được từ nhiều bài báo khác nhau, do đó có thể gặp sai số trong xây dựng mô hình QSAR; việc giải thích các biến TSPT đôi khi gặp phải khó khăn vì cơ chế của chúng phức tạp đòi hỏi những hiểu biết chuyên sâu về hóa lượng tử; bên cạnh đó chưa có nhiều tài liệu tham khảo, do đó chưa đủ cơ sở để giải thích. Nhược điểm của phương pháp này là khai thác mối tương quan tuyến tính giữa cấu trúc hóa học và tác dụng sinh học của các hợp chất, nhưng đôi khi sự tương quan đó không phải là tuyến tính (đường thẳng) mà nó có thể phi tuyến tính. Đã có một số nghiên cứu khai thác mối tương quan phi tuyến tính về tính thấm qua da và đã thu kết quả tương đối tốt. Trên thế giới, mặc dù đã có nhiều nghiên cứu liên quan QSAR về khả năng thẩm thấu qua da dựa trên cấu trúc phân tử nhưng theo các tài liệu thu thập được, lần đầu tiên tại Việt Nam, các mô hình QSAR dự đoán khả năng thẩm thấu qua da dựa trên cấu trúc phân tử được xây dựng và đánh giá. Các mô hình này đảm bảo tính chính xác, bền vững và khả năng dự đoán tốt đồng thời thỏa mãn các tiêu chí bắt buộc do Tổ chức Hợp tác và Phát triển Kinh tế thế giới (OECD) đã đề ra để đánh giá mô hình QSAR . 3.2.2. Về kết quả của thu được Mô hình log Kp thu được sau quá trình tính toán: Log Kp = -2.49869 - 3.18926 x nR07 - 0.06478 x CATS2D_04_LL - 0.97246 x B03[O-O] + 1.25602 x B06[N-O] - 0.19308 x F02[C-N] + 0.50869 x MLOGP @ School of Medicine and Pharmacy, VNU 28
  37. Mô hình QSAR có sự tham gia của 6 biến, là các tham số phân tử 2D. Tham số phân tử 2D biểu diễn các cấu trúc theo kích thước, độ phân nhánh, và hình dạng tổng thể. Các tham số phân tử 2D trong mô hình bao gồm: nR07; CATS2D_04_LL; B03[O-O]; B06[N-O]; F02[C-N]; MLOGP.Trong đó: . nR07: Số vòng 7 cacbon có trong hợp chất. . CATS2D_04_LL: CATS2D Lipophilic-Lipophilic tại khoảng cách tôpô 4 . B03[O-O]: Sự hiện diện / vắng mặt của liên kết O-O tại khoảng cách tôpô 3 . B06[N-O]: Sự hiện diện / vắng mặt của liên kết N-O tại khoảng cách tôpô 6 . F02[C-N]: Tần số C - N ở khoảng cách tôpô 2 . MLOGP: Hệ số phân chia octanol – nước Moriguchi  Các dấu (+) ở TSPT B06[N-O] và MLOGP thể hiện sự có mặt nhiều liên kết N-O và hệ số phân chia octanol – nước Moriguchi sẽ làm tăng khả năng thẩm thấu qua da của hợp chất. Nhưng hệ số của TSPT MLOGP là trung bình (0.50869) nên sẽ không là yếu tố quyết định làm thay đổi đến log Kp cũng như kết quả của mô hình.  Các dấu (-) ở các TSPT còn lại nR07, CATS2D_04_LL, B03[O-O], F02[C-N] cho thấy biến gắn với tham số âm làm ảnh hưởng ngược chiều tới giá trị log Kp. Số liên kết N-C với hệ sô nhỏ (-0.19308) ảnh hưởng ít nhất lên tính thấm, trong khi đó hợp chất có vòng chứa 7 carbon với hệ số rất cao (- 3.18926) dường như có ảnh hưởng mạnh nhất lên tính thấm của một hợp chất. Điều này có thể được giải thích một phần thông qua khả năng phân cực, các vòng thơm thường có mật độ electron cao, dễ gây phân cực trong phân tử, bản chất màng phospholipid của da là không phân cực nên các hợp chất này sẽ khó có thể đc thẩm thấu qua màng. Trong khi đó hệ số phân bố dầu nước Log Kp lại là một chỉ số của khả năng thân dầu, một hợp chất có tính thân dầu sẽ dễ dàng thấm qua màng. @ School of Medicine and Pharmacy, VNU 29
  38. 3.2.3. So sánh với các mô hình khác trên thế giới Nghiên cứu đã đánh giá mô hình xây dựng được theo các nguyên tắc của OECD với R2=0.84, Q2= 0.79 và khả năng dự đoán ngoại 73,56%. Như vậy mô hình thoả mãn các tiêu chí đánh giá nội và ngoại về độ chính xác, độ ổn định và khả năng dự đoán tốt. So với các mô hình khác trên thế giới thì lượng hợp chất trong CSDL nghiên cứu tương đối lớn, nhiều hơn so với hầu hết các mô hình đã được nghiên cứu và công bố trước đây thể hiện qua bảng 1.2 [6, 25, 27]. Điều đó cho thấy được tính khái quát của mô hình, cũng như khả năng dự đoán đối với nhiều hợp chất hơn. Khả năng dự đoán ngoại 73,56% cũng đã cho thấy được điều đó. Có thể áp dụng để phát triển mô hình trong các nghiên cứu thuốc điều trị qua da, điều trị tại chỗ, các hóa mỹ phẩm, @ School of Medicine and Pharmacy, VNU 30
  39. KẾT LUẬN VÀ KIẾN NGHỊ KẾT LUẬN Từ những kết quả nghiên cứu đã trình bày trên đây chúng tôi rút ra các kết luận sau: Nghiên cứu đã xây dựng thành công mô hình toán học biểu diễn mối quan hệ định lượng giữa cấu trúc và khả năng thẩm thấu qua da dựa trên 93 hợp chất có trong CSDL: LogKp = -2.49869 - 3.18926 x nR07 - 0.06478x CATS2D_04_LL - 0.97246 x B03[O-O] + 1.25602 x B06[N-O] - 0.19308 x F02[C-N] + 0.50869 x MLOGP Với R2=0.84, Q2= 0.79 và khả năng dự đoán ngoại 73,56%. Như vậy mô hình thoả mãn các tiêu chí đánh giá nội và ngoại về độ chính xác, độ ổn định và khả năng dự đoán. Mô hình xây dựng được hoàn toàn phù hợp các nguyên tắc của OECD và có tính ứng dụng cao. So với các mô hình khác trên thế giới thì lượng dữ liệu là khá lớn, lớn hơn hầu hết các mô hình nghiên cứu trước đây. Do đó, mô hình sẽ có tính ứng dụng và khái quát cao hơn. KIẾN NGHỊ Để tiếp tục phát triển các kết quả nghiên cứu của khóa luận xây dựng mô hình toán học dự đoán khả năng thẩm thấu qua da dựa trên cấu trúc phân tử, chúng tôi xin đưa ra các đề xuất sau: 1. Mở rộng cơ sở dữ liệu xây dựng mô hình giúp tăng miền ứng dụng của mô hình từ đó mô hình mang tính khái quát cao hơn nữa và khả năng ứng dụng thực tế sẽ tốt hơn rất nhiều. 2. Khai thác các phương pháp mô hình hoá phi tuyến tính làm giảm các nhược điểm của phương pháp xây dựng mô hình tuyến tính hiện nay. 3. Kiểm chứng bằng thực nghiệm để xác định chính xác hơn khả năng dự đoán của mô hình xây dựng được. @ School of Medicine and Pharmacy, VNU 31
  40. TÀI LIỆU THAM KHẢO 1. Bartek, Methodius J, Labudde, John A, and Maibach, Howard I (1972), "Skin permeability in vivo: comparison in rat, rabbit, pig and man", Journal of Investigative Dermatology. 58(3), pp. 114-123. 2. Brian , Barry (1983), Dermatological formulations: percutaneous absorption, drugs and pharmaceutical sciences, New York, Marcel Dekker, Inc. 3. Bronaugh, Robert L, et al. (1982), "Methods for in vitro percutaneous absorption studies I. Comparison with in vivo results", Toxicology and applied pharmacology. 62(3), pp. 474-480. 4. Chow, C, et al. (1978), "Percutaneous absorption of hexachlorophene in rats, guinea pigs and pigs", Toxicology. 9(1-2), pp. 147-154. 5. Esposito, E, et al. (1998), "Influence of liposomal formulation parameters on the in vitro absorption of methyl nicotinate", International journal of pharmaceutics. 172(1-2), pp. 255-260. 6. Flynn, G (1990), "Physiochemical determinants of skin absorption", Principles of route-to-route extrapolation for risk assessment, pp. 93- 127. 7. Foley, D, Corish, J, and Corrigan, OI (1992), "Iontophoretic delivery of drugs through membranes including human stratum corneum", Solid State Ionics. 53, pp. 184-196. 8. Franz, Thomas J (1975), "Percutaneous absorption. On the relevance of in vitro data", Journal of Investigative Dermatology. 64(3), pp. 190- 195. 9. Fujiwara, Shin‐Ichi, Yamashita, Fumiyoshi, and Hashida, Mitsuru (2003), "QSAR analysis of interstudy variable skin permeability based on the “latent membrane permeability” concept", Journal of pharmaceutical sciences. 92(10), pp. 1939-1946. 10. Hager, DF, et al. (1994), "Evaluation of a cultured skin equivalent as a model membrane for iontophoretic transport", Journal of controlled release. 30(2), pp. 117-123. 11. Horiguchi, Yuji, et al. (1997), "Three‐dimensional cultures of keratinocytes and an application to in vitro‐amyloid production of cutaneous amyloidosis", Microscopy research and technique. 38(4), pp. 387-393. 12. Kirchner, LA (1997), "The prediction of skin permeability by using physicochemical data", ATLA. 25, pp. 359-370. 13. Lee, Pil H, Conradi, Robert, and Shanmugasundaram, Veerabahu (2010), "Development of an in silico model for human skin permeation based on a Franz cell skin permeability assay", Bioorganic & medicinal chemistry letters. 20(1), pp. 69-73. @ School of Medicine and Pharmacy, VNU 32
  41. 14. Lian, Guoping, Chen, Longjian, and Han, Lujia (2008), "An evaluation of mathematical models for predicting skin permeability", Journal of pharmaceutical sciences. 97(1), pp. 584-598. 15. Liaw, Andy and Svetnik, Vladimir (2015), "QSAR modeling: prediction of biological activity from chemical structure", Statistical Methods for Evaluating Safety in Medical Product Development, pp. 66-83. 16. Lien, Eric J and Gaot, Hua (1995), "QSAR analysis of skin permeability of various drugs in man as compared to in vivo and in vitro studies in rodents", Pharmaceutical research. 12(4), pp. 583-587. 17. Lin, SHAN-YANG, et al. (1992), "Comparisons of different animal skins with human skin in drug percutaneous penetration studies", Methods and findings in experimental and clinical pharmacology. 14(8), pp. 645-654. 18. M, Corbo, et al. (1993), "Development and validation of in vitro release testing methods for semisolid formulations", Pharmaceutical Technology. 17(9), pp. 112-112. 19. Martin, Todd M, et al. (2012), "Does rational selection of training and test sets improve the outcome of QSAR modeling?", Journal of Chemical Information and Modeling. 52(10), pp. 2570-2578. 20. Martin, YC (1978), "Quantitative Drug Design, Marcel Dkker", Inc., New York, USA. 21. Mizunuma, M, et al. (2000), "Experience in repair utilizing artificial skin for exposed bone surfaces", European Journal of Plastic Surgery. 23(6), pp. 305-308. 22. Nemecek, Georgina M and Dayan, Anthony D (1999), "Safety evaluation of human living skin equivalents", Toxicologic pathology. 27(1), pp. 101-103. 23. Norinder, Ulf, Rybacka, Aleksandra, and Andersson, Patrik L (2016), "Conformal prediction to define applicability domain–A case study on predicting ER and AR binding", SAR and QSAR in Environmental Research. 27(4), pp. 303-316. 24. Ng, Shiow-Fern, et al. (2010), "Validation of a static Franz diffusion cell system for in vitro permeation studies", Aaps Pharmscitech. 11(3), pp. 1432-1441. 25. Patel, Hiren, Cronin, Mark, and Street, Byrom (2001), "Determination of the optimal physico-chemical parameters to use in a QSAR-approach to predict skin permeation rate", CEFIC-LRI project number NMALRI- A22UNJM-0007. 26. Patterson, David E, et al. (1996), "Neighborhood behavior: a useful concept for validation of “molecular diversity” descriptors", Journal of medicinal chemistry. 39(16), pp. 3049-3059. @ School of Medicine and Pharmacy, VNU 33
  42. 27. Potts, Russell O and Guy, Richard H (1992), "Predicting skin permeability", Pharmaceutical research. 9(5), pp. 663-669. 28. Ramsamooj, R, et al. (1998), A Novel In Vitro Model for Xenorejection and Immune Mechanisms Using Bioengineered Living Skin Equivalents 1, Transplantation proceedings, Elsevier, pp. 1087- 1088. 29. Rekker, Roelof F (1992), "The history of drug research: From Overton to Hansch", Molecular Informatics. 11(2), pp. 195-199. 30. Riviere, Jim E and Brooks, James D (2005), "Predicting skin permeability from complex chemical mixtures", Toxicology and applied pharmacology. 208(2), pp. 99-110. 31. Roberts, MS, Anderson, RA, and Swarbrick, J (1977), "Permeability of human epidermis to phenolic compounds", Journal of pharmacy and pharmacology. 29(1), pp. 677-683. 32. Scheuplein, Robert J and Blank, Irvin H (1971), "Permeability of the skin", Physiological reviews. 51(4), pp. 702-747. 33. Schultz, T Wayne, et al. (2003), "Quantitative structure–activity relationships (QSARs) in toxicology: a historical perspective", Journal of Molecular structure: THEOCHEM. 622(1-2), pp. 1-22. 34. Sen, Sandip, et al. (2012), "CoMFA-3D QSAR approach in drug design". 35. Todeschini, Roberto and Consonni, Viviana (2008), Handbook of molecular descriptors, Vol. 11, John Wiley & Sons. 36. Woolfson, A David, McCafferty, Dermot F, and Moss, Gary P (1998), "Development and characterisation of a moisture-activated bioadhesive drug delivery system for percutaneous local anaesthesia", International journal of pharmaceutics. 169(1), pp. 83-94. @ School of Medicine and Pharmacy, VNU 34
  43. PHỤ LỤC Bảng. Cấu trúc hóa học và giá trị Kp của các hợp chất xây dựng mô hình ST K (cm/hr) Cấu thức cấu tạo T p OH OH 2,85714E- 1 OH 05 HO OH OH 0,00627327 2 H H 3 O OH 3 0,0003525 HO B OH O OH 0,01763333 4 HO 3 CH3 OH CH 0,00651482 3 5 2 O CH3 6 0,01087 N N H3C O O 7 0,0042925 N @ School of Medicine and Pharmacy, VNU 35
  44. O 8 0,0083396 H3C O N N O 9 0,0080652 O O 10 0,00038275 HO H3C HOH3C O OH O HO 11 0,0000389 O N CH3 12 0,00010125 N O O CH3 O O O 13 0,000123 N O CH3 O O @ School of Medicine and Pharmacy, VNU 36
  45. CH3 H3C 14 0,017 HO CH3 O O OH Cl 15 0,0059894 NH Cl O OH CH3 0,01029583 16 3 O CH3 CH3 O O O 17 0,00724 HO N CH 3 O 18 0,0000418 O OH @ School of Medicine and Pharmacy, VNU 37
  46. O OH 0,03752869 19 9 CH3 O O 0,00345666 20 7 N H3C NH OH H C 21 0,006 3 HO3C N O OH 22 0,00005 O H3C N O 23 0,00013 CH3 N N CH3 @ School of Medicine and Pharmacy, VNU 38
  47. O H C O 3 OH OH OHOH H3C O 24 0,00000238 OH O OH OH OH HO CH O 3 HO O O HO H3C O HO CH 25 0,000013 3 O OH O H3C H3C O O N 0,00218460 26 7 H3C N CH3 Cl – O + N 0,01102994 O O 27 9 O + O O + O N N – – O O @ School of Medicine and Pharmacy, VNU 39
  48. O N CH3 28 0,0108 N 0,00331333 HO 29 3 OH CH3 30 0,03165 OH H3C 0,00143333 HO 31 3 CH3 32 0,00072775 H3C OH 33 0,000501 HO CH3 34 0,06 OH H3C 35 0,0797 H3C OH HO 0,00266666 36 7 CH3 37 0,06 H3C OH 38 0,01874 H3C OH 39 0,006 OH H3C @ School of Medicine and Pharmacy, VNU 40
  49. CH3 O O 0,01312370 40 2 OH OH 0,02845809 41 8 Cl 42 0,0601 Cl OH OH 43 0,03611 Br OH 44 0,00564 – O + N O CH3 45 0,0175 OH @ School of Medicine and Pharmacy, VNU 41
  50. – O + O N 46 0,0283 OH CH3 HO 47 0,0157 CH3 CH3 48 0,036 OH Cl HO 49 0,0594 Cl Cl CH3 Cl 50 0,059 H3C OH OH 51 0,00856 H3C 52 0,0349 OH @ School of Medicine and Pharmacy, VNU 42
  51. OH 53 0,000545 HO OH 54 0,0363 Cl CH3 55 0,05125 OH H3C CH3 OH Cl 56 0,0331 CH3 Cl 57 0,055 OH CH3 58 0,01638767 OH N O OH 59 0,0093135 NH N H3C S O O @ School of Medicine and Pharmacy, VNU 43
  52. Cl O N 60 0,00578075 H3C CH3 O O HO 0,00044766 61 OH 7 H3C O H3C OH 62 0,00004 HO CH3 H3C 63 0,0045 O H3C H3C 64 0,016 O CH3 OH 65 0,0006 H3C H C 3 O HO3HC O 66 0,000071 HO H3C HOH3C O O HO 67 0,0015 CH3 CH3 CH3 O @ School of Medicine and Pharmacy, VNU 44
  53. O OH CH3 CH3 68 0,00045 O O CH3 CH3 CH3 69 0,00151 O O 70 0,000075 HO H3C HOH3C O O 71 0,000181 H3C H3C HO O CH CHHO3 3 CH 0,00060011 3 72 O 3 O HO 73 0,0036 O CH3 O 74 0,00002655 H3C HO OH O O @ School of Medicine and Pharmacy, VNU 45
  54. O O CHHO 3 O CH3 HO O 75 0,00021 CH3 H O H H O O HO CH3 O CH HO 3 76 0,00018 CH3 H O H H O O OH CH3 H H CH 77 0,00054 O3H O O CH3 H O O O O O CHHO 3 O CH3 HO N CH H 78 0,000067 3 O CH3 H H O @ School of Medicine and Pharmacy, VNU 46
  55. O H CH3 79 0,00063 OH H H O CH3 OH O OH O O H3C O O HO O CH 80 0,0017 F CH 3 3 O CH3 O CH3 O F O HO CH3 O CH HO 3 CH H 81 0,00062 3 O H H O O OH CH3 H H CH 82 0,00034 O3H O CH3 H O O @ School of Medicine and Pharmacy, VNU 47
  56. O H CH3 83 0,000026 OH H H O CH 3 NH2 O OH O O O H CH3 84 0,00091 OH H H O CH3 OH O OH O O O O HO CH O NH2 3 OH 85 0,00089 CH3 O OH HO O OH 6,53333E- HO OH 86 O O 06 OH OH OH @ School of Medicine and Pharmacy, VNU 48
  57. NH2 H N 87 0,00045 2 NH2 88 0,001115 – O + N O NH2 NH2 89 0,00024 NH2 NH2 90 0,00319 – O + N O OH NH2 91 0,0021 H2N Cl – O + O N 92 0,00066 H2N OH @ School of Medicine and Pharmacy, VNU 49
  58. H3C HO O H3C O CH3 OH 93 0,0036 N H3C @ School of Medicine and Pharmacy, VNU 50