Khóa luận Phân tích vai trò của gốc methionine trong cấu trúc nhân tố phiên mã ở cây đậu tương (Glycine max (L.) Merr.1917)

pdf 61 trang thiennha21 15/04/2022 5460
Bạn đang xem 20 trang mẫu của tài liệu "Khóa luận Phân tích vai trò của gốc methionine trong cấu trúc nhân tố phiên mã ở cây đậu tương (Glycine max (L.) Merr.1917)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfkhoa_luan_phan_tich_vai_tro_cua_goc_methionine_trong_cau_tru.pdf

Nội dung text: Khóa luận Phân tích vai trò của gốc methionine trong cấu trúc nhân tố phiên mã ở cây đậu tương (Glycine max (L.) Merr.1917)

  1. ````````TRƢỜNG ĐẠI HỌC SƢ PHẠM HÀ NỘI 2 KHOA SINH–KTNN  LÊ MINH TUẤN PHÂN TÍCH VAI TRỊ CỦA GỐC METHIONINE TRONG CẤU TRÚC NHÂN TỐ PHIÊN MÃ Ở CÂY ĐẬU TƢƠNG (Glycine max (L.) Merr.1917) KHĨA LUẬN TỐT NGHIỆP Chuyên ngành: Tin sinh học HÀ NỘI, 2019
  2. TRƢỜNG ĐẠI HỌC SƢ PHẠM HÀ NỘI 2 KHOA SINH – KTNN  LÊ MINH TUẤN PHÂN TÍCH VAI TRỊ CỦA GỐC METHIONINE TRONG CẤU TRÚC NHÂN TỐ PHIÊN MÃ Ở CÂY ĐẬU TƢƠNG (Glycine max (L.) Merr.1917) KHĨA LUẬN TỐT NGHIỆP Chuyên ngành: Tin sinh học Ngƣời hƣớng dẫn khoa học TS. Chu Đức Hà HÀ NỘI, 2019
  3. LỜI CAM ĐOAN Tơi cam đoan đây là cơng trình nghiên cứu của tơi đƣợc thực hiện dƣới sự hƣớng dẫn của TS. Chu Đức Hà. Các nội dung nghiên cứu, kết quả trong đề tài này là trung thực và chƣa từng đƣợc ai cơng bố dƣới bất kỳ hình thức nào. Khĩa luận sử dụng thơng tin, số liệu, hình ảnh từ các bài báo và nguồn tài liệu của các tác giả khác đều đƣợc chú thích và trích dẫn đầy đủ. Tơi xin chịu trách nhiệm hồn tồn về nội dung của khĩa luận. Hà Nội, ngày tháng năm 2019 Sinh viên Lê Minh Tuấn
  4. LỜI CẢM ƠN Lời đầu tiên tơi xin đƣợc gửi lời cảm ơn tới TS. Chu Đức Hà - Viện Di truyền Nơng nghiệp đã tận tình hƣớng dẫn và tạo mọi điều kiện thuận lợi, giúp đỡ tơi trong suốt quá học tập, làm việc và hồn thành khĩa luận. Xin gửi lời cảm ơn tới các cán bộ phịng Sinh học phân tử, Viện Di truyền Nơng nghiệp đã tạo mọi điều kiện thuận lợi và giúp đỡ tơi trong suốt quá trình thực hiện khĩa luận tại đây. Tơi cũng xin gửi lời cảm ơn tới TS. La Việt Hồng, Khoa Sinh - Kỹ thuật Nơng nghiệp, trƣờng Đại học Sƣ phạm Hà Nội 2 đã tận tình giúp đỡ, hƣớng dẫn và tạo điều kiện cho tơi đƣợc tham gia vào nhĩm nghiêm cứu khoa học từ rất sớm. Cuối cùng, tơi xin gửi lời cảm ơn tới gia đình và bạn bè đã giúp đỡ và chia sẻ, động viên trong suốt quá trình học tập cũng nhƣ thực hiện khĩa luận. Hà Nội, ngày tháng năm 2019 Sinh viên Lê Minh Tuấn
  5. DANH MỤC BẢNG Bảng 1. 1: Diện tích và sản lƣợng đậu tƣơng của 5 nƣớc dẫn đầu và tồn thế giới (FAO, 2016) 8 Bảng 2. 1: Th ng tin về c c TF giàu Met đƣợc hai th c trong nghi n cứu. 15 Bảng 3. 1: Đặc tính của nhĩm protein họ bHLH ở đậu tƣơng 20 Bảng 3. 2: Đặc điểm protein nhĩm bZIP ở cây đậu tƣơng 22
  6. DANH MỤC HÌNH Hình 1. 1: Đặc điểm Hình th i cây đậu tƣơng 5 Hình 1. 2: Diện tích và sản lƣợng đậu tƣơng trong ni n vụ 2010 - 2016 . 10 Hình 2. 1: Giao diện trang web ExPASy protparam tool 16 Hình 2. 2: Cơ sở dữ liệu TargetP 16 Hình 3. 1: Tỉ lệ phân bố Methionine ngồi vùng bảo thủ c c họ TF 27 Hình 3. 2: Sự biểu hiện của c c gene bHLH, bZIP, SRF của cây đậu tƣơng trong c c m ở điều iện thƣờng 28 Hình 3. 3: Sự biểu hiện của c c gene bHLH, bZIP, SRF của cây đậu tƣơng trong c c m ở điều iện mặn 30
  7. DANH MỤC VIẾT TẮT VÀ KÝ HIỆU Ký hiệu Thuật ngữ Tiếng Anh Thuật ngữ Tiếng Việt bHLH Basic Helix Loop Helix Basic Helix Loop Helix bZIP Basic Leucine Zipper Basic Leucine Zipper DNA Deoxyribonucleic acid Axít đêơxyribơnuclêic FAO Food and Agriclture Tổ chức lƣơng thực thế organization giới GRAVY Grand average of Độ ƣa nƣớc trung bình hydropathicity GEO Gene expression Cơ sở dữ liệu của dữ liệu omnibus biểu hiện gen kDa Kilo dalton Kilơ daltơn II Instability Index Chỉ số bất ổn định Met Methionine Methionin MYB Myeloblastosis Myeloblastosis NAC NAM/ATAF1/CUC2 NAM/ATAF1/CUC2 pI Isoelectric point Điểm đẳng điện RNA Ribonucleic Acid Axít Ribơnuclêic SRF Serum - Response Factor Yếu tố phiên mã đáp ứng serum TF Transcription factor Nhân tố phiên mã
  8. MỤC LỤC MỞ ĐẦU 1 1. Tính cấp thiết của đề tài 1 2. Mục tiêu nghiên cứu của đề tài 2 3. Nội dung nghiên cứu 2 4. Ý nghĩa khoa học và ý nghĩa thực tiễn 2 4.1. Ý nghĩa khoa học 2 4.2. Ý nghĩa thực tiễn 2 NỘI DUNG 3 Chƣơng 1: TỔNG QUAN TÀI LIỆU 3 1.1. Tổng quan về cây đậu tƣơng 3 1.1.1. Nguồn gốc và phân loại của cây đậu tương 3 1.1.2. Đặc điểm sinh học của cây đậu tương 4 1.1.2.1. Đặc điểm hình thái học của cây đậu tương 4 1.1.2.2. Đặc điểm di truyền của cây đậu tương 6 1.1.3. Vai trị của cây đậu tương 6 1.1.4. Tình hình sản xuất đậu tương trên thế giới và Việt Nam 8 1.1.4.1. Tình hình sản xuất đậu tương trên thế giới 8 1.1.4.2. Tình hình sản xuất đậu tương tại Việt Nam 9 1.2. Tổng quan về các nhân tố phiên mã trong nghiên cứu 10 1.2.1. Nhân tố phiên mã bHLH (Basic Helix-Loop-Helix) 10 1.2.2. Nhân tố phiên mã bZIP (Basic Leucine Zipper) 11 1.2.3 Nhân tố phiên mã SRF (Serum-Response Factor) 11 1.3. Met và vai trị của Met trong đáp ứng điều kiện bất lợi 12 1.4. Lịch sử nghiên cứu 13 1.4.1. Lịch sử nghiên cứu thế giới 13 1.4.2. Lịch sử nghiên cứu tại Việt Nam 14
  9. Chƣơng 2: VẬT LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU 15 2.1.Vật liệu nghiên cứu 15 2.2. Phƣơng pháp nghiên cứu 15 2.2.1. Phương pháp phân tích đặc tính protein ở đậu tương 15 2.2.3. Phương pháp tính %Met ở ngồi vùng bảo thủ 16 2.2.4. Phương pháp xác định vị trí phân bố của protein trong tế bào 16 2.2.5. Phương pháp phân tích mức độ biểu hiện của gen mã hĩa trong điều kiện thường và điều kiện mặn 17 Chƣơng 3: KẾT QUẢ VÀ THẢO LUẬN 18 3.1. Phân tích đặc tính protein của ba nh m TF giàu Met ở đậu tƣơng 18 3.1.1. Nhĩm bHLH ở đậu tương 18 3.1.2.Nhĩm bZIP ở đậu tương 22 3.1.3. Nhĩm SRF ở đậu tương 23 3.2. Phân tích mật độ phân bố Met ở ngồi vùng bảo thủ của các nhĩm TF giàu Met ở đậu tƣơng 26 3.3. Phân tích dữ liệu biểu hiện của gene mã h a TF giàu Met ở đậu tƣơng trong các điều kiện 28 KẾT LUẬN VÀ KIẾN NGHỊ 32 1. Kết luận 32 2. Đề xuất 32 DANH MỤC CƠNG TRÌNH ĐÃ CƠNG BỐ LIÊN QUAN ĐẾN LUẬN VĂN 33 TÀI LIỆU THAM KHẢO 34 PHỤ LỤC
  10. MỞ ĐẦU 1. Tính cấp thiết của đề tài Cây đậu tƣơng (Glycine max) là một trong những đối tƣợng cây trồng quan trọng trên thế giới. Đây là nguồn nguyên liệu quan trọng đối với các ngành cơng nghiệp, đặc biệt là đối với sản xuất chế biến, sử dụng làm thức ăn cho gia súc [6]. Tuy nhiên, tác động của biến đổi khí hậu diễn ra liên tục và kéo dài đã ảnh hƣởng đến năng suất và sản lƣợng của đậu tƣơng [1]. Chính vì vậy, các nghiên cứu về đậu tƣơng thƣờng hƣớng đến mục tiêu cải thiện tính chống chịu bất lợi và nâng cao năng suất của giống nh m đáp ứng với biến đổi khí hậu. Trong genome của thực vật cĩ khoảng 7% gene mã hĩa cho các yếu tố phiên mã (transcription factor, TF) [47], phần nhiều trong số đ đã đƣợc chứng minh c đáp ứng với các bất lợi mơi trƣờng [26]. Các TF là những phân tử protein nhận biết trình tự đặc hiệu trên v ng promoter (yếu tố điều h a cis- , từ đ điều h a sự biểu hiện của gene đích khi c tác động của điều kiện bất lợi [26], vì vậy chúng tham gia vào đáp ứng các bất lợi mơi trƣờng [12,43]. Các họ TF lớn ở thực vật c thể đƣợc liệt kê nhƣ bZIP [51], NAC [30], WRKY [50] và bHLH [20]. Trong nội dung kh a luận này, 3 họ TF lớn ở thực vật gồm bHLH, bZIP và SRF đã đƣợc tập trung nghiên cứu. Methionine (Met) là một gốc amino acid đ ng một vai trị vơ cùng quan trọng đối với đời sống của sinh giới [42]. Met là đơn vị cấu thành nên cấu trúc của chuỗi protein, tham gia vào chu trình Yang, liên quan đến hàng loạt các chu trình nội bào quan trọng nhƣ hình thành nên màng tế bào, tổng hợp diệp lục và củng cố thành tế bào [9]. Tuy nhiên, cấu tạo mạch cĩ chứa lƣu huỳnh nên các gốc Met rất dễ bị ơxi h a, làm thay đổi cấu trúc hoặc dẫn đến thay đổi hoặc mất chức năng của phân tử protein trong tế bào. Điều đáng chú ý nhất là khoảng 68% phân tử bị ơxi hĩa trong tế bào chính là protein [44], vì vậy đây 1
  11. đƣợc xem là một đối tƣợng rất dễ bị tác động trong điều kiện bất lợi [27]. Xuất phát từ những lí do trên, chúng tơi đã thực hiện đề tài “Phân tích vai trị của gốc methionine trong cấu trúc nhân tố phiên mã ở cây đậu tƣơng (Glycine max (L.) Merr.1917)”. 2. Mục ti u nghi n cứu của đề tài Mục đích của nghiên cứu này nh m làm r giả thuyết về vai tr bảo vệ của các gốc Met trên các phân tử protein đ ng vai tr TF ở cây đậu tƣơng. 3. Nội dung nghi n cứu Phân tích đặc tính của 3 nh m TF giàu Met ở đậu tƣơng. Xác định mật độ phân bố Met ở ngồi vùng bảo thủ của 3 nhĩm TF giàu Met ở đậu tƣơng. Phân tích mức độ biểu hiện của các gene mã h a TF giàu ở đậu tƣơng trong điều kiện thƣờng và điều kiện xử lí mặn. 4. Ý nghĩa hoa học và ý nghĩa thực tiễn 4.1. Ý nghĩa khoa học Nghiên cứu này nh m cung cấp những dẫn liệu quan trọng cho những nghiên cứu tiếp theo nh m phân tích rõ vai trị của các gene mã hĩa giàu Met liên quan đến tính chống chịu bất lợi ở thực vật. 4.2. Ý nghĩa thực tiễn Kết quả của nghiên cứu này s cung cấp những gene ứng viên mã h a bHLH, bZIP và SRF c đáp ứng với điều kiện ngoại cảnh bất lợi nh m phục vụ cơng tác chọn tạo giống nh m nâng cao tính chống chịu ở cây đậu tƣơng. 2
  12. NỘI DUNG Chƣơng 1 TỔNG QUAN TÀI LIỆU 1.1. Tổng quan về cây đậu tƣơng 1.1.1. Nguồn gốc và phân loại của cây đậu tương Cây đậu tƣơng là một trong những cây trồng cĩ lịch sử rất lâu đời và đ ng vai trị quan trọng trong nền nơng nghiệp cũng nhƣ cơng nghiệp của thế giới. Theo những nghiên cứu gần đây các nhà khoa học đã chỉ ra r ng cây đậu tƣơng c nguồn gốc từ châu Á và đƣợc trồng tại Trung Quốc vào khoảng 5000 năm trƣớc cơng nguyên [19]. Nghiên cứu khác của Hymowitz cho r ng cây đậu tƣơng đã đƣợc thuần hĩa và gieo trồng ở một phần phía đơng và bắc Trung Quốc vào thế kỉ XI trƣớc cơng nguyên, sau đ n đã đƣợc du nhập vào Hàn Quốc, Nhật Bản và các nƣớc Đơng Nam Á vào khoảng thế kỉ XI đến thế kỉ XIII trƣớc cơng nguyên [18]. Sau chiến tranh thế giới thứ hai, cây đậu tƣơng đƣợc trồng và phát triển mạnh ở Hoa Kỳ, Brazil và Canada. Theo sách “Vân Đài loại ngữ” của Lê Quý Đơn, Việt Nam cĩ lịch sử canh tác cây đậu tƣơng vào khoảng thế kỉ thứ VI [4]. Trong một số ghi chép cho r ng cây đậu tƣơng đã đƣợc canh tác ở nƣớc ta vào thời vua H ng trƣớc cả cây đậu xanh và đậu đen [2]. Đậu tƣơng đƣợc trồng chủ yếu để lấy hạt, là loại cây thực phẩm quan trọng sau lúa mì, lúa nƣớc và ngơ. Ở Châu Mỹ là nơi c diện tích canh tác đậu tƣơng lớn nhất lên tới 70% và tiếp ngay sau đ là Châu Á. Theo số liệu năm 1993 Việt Nam đã hình thành 6 vùng sản xuất đậu tƣơng trọng điểm trên cả nƣớc với diện tích lớn bao gồm: v ng Đơng Nam Bộ (26,2%), miền núi Bắc Bộ (24,7% , đồng b ng sơng Cửu Long (12,4% , đồng b ng sơng Hồng (17,5%), hai vùng cịn lại là đồng b ng ven biển miền Trung và Tây Nguyên với diện tích canh tác thấp hơn [2]. Đậu tƣơng hay một số nơi c n gọi là đỗ tƣơng, đậu nành hoặc hồng đậu miêu thuộc bộ Phaseoleae, họ đậu Fabaceae, họ phụ cánh bƣớm 3
  13. Papilionoideae, chi Glycine với tên khoa học là Glycine max. Dựa vào các đặc điểm về hình thái, sự phân bố địa lý và số lƣợng nhiễm sắc thể do Hymowit và Newell (1984) xây dựng thì ngồi chi Glycine cịn cĩ thêm chi phụ Soja. Chi Glycine đƣợc chia ra thành 7 lồi hoang dại lâu năm, chi phụ Soja đƣợc chia ra làm 2 lồi: lồi đậu tƣơng trồng Glycine (L.) Merr và lồi hoang dại hàng năm G.Soja Sieb và Zucc. [6]. 1.1.2. Đặc điểm sinh học của cây đậu tương 1.1.2.1. Đặc điểm hình thái học của cây đậu tương Đậu tƣơng là cây hai lá mầm, thân thảo. Thân cây cĩ hình trịn, trên thân cĩ nhiều lơng nhỏ, màu trắng. Thân cây lúc cịn non cĩ màu xanh hoặc màu tím, khi về già chuyển sang màu nâu nhạt. Màu sắc của thân non cĩ thể cho ta biết màu sắc của hoa sau này, nếu thân lúc cịn non màu xanh thì hoa màu trắng và nếu khi c n non thân c màu tím thì hoa c màu tím đỏ. Thân cây đậu tƣơng thƣờng cĩ chiều cao từ 0,3 - 1m tùy theo từng giống [6]. Cây đậu tƣơng c lá kép, mọc so le, gồm 3 lá chét cĩ dạng hình bầu dục hoặc hình trái xoan. Gốc lá tr n, đầu nhọn, dài từ 3 - 12cm, rộng từ 2 - 8cm. Lá chét bên lệch, hai mặt cĩ lơng bao phủ, gân chính cĩ 3 cuống chung dài từ 7 - 10cm, cĩ lơng bao phủ (Hình 1.1) [5]. Lá đa dạng về hình dạng phụ thuộc vào giống, những giống cĩ lá dài và nhỏ chịu hạn tốt nhƣng thƣờng cho năng suất kém, những giống lá to thì thƣờng cho năng suất cao hơn nhƣng tính chống chịu kém hơn. Số lƣợng lá nhiều, to và khỏe nhất vào thời kì đang ra hoa rộ. Khi phiến lá phát triển to, rộng, mỏng phẳng và lá c màu xanh tƣơi chứng tỏ cây đang sinh trƣởng khỏe và cĩ khả năng cho năng suất cao [6]. Hoa thƣờng nhỏ, cĩ màu tím hoặc màu trắng, hình chuơng, phủ lơng mềm. Tràng hoa cĩ cánh cờ mở rộng, khơng cĩ tai, nhị một bĩ, bầu cĩ lơng (Hình 1.1)[5]. Hoa thƣờng mọc thành từng chùm, mỗi chùm cĩ từ 3 - 5 hoa. Hoa đậu tƣơng là hoa lƣỡng tính nên đây là cây tự thụ phấn, tỷ lệ giao phấn rất thấp chỉ chiếm khoảng 0,5 - 1% [6]. 4
  14. Quả đậu tƣơng thẳng hoặc hơi cong, dài từ 2 - 7cm. Mỗi quả thƣờng cĩ từ 2 - 3 hạt. Lúc quả cịn non quả cĩ màu xan, khi quả chín cĩ màu nâu. Hạt cĩ hình trịn, hình bầu dục. Những giống cĩ hạt màu vàng thƣơng c giá trị thƣơng phẩm cao. Trong hạt, phơi thƣờng chiếm 2%, hai lá tử điệp chiếm 90% và 8% cịn lại là vỏ hạt trên tổng khối lƣợng của hạt. Hình dạng và màu sắc của rốn hạt đặc trƣng cho mỗi giống (Hình 1.1)[6]. Bộ rễ của đậu tƣơng gồm rễ chính và rễ phụ. Trên rễ cĩ rất nhiều nốt sần, đ là kết quả của sự cộng sinh giữa vi khuẩn Rhizobium jabonicum với rễ. Nốt sần cĩ thể dài tới 1cm, đƣờng kính từ 5 - 6mm, khi mới hình thành nĩ cĩ màu trắng sữa, khi phát triển tốt nhất nốt sần cĩ màu hồng. Nốt sần tập trung nhiều nhất ở tầng đất c độ sâu từ 0 - 20cm, cĩ vai trị quan trọng trong việc cố định từ nitơ trong khơng khí với lƣợng đạm cung cấp cho cây khoảng 30 - 60kg/ha (Hình 1.1) [6]. Hình 1.1: Đặc điểm Hình thái cây đậu tƣơng (Nguồn tài liệu tham khảo: A: Hoa đậu tƣơng; B: Quả đậu tƣơng; C: Lá cây đậu tƣơng; D: Rễ cây đậu tƣơng. 5
  15. 1.1.2.2. Đặc điểm di truyền của cây đậu tương Đậu tƣơng thuộc chi Glycine cĩ tổ tiên là lồi hoang dại Glycine soja. Glycine là chi duy nhất trong bộ Phaseoleae mà các lồi của nĩ cĩ số nhiễm sắc thể nhị bội 2n = 40 và 80 khơng phải là 20 [2]. Trong nghiên cứu của Lackey số nhiễm sắc thể của Glycine cĩ thể bắt nguồn từ lồi nhị bội với số nhiễm sắc thể gốc x = 11 trải qua quá trình đa bội lệch khuyết cĩ gốc x = 10 và đa bội thể đã cho bộ nhiễm sắc thể lên đến 40 và 80 [29]. Theo Gurley, đậu tƣơng là dạng tứ bội bền vững của bộ nhiễm nhị bội [15]. Cây đậu tƣơng cĩ bộ nhiễm sắc thể lƣỡng bội 2n = 40 với kích thƣớc vào khoảng 1115Mb bao gồm 1,115 triệu cặp bazơ trên mỗi nhiễm sắc thể đơn bội [8]. Trong tồn bộ genome cĩ khoảng 40 - 60% trình tự gen lặp lại [15,16]. Đậu tƣơng c bộ nhiễm sắc thể 2n = 40 với tỷ lệ G/C trung bình là 34,8%, số lƣợng protein trung bình là 89 597 và số lƣợng gen trung bình là 56 680 (www.ncbi.nlm.nih.gov/genome/5). 1.1.3. Vai trị của cây đậu tương Đậu tƣơng là cây trồng ngắn ngày đem lại giá trị kinh tế cao và cĩ tác dụng về nhiều mặt nhƣ: làm thực phẩm, thức ăn chăn nuơi, nguyên liệu trong nhiều ngành cơng nghiệp, cải tạo đất. Vì thế cây đậu tƣơng đƣợc mệnh danh là “ Ơng hồng trong các loại cây họ đậu” [6]. Đậu tƣơng đƣợc biết tới là một loại ngũ cốc c hàm lƣợng dinh dƣỡng rất cao nhất là hàm lƣợng protein trung bình khoảng 35,5 - 40%. So với hàm lƣợng protein trong gạo (6,2 - 12%), ngơ (9,8 - 13,2%) hay các loại thịt nhƣ thịt bị (21%), thịt gà (20%), cá (17 - 20% thì hàm lƣợng protein trong đậu tƣơng ở mức cao, lipit khoảng 15 - 20%, carbohydrate khoảng 15 - 16% và một số các khống chất khác cần cho sự sống [3]. Protein trong đậu tƣơng đƣợc coi là loại protein thực vật cĩ phẩm chất tốt, dễ tiêu h a hơn protein trong thịt và đặc biệt là khơng cĩ các thành phần tạo cholesterol. Hàm lƣợng lipid trong đậu tƣơng cũng rất cao, chứa khoảng 60 - 70% các acid béo khơng 6
  16. no rất tốt cho sức khỏe. Bên cạnh đ , trong hạt đậu tƣơng c chứa rất nhiều các vitamin và khống chất nhƣ vitamin B1, vitamin B2, vitamin C, Ca, Fe, P [6]. Ngồi đƣợc sử dụng để chế biến thành các loại thực phẩm cho con ngƣời, đậu tƣơng c n đƣợc sử dụng làm thức ăn cho gia súc. Khoảng 1kg hạt đậu tƣơng khơ tƣơng đƣơng với 1,38 đơn vị thức ăn chăn nuơi. Tồn bộ cây đậu tƣơng c chứa hàm lƣợng đạm khá cao cĩ thể sử dụng làm thức ăn cho gia súc hoặc nghiền khơ để chế biến thức ăn tổng hợp rất tốt. Sản phẩm phụ cơng nghiệp nhƣ khơ dầu cĩ thành phần dinh dƣỡng khá cao: N: 6,2%, P2O5: 0,7%, K2O: 2,4% cĩ thế làm thức ăn bổ sung cho gia súc rất tốt [2]. Hiện nay, những nguồn năng lƣợng hĩa thạch nhƣ than đá, dầu mỏ cĩ trữ lƣợng ngày càng giảm kèm theo là hiện tƣợng biến đổi khí hậu và các vấn đề mơi trƣờng nên nhiên liệu sinh học là giải pháp thay thế tốt nhất. Biodiesel là nhiên liệu sạch và tái tạo đƣợc coi là sự thay thế tốt nhất cho nhiên liệu diesel. Trong đ dầu đƣợc chiết xuất từ hạt đậu tƣơng đƣợc coi là nguồn nguyên liệu chính để sản xuất dầu diezel sinh học. Ngồi là nguyên liệu sản xuất dầu diezel sinh học, dầu đậu tƣơng c thể sử dụng để sản xuất một dạng nhiên liệu sinh học khác là bioethanol. Vỏ đậu tƣơng chứa lƣợng lớn carbohydrate sử dụng để tạo ra bioethanol và cĩ thể làm thức ăn cho động vật vì cĩ chứa hàm lƣợng protein cao. Kết quả kiểm tra khí thải động cơ cho thấy r ng chỉ sử dụng dầu diesel sinh học đã tạo ra khí thải CO, HC, NOx và kh i ít hơn so với petro-diesel [25]. Tồn bộ cây đậu tƣơng (thân, lá, quả, hạt) cả khi tƣơi và khơ đều cĩ thể làm thức ăn cho gia súc. Đặc biệt cây đậu tƣơng c vai tr quan trọng trong việc cải tạo đất do trên rễ cĩ rất nhiều nốt sần (là kết quả của sự cộng sinh giữa vi khuẩn Rhizobium jabonicum với rễ) c năng cố định đạm. Vậy cứ trồng khoảng 1 ha đậu tƣơng sinh trƣởng tốt s tạo ra khoảng 30 - 60 kg nitơ 7
  17. trong đất. Đối với thân và lá đậu tƣơng c chứa lƣợng lớn nitơ nên sau khi thu hoạch cĩ thể sử dụng nhƣ phân hữu cơ để b n cho đất hoặc các cây trồng khác. Việc luân canh cây đậu tƣơng với một loại cây trồng khác đƣợc xem là biện pháp cải tạo đất trồng rất tốt [6]. 1.1.4. Tình hình sản xuất đậu tương trên thế giới và Việt Nam 1.1.4.1. Tình hình sản xuất đậu tương trên thế giới Đậu tƣơng là cây trồng cĩ giá trị kinh tế và dinh dƣỡng cao, đƣợc xem là một trong những loại cây thực phẩm quan trọng bậc nhất thế giới sau cây lúa mì, lúa nƣớc và ngơ. Do cĩ khả năng thích ứng rộng với các điều kiện khí hậu khác nhau nên đậu tƣơng đƣợc canh trồng rộng rãi trên tồn thế giới, nhƣng tập trung chủ yếu ở tại Hoa Kỳ, tiếp đến là Châu Á. Theo số liệu từ bảng 1.1 cho thấy tổng diện tích canh tác đậu tƣơng trên tồn thế giới khoảng 121,5 triệu ha, trong đ : Hoa Kỳ là 33,5 triệu ha (28% , Brazil đạt 33,2 triệu ha (27,2%), Argentina là 19,5 triệu ha (16%), Ấn Độ là 11,5 triệu ha (9%) và Trung Quốc là 6,6 triệu ha (5,5%). Số liệu từ bảng 1.1 cho thấy tổng sản lƣợng của thế giới là 334,9 triệu tấn tăng khoảng 11,7 triệu tấn so với năm 2015. Tổng sản lƣợng thu hoạch của Hoa Kỳ năm 2016 khoảng hơn 117,2 triệu tấn chiếm gần 35% sản lƣợng của thế giới (FAO, 2016). Bảng 1. 1: Diện tích và sản lƣợng đậu tƣơng của 5 nƣớc dẫn đầu và tồn thế giới (FAO, 2016) T n quốc gia Diện tích canh t c Sản lƣợng thu hoạch (triệu ha) (triệu tấn) Hoa Kỳ 33,5 117,2 Brazil 33,2 96,3 Argentina 19,5 58,8 Ấn Độ 11,5 14 Trung Quốc 6,6 11,9 Thế giới 121,5 334,9 8
  18. 1.1.4.2. Tình hình sản xuất đậu tương tại Việt Nam Việt Nam là một đất nƣớc cĩ nền nơng nghiệp rất lâu đời, bên cạnh các cây lƣơng thực nhƣ lúa, ngơ và một số cây cơng nghiệp khác thì đậu tƣơng cũng đ ng vai tr quan trọng đối với đối với đời sống của ngƣời dân Việt Nam. Cả nƣớc cĩ 28 tỉnh thành canh tác đậu tƣơng trong đ 70% là ở miền Bắc và 30% ở các tỉnh phía Nam [6]. Theo số liệu chính thức của FAO thì diện tích và sản lƣợng trồng đậu tƣơng ở nƣớc ta thì từ năm 2010 trở về các năm trƣớc thì phát triển rất mạnh cả về diện tích gieo trồng cũng nhƣ là năng suất thu hoạch. Tuy nhiên với những phƣơng thức canh tác truyền thống, bộ giống năng suất thấp, sản xuất nhỏ lẻ, giá thành cao, lãi suất thấp, giá thành đậu tƣơng trong nƣớc khơng cĩ khả năng cạnh tranh với đậu tƣơng nhập khẩu cộng thêm sự bất lợi về điều kiện khí hậu trong một vài năm gần đây là nguyên nhân dẫn đến việc nơng dân khơng cịn mặn mà với cây đậu tƣơng đã dẫn đến diện tích và sản lƣợng đậu tƣơng giảm mạnh trong 6 năm gần đây. Quan sát biểu đồ hình 1.2 cĩ thể thấy năm 2012 sản lƣợng đậu tƣơng nƣớc ta đã giảm 34,3% so với cùng kỳ năm trƣớc xuống cịn khoảng 175,2 nghìn tấn do điều kiện khí hậu bất lợi. Diện tích trơng đậu tƣơng năm 2016 ở nƣớc ta giảm mạnh chỉ b ng khoảng 50% diện tích của năm 2010 là 99,6 nghìn ha và sản lƣợng đạt ở mức 161 nghìn tấn giảm gần 138 nghìn tấn so với cùng kỳ năm 2010 (FAO, 2016). 9
  19. Hình 1.2: Diện tích và sản lƣợng đậu tƣơng trong niên vụ 2010 - 2016 ( FAO, 2010-2016) 1.2. Tổng quan về c c nhân tố phi n mã trong nghi n cứu TF là một protein gắn đặc hiệu với trình tự DNA trong v ng điều khiển và tham gia điều khiển quá trình phiên mã của gene [10][31]. Trong nghiên cứu này, chúng tơi s tiến hành phân tích 3 nhĩm TF phổ biến nhất ở thực vật là bHLH, bZIP và SRF. 1.2.1. Nhân tố phiên mã bHLH (Basic Helix-Loop-Helix) TF basic/helix-loop-helix (bHLH) và nhân tố tƣơng đồngcủa chúng đã tạo thành một họ lớn trong genome của cả thực vật và động vật [36]. Từ khi tìm ra TF bHLH cĩ khả năng liên kết với DNA và khả năng nhị trùng hĩa [36] các thành viên trong siêu họ protein bHLH ngày càng phát hiện thêm nhiều chức năng quan trọng trong quá trình sinh lí và sinh trƣởng ở động vật ở mức độ thấp hơn so với thực vật [35][40]. bHLH chứa khoảng 60 acid amin với hai vùng chức năng đ là v ng cơ bản (basic) và vùng chức năng (helix-loop- helix . V ng cơ bản n m ở đầu amin (N-terminal) của miền bHLH và cĩ chức năng nhƣ một dạng gắn kết DNA, bao gồm khoảng 15 amino acid thƣờng 10
  20. gồm sáu dƣ lƣợng cơ bản. Vùng HLH gồm hai phân tử α-helices phân cực với một sự liên kết vịng lặp với chiều dài biến thiên. Các α-helices lƣỡng cực của hai protein bHLH cĩ thể tƣơng tác và hình thành hai cấu phần giống nhau (homodimer) hoặc hai cấu phần khác nhau (heterodimer) [13][36][38]. Trong các nghiên cứu gần đây đã cho thấy một số protein bHLH ở thực vật cĩ khả năng tƣơng tác với các protein bị thiếu đi một miền bHLH, đặc biệt là đối với các phức hợp protein với protein MYB (Myeloblastosis), bHLH và WD40 đƣợc đƣa ra để bảo vệ tế bào và rễ tơ khác nhau [39]. 1.2.2. Nhân tố phiên mã bZIP (Basic Leucine Zipper) Protein bZIP (basic leucine zipper) là một họ lớn cĩ khả năng điều chỉnh quá trình phiên mã [46], đặc biệt là đối với thực vật nĩi chung và sinh vật nhân thực n i riêng. Các protein bZIP thƣờng gồm một miền bZIP cĩ hai vùng là: vùng basic và vùng nhị trùng hĩa. Vùng basic liên kết với DNA và vùng nhị trùng hĩa cĩ dạng homo giống nhƣ các dị thể. Ở tại v ng cơ bản cĩ vùng tín hiệu bên trong dựa trên một dạng N-x7-R/K khơng đổi để liên kết với DNA. Ngồi ra, sự lặp lại của một đoạn leucine tại vị trí chín amino acid n m dọc theo v ng đầu cacboxyl (C-terminus) đã tạo ra một phân tử helix phân cực. Các yếu tố phiên mã bZIP ở thực vật thì liên kết chặt ch với chuỗi DNA của -ACGT- nhƣ G-box (-CACGTG-), C-box (-GACGTC-), A-box (- TACGTA-) [23]. Các TF bZIP thƣờng phổ biến nhất ở thực vật nh m điều chỉnh các hiện tƣợng nhƣ: nảy mầm, quang hĩa, hình thành hoa, phát triển hoa và cũng c vai trị quan trọng đối với cây trồng trong việc báo hiệu bất lợi và hormone. Các protein bZIP ở thực vật đã đƣợc nghiên cứu rộng rãi và các chức năng của chúng phức tạp hơn đối với các TF khác [49]. 1.2.3 Nhân tố phiên mã SRF (Serum-Response Factor) Họ TF SRF gồm khoảng 56 amino acid và đƣợc tìm thấy trong vùng liên kết DNA của phần đơng các TF ở sinh vật nhân thực. Vùng ở đầu amin (N- 11
  21. terminal) của MADS-box gồm chủ yếu là đuơi kỵ nƣớc với tỷ lệ base cao trong khi vùng ở đầu cacboxyl (C-terminal) chủ yếu là đuơi kỵ nƣớc. Ở phần lớn các MADS-box, MADS-box n m ở phần cuối vùng N-terminal. Tuy nhiên trong một số protein khác thì MADS-box n m ở gần vùng trung tâm hoặc n m ở phía cuối vùng ở đầu cacboxyl (C-terminal). Trong trƣờng hợp của SRF sự cĩ mặt của một N-terminal mở rộng đến MADS-box cĩ ảnh hƣởng lớn đến tính đặc hiệu của liên kết DNA [45]. 1.3. Met và vai trị của Met trong đ p ứng điều iện bất lợi Methionine (Met) là một gốc amino acid cĩ vai trị vơ cùng quan trọng đối với đời sống của sinh giới. Về cấu trúc, phân tử Met cĩ chứa một gốc lƣu huỳnh. Met là một phân tử kỵ nƣớc, hầu hết dƣ lƣợng Met trong protein cĩ hình cầu và đƣợc tìm thấy bên trong lõi kỵ nƣớc. Ở khoảng gian màng tế bào thì Met thƣờng đƣợc tìm thấy trong trạng thái tƣơng tác với lớp lipit kép. Đối với một số protein thì một phần dƣ lƣợng Met s đƣợc phân bố trên bề mặt. Dƣ lƣợng Met dễ bị ơxi hĩa thành methionine sulfoxide. Theo Levine cho r ng dƣ lƣợng Met giống nhƣ là những chất chống ơxi hĩa nội sinh trong protein [32]. Vai trị của Met thƣờng đƣợc biết đến là chất chống ơxi hĩa, chất xúc tác, cấu trúc nên protein, cĩ khả năng ơxi hĩa-khử và điều chỉnh phù hợp. Trong nghiên cứu gần đây của Vally đã xác định đƣợc r ng dƣ lƣợng Met trong protein thƣờng đƣợc định vị để hình thành nên các liên kết kỵ nƣớc giữa các nguyên tử lƣu huỳnh với các v ng thơm, bao gồm tryptophan, phenylalanine và tyrosine [48]. Những liên kết kỵ nƣớc giữa lƣu huỳnh với v ng thơm rất phổ biến và đ ng g p vào sự ổn định của cấu trúc protein với năng lƣợng liên kết từ 1,0-1,5 kcal/mol. Những amino acid chứa v ng thơm là một trong những chất dễ bị ơxi hĩa nhất bởi các phản ứng, để tƣơng tác với Met thì cần thiết lập vị trí tối ƣu để bảo vệ protein chống lại sự ơxi hĩa. Quá trình chuyển đổi Met thành MetO (methionine sulfoxide) s loại bỏ liên kết kỵ nƣớc và cĩ 12
  22. khả năng ảnh hƣởng đến cấu trúc khơng gian của phân tử protein (Kim et al. ,2014). Rinalducci đã chỉ ra r ng khoảng 68% phân tử bị ơxi hĩa trong tế bào là chính là protein [44], vì vậy đây đƣợc coi là một đối tƣợng rất dễ bị tác động bởi các điều kiện bất lợi. 1.4. Lịch sử nghi n cứu 1.4.1. Lịch sử nghiên cứu thế giới Trên thế giới tính đến nay đã c rất nhiều cơng trình nghiên cứu về vai trị của các họ TF trong đáp ứng các điều kiện bất lợi trên đối tƣợng thực vật. Cụ thể, 319 gene thuộc họ bHLH đã đƣợc xác định ở đậu tƣơng [20]. Đáng chú ý, 47% số gene đƣợc biểu hiện ở mơ rễ, lá và các mơ hạt, trong khi các gene cịn lại đƣợc biểu hiện mạnh ở mơ cụ thể (một hoặc nhiều loại mơ) [20]. Đối với họ bZIP, đã tìm và xác định đƣợc 160 gene chia thành 12 phân họ và phân bố đều trên 20 nhiễm sắc thể của đậu tƣơng [51]. Phân tích mức độ biểu hiện của các gene mã h a họ bZIP ở đậu tƣơng đã chỉ ra r ng cĩ 83,44% biểu hiện mạnh ở các mơ và 75,6% c mức độ phiên mã đáp ứng với xử lí hạn [51]. Tuy nhiên, chƣa c nhiều nghiên cứu đã ghi nhận về các gene mã h a họ TF SRF ở thực vật. Trong genome của cây đậu tƣơng, đã xác định đƣợc 152 thành viên của họ NAC TF với 58 gene đáp ứng các điều kiện bất lợi [30]. Một nghiên cứu khác đã xác định đƣợc 21 gene GmNFYA, 32 GmNF-YB và 15 gene GmNF- YC trong genome đậu tƣơng c vai tr trong đáp ứng hạn [39]. Đối với TF WRKY là một họ lớn tham gia vào quá trình sinh lí và đặc biệt là quá trình đáp ứng điều kiện bất lợi của mơi trƣờng. Trong nghiên cứu này, họ đã xác định đƣợc 188 gene WRKY, chia thành 3 nhĩm chính (I,II,III) [50]. Tuy nhiên, chƣa c nghiên cứu nào ghi nhận về vai tr của các amino acid c thể liên quan đến đáp ứng bất lợi ở các nh m TF ở thực vật. 13
  23. 1.4.2. Lịch sử nghiên cứu tại Việt Nam Gần đây, 121 và 213 gene mã h a protein giàu Met đã đƣợc xác định một cách c hệ thống trên cây mơ hình Arabidopsis và đậu tƣơng [21]. Trong đ , phần lớn các gene đều tham gia vào những quá trình sinh học quan trọng diễn ra trong tế bào nhƣ phiên mã RNA, protein sửa đổi và tín hiệu Ca2+ [21]. Nhƣ đã trình bày, Met là một amino acid rất dễ bị ơxi h a dƣới tác động của bất lợi ngoại cảnh [27]. Chính vì vậy, câu hỏi đƣợc đặt ra là liệu r ng các phân tử protein giàu Met này tham gia vào quá trình đáp ứng bất lợi ra sao Cụ thể hơn, các gốc Met liệu c thể bảo vệ phân tử protein khi bị bất lợi tấn cơng hay khơng? 14
  24. Chƣơng 2 VẬT LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU 2.1.Vật liệu nghi n cứu Trình tự protein và mã định danh của 21 TF giàu Met, bao gồm 11 TF nh m bHLH, 3 TF nh m bZIP và 7 TF nh m SRF đƣợc khai thác từ nghiên cứu trƣớc đây [21] (Bảng 2.1) Bảng 2. 1: Thơng tin về các TF giàu Met đƣợc khai thác trong nghiên cứu. TT Mã định danh TF TT Mã định danh TF TT Mã định danh TF 01 Glyma01g15930 08 Glyma10g04890 15 Glyma10g40080 02 Glyma02g00980 09 Glyma11g17120 16 Glyma11g26260 03 Glyma03g04000 10 Glyma13g19250 17 Glyma11g30490 04 Glyma03g32740 11 Glyma20g22280 18 Glyma11g30620 bHLH 05 Glyma04g04190 12 Glyma02g01600 19 Glyma18g05930 06 Glyma05g19920 13 Glyma05g28960 20 Glyma18g05960 P 07 Glyma06g04380 14 Glyma08g12170 21 Glyma20g27320 bHLH bZI SRF 2.2. Phƣơng ph p nghi n cứu 2.2.1. Phương pháp phân tích đặc tính protein ở đậu tương Lấy trình tự của chuỗi protein cần từ cơ sở dữ liệu SOYBASE ( dƣới định dạng FASTA. Một số đặc tính, bao gồm số lƣợng amino acid (L), trọng lƣợng phân tử (molecular weight, mW , điểm đẳng điện (isoelectric point, pI), chỉ số bất ổn định (Instability index), chỉ số béo (Aliphatic index), độ ƣa nƣớc (grand average of hydropathicity, GRAVY đƣợc xác định b ng cách đƣa trình tự amino acid của các protein thuộc 3 họ TF là bHLH, bZIP và SRF vào cơng cụ Expasy [17]. 15
  25. Hình 2.1: Giao diện trang web ExPASy protparam tool 2.2.2. Phương pháp xây dựng cây phát sinh Cây phân loại đƣợc xây dựng b ng phần mềm MEGA 7.0 dựa trên thuật tốn Neighbor-Joining [28]. 2.2.3. Phương pháp tính %Met ở ngồi vùng bảo thủ Các nh m TF đƣợc kiểm tra v ng bảo thủ b ng phần mềm MEGA (v. 7.0) [28]. Trình tự ngoại biên từ đầu 3 và 5 đến vị trí tiếp giáp v ng bảo thủ đƣợc tách biệt để xác định sự phân bố các gốc Met b ng cơng cụ BioEDIT [22]. 2.2.4. Phương pháp xác định vị trí phân bố của protein trong tế bào Hình 2.2: Cơ sở dữ liệu TargetP 16
  26. Vị trí cƣ trú của protein trong tế bào đƣợc dự đốn b ng cách đƣa trình tự mã hĩa DNA (ở định dạng FASTA) của 21 gene thành viên của 3 họ gene bHLH, bZIP, SRF truy vấn vào chƣơng trình TargetP v1.1 ( [14]. 2.2.5. Phương pháp phân tích mức độ biểu hiện của gen mã hĩa trong điều kiện thường và điều kiện mặn Sự biểu hiện của các gene ở điều kiện thƣờng đƣợc phân tích thơng qua kết quả RNA-seq (giải trình tự tổng hợp ARN thơng tin) của cây đậu tƣơng trong nghiên cứu của Libault [42]. Nghiên cứu này, chúng tơi sử dụng dữ liệu từ cơ sở dữ liệu CEO của NCBI với số hiệu GSE57252 [11] để phân tích sự biểu hiện của các gene mã hĩa thuộc các họ TF bHLH, bZIP, SRF trong điều kiện mặn qua kết quả RNA-seq. Những hạt giống của G. max cv. Williams 82 đã nảy mầm trên giấy ẩm và chờ chúng phát triển đến giai đoạn v1 (giai đoạn cĩ 3 lá kép đầu tiên trong buồng sinh trƣởng duy trì ở 770F (250C) và độ ẩm 60% trong suốt thí nghiệm. Nhiệt độ và độ ẩm liên tục đƣợc theo d i và duy trì trong buồng tăng trƣởng. Việc xử lý muối đƣợc áp dụng b ng cách chuyển cây con vào dung dịch NaCl 100 mM. Mơ rễ s đƣợc thu sau 0, 1, 6 và 12 giờ điều trị căng thẳng. Sử dụng 5 cây cho mỗi lần tại một thời điểm điều trị căng thẳng. Sau khi thu mẫu mơ rễ từ cây trong điều kiện mặn s tiến hành tinh sạch RNA và giải trình tự, xử lí số dữ liệu và phân tích biển hiện của gene [11]. 17
  27. Chƣơng 3 KẾT QUẢ VÀ THẢO LUẬN 3.1. Phân tích đặc tính protein của ba nhĩm TF giàu Met ở đậu tƣơng 3.1.1. Nhĩm bHLH ở đậu tương Trình tự protein và mã định danh của 21 TF giàu Met, bao gồm 11 TF nh m bHLH, 3 TF nh m bZIP và 7 TF nh m SRF đƣợc khai thác từ nghiên cứu trƣớc đây của Chu Đức Hà [21]. Một số đặc tính cơ bản của các họ TF trong nghiên cứu đƣợc khai thác và tìm kiếm b ng cách tiến hành truy vấn trình tự protein b ng các cơng cụ tin sinh học. Đặc tính của phân tử protein, bao gồm kích thƣớc phân tử, trọng lƣợng phân tử, điểm đẳng điện, chỉ số bất ổn định, chỉ số béo và độ ƣa nƣớc trung bình đƣợc xác định thơng qua cơng cụ Expasy [17]. Cơng cụ Expasy là cơ sở dữ liệu về hệ thống nghiên cứu phân tích cấu trúc phiên mã [17]. Chính vì vậy, đây là cơ sở dữ liệu đƣợc hầu hết nhà khoa học trên thế giới sử dụng để thu thập và khai thác các thơng tin cơ bản của phân tử protein, trong đ c kích thƣớc phân tử, trọng lƣợng phân tử, điểm đẳng điện, chỉ số bất ổn định, chỉ số béo và độ ƣa nƣớc trung bình của phân tử protein. Ngồi ra chúng tơi sử dụng cơng cụ TargetP để xác định vị trí của các phân tử protein trong tế bào. Từ kết quả thu đƣợc ở bảng 3.1 cĩ thể thấy, kích thƣớc và trọng lƣợng của các protein thuộc họ TF bHLH rất đa dạng, dao động trong khoảng từ 259 đến 491 amino acid. Trung bình kích thƣớc của các protin thuộc họ TF bHLH đạt khoảng 380 amino acid. Chuỗi protein ngắn nhất là Glyma06g04380 đạt 258 amino acid, trong khi đ chuỗi dài nhất là Glyma10g04890 đƣợc cấu tạo từ 481 amino acid. Trọng lƣợng của protein tỷ lệ thuận với kích thƣớc, dao động trong khoảng từ 29,2 (Glyma02g00980 đến 54,3 kDa (Glyma10g04890). Khối lƣợng trung bình khoảng 42,4kDa. Với kích thƣớc và trọng lƣợng phân tử khá cao dẫn đến các protein họ bHLH c độ linh hoạt thấp. 18
  28. Mặt khác, giá trị điểm đẳng điện của các phân tử protein cũng đƣợc chứng minh là cĩ liên quan tới vị trí và chức năng của các protein trong tế bào [24]. Phân tích ba vị trí dƣới tế bào của các protein đ trong thấy r ng trong plasmtid và proteome ty thể của thực vật c dƣ thừa một lƣợng protein cĩ tính acid. Tế bào chất và các proteome màng gồm cĩ cả protein cĩ tính acid và protein basic, proteome nhân cĩ tỷ lệ tƣơng đối của các protein cĩ tính acid và protein basic. Các protein cĩ tính acid mạnh nhất khơng chỉ cĩ ở tế bào chất mà cịn cĩ trong các khơng bào, lysosome và nhiều protein acid tạo thành khung tế bào [24]. Nhìn chung các protein c tính acid thƣờng đƣợc phân bố ở tế bào chất, trong ty thể và một số bào quan c màng thƣờng chứa protein c tính base. Kết quả cho thấy, các phân tử protein thuộc họ TF bHLH cĩ giá trị pI trong khoảng từ 5,84 (Glyma10g04890 đến 9,26 (Glyma02g00980). Các protein n m trong khoảng từ 5,84 đến 6,84 bao gồm glyma10g04890, glyma20g22280, glyma13g19250, glyma06g04380, glyma04g04190 là những protein cĩ tính acid. Chúng s đƣợc vận chuyển ra tế bào chất ngay sau khi đƣợc tổng hợp trong nhân. Cĩ 6 protein cịn lại n m trong khoảng pI từ 7,2 đến 9,26 là những protein cĩ tính base gồm glyma03g32740, glyma11g17120, glyma01g15930, glyma05g19920, glyma03g04000, glyma02g00980. Chúng cĩ thể đƣợc bám trên ty thể hoặc các hệ thống cĩ màng khác. 19
  29. Bảng 3.1: Đặc tính của nhĩm protein họ bHLH ở đậu tƣơng STT Tên Protein %Met L(aa) mW (kDa) pI II Chỉ số béo GRAVY Vị trí 1 Glyma01g15930 6,75 458 49,2 8,88 47,61 55,15 -0,549 C 2 Glyma02g00980 6,15 259 29,2 9,26 39,46 88,49 -0,098 S 3 Glyma03g04000 7,54 397 44,2 9,14 51,91 55,21 -0,695 _ 4 Glyma03g32740 6,22 481 52,6 7,2 63,57 60,29 -0,511 M 5 Glyma04g04190 7,17 264 30,2 6,84 68,89 57,31 -0,781 _ 6 Glyma11g17120 7,73 465 49,9 8,63 46,28 51,63 -0,576 C 7 Glyma13g19250 6,29 476 52,6 6,03 65,52 49,1 -0,82 M 8 Glyma20g22280 6,79 426 44,8 5,92 62,84 51,6 -0,656 _ 9 Glyma05g19920 6,2 273 30,4 8,93 52,3 64,25 -0,531 _ 10 Glyma06g04380 7,34 258 29,4 6,63 59,36 59,07 -0,719 _ 11 Glyma10g04890 6,1 491 54,3 5,84 65,4 50,92 -0,845 _ Ghi chú: L(aa): Kích thước (amino acid), mW: Trọng lượng phân tử, C: Lục lạp, M: Ty thể, S: hệ thống bao gĩi, *: Độ tin cậy cao. 20
  30. Chỉ số bất ổn định (II cũng đƣợc đề cập tới và sử dụng để xác thời gian bán hủy của protein trong ống nghiệm. Theo kết quả phân tích, chỉ cĩ duy nhất một phân tử protei cĩ chỉ số II = 39,46 40 vậy nên s cĩ thời gian bán hủy ngắn và kém ổn định trong ống nghiệm. Khi quan sát bảng 3.1 ta cĩ thể thấy r ng các chỉ số về độ ƣa nƣớc trung bình của các protein họ bHLH đều nhỏ hơn 0 (GRAVY < 0 chứng tỏ r ng chúng đều c tính ƣa nƣớc. Ngồi ra, trong nghiên cứu này chúng tơi cũng sử dụng chỉ số béo Aliphatic để đánh giá các protein. Chỉ số này đƣợc coi là một yếu tố tích cực để gia tăng khả năng chịu nhiệt của các protein hình cầu. Điều này c ý nghĩa thật sự với những phân tử cĩ khối lƣợng dƣới 100. Nh m tăng độ tin cậy cho kết quả, chúng tơi đã sử dụng phần mềm TagertP để xác định vị trí của những phân tử protein này trong tế bào. Kết quả cho thấy cĩ thể cĩ 2 protein là Glyma01g15930 và Glyma11g17120 s n m tại lục lạp. Đối với ty thể cĩ thể cĩ sự xuất hiện của 2 protein là Glyma03g32740 và Glyma13g19250. Trong hệ thống bao gĩi của tế bào cĩ thể cĩ sự hiện diện của protein Glyma02g00980. Đây đƣợc xem là dẫn liệu quan trọng trong những nghiên cứu chức năng gene tiếp theo. 21
  31. 3.1.2.Nhĩm bZIP ở đậu tương Bảng 3.2: Đặc điểm protein nhĩm bZIP ở cây đậu tƣơng Tên Protein Glyma02g01600 Glyma08g12170 Glyma05g28960 Nội dung %Met 6,67 7,69 7,32 L(aa) 149 168 163 mW (kDa) 16,9 19,1 18,4 pI 5,07 5,24 5,23 II 55,4 44,66 43,56 Chỉ số béo 68,19 65,71 68,34 GRAVY -0,664 -0,735 -0,645 Vị trí C* C* C* Ghi chú: L(aa): Kích thước (amino acid), mW: Trọng lượng phân tử, C: Lục lạp, M: Ty thể, S: Hệ thống bao gĩi, *: Độ tin cậy cao. Phân tích kết quả bảng 3.2, kích thƣớc và trọng lƣợng của các phân tử protein trong nhĩm bZIP khá là nhỏ. Chiều dài phân tử dao động trong khoảng 149 amino acid (Glyma02g01600 đến 169 amino acid (Glyma08g12170). Khối lƣợng phân tử n m trong khoảng từ 16,9kDa (Glyma02g01600 đến 19,1kDa (Glyma08g12170). Nhìn chung các phân tử protein này c kích thƣớc và trọng lƣợng tƣơng đối nhỏ làm chúng c độ linh hoạt cao và cĩ thể dễ dàng đƣợc xuất hoặc nhập qua màng sinh học để đƣợc thực hiện chức năng trong tế bào. Tất cả ba phân tử protein gồm Glyma02g01600, Glyma08g12170, Glyma05g28960 đều cĩ giá trị pI n m trong 5,07 đến 5,24 và mang tính acid rất cao. Cho nên những phân tử này s đƣợc vận chuyển ra tế bào chất ngay sau khi đƣợc tổng hợp trong nhân. 22
  32. Ngồi chỉ số pI thì chúng tơi cịn phân tích thêm chỉ số béo, II và GRAVY. Các chỉ số II của protein thuộc nh m bZIP đều lớn hơn 40 vậy nên tính ổn dịnh trong ống nghiệm của chúng khơng cao. Nhìn chung đây là các phân tử protein c tính ƣa nƣớc vì chỉ số GRAVY < 0. Chỉ số béo đƣợc coi là một yếu tố tích cực để gia tăng khả năng chịu nhiệt của các protein hình cầu. điều này c ý nghĩa thật sự với những phân tử cĩ khối lƣợng dƣới 100. Để tăng thêm độ tin cậy, chúng tơi đã sử dụng phần mềm Tagert P để xác định vị trí của những phân tử protein này trong tế bào. Kết quả cho thấy tất cả các protein trong nh m này đều cĩ thể đƣợc phân bố ở lục lạp. Đây đƣợc xem là dẫn liệu quan trọng trong những nghiên cứu chức năng gene tiếp theo. 3.1.3. Nhĩm SRF ở đậu tương Tiến hành phân tích đặc tính của các protein thuộc nhĩm TF SRF qua bảng 3.3, ta cĩ thể thấy kích thƣớc và trọng lƣợng của nhĩm này tƣơng đối là nhỏ. Kích thƣớc của chúng n m trong khoảng 156 amino acid (Glyma11g30490 và Glyma11g30620) đến 247 amino acid (Glyma10g40080). Bên cạnh đ , trọng lƣợng protein cũng nhỏ dao động từ 17,9kDa (Glyma11g30490 đến 27,8kDa (Glyma10g40080). Khối lƣợng phân tử trung bình chỉ vào khoảng 21kDa. Đối với những phân tử cĩ trọng lƣợng và kích thƣớc nhỏ thì các protein thuộc TF SRF c độ linh hoạt rất cao và cĩ thể dễ dàng xuất hoặc nhập qua màng tế bào để thực hiện chức năng sinh học của chúng. Bên cạnh đ , chỉ số pI của TF SRF cũng đƣợc chúng tơi đề cập tới trong nghiên cứu này. Ở đây chỉ cĩ duy nhất 1 protein cĩ tính acid đ là Glyma11g26260 (pI = 6,84). Cịn lại 6 protein đều mang tính base với pI dao động trong khoảng từ 9,26 (Glyma11g30490 đến 10 (Glyma18g05930). Rất cĩ thể những protein mang tính base này s bám trên ty thể hoặc các hệ thống cĩ màng khác của tế bào. 23
  33. Khi tiến hành phân tích chỉ số ổn định của nhĩm protein thuộc TF SRF kết quả cho thấy tất cả các protein của nh m này đề cĩ chỉ số II > 40. Từ đây c thể nhận thấy r ng những protei này cĩ thời gian bán hủy ngắn hay nĩi cách khác độ ổn định của chúng trong ống nghiệm khơng cao. Chỉ số GRAVY của nhĩm này thể hiện đây là những phân tử protein đều c tính ƣa nƣớc (GRAVY < 0 . Đối với chỉ số béo Aliphatic c liên quan đến độ chịu nhiệt của protein hình cầu. Điều này c ý nghĩa thật sự với những phân tử cĩ khối lƣợng dƣới 100. Để tăng cƣờng độ tin cậy của phép dự đốn, định khu dƣới tế bào của họ TF SRF đƣợc phân tích b ng cơng cụ TargetP. Kết quả cho thấy là các protein này chƣa đƣợc xác định vị trí rõ ràng trong tế bào và cĩ thể chúng s đƣợc phân bố tại các hệ thống bao gĩi trong tế bào. Đây đƣợc xem là dẫn liệu quan trọng trong những nghiên cứu chức năng gene tiếp theo. 24
  34. Bảng 3.3: Đặc tính protein nhĩm SRF ở cây đậu tƣơng STT Tên protein %Met L(aa) mW pI II Chỉ số béo GRAVY Vị trí (kDa) 1 Glyma11g26260 6,79 161 18,7 6,84 55,54 84,04 -0,65 _ 2 Glyma11g30490 7,69 156 17,9 9,26 57,12 76,22 -0,437 _ 3 Glyma11g30620 7,69 156 18 9,37 55,52 80,58 -0,42 _ 4 Glyma18g05930 10,12 168 19,7 10 58,23 67,98 -0,641 _ 5 Glyma18g05960 7,55 159 18,2 9,13 59,28 71,13 -0,574 _ 6 Glyma20g27320 6,67 239 26,7 9,79 55,34 63,35 -0,444 _ 7 Glyma10g40080 6,45 247 27,8 9,76 46,27 67,49 -0,466 _ Ghi chú: L(aa): Kích thước (amino acid), mW: Trọng lượng phân tử, C: Lục lạp, M: Ty thể, S: Hệ thống bao gĩi, *: Độ tin cậy cao. 25
  35. 3.2. Phân tích mật độ phân bố Met ở ngồi vùng bảo thủ của c c nhĩm TF giàu Met ở đậu tƣơng Sau khi tiến hành phân tách các trình tự amino acid ở ngồi vùng bảo thủ của các TF là bHLH, bZIP và SRF chúng tơi đã sử dụng phần mềm BioEdit để tính hàm lƣợng Met và thu đƣợc kết quả nhƣ hình 3.1. Kết quả cho thấy, trong tổng số 11 protein thuộc TF bHLH cĩ 8 protein cĩ tỉ lệ Met tập trung ở ngồi vùng bảo thủ rất cao từ 10,14% (Glyma06g04380) cho tới 21,05% (Glyma03g04000 . Đa phần các protein c tỉ lệ Met phân bố ngồi v ng bảo thủ cao đều là các protein n m trong ty thể hoặc hệ thống bao g i của tế bào. Trong tổng số 3 protein thuộc họ TF bZip chỉ duy nhất protein Glyma02g01600 cĩ tỉ lệ Met ở v ng thƣợng nguồn cao (10% . Protein này c thể đƣợc phân bố ở lục lạp. Họ TF SRF, tất cả các protein c tỉ lệ Met ngồi v ng bảo thủ cao đều là các protein c tính base. Chúng c thể đƣợc phân bố trong ty thể hoặc hệ thống bao g i trong tế bào. Nhƣ vậy sau khi phân tích chúng tơi đã tìm thấy 15 trong tổng số 21 gene c sự phân bố Met nhiều ở quanh v ng bảo thủ, vì thế các gốc Met này c thể giúp các protein đáp ứng lại với các điều kiện bất lợi từ ngoại cảnh. 26
  36. Hình 3.1: Tỉ lệ phân bố Methionine ngồi vùng bảo thủ các họ TF 27
  37. 3.3. Phân tích dữ liệu biểu hiện của c c gene mã hĩa TF giàu Met ở đậu tƣơng trong c c điều iện Dựa trên nghiên cứu của Libault, chúng tơi tiến hành phân tích biểu hiện gene của các họ TF ở điều kiện thƣờng qua kết quả RNA-seq ở 9 mơ khác nhau của cây đậu tƣơng gồm tế bào lơng rễ (RH sau khi gieo 84 giờ và 120 giờ (HAS , mơ ch p rễ (RT , mơ rễ (R , nốt sần (N , mơ lá (L , mơ phân sinh đỉnh (SAM , mơ hoa (F) và vỏ quả xanh (GP). Chúng đƣợc phân thành 4 mức độ dựa vào biểu hiện đặc trƣng của từng mơ: mức dƣới ngƣỡng phát hiện (fold change < 3 , c biểu hiện (3 ≤ fold change ≤ 10 , c xu hƣớng biểu hiện (10 ≤ fold change ≤ 100 , biểu hiện mạnh (100 ≤ fold change < 1000) [32]. Từ các dữ liệu đã c chúng tơi xây dựng biểu đồ thể hiện mức độ biểu hiện của các mơ nhƣ hình 3.2. Hình 3.2: Sự biểu hiện của các gene bHLH, bZIP, SRF của cây đậu tƣơng trong các mơ ở điều kiện thƣờng 28
  38. Kết quả trên cho thấy các gene thuộc 2 họ TF là bHLH và bZIP đều c biểu hiện mạnh ở ít nhất là một mẫu mơ. Trong họTF bHLH c 4 gene biểu hiện mạnh ở hoa và lá gồm Glyma01g15930, Glyma11g17120, Glyma03g32740 và Glyma13g19250 c thể tham gia vào quá trình sinh trƣởng và phát triển của cây. Đáng chú ý là gene Glyma03g32740 và Glyma13g19250 đƣợc phân bố tại ty thể, c thể đáp ứng lại những bất lợi ở hoa và lá. Quan sát các gene thuộc TF bZIP c thể thấy tất cả các gene đều hiện ở hầu hết các mơ, đặc biệt chúng biểu hiện mạnh nhất ở các bộ phận dƣới mặt đất. Gene Glyma02g01600 biểu hiện mạnh nhất tại 4 mơ là nốt sần, hoa, rễ và lơng rễ. Ngồi ra gene Glyma05g2896 cũng đặc biệt biểu hiện rất mạnh tại mơ nốt sần. Hầu nhƣ các gene thuộc họ TF SRF đều biểu hiện ở dƣới ngƣỡng phát hiện ngoại trừ gene Glyma11g26260 c biểu hiện ở rễ. Ngồi ra trong nghiên cứu này, yếu tố bất lợi đƣợc chúng tơi quan tâm đến là độ mặn cao. Đây đƣợc coi là một trong những yếu tố ảnh hƣởng tới quá trình sinh trƣởng và phát triển của cây trồng. Các yếu tố mặn giúp tăng cƣờng sự điều chỉnh để đáp ứng các bất lợi của gene, ngƣợc lại điều kiện hạn s giảm sự điều chỉnh của gene [11]. Trong một nghiên cứu của Belamkar năm 2014 về dữ liệu đặc điểm tồn diện và định dạng RNA-seq của họ TF HD-ZIP ở cây đậu tƣơng trong điều kiện hạn và mặn cao [11]. Dữ liệu đƣợc thu thập từ GEO đƣợc truy cập theo số hiệu GSE57252. Từ những dẫn liệu trên chúng tơi đã thiết lập thành biểu đồ thể hiện mức độ biểu hiện của các gene mã hĩa trong điều kiện mặn nhƣ hình 3.3 dƣới đây: 29
  39. Hình 3.3: Sự biểu hiện của các gene bHLH, bZIP, SRF của cây đậu tƣơng trong các mơ ở điều kiện mặn (Na0hrR: mẫu rễ sau 0 giờ trong dung dịch NaCl, Na1hrR: mẫu rễ sau 1 giờ trong dung dịch NaCl, Na6hrR: mẫu rễ sau 6 giờ trong dung dịch NaCl, Na12hrR: mẫu rễ sau 12 giờ trong dung dịch NaCl) Kết quả thu đƣợc 10 gene trên tổng số 21 gene c biểu hiện khi xử lí trong điều kiện mặn cao. Họ TF bHLH c 6 gene biểu hiện gồm Glyma01g15930, Glyma03g04000, Glyma20g22280, Glyma03g32740, Glyma13g19250, Glyma10g04890. Trong điều kiện mặn 2 gene Glyma03g32740, Glyma13g19250 c biểu hiện mạnh, c thể đáp ứng các bất lợi cho cây. Các gene trong họ TF bZIP đều c biểu hiện rất mạnh trong điều kiện mặn. Gene Glyma02g01600 c biểu hiện mạnh nhất ở cả 3 thời điểm thí nghiệm (xử lí mặn sau 1 giờ, 6 giờ và 12 giờ . Chúng tơi khơng thể tìm thấy các dẫn liệu biểu hiện trong điều kiện mặn của hầu hết các gene thuộc họ TF SRF ngoại trừ gene Glyma11g26260 c biểu hiện. Nhƣ vậy, sau khi tiến hành phân tích biểu hiện các TF trong điều kiện xử lí mặn c 5 gene đáp ứng rất mạnh gồm 1 gene bHLH (Glyma13g19250), 3 gene bZIP và 1 gene SRF (Glyma11g26260) 30
  40. c biểu hiện đáp ứng phiên mã tăng mạnh khi xử lí mặn. Đặc biệt các gene thuộc TF bZIP đều đều đƣợc tăng cƣờng biểu hiện mạnh ở rễ trong cả điều kiện thƣờng và điều kiện xử lí mặn. 31
  41. KẾT LUẬN VÀ KIẾN NGHỊ 1. Kết luận Các phân tử protein thuộc họ bHLH c kích thƣớc trung bình khá lớn, c độ linh hoạt thấp. Đối với họ bZIP và SRF c kích thƣớc và trọng lƣợng nhỏ, c độ linh hoạt cao dễ dàng đƣợc xuất hoặc nhập qua màng tế bào để thực hiện chức năng sinh học. Ngồi ra, các gene thuộc họ bHLH, bZIP, SRF c thể cƣ trú ở rất nhiều vị trí để thực hiện chức năng điều h a trong tế bào. Tất cả protein trong nghiên cứu đều là những proetin ƣa nƣớc và cĩ khả năng chịu nhiệt. Trong nghiên cứu này chúng tơi đã xác định đƣợc 15 trên tổng số 21 protein thuộc 3 họ TF c hàm lƣợng Met phân bố nhiều quanh v ng bảo thủ. Cĩ 15 gene c biểu hiện ở ít nhất là một mơ trong điều kiện thƣờng. Họ bHLH cĩ 4 gene biểu hiện mạnh ở hoa và lá, c thể tham gia vào quá trình sinh trƣởng và phát triển. Họ bZIP thì biểu hiện rất mạnh ở các bộ phân dƣới mặt đất. Các gene thuộc họ SRF hầu hết đều biểu hiện ở dƣới ngƣởng phát hiện. Sau khi tiến hành xử lí mặn thì c 10 gene biểu hiện, trong đ c 5 gene đáp ứng mạnh gồm 1 gene bHLH (Glyma13g19250), 3 gene bZIP và 1 gene SRF (Glyma11g26260). 2. Đề xuất Đề nghị cần tiếp tục phát triển nghiên cứu này trên thực nghiệm nh m tăng độ tin cậy cho giả thuyết trên và đánh giá tính chống chịu mặn của một số gene thuộc 3 họ TF đặc biệt là đối với TF bZIP gồm 3 gene Glyma02g01600, Glyma08g12170, Glyma05g28960 đã đƣợc xác định là quan trọng từ dẫn liệu đƣợc khai thác. 32
  42. DANH MỤC CƠNG TRÌNH ĐÃ CƠNG BỐ LIÊN QUAN ĐẾN KHĨA LUẬN Chu Đức Hà, La Việt Hồng, Lê Minh Tuấn, Phạm Phƣơng Thu, Phạm Thị Lý Thu (2019 , “Phân tích vai tr của gốc methionine trong cấu trúc họ nhân tố phiên mã ở cây đậu tƣơng (Glycine max ”, Tạp chí Khoa học Cơng nghệ Nơng nghiệp Việt Nam (Chấp nhận đăng . 33
  43. TÀI LIỆU THAM KHẢO Tài liệu tiếng Việt [1] Chu Hồng Mậu (2013 , “ Đặc điểm của gen Expansin phân lập từ giống đậu địa phƣơng Việt Nam”, Tạp chí sinh học số, 35(1), 99-104. [2] Ngơ Thế Dân (1999), Cây đậu tương, NXB Nơng nghiệp Hà Nội. [3] Nguyễn Thị Hiền và Vũ Thị Thƣ (2004 , Hĩa Sinh học, NXB Đại học Sƣ phạm. [4] Lê Quý Đơn (2006 , Vân Đài loại ngữ, NXB Văn h a thơng tin. [5] Đỗ Huy Bích, Đặng Quang Trung (2004), Cây thuốc và động vật làm thuốc ở Việt Nam, NXB Khoa hoc kỹ thuật Hà Nội. [6] Trần Văn Điền (2007), Giáo trình cây đậu tương, NXB Nơng nghiệp Hà Nội. Tài liệu tiếng Anh [7] Atchley, W.R., Fitch, W.M., (1997), “ A natural classification of the basic helix-loop-helix class of transcription factors”, Proc Natl Acad Sci USA,( 94), 5172-5176. [8] Arumuganathan, K., and Earle, E.D., (1991 , “Nuclear DNA content of some important plant species”, Plant Molecular Biology Reporter, (9), 208-219. [9] Brosnan, J.T., Brosnan, M.T., (2006 , “The sulfur-containing amino acids: an overview”, J Nutr, 136 (6 Suppl): 1636s-1640s. [10] Brivanlou, A.H., James, E., Darnell, Jr., (2002 , “Signal transduction and the control of gene expression", Science, (295), 813. [11] Belamkar, V., Weeks, T.M., Bharti, K.A., Farmer, D.A., Garham, A.M., and Cannon, B.S., (2014 , “Comprehensive characterization and RNA- Seq profiling of the HD-Zip transcription factor family in soybean (Glycine max during dehydration and salt stress”, BMC Genomics, 15, 950. 34
  44. [12] Chen, L., Song, Y., Li, S., Zhang, L., Zou, C., Yu, D., (2012), “The role of WRKY transcription factors in plant abiotic stresses”, Biochim Biophys Acta, (1819), 120-128. [13] Ellenberger, T., Fass, D., Arnaud, M., Harrison, S.C., (1994 , “Crystal structure of transcription factor E47: E-box recognition by a basic region helix-loophelix dimer”, Genes Dev, (8), 970–980. [14] Emanuelsson, O., Brunak, S., Heijne, G.V., Nielsen, H., (2007), “Locating proteins in the cell using TargetP, SignalP and related tools”, Nat Protoc, 2(4), 953-971. [15] Gurley, W.B., Hepburn, A.G., & Key, J.L., (1979 , “Sequence organization of the soybean genome”, Biochim Biophys Acta, (561), 167- 183. [16] Goldberg, R.B., (1978 , “ DNA sequence organization in the soybean plant”, Biochem Genet, 16, 45-68. [17] Gasteiger, E., Gattiker, A., Hoogland, C., Ivanyi, I., Appel, R. D., Bairoch, A., (2003), “ExPASy: The proteomics server for in-depth protein knowledge and analysis”. Nucleic Acids Res, 31(13): 3784-3788. [18] Hymowitz, T., (1970 , “On domestication of Soybean”, Econ Bot, (24), 408-421. [19] Hymowitz, T., (2004), “Speciation and cytogenetics”. p. 97-136. In H. R. Boerma, J. E. Specht (eds.).Soybeans: improvement, production, and uses. American Society of Agronomy, Crop Science Society of America, and Soil Science Society of America, Madison, WI, Agronomy Series, no. 16, 1180 p. [20] Hudson, K.A., Hudson, M.E., (2015 , “A classification of basic helix- loop-helix transcription factors of soybean”, Int J Genomics, (2015), 603-182. 35
  45. [21] Ha, D.C., Quynh, N.L., Huy, Q.N., Dung, T.L., (2016), Genome-wide analysis of genes encoding methionine-rich proteins in Arabidopsis and Soybean suggesting their roles in the adaptation of plants to abiotic stress, Int J Genomics, (2016),1-8. [22] Hall, T.A., (1999), “BioEdit: A user-friendly biological sequence alignment editor and analysis program for Windows 95/98/NT”, Nucleic Acids Symp Ser, 41, 95-98. [23] Jakoby, M., B. Weisshaar, W. Drưge-Laser, J. VicenteCarbajosa, J. Tiedemann, T. Kroj and F. Parcy, (2002), bZIP transcription factors in arabidopsis. Trends Plant Sci, (7),106-111. [24] Kiraga, J., Mackiewicz, P., Mackiewicz, D., Kowalczuk, M., Biecek, P., Polak, N., Smolarczyk, K., Dudek, M.R., Cebrat, S., (2007), “The relationships between the isoelectric point and: length of proteins, taxonomy and ecology of organisms", BMC Genomics, (8), 163. [25] Koc, A.B., Abdullah, M., Fereidouni, M., (2011 , “ Soybean - Applications and Technology”, Published by InTech. [26] Kilian, J., Peschke, F., Berendzen, K.W., Harter, K., Wanke, D., (2012) “Prerequisites, performance and profits of transcriptional profiling the abiotic stress response”, Biochim Biophys Acta, (1819), 166–175. [27] Kim, G., Stephen, J.W., (2014), “Methionine oxidation and reduction in proteins”, J Biol Chem, 293(19), 7355-7366. [28] Kumar, S., Stecher, G., Tamura, K., (2016), “MEGA7: Molecular evolutionary genetics analysis version 7.0 for bigger datasets”, Mol Biol Evol, 33(7),1870-1874. [29] Lackey, J.A., (1980 , “Chromosome numbers in the phaseoleae (Fabaceae:Faboideae and there relation to taxonomy”, Am J Bot, 67 (4), 595-602. [30] Le, D.T., Nishiyama, R., Watanabe, Y., Mochida, K., Kazuko Yamaguchi-Shinozaki, Shinozaki, K., and Tran, L.S.P., (2011), 36
  46. “Genome-wide survey and expression analysis of the plant-specific NAC transcription factor family in Soybean during development and dehydration stres”, DNA Res, 18(4), 263-76. [31] Latchman, D.S., (1997 , “Transcription factor : An overview”, Int J Biochem Cell Biol, 29(12), 1305-1312. [32] Levine, R.L., Mosoni, L., Berlett, B.S., Stadtman, E.R., (1996), “Methionine residues as endogenous antioxidants in proteins”, Proc Natl Acad Sci USA, 93(26), 15036-40. [33] Li, X., Duan, X., Jiang, H., Sun, Y., Tang, Y., Yuan, Z., Guo, J., Liang, W., Chen, L., Yin, L., Ma, H., Wang, J., and Zhang, D., (2006), “Genome-Wide analysis of basic/helix-loop-helix transcription factor family in rice and arabidopsis”, Plant Physiol, (141), 1167–1184. [34] Libault, M., Farmer, A., Joshi, T., Takahashi, K., Langley, J.R., Farnklin, D.L., Xu, D., May, G., and Stacey, G., (2010 , “An integrated transcriptome atlas of the crop model Glycine max, and its use in comparative analyses in plants”, Plant J, (63), 86-99. [35] Ledent, V., Vervoort, M., (2001 , “The basic helix – loop – helix protein family: comparative genomeics and phylogenetic analysis”, Genome Res, 11(5), 754-70. [36] Murre, C., McCaw, P.S, Baltimore, D., (1989), “A new DNA binding and dimerization motif in immunoglobulin enhancer binding, daughterless, MyoD, and myc proteins”, Cell, (56), 777-783. [37] Nakashima, K., Y. Ito and K. Yamaguchi-Shinozaki, (2009), “Transcriptional regulatory networks in response to abiotic stresses in Arabidopsis and grasses”, Plant Physiol (149), 88-95. [38] Nesi, N., Debeaujon, I., Jond, C., Pelletier, G., Caboche, M., Lepiniec, L., (2000), “The TT8 gene encodes a basic helix-loop-helix domain 37
  47. protein required for expression of DFR and BAN genes in Arabidopsis siliques”, Plant Cell, (12), 1863–1878. [39] Quach, T.N., Nguyen, H.T.M., Valliyodan, B., Joshi, T., Xu, D., Nguyen, T.H., (2014 , “Genome-wide expression analysis of soybean NF-Y genes reveals potential function in development and drought response”, Mol Genet Genomics, 290(3),1095-115. [40] Quail, P.H., Huq, E., (2002 , “PIF4, a phytochrome-interacting bHLH factor, functions as a negative regulator of phytochrome B signaling in Arabidopsis”, EMBO J, 21(10), 2441-2450. [41] Ramsay, N.A., Glover, B.J., (2005 , “ MYB-bHLH-WD40 protein complex and the evolution of cellular diversity”, Trends Plant Sci, (10), 63–70. [42] Ravanel, S., Gkière, B., Job, D., and Douce, R., (1998 , “The specific features of methionine biosynthesis and metabolism in plants”, Proc Natl Acad Sci USA, (95), 7805-7812. [43] Rushton, D.L., Tripathi, P., Rabara, R.C., Lin, J., Ringler, P., Boken, A.K., Langum, T.J., Smidt, L., Boomsma, D.D., Emme, N.J., Chen, X., Finer, J.J., Shen, Q.J., Rushton, P.J., (2012 , “WRKY transcription factors: Key components in abscisic acid signalling”, Plant Biotechnol. J, (10), 2-11. [44] Rinalducci, S., Murgiano, L., Zolla, L., (2008), “Redox proteomics: basic principles and future perspectives for the detection of protein oxidation in plants”, J Exp Bot, 59(14), 3781-3801. [45] Shore, P., Andrew, D., Sharrocks, (1995 , “The MADS-box family of transcription factors”, Eur J Biochem, (229), 1-13. [46] Umezawa, T., M. Fujita, Y. Fujita, K. Yamaguchi-Shinozaki and K. Shinozaki, (2006), “Engineering drought tolerance in plants: discovering 38
  48. and tailoring genes to unlock the future”, Curr Opin Biotechnol, (17), 113-122. [47] Udvardi, M.K., Kakar, K., Wandrey, M., Montanari, O., Murray, J., Andriankaja, A., Zhang, J.Y., Benedito, V., Hofer, J.M., Chueng, F., (2007), “Legume transcription factors: Global regulators of plant development and response to the environment”, Plant Physiol, (144), 538–549. [48] Valley, C.C., Cembran, A., Perlmutter, J.D., Lewis, A.K., Labello, N.P., Gao, J., Sachs, J.N., (2012 , “The methionine – aromatic motif plays a unique role in stabilizing protein structure”, J Biol Chem, 287(42), 34979-91. [49] Wei, L.Q., W.Y. Xu, Z.Y. Deng, Z. Su, Y. Xue and T. Wang., (2010), “Genome-scale analysis and comparison of gene expression profiles in developing and germinated pollen in Oryza sativa”, BMC Genomics, (11), 338. [50] Yu, Y., Wang, N., Hu, R., Xiang, F., (2016 , “Genome-wide identification of soybean WRKY transcription factors in response to salt stress”, SpringerPlus, (5),920. [51] Zhang, M., Liu, Y., Shi, H., Guo, M., Chai M., He, Q.,Yan, K., Cao, D., Zhao, L., Cai, H., and Qin, Y., (2018 , “Evolutionary and expression analyses of soybean basic Leucine zipper transcription factor family”, BMC Genomics, (19), 159. 39
  49. PHỤ LỤC Trình tự protein của 21 gene trong nghiên cứu ở định dạng fasta: >Glyma01g15930 MSQCVPSWDVEDNPPPSRVSLRSNSNSTAPDVPMLDYEVAELTWENGQLSMHGLGLPRVPVKPPTAVTNK YTWEKPRASGTLESIVNQVTSFPHRGKPTPLNGGGGGGVYGNFRVPWFDPHATATTTNTVTMDALVPCSN REQSKQGMESVPGGTCMVGCSTRVGSCCGGKGAKGHEATGRDQSVSGSATFGRDSKHVTLDTCDREFGV GFTSTSINSLENTSSAKHCTKTTTVDDHDSVSHSKPVGEDQDEGKKKRANGKSSVSTKRSRAAAIHNQSER KRRDKINQRMKTLQKLVPNSSKSDKASMLDEVIEYLKQLQAQLQMINRINMSSMMLPLTMQQQLQMSMM SPMGMGLGMGMGMGMGMGMDMNSMNRAHIPGIPPVLHPSAFMPMAASWDAAAAAGGGDRLQGTPAN VMPDPLSTFFGCQSQPMTIDAYSRLAAMYQQLHQPPPASGSKN* >Glyma02g00980 VSFGCVLTSHLHSLFSFNSLCKKSTVDIHQMIRTILHLVNVLSFLWFMNDEEPEDVVKEKPAREGTGVKRSR NAQVHNLCERKRRDKINKRMRILKELIPNCNKTDKASMLDDAIEYLKTLKLQIQMMSMDAGFCIPFMMLR NAAHHMMNTPLLHQLMGLGMGFRPDTAIPCSLPQFPITPLPAITDNRVHFFGFPNQVPPMPISHAPFIPMLG NPSTQTPLATSTAINLAENPASSQLTTLMASVPKNLYLTCQRQLL* >Glyma03g04000 MSQRVPNCDVDDNNNIPTTTKIPLLPNFNFISHEVPMLGYQAAELPCKKGQPSTYKGSHGNLTSTWDKPRT SGGTLESIVSQHVSENRYKLVTMDALVPCSEQQGTQKAVVSERLDACGKSRFPRVVAQEEVEKRAGVVAR GTRGTTTLELGGCKDWSVSGSETCRRELSVTFNSATKGSPENTTSSGKQCTGTTTNDDRDSISHRISQGEVP DEDYKATKVDRSSGSNKRIKANSVVHKQSERRRRDKINQRMKELQKLVPNSSKTDKASMLDEVIQYMKQ LQAQVQMMNWMKMYTSMMLPITMQQQQQQQQLKMSMMMAQMGMGMGMSKDMVMNMNSMNIPGF PPMLPFPSFMPMAPCGDQLQGTPEKSVTMDAYSTMASLYQQLFHPPASSSKN* >Glyma03g32740 MELLWHNGQVVVQSQNQRSLRKLPPVTNSHDASPAGPSMTREIRPLVENFNQHLFMHEGEMASWLHYPID DDEPAFMQTLGHTSQLTELRPMSANPRPPIPPPRRPEQRTPNFAYFSRHNTRAAEPSVKAAARESTVVDSCD TEAAASRVSETVRSAAEGGAGVAAPSTSAGGGRSTMMYDLTMTSSPGGSSSCDEPVQVAAAEEDRKRKG REAEEWECQSELQIPCTLVYANVRWVSDVGLREHSPRCCIYFGAVALCSFGTVITFTVVAAHVQAKKQVC GSTSTKRSRAAEVHNLSERRRRDRINEKMKALQELIPRCNKSDKASMLDEAISYLKSLQLQVQMMSMGCG MVPVMFPGIQQYMPAMGMGVGMGMGMEMGMNRPVMPFPNMLPGSALPAATAAAAHLGPRMQAANQS DNNMVTSAGPPDPNQSRIPNFTDPYQQYLGPHQMQFQLIQNQAMNQPNVSKPSNNGGPANPENH* >Glyma04g04190 MEQLKPEEYQMDVMTMMLQQLPQLSEPYTHTMEGFHPPEDHFYGNNTMPLADLIDNNNPHSSMPWSSSY SFTHLPSSTISFSNNNPIMLQEQQQHSPSETYEDANANPYGGEKRSSMAAMREMIFRMAAMQPIHIDPESVK QPKRRNVKISKDPQSVAARHRRERISERIRILQRLVPGGTKMDTASMLDEAIHYVKFLKTQVQSLQRASSAN NNIRPLGTSTVNATGIGFPVAMSTTSNSTPYFPLPKPYQARHMENMHDRYD* >Glyma11g17120 MSQCVPSWDVEDNPPPSRVSLRSNSNSTAPDVPMLDYEVAELTWENGQLSMHGLGLPRVPVKPPTAATNK YTWEKPRGSGTLESIVNQATSFSHQEKPRPLNGDSGGGGGVYGNFMVPWFDPHAAATTTTTTTNTMTMD ALVPCSNREQGKKKGMESGPGTCMVGCSTRVGSCCGGKGAKGHEASGRDQSVSGSATFGRDSKHVTLDT CDREFGVAFTSTSINSLENTSYAKHCTKTTTIEEHDSVSHSKPMGEDGDEEKKKRANGKSSVSTKRSRAAAI HNQSERKRRDKINQRMKTLQKLVPNSSKTDKASMLDEVIEYLKQLQAQVQMMNRINMSSMMLPLTMQQ QLQMSMMSPMGMGLGMGMGMGMGMGMDMNSMNRANIPGIPPVLHPSAFMPMAASWDAAVAAAAGG GDRLQGTPASVMPDPLSTIFGCQSQPMTMDAYSRLAAMYQQLHQPPTSGSKN*
  50. >Glyma13g19250 MELLWQNGQVVMQSQNQRPFRKPPQPPEANGGDGAISAREIRSSEAENYNNSQHLFMQEDEMAAWLHYP IHEDPPPFDHHDFGADIFYPPPNATASQNRGSAAVQSSFRTTELWHPAPRPPIPPPRRPEHAPSRIHNFAHFTK HGNASSSSKAAAAAQPTVVDSCETPVATAEHAETGRARAAAGKTAVSDGGRETATCDVTVTSSPGDSSGS AEPVEREPMADRKRKGREHEESEFQSEDVDFESPEAKKQVHGSTSTKRSRAAEVHNLSERRRRDRINEKM KALQELIPRCNKSDKASMLDEAIEYLKSLQLQVQMMSMGYGMVPMMFPGIQQYMPPMGMGIGMGMGM EMGMGMNRPVMPFTNMLASSTLPAATAAVHLGPRFPMPPFHMPHVAAPDSSRMQGANHPDNNMLNSLG TLDPDQSRIPNFTDPYQQYLGLQQAQLQLMQTMNQQNVSKPSSSRGQENPEKHQSDET* >Glyma20g22280 MEIKNKGAAATSSNPPESILVDSSGECSKEPTMQCQQVVEQSKPDVNSLQPKSVEQNAVPSKQSEPASKESA TKIDQTPNQVLGDSGTKGQTAAEKSMEPAVASSSVCSGTGADQGSDEPNQNLKRKTKDTDDSECHSEDVE EESAGAKKTAGGQGGAGSKRSRAAEVHNLSERRRRDRINEKMRALQELIPNCNKVDKASMLDEAIEYLKT LQLQVQIMSMGAGLYMPPMMLPAGMQHMHAPHMAPFSPMGVGMHMGYGMGYGMGMPDMNGGSSRF PMIQVPQMQGTHIPVAHMSGPTALHGMARSNPPGYGLPGQGYPMHMPPASVFPFSGGPLMNSPAQGLHA RGSSGLVETVDSASASGLKDQMQNVDPQVKQSTGGCDSTSQMPTQCEAAAVGFEQSALAHSRGHASKAN DNGAVNPDPGR* >Glyma05g19920 MDVDIVKTSSNNNNMDVMAMMMQMEKFPELFCDPFYTTSYQETDLLSSGSSSTTSASTLFNNNSIVTTTPP PTTTLVDPTPSNVVQFSKIDDLFQHQHQQQPMSQSLQPYPSEKKNSMAAMREMIFRIAVMQPVHIDPESIKP PKRRNVKISKDPQSVAARHRRERISERIRILQRLVPGGTKMDTASMLDEAIHYVKFLKKQVQTLEQAGANT SPHSNTNSPNNHVVGAAGFPLGMSSNYSNNSSVNYSSLLMKGGCQPCQMFGSTSKQLLS* >Glyma06g04380 MEQQHMDMMTMMMLQHLPEFSEPYTHTMEGFHPPSEEFCGNNNNNIRNTMQLADLIDNNNPLSPIPWSSS YSFTHLPASTTEISFSNNSHPTTPIMLQEHEQQYEGANANPYGGEKRNSMAAMREMIFRMAAMQPIHIDPES VKAPKRRNVKISKDPQSVAARHRRERISERIRILQRLVPGGTKMDTASMLDEAIHYVKFLKTQVQSLERASS ANNNIRPLNAAGQIGFPVASTPYFPLPSKPYQAPNMDNMHDTYH* >Glyma10g04890 MDDDDEEYPIPVSKKPSTQNDEIMELLWQNGQVVMQNQNQRPFRKQPPTTDGDGPIPAREIRSSEAENYNS QHLFMQEDEMASWLHYPIHEDPPPFDHHDFCADILYPPPNATASQNQSSASVQSSVRTTELQHPAPRPPIPPP RRQEHTLSRIHNFTHFAKHGNASSSSKAAAPAQPTVATAEHVETGRASVSAAAGKTPASDGGRETATCDV TVTSSPGGSSGSAEPVQREPVVNRKRKGREQEESEYQSEDVDFESPEAKKQVRGSTSTKRSHAAEVHNLSE RRRRDRINEKMKALQELIPRCNKSDKASMLDEAIEYLKSLQLQVQMMSMGCGMVPMIFPGIQQYMPPMG MGIGMGMGMGMEMGMGMNRSVMPFPNMLASSTLPAATATAHLGPRFPMPPFHMPHVATPDSSRMQGA NHPDNNMLNSLGTLDPDQSCIPNFTDPYQQYLSLQQAQLQLMQTMNQPNVSKPSTSRGQENPEKHQSDKT >Glyma02g01600 MASIQRPASSGSSEGGDPVMYERKRKRMESNRESARRSRMKKQKQLEDLTDEVSRLEGENARLAPSIKVK EEAYVEMEAANDILRAQTMELADRLRFLNSIIEIADEVGGESFEIPQIPDPLFMPWQIPHPMMATPPDMFFHG NEGLFA* >Glyma08g12170 MASPGGSGTYSSGSSSLQNSGSEGDRDIMEQRKRKRMLSNRESARRSRMRKQQHLEGLSAQLDQLKKENT QMNTNIGISTQLYLNVEAENAILRAQMEELSKRLNSLNEMISLINSTTTTNNCLMFDEAQETTTQLFNDCGF MDAWNYGIPLNQQIMAYADNDMLMMY*
  51. >Glyma05g28960 MASPGGSGTYSSGSSSLQNSGSEGDRDIMEQRKRKRMLSNRESARRSRIRKQQHLEGLSAQLDQLKKENA QINTNISITTQMYLNVEAENAILRAQMGELSNRLNSLNEMISFINSTNNNCLMMFDEAQETTTQLFNDCGFM DYAWNGIPIMASADNEMLIMY* >Glyma11g26260 MKKMNEISTLCGIETCAIIYSPNDPQPEVWPSDSGVQRVLSRFMEMPEVRQSRKMLNQESFLRQMITKGQQ QLTRQRNENRKKEMTNLMLQYLTAGKVVGNPSLVDLNDLSWLIDQNLNEIEKKITMLQIQEVVIPVIENEG HMNHVQGLESNMDTKKKQH* >Glyma11g30490 MAPGKLKLTFIGNDSKRKNVCKKRKQSLLKKTEELSMLCGVEACAIVYGPNDPRPVIWPSEFGVENVLRKF MSMPHWEQSKKMVNQESFIAQSIMKSKEKLQKIVKENKDIEMSLFMAHCFKTGMFQPDINMTTADMNVL ASIIEQNLKDIDKRME >Glyma11g30620 MAPGKLKLTFIGNDFKRKNVCKKRKQSLLKKTEELSMLCGVEACAIVYGPNDPRPVIWPSELGVENVLRKF MSMPQLEQSKKMVNQESFIAQRIMKSKEKLQKIVKENKEIEMSLFMAHCFKTGMFQPDINMTTADMNVLS SIIEQNLKDIDKRME >Glyma18g05930 MTRKKVQPAFISFDSARKLTYKKMKKGMLKKIDEPSTLCGIEACAIVYSPRILRQRVLEKFMSMPELEQSKK MVNQESFTAQSIMKGNKQMMKLMKDNRRRSRARPDNNMTIANLNFLSRMVDQNLKDIDKRMETLKMQT PALNYALGSDMNTAEPMQNLWFMDFLNN >Glyma18g05960 MATGKLKLTFVANDSQRKTVCKKRKQSLLKKTEELSTLCGIEACAIVYGPNDHRPEIWPSESGVKNVLGKF MNKPQWEQSKKMMNQESFIAQSIMKSKDKLQKVVKENKEIEMSLFMAQCFQTGMFQPDINMTAADMNV LSSEIEQNLKDIDKRMEMLK >Glyma20g27320 MSGPKKSRGRQKIEMKKMSNESNLQVTFSKRRSGLFKKASELCTLCGADVALIVFSPGEKVFSFGHPNVDA VIDRYLERAPPTESFMEAHRMAHVRDLNAQLTQISNHLDAGRKRAEELNLMKKEAQAHLWWARPVDGM SMAQMKQFKAALEELKKQVARLADRAMLQSVTNPTHEFFPAAGVSSSSSSNSNSNPLSPQVFSPHLIQPPM LQNFMSMMPRHHGFNYMGMGGYGPAAGFF* >Glyma10g40080 MSGPKKSRGRQKIEMKKMSNESNLQVTFSKRRNGLFKKASELCTLCGTDVALVVFSPGQKVFSFGHPNVD AVIDRYLARPPPTDSGTMQIIEAHRMAHVHDLNVQLTQINNQLDHERKRTNELNLMNKEAQAQMWWARP VDGMSMAQVKQFKAALEEMKKQVARLVDRAMLQSVTNPTLQFFPGVSSSSNSNLVHQPHPLPAPQVFTP HLIQPPMLQNFMFHDGSMMRHHGFDNIGMGGYGPTAGFF*
  52. PHÂN TÍCH VAI TRỊ CỦA GỐC METHIONINE TRONG CẤU TRÚC HỌ NHÂN TỐ PHIÊN MÃ Ở ĐẬU TƢƠNG (Glycine max) Chu Đức Hà1, La Việt Hồng2, Lê Minh Tuấn1,2, Phạm Phƣơng Thu2, Phạm Thị Lý Thu1 1 Viện Di truyền Nơng nghiệp, VAAS 2 Khoa Sinh - Kỹ thuật nơng nghiệp, Đại học Sƣ phạm Hà Nội 2 Thơng tin liên hệ: Chu Đức Hà. ĐT: 0983 766 070. Email: hachu_amser@yahoo.com TĨM TẮT Methionine (Met) là một axit amin đ ng vai tr thiết yếu ở thực vật. Các gốc Met cấu trúc đƣợc giả thuyết là tham gia bảo vệ phân tử protein chống lại bất lợi ơxi h a xảy ra trong tế bào khi gặp điều kiện bất lợi. Trong nghiên cứu này, 21 phân tử protein giàu Met (Met-rich protein, MRP , thuộc ba nh m nhân tố phiên mã (transcription factor, TF lần lƣợt là Basic helix-loop-helix (bHLH , Basic leucine zipper (bZIP và Serum response factor (SRF ở đậu tƣơng (Glycine max đã đƣợc phân tích nh m chứng tỏ giả thuyết trên. Kết quả phân tích đã đƣa ra 15 MRP c sự phân bố dày đặc của gốc Met trên hai khoảng ngoại biên quanh v ng bảo thủ. Thơng qua các cơng cụ tin sinh học, các TF này đều ƣa nƣớc và hầu nhƣ khơng bền vững trong ống nghiệm. Trong đ , một số TF c thể phân bố trong tế bào chất, ty thể hoặc trên hệ thống bao g i. Dựa trên dữ liệu biểu hiện trong điều kiện thƣờng, phần lớn các gen mã h a họ bHLH và bZIP đều c xu hƣớng tăng cƣờng biểu hiện ở ít nhất một cơ quan chính. Phân tích dữ liệu RNA-Seq cho thấy, một số gen mã h a họ bHLH và SRF c mức độ phiên mã đáp ứng, trong khi các gen mã h a họ bZIP c đáp ứng tăng ở rễ đậu tƣơng xử lý mặn. Nghiên cứu này s đƣợc tiếp tục nh m đánh giá thực nghiệm biểu hiện của các gen mã h a 21 MRP này trong các điều kiện ngoại cảnh bất lợi. T hĩa: Bất lợi, đậu tƣơng, Methionine, nhân tố phiên mã, tin sinh học. I. MỞ ĐẦU Dƣới tác động của ngoại cảnh bất lợi, sự dƣ thừa của một số dạng chứa ơxi nguyên tử hoạt động đã gây ra những tổn thƣởng đến các đại phân tử, ảnh hƣởng tiêu cực đến sinh trƣởng và phát triển của tế bào thực vật. Khoảng 68 % đại phân tử bị tác động từ quá trình này là các protein. Trong đ , các gốc Methionine (Met) trên phân tử protein, do cĩ mạch chứa lƣu huỳnh, nên rất dễ bị ơxi hĩa, làm biến đổi cấu trúc dẫn đến thay đổi hoặc gây mất chức năng của protein [1]. Đây là một axít amin đ ng vai tr thiết yếu trong đời sống của thực vật, tham gia vào con đƣờng Yang, liên quan đến nhiều chu trình nội bào quan trọng nhƣ hình thành màng tế bào, tổng hợp diệp lục và củng cố thành tế bào [2]. Giả thuyết đặt ra là, liệu r ng các gốc Met liên kết trên chuỗi polypeptide cĩ thực sự tham gia vào cơ chế bảo vệ cấu trúc để duy trì chức năng của phân tử protein trong điều kiện bất lợi hay khơng?
  53. Gần đây, 213 phân tử protein giàu Met (Met-rich protein, MRP đã đƣợc sàng lọc ở đậu tƣơng (Glycine max) [3]. Các MRP này đã đƣợc xác định tham gia vào nhiều quá trình quan trọng trong tế bào, trong đ , 20 % MRP liên quan đến điều h a phiên mã ở đậu tƣơng [3]. Nhƣ đã biết, nhân tố phiên mã (transcription factor, TF là họ protein tham gia điều h a sự biểu hiện của gen, vì vậy liên quan đến cơ chế đáp ứng và khả năng chống chịu với điều kiện bất lợi. Trong nghiên cứu này, 3 nh m TF giàu Met cơ bản ở đậu tƣơng, bao gồm Basic helix-loop-helix' (bHLH), 'Basic leucine zipper (bZIP và Serum response factor (SRF [3], đã đƣợc khai thác để chứng minh giả thuyết về vai tr của các gốc Met liên quan đến cơ chế đáp ứng ở thực vật trên để phân tích đặc tính lý h a học của protein và khảo sát sự phân bố của các gốc Met trên phân tử. Mức độ biểu hiện của gen mã h a các TF đƣợc phân tích tại một số cơ quan chính trên đậu tƣơng. Kết quả của nghiên cứu này c thể cung cấp những dẫn liệu quan trọng về vai tr của các gốc Met liên quan đến tính chống chịu điều kiện bất lợi ở đậu tƣơng. II. VẬT LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU 2.1. Vật liệu nghi n cứu Trình tự protein và mã định danh của 21 TF giàu Met, bao gồm 11 TF nh m bHLH, 3 TF nh m bZIP và 7 TF nh m SRF đƣợc khai thác từ nghiên cứu trƣớc đây [3] (Bảng 1 . Bảng 1. Thơng tin về các TF giàu Met đƣợc khai thác trong nghiên cứu này [3] TT Mã định danh TF TT Mã định danh TF TT Mã định danh TF 01 Glyma01g15930 08 Glyma10g04890 15 Glyma10g40080 02 Glyma02g00980 09 Glyma11g17120 16 Glyma11g26260 03 Glyma03g04000 10 Glyma13g19250 17 Glyma11g30490 bHLH 04 Glyma03g32740 11 Glyma20g22280 18 Glyma11g30620 SRF 05 Glyma04g04190 bHLH 12 Glyma02g01600 19 Glyma18g05930 06 Glyma05g19920 13 Glyma05g28960 20 Glyma18g05960 bZIP 07 Glyma06g04380 14 Glyma08g12170 21 Glyma20g27320 2.2. Phƣơng ph p nghi n cứu - Phƣơng pháp phân tích v ng bảo thủ của protein: Các nh m TF đƣợc kiểm tra v ng bảo thủ b ng phần mềm MEGA (v. 7.0 [4]. Trình tự ngoại biên từ đầu 3 và 5 đến vị trí tiếp giáp v ng bảo thủ đƣợc tách biệt để xác định sự phân bố các gốc Met b ng cơng cụ BioEDIT [5].
  54. - Phƣơng pháp xác định đặc tính lý h a của protein: Trình tự axit amin (.fasta đƣợc phân tích trên cơng cụ ExPASy Protparam [6] để đánh giá các đặc tính lý h a học của chuỗi truy vấn. Một số chỉ tiêu đƣợc quan tâm, bao gồm điểm đẳng điện lý thuyết (Isoelectric point, pI), chỉ số bất ổn định (Instability index, II , độ ƣa nƣớc (Grand average of hydropathicity, GRAVY). - Phƣơng pháp dự đốn vị trí phân bố nội bào của protein: Trình tự axít amin (.fasta của các TF đƣợc sử dụng để tìm kiếm vị trí cƣ trú trong tế bào thơng qua cơng cụ TargetP [7]. Trong đ , mức độ tin cậy của thuật tốn đƣợc xác định theo thang điểm 5 [7]. - Phƣơng pháp phân tích in silico mức độ biểu hiện gen trong điều kiện thƣờng: Mức độ phiên mã của gen mã h a các TF đƣợc xác định trong điều kiện thƣờng dựa trên dữ liệu microarray đã cơng bố [8]. Trong đ , chín mẫu mơ, bao gồm lơng rễ thu ở thời điểm 84 và 120 h sau nảy mầm (84-, 120-hour-after-sprayed root hair, RH 84 HAS, RH 120 HAS , nốt sần (Nodule, N , mơ phân sinh đỉnh chồi (Shoot apical meristem, SAM), hoa (Flower, F , vỏ quả xanh (Green pod, GP , lá (Leaf, L , rễ (Root, R , ch p rễ (root tip, RT đƣợc khai thác và phân tích [8]. Mã định danh của gen mã h a TF đƣợc truy vấn trên dữ liệu microarray để tìm kiếm mức độ biểu hiện của gen tƣơng ứng ở các mơ trong điều kiện thƣờng. - Phƣơng pháp phân tích in silico mức độ biểu hiện gen trong điều kiện bất lợi: Mức độ phiên mã của gen mã h a các TF trong điều kiện hạn đƣợc khai thác trên dữ liệu RNA-Seq đã ghi nhận gần đây (GSE57252 [9]. Trong đ , mẫu rễ xử lý với dung dịch NaCl 100 mM trong 0 (đối chứng , 1, 6 vá 12 h đƣợc thu thập để phân tích RNA-Seq [9]. Mã định danh của gen mã h a TF đƣợc truy vấn trên dữ liệu RNA-Seq để tìm kiếm mức độ biểu hiện của gen tƣơng ứng ở rễ trong điều kiện xử lý mặn. - Phƣơng pháp phân tích và mơ hình h a dữ liệu biểu hiện gen: Số liệu thƣờng phân tích b ng bản đồ nhiệt (heatmap trên cơng cụ Microsoft Excel và minh họa trên Adobe Illustrator. III. KẾT QUẢ VÀ THẢO LUẬN 3.1. Kết quả phân tích sự phân bố của gốc Met trong c c họ TF ở đậu tƣơng Với giả thuyết đặt ra, v ng thƣợng nguồn (upstream region và hạ nguồn (downstream region của các nh m TF đƣợc chọn lọc để xác định mức độ phân bố của các gốc Met trên protein. Trƣớc tiên, v ng bảo thủ của các TF đƣợc xác định b ng cơng cụ MEGA [4]. V ng bảo thủ của họ TF bHLH giàu Met ở đậu tƣơng c cấu tạo gồm bốn domain, basic-helix-loop-helix , trong khi các thành viên của họ TF bZIP đều chia sẻ cấu
  55. trúc bảo thủ gồm ba v ng, basic-hinge-leucine zipper (Hình 1 . Phân tích trình tự tƣơng đồng cho thấy họ TF SRF c v ng bảo thủ MADS-box (Hình 1 . Hình 1. Sự phân bố của các gốc Met trên trình tự polypeptide của ba nh m TF ở đậu tƣơng Khảo sát hai v ng ngồi trình tự bảo thủ của ba nh m TF đã cho thấy sự mật độ dày đặc của các gốc Met. Cụ thể, phần lớn các TF thuộc họ bHLH (tám trên tổng số 11 c v ng thƣợng nguồn hoặc hạ nguồn quy tụ nhiều gốc Met (lớn hơn 10 % (Hình 1 . Chỉ c một TF thuộc họ bZIP, Glyma02g10600, đƣợc xác định c sự phân bố dày dặc của gốc Met ở hai v ng ngoại biên cận bảo thủ (Hình 1 . Trong khi đ , hai đoạn trình tự ngồi v ng bảo thu của hầu hết các thành viên của họ SRF (sáu trên bảy đƣợc ghi nhận sự c mặt của rất nhiều gốc Met (Hình 1 . Trƣớc đây, Luo và cộng sự (2009 đã chứng minh vai tr của các gốc Met trên phân tử protein giúp chống lại các bất lợi ơxi h a b ng cách thay thế Met với Norleucine [10]. Nhƣ vậy, kết quả của nghiên cứu này đã tìm ra đƣợc 15 trên tổng số 21 TF c sự tập trung nhiều Met quanh v ng bảo thủ, vì thế, các gốc Met này c thể giúp phân tử protein đáp ứng lại điều kiện ngoại cảnh bất lợi. 3.2. Kết quả phân tích đặc tính lý hĩa của nhân tố phi n mã giàu Met ở đậu tƣơng Đặc tính lý h a của phân tử protein đƣợc thể hiện ở giá trị pI, II và GRAVY thơng qua phân tích trên cổng thơng tin ExPASy Protparam [6]. Kết quả đã chỉ ra r ng hầu hết các TF, ngoại trừ Glyma02g00980 (một thành viên của họ TF bHLH c giá trị II lớn hơn
  56. 40, cho thấy chúng khơng ổn định trong điều kiện kiểm tra trong ống nghiệm (Bảng 2 . Phân tích từ ExPASy Protparam [6] cũng ghi nhận tất cả các TF c chỉ số GRAVY nhỏ hơn 0, suy ra 21 phân tử protein này đều ƣa nƣớc (Bảng 2 . Bảng 2. Đặc tính lý h a của 3 nh m TF giàu Met đƣợc tìm thấy ở đậu tƣơng TT Tên protein TF pI II GRAVY BQ TT Tên protein TF pI II GRAVY BQ 01 Glyma01g15930 8,88 47,61 -0,55 C5 12 Glyma02g01600 5,07 55,40 -0,66 C3 5 2 02 Glyma02g00980 9,26 39,46 -0,10 S 13 Glyma05g28960 5,23 43,56 -0,64 C 03 Glyma03g04000 9,14 51,91 -0,69 - 14 Glyma08g12170 5,24 44,66 -0,73 C2 bZIP 04 Glyma03g32740 7,20 63,57 -0,51 M3 15 Glyma10g40080 9,76 46,27 -0,47 - 05 Glyma04g04190 6,84 68,89 -0,78 - 16 Glyma11g26260 6,84 55,54 -0,65 - 06 Glyma05g19920 8,93 52,30 -0,53 - 17 Glyma11g30490 9,26 57,12 -0,44 - 07 Glyma06g04380 bHLH 6,63 59,36 -0,72 - 18 Glyma11g30620 9,37 55,52 -0,42 - SRF 08 Glyma10g04890 5,84 65,40 -0,84 - 19 Glyma18g05930 10,0 58,23 -0,64 - 09 Glyma11g17120 8,63 46,28 -0,58 C5 20 Glyma18g05960 9,13 59,28 -0,57 - 10 Glyma13g19250 6,03 65,52 -0,82 M4 21 Glyma20g27320 9,79 55,34 -0,44 - 11 Glyma20g22280 5,92 62,84 -0,66 - TT: Thứ tự, T : Nhân tố phiên mã, p : Điểm đ ng điện, : Ch số ất n định, R V : Độ ưa nước, : ào quan, C: Lục lạp, : ệ thống ao gĩi, M: Ty thể. Tiếp theo, giá trị pI của các TF dao động từ khoảng 5,07 (tính acid đến 10,00 (tính base (Bảng 2 . Trong đ , các protein c tính acid c thể phân bố trong tế bào chất, trong khi protein bám trên màng bào quan thƣờng c tính base [11]. Để tăng tính tin cậy về vị trí cƣ trú của TF trong tế bào, trình tự amino acid của protein đƣợc truy vấn trên TargetP [7]. Kết quả cho thấy năm TF đƣợc tìm thấy ở tế bào chất, hai TF c thể cƣ trú ở ty thể, trong khi một TF phân bố trên hệ thống bao g i trong tế bào (Bảng 2 . Trƣớc đ , ty thể đã đƣợc chứng minh là bào quan tích lũy các dạng chứa ơxi nguyên tử hoạt động (reactive oxgen species trong tế bào khi chịu bất lợi trong khi protein cƣ trú trong hệ thống bao g i c thể đƣợc vận chuyển nội bào để tham gia vào quá trình sửa chữa trong tế bào [12]. 3.3. Kết quả phân tích dữ liệu biểu hiện của gen mã hĩa nhân tố phi n mã giàu Met ở đậu tƣơng trong c c điều iện Trong nghiên cứu này, mức độ biểu hiện của các gen mã h a 3 nh m TF ở đậu tƣơng đƣợc phân tích in silico dựa trên dữ liệu phiên mã trong điều kiện thƣờng [8] và khi xử lý mặn [9]. Cụ thể, biểu hiện của một gen trong điều kiện thƣờng ở chín mẫu mơ c thể đƣợc chia làm bốn mức độ, dƣới ngƣỡng phát hiện (fold-change < 3 , biểu hiện (3 ≤ fold- change < 10 , c xu hƣớng biểu hiện mạnh (10 ≤ fold-change < 100 và biểu hiện mạnh (fold-change ≥ 100 [8]. Trong khi đ , gen c mức độ phiên mã tăng hoặc giảm trong điều
  57. kiện mặn khi giá trị fold-change ≥ 2 hoặc ≤ -2 [9]. Kết quả phân tích in silico mức độ biểu hiện của các gen mã h a ba nh m TF đƣợc thể hiện ở Hình 2. Hình 2. Mức độ biểu hiện của gen mã h a TF giàu Met ở cơ quan chính trong các điều kiện Trong điều kiện thƣờng, phần lớn các gen mã h a hai nh m TF bHLH và bZIP đều c xu hƣớng biểu hiển mạnh ở ít nhất một bộ phận chính trong cây đậu tƣơng, trong khi mức độ phiên mã của bảy gen mã h a họ TF SRF ở chín mẫu mơ cơ quan dƣới ngƣỡng phát hiện (Hình 2 . Cụ thể, bốn gen, Glyma13g19250, Glyma03g32740, Glyma01g15930 và Glyma11g17120 đƣợc xác định biểu hiện mạnh ở hoa và lá nhƣng khơng c xu hƣớng biểu hiện mạnh ở các cơ quan dƣới đất, chứng tỏ các gen này c thể liên quan và tham gia một cách đặc th vào các quá trình sinh trƣởng và phát triển của hai bộ phận này trên đậu tƣơng trong điều kiện thƣờng. Đáng chú ý, Glyma03g32740 và Glyma12g19250 c thể phân bố ở ty thể (Bảng 2 , các gen mã h a 2 TF này biểu hiện đặc th ở hoa và lá (Hình 2 , gợi ý r ng chúng c thể liên quan đến quá trình đáp ứng bất lợi ở lá hoặc hoa. Bên cạnh đ , gen mã h a hai thành
  58. viên của nh m bZIP biểu hiện rất đặc th ở tất cả các bộ phận dƣới mặt đất, trong khi Glyma02g01600 c mức độ phiên mã rất mạnh ở tất cả chín mẫu mơ cơ quan chính trong cây (Hình 2 . Kết quả này chứng tỏ Glyma02g01600 c thể đ ng vai tr thiết yếu liên quan đến quá trình sinh trƣởng và phát triển của cây trong điều kiện thƣờng. Khi xem xét trong điều kiện bất lợi, dữ liệu GSE57252 [9] đƣợc khai thác để đánh giá mức độ biểu hiện của các gen mã h a TF ở mơ rễ xử lý mặn. Kết quả đã tìm thấy dữ liệu của 10 gen, bao gồm sáu gen mã h a TF bHLH, ba gen mã h a TF bZIP và một gen mã h a TF SRF (Hình 2 . Trong đ , năm gen đã đƣợc xác định c đáp ứng phiên mã tăng mạnh ở rễ khi xử lý mặn (fold-change ≥ 2 (Hình 2 . Đặc biệt, các gen mã h a TF bZIP đều đƣợc tăng cƣờng biểu hiện ở rễ trong cả điều kiện thƣờng và khi xử lý mặn (Hình 2 , chứng tỏ các gen này c thể tham gia vào quá trình đáp ứng bất lợi ở rễ. Bên cạnh đ , một gen mã h a cho thành viên thuộc họ TF SRF, Glyma11g26260, cũng c biểu hiện tăng ở rễ khi xử lý mặn (Hình 2 . Trƣớc đ , khi xem xét dữ liệu phiên mã khi xử lý lá cây đậu tƣơng V6 và R2 trong điều kiện hạn, Chu et al (2016 đã chỉ ra ba gen c đáp ứng [3]. Cụ thể, hai gen Glyma01g15930 và Glyma03g32740 bị giảm biểu hiện, trong khi Glyma20g22280 c mức độ phiên mã tăng ở cả mẫu lá V6 và R2 khi xử lý hạn [3]. Những kết quả này ph hợp với nhận định về vai tr của gen Glyma03g32740 trong đáp ứng bất lợi ở lá. IV. KẾT LUẬN VÀ ĐỀ NGHỊ 4.1. Kết luận - Đã xác định đƣợc 15 trên tổng số 21 protein thuộc ba họ TF c sự tập trung nhiều Met quanh v ng bảo thủ, đặt ra giả thuyết về vai tr của gốc Met trong việc giúp phân tử protein đáp ứng lại điều kiện ngoại cảnh bất lợi. - Phân tích đặc tính lý h a cho thấy các TF giàu Met đều ƣa nƣớc, hầu hết đều khơng ổn định trong điều kiện in vitro. Các TF này c thể cƣ trú trong tế bào chất, ty thể hoặc trên các hệ thống bao g i trong tế bào. - Phân tích in silico dữ liệu phiên mã cho thấy hầu hết các gen mã h a họ TF bHLH và bZIP c xu hƣớng biểu hiển mạnh ở ít nhất một bộ phận chính, trong khi họ TF SRF hoạt động yếu trong điều kiện thƣờng. Trong điều kiện mặn, một số thành viên của họ TF bHLH và SRF c đáp ứng ở rễ, trong khi tất cả các gen mã h a TF bZIP đều đƣợc tăng cƣờng biểu hiện ở rễ xử lý mặn. 4.2. Đề nghị
  59. - Nghiên cứu này s tiếp tục đƣợc thực hiện nh m kiểm chứng b ng thực nghiệm những phân tích tin sinh học về mức độ đáp ứng của các gen mã h a TF trong điều kiện bất lợi ở đậu tƣơng. LỜI CẢM ƠN: Nghiên cứu này đƣợc thực hiện từ kinh phí của đề tài nghiên cứu cơ bản mã số 08/HĐƢT-KHCN do Đại học Sƣ phạm Hà Nội 2 tài trợ. TÀI LIỆU THAM KHẢO [1] G. Kim, S.J. Weiss, R.L. Levine (2014), "Methionine oxidation and reduction in proteins", Biochim Biophys Acta, 1840(2): 901-905. [2] J.T. Brosnan, M.E. Brosnan (2006), "The sulfur-containing amino acids: an overview", J Nut, 136(6 Suppl): 1636s-1640s. [3] H.D. Chu, Q.N. Le, H.Q. Nguyen, D.T. Le (2016), "Genome-wide analysis of genes encoding methionine-rich proteins in Arabidopsis and soybean suggesting their roles in the adaptation of plants to abiotic stress", Int J Genomics, 2016: e5427062. [4] S. Kumar, G. Stecher, K. Tamura (2016), "MEGA7: Molecular evolutionary genetics analysis version 7.0 for bigger datasets", Mol Biol Evol, 33(7): 1870-1874. [5] T.A. Hall (1999), "BioEdit: A user-friendly biological sequence alignment editor and analysis program for Windows 95/98/NT", Nucleic Acids Symp Ser, 41: 95-98. [6] E. Gasteiger, A. Gattiker, C. Hoogland, I. Ivanyi, R.D. Appel, A. Bairoch (2003), "ExPASy: The proteomics server for in-depth protein knowledge and analysis", Nucleic Acids Res, 31(13): 3784-3788. [7] Emanuelsson, S. Brunak, G. von Heijne, H. Nielsen (2007), "Locating proteins in the cell using TargetP, SignalP and related tools", Nat Protoc, 2(4): 953-971. [8] M. Libault, A. Farmer, T. Joshi, K. Takahashi, R.J. Langley, L.D. Franklin, J. He, D. Xu, G. May, G. Stacey (2010), "An integrated transcriptome atlas of the crop model Glycine max, and its use in comparative analyses in plants", Plant J, 63(1): 86-99. [9] V. Belamkar, N.T. Weeks, A.K. Bharti, A.D. Farmer, M.A. Graham, S.B. Cannon (2014), "Comprehensive characterization and RNA-Seq profiling of the HD-Zip transcription factor family in soybean (Glycine max) during dehydration and salt stress", BMC Genomics, 15(1): 1-25.
  60. [10] S. Luo, R.L. Levine (2009), "Methionine in proteins defends against oxidative stress", FASEB J, 23(2): 464-472. [11] J. Kiraga, P. Mackiewicz, D. Mackiewicz, M. Kowalczuk, P. Biecek, N. Polak, K. Smolarczyk, M.R. Dudek, S. Cebrat (2007), "The relationships between the isoelectric point and: length of proteins, taxonomy and ecology of organisms", BMC Genomics, 8: 163. [12] D.M. Rhoads, C.C. Subbaiah (2007), "Mitochondrial retrograde regulation in plants", Mitochondrion, 7(3): 177-194.
  61. ANALYSIS OF THE ROLE OF METHIONINE RESIDUES IN THE TRANSCRIPTION FACTOR FAMILIES IN SOYBEAN (Glycine max) Chu Duc Ha1, La Viet Hong2, Le Minh Tuan1,2, Pham Phuong Thu2, Pham Thi Ly Thu1 1 Agricultural Genetics Institute, VAAS 2 Faculty of Biology - Agricultural technology, Hanoi Pedagogical University 2 SUMMARY Methionine (Met) is considered as an important amino acid residue in the plant. The structural Met residues were hypothesized to protect the structure of protein against the oxidative stress in the cell. In this study, 21 Met-rich proteins, belonging to three transcription factor (TF) families, namely 'Basic helix-loop- helix' (bHLH), 'Basic leucine zipper' (bZIP) and 'Serum response factor' (SRF), were analyzed to demonstrate this hypothesis. As the result, the high accumulation of Met residues has been recorded in the upstream and downstream regions close to the conserved domains of 15 MRPs. By using various bioinformatics tools, we found that these TFs were hydrophilic and mostly unstable in the test tube. Interestingly, several TFs might localize on the cytosol, mitochondrial or the secretory pathways. According to the public microarray database, the majority of genes encoding TF bHLH and bZIP was up-regulated in at least one major organ in soybean plant in the normal condition. By retrieving the previous RNA-Seq database, several genes encoding TF bHLH and SRF were significantly altered, while all genes encoding TF bZIP were also induced in root under the high salt stress. In the further study, the expression levels of genes encoding 21 MRPs under various adverse environmental conditions would be validated by the experimental approach. Keywords: Stress, soybean, Methionine, transcription factor, bioinformatics.