TIN SINH HỌC P58
Chia sẻ bởi Võ Phương Thảo |
Ngày 23/10/2018 |
57
Chia sẻ tài liệu: TIN SINH HỌC P58 thuộc Bài giảng khác
Nội dung tài liệu:
HUỲNH VĂN TOÀN – SINH HỌC THỰC NGHIỆM K 14
Chuỗi axit amin của protein chứa thông tin thú vị và của chính nó. Một chuỗi protein có thể được so sánh và đối chiếu với trình tự của các protein khác để thiết lập mối quan hệ của nó, nếu có, cho các loại protein được biết đến, và để cung cấp thông tin về sự tiến hóa của chức năng sinh hóa. Tuy nhiên, cho mục đích của sự hiểu biết chức năng protein, các cấu trúc 3D của một protein được thêm rất nhiều hữu ích hơn so với trình tự của nó.
Tài sản quan trọng của protein cho phép chúng thực hiện một loạt các chức năng sinh hóa là chuỗi các axit amin trong chuỗi protein, mà bằng cách nào đó xác định duy nhất cấu trúc 3D của protein. 20 loại axit amin, có một số lượng lớn các cách thức họ có thể được kết hợp để tạo nên một chuỗi protein ngắn, có nghĩa là thời gian nhất định, sinh vật có thể phát triển các protein thực hiện thực tế bất kỳ mục đích tưởng tượng.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
Mỗi lần một chuỗi protein đặc biệt được tổng hợp trong tế bào, nó gấp lại với nhau để mà mỗi của các nhóm hóa học quan trọng cho chức năng protein đặc biệt được đưa vào một cấu trúc hình học chính xác. Lần giả định một trình tự protein khác nhau. Mỗi sự xuất hiện của rằng nếp gấp protein đặc biệt vào cùng một cấu trúc chính xác.
Mặc dù tính nhất quán này trên một phần của protein, không có ai đã tìm ra làm thế nào để dự đoán chính xác các cấu trúc 3D rằng một loại protein sẽ gấp nếp thành dựa trên trình tự của nó một mình. Mô hình được rõ ràng trong các chuỗi axit amin của protein, nhưng những mô hình đang thoái hóa, có nghĩa là nhiều hơn một trình tự có thể chỉ định một loại cụ thể của lần. Trong khi có hàng ngàn khi hàng ngàn cách khác nhau amino axit có thể kết hợp để tạo thành một chuỗi có chiều dài đặc biệt, cách duy nhất mà một cấu trúc protein có thể tổ chức chính nó dường như là nhỏ hơn nhiều. Chỉ có một vài trăm nếp gấp protein độc đáo đã được quan sát thấy trong Ngân hàng dữ liệu protein. Protein gần như hoàn toàn nonhomologous chuỗi dù sao lần thành những cấu trúc tương tự như. Và vì thế, tính toán dự báo cấu trúc từ trình tự là một vấn đề khó khăn.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
Nếu chúng tôi thực nghiệm có thể xác định cấu trúc của các protein tinh thể học X-ray hoặc NMR, và cấu trúc dự đoán là khó khăn như vậy, tại sao bận tâm với dự đoán cấu trúc ở tất cả? Câu trả lời là xác định cấu trúc protein thực nghiệm là rất khó, và có tắc nghẽn trong quá trình thử nghiệm.
Cấu trúc 3D đã được xác định cho chỉ có khoảng 35.000 các chuỗi protein (tháng 3 năm 2006), ít hơn nhiều so với số lượng khoảng 264.000 mục trình tự trong cơ sở dữ liệu UniProt / TrEMBL [http://www.expasy.org/sprot/] (tháng 3 năm 2006) . Vì vậy, rất nhiều có liên quan ba cấu trúc chiều sẽ có giá trị để điều tra đang thiếu. Trong ánh sáng của khoảng cách cơ sở dữ liệu, dự báo cấu trúc tính toán là một mục tiêu nóng. Nó thường được gọi là "Chén thánh" của sinh học tính toán, nó là cả hai mục tiêu quan trọng và một mục tiêu, khó nắm bắt, có lẽ không thể,.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
Cơ cấu phương pháp dự đoán là thô được chia thành ba loại:
1.) Tương đồng về mô hình tập trung vào việc sử dụng một mẫu cấu trúc bắt nguồn từ các cấu trúc được biết đến xây dựng một mô hình tất cả các nguyên tử của một protein. Chất lượng của các dự đoán cho thấy cấu trúc dự đoán dựa trên tương đồng rất thành công trong sản xuất các mô hình hợp lý trong mọi trường hợp, trong đó đáng kể tương đồng cấu trúc đã có sẵn. Thách thức đối với dự đoán dựa trên tương đồng, cũng như cho sự liên kết chuỗi cơ bản, là phát hiện tương đồng trình tự có ý nghĩa trong Khu dưới đây Chạng vạng tương đồng chuỗi 25%.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
2) phương pháp Threading chuỗi acid amin của một cấu trúc protein uncharacterized, nhanh chóng tính toán các mô hình dựa trên cấu trúc 3D hiện có, và sau đó đánh giá các mô hình này để xác định tốt như thế nào acid amin không rõ "phù hợp với mỗi cấu trúc mẫu. Tất cả các phương pháp luồng sản xuất mô hình chính xác cấu trúc trong ít hơn một nửa các trường hợp, trong đó họ được áp dụng. Họ là thành công được sử dụng để phát hiện các homologies từ xa mà không thể được phát hiện bởi sự liên kết chuỗi tiêu chuẩn, nếu các bộ phận của một trình tự phù hợp với một giếng lần, liên kết nói chung có thể được suy ra, mặc dù có thể không có đủ thông tin để xây dựng một mô hình hoàn chỉnh.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
3.) Ab-initio phương pháp dự báo tập trung vào việc xây dựng cấu trúc không có thông tin trước khi. Trong khi không có của phương pháp ab-initio sản xuất các mô hình chính xác với độ tin cậy bất kỳ, một loạt các phương pháp hiển thị một số hứa hẹn trong lĩnh vực này. Một chiến lược dựa trên thông tin để dự đoán cấu trúc đã được phát triển thư viện đại diện của các phân đoạn ngắn cấu trúc trong đó có cấu trúc có thể được xây dựng. Kể từ khi cơ cấu "từ" mà không phải là trong thư viện của các phân đoạn giới hạn, không gian cấu trúc được tìm kiếm trong việc xây dựng mô hình có phần hạn chế. Một ab initio phương pháp phổ biến là sử dụng một đại diện giảm của cấu trúc protein để mô phỏng gấp. Trong những phương pháp này, các protein có thể được biểu diễn như là các hạt chuỗi. Mỗi amino acid, hoặc mỗi đơn vị cấu trúc thứ cấp trong một số phương pháp cố định, trở thành một hạt với những tài sản được giao thu hút và đẩy lùi các loại hạt, và thống kê các phương pháp mô phỏng cơ khí được sử dụng để tìm kiếm các không gian conformational có sẵn cho mô hình đơn giản. Những phương pháp này có thể được thành công trong việc xác định các nếp gấp protein, ngay cả khi các chi tiết của cấu trúc không thể được dự đoán.
Trung dự đoán cấu trúc thường được xem như một bước đầu tiên trong dự đoán cấu trúc của một protein. Như với bất kỳ phương pháp dự đoán, giá trị của chủ nghĩa hoài nghi nên được sử dụng trong việc giải thích các đầu ra của các chương trình này là dự đoán thực tế của cấu trúc thứ cấp.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
8/9.1 DỰ ĐOÁN CẤU TRÚC THỨ CẤP
Dự đoán cấu trúc thứ cấp protein là sự phân loại các amino acid trong 1 trình tự protein theo vùng cấu trúc được dự đoán của chúng. Cấu trúc thứ cấp thường chia làm 3 loại (xoắn α, gấ β hoặc cuộn tròn), mặc dù số loại phụ thuộc vào mô hình sử dụng.
Thông thường, mục tiêu của dự đoán cấu trúc thứ cấp thì đem đến khả năng dự đoán chính xác nhất. Nhiều nhà nghiên cứu thực hiện điều này như là 1 mục đích của họ, có thể kết luận trên nhiều móng tay bị ăn mòn và 1 lượng tóc bị rụng. Như đề cập, bài học khô khan về dự đoán cấu trúc thứ cấp protein thì thật không được chính xác cho lắm. Tuy nhiên, những phương pháp dự đoán cấu trúc thứ cấp protein có các ứng dụng đặc biệt trong lĩnh vực tin sinh học, đặc biệt là trong việc dò ra những trình tự tương đồng họ hàng xa nhau. Những công ty dược so sánh các dự đoán cấu trúc thứ cấp cho những trình tự tương đồng có họ hàng xa trong các tìm kiếm nghiên cứu mục tiêu sản xuất thuốc. Các mô hình của cấu trúc thứ cấp được dự đoán có thể cho biết trước những dạng cuộn gấp của các phân tử protein và chọn lựa được các mục tiêu trong nghiên cứu bộ gen.
Các phương pháp dự đoán cấu trúc thứ cấp protein có thể chia làm 2 dạng là cách sắp xếp cơ bản và phương pháp trình tự gốc đơn. phương pháp dùng sự sắp xếp cơ bản trong dự đoán cấu trúc thứ cấp thì hoàn toàn dựa vào trực giác và thay thế cho khái niệm của các mô tả trình tự protein.
Trong 1 dự đoán cách xắp xếp cấu trúc thứ cấp , người nghiên cứu sẽ tìm ra 1 họ của các trình tự mà nó tương tự như nhau trong cấu trúc chưa xác định. Những vùng tương đồng trong họ các trình tự thì được thừa nhận để tham gia cấu trúc thứ cấp tương tự và việc dự đoán không được làm cơ sở cho trình tự đó nhưng dựa trên sự thống nhất của các trình tự trong tập hợp đó. Phương pháp tiếp cận trình tự gốc đơn, trên 1 lĩnh vực khác, dự đoán vùng cấu trúc dành cho 1 trình tự không xác định.
Những công cụ dùng để dự đoán cấu trúc thứ cấp như là predictotein and JPred liên kết các kết quả của một vài phương pháp tiếp cận, bao gồm dự đoán cấu trúc thứ cấp protein và các phương pháp xâu chuỗi protein. Sử dụng các dự đoán về cấu trúc thứ cấp protein từ 1 vài phương pháp bổ sung có thể cho kết quả trong 1 đáp án hay hơn là chỉ sử dụng 1 phương pháp. Nếu toàn bộ các phương pháp đều đồng ý về cấu trúc protein được dự đoán tại vùng nào đó, bạn có thể tin tưởng chắc chắn hơn về việc dự đoán đó hơn là nếu đó chỉ được đem lại bởi chỉ 1 hoặc 2 chương trình.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
1.Các phương pháp tiếp cận trình tự gốc đơn
- Phương pháp dự đóan cấu trúc đầu tiên là vào những năm 1970 là 1 trình tự đơn. Phương pháp Chou-Fasman dùng các quy luật bắt nguồn từ dữ liệu hóa lý về amino acid để dự đoán cấu trúc thứ cấp. Thuật toán GOR (tên đặt theo tên các tác giả: Garnier, Osguthorope và Robson) và những người nối tiếp sau đó dùng thông tin về tần số với bất kì các phần dư nào trong những xoắn, các tấm và những dạng cuộn vòng trong các phân tử protein của cấu trúc đã biết để dự đoán các cấu trúc đó. Cả 2 phương pháp hiện vẫn đang được sử dụng, thường là trên nhiều công cụ hỗ trợ như SDSC Biology Workbench.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
2. dự đoán trình tự sắp xếp cấu trúc thứ cấp
- Các phương pháp hiện đại cho việc dự đoán cấu trúc thứ cấp khai thác thông tin từ sự sắp xếp nhiều trình tự, hoặc nhiều sự phối hợp của các dự đoán từ nhiều phương pháp, hoặc cả 2. Các phương pháp này đòi hỏi độ chính xác khoảng 70 – 77%. Nhiều chương trình này có thể dùng trên Web. Chúng đưa vào 1 trình tự giống như là nạp dữ liệu, thực hiện một vài thủ tục trên chúng, sau đó cho ra 1 sự dự đoán, thường bằng email, từ khi những thuật toán dự đoán đòi hỏi tính toán nhiều và lưu trữ để chạy trong 1 hàng.
Sau đây là danh sách các hương pháp thường dùng:
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
PHD[http://npsa-pbil.ibcp.fr/cgi-in/npsa_automat.pl?page=/NPSA/npsa_phd.html]
PHD kết nối các kết quả từ số lượng lớn hệ thần kinh, mỗi cái như vậy dự đoán cấu trúc thứ cấp của dạng trình tự gốc còn lại và trên toàn bộ trình tự (chiều dài rotein, các tần số xuất hiện amino acid,…). Sau đó, dự đoán cuối cùng đó là trung bình cộng các giá trị của mỗi hệ thần kinh này. Như là các kết nối được biết đến như các phương pháp jury decision winner-take-all.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
PSIPRED [http://bioinf.cs.ucl.ac.uk/psipred/]
PSIPRED kết nối dự đoán hệ thần kinh với nhiều trình tự thẳng hàng lấy từ tìm kiếm dữ liệu PSI-BLAST.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
Jpred [http://www.compbio.dundee.ac.uk/~www-jpred/]
Các dự đoán cấu trúc thứ cấp protein Jpred thì được đưa ra từ sự thống nhất của một vài phương pháp dự đoán hỗ trợ, bổ sung bởi thông tin của nhiều trình tự thẳng hàng. Jpred là 1 trong những các chuyên gia dự đoán hàng đầu về cấu trúc thứ cấp protein.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
PREDATOR [http://bioweb.pasteur.fr/seqanal/interfaces/predator-simple.html]
PredictProtein [http://www.embl-eidelberg.de/predictprotein/predictprotein.html]
PREDATOR kết nối thông tìn của nhiều trình tự chuỗi với các liên kết hydro của amino acid để dự đoán cấu trúc thứ cấp.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
PSA là mô hình cơ bản Markov gần như để dự đoán cấu trúc thứ cấp. Nó nổi bật vì giao diện của mình,Dự đoán cấu trúc protein là một trong những nhiệm vụ quan trọng,nhằm xây dựng cơ sở dữ liệu protein, phục vụ cho việc tìm hiểu chức năng và ý nghĩa của các protein, hiểu được bản chất của sự sống từ đó cải thiện môi trường sống. Tìm ra cấu trúc protein thông qua quá trình phân tích thực nghiệm đòi hỏi nhiều thời gian và công sức. Nhiệm vụ quan trọng của Sinh tin học là giúp dự đoán cấu trúc protein từ một chuỗi các amino acid đã biết hình thành nên protein đó. Tuy nhiên các phương pháp dự đoán cấu trúc protein hiện vẫn chưa thể có độ chính xác tuyệt đối. Tỉ lệ chính xác của các phương pháp chẩn đoán cấu trúc protein hiện nay vẫn chưa vượt quá con số 80%. Việc tìm hiểu chức năng của protein thường dựa vào cấu trúc bậc ba của protein đó.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
Tuy nhiên, việc áp dụng các phương pháp thí nghiệm hoá lý để tìm ra cấu trúc bậc ba của protein vẫn còn gặp nhiều khó khăn và phức tạp. Do đó, đa số các phương pháp xác định cấu trúc bậc ba của một protein phải trải qua một bước trung gian quan trọng là xác định cấu trúc bậc hai của protein đó. Việc xác định được cấu trúc bậc hai của protein sẽ làm tăng thêm độ chính xác trong việc xác định cấu trúc bậc ba lên từ 25 - 50 %.
Phương pháp thí nghiệm hoá lý được sử dụng để xác định cấu trúc bậc hai protein cũng gặp nhiều khó khăn và tốn kém thời gian. Chính những khó khăn này đã thúc đẩy các nhà nghiên cứu tìm cách chẩn đoán cấu trúc bậc hai của các protein mới dựa trên cấu trúc bậc hai của những protein đã biết. Nhiều thuật toán khác nhau được phát triển như thuật toán sử dụng hệ chuyên gia, sử dụng các lý thuyết về đồ thị, sử dụng các phương pháp thống kê, thuật toán người láng giềng gần nhất, sử dụng mạng neural, ...
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
Để giải quyết bài toán trên, phương pháp thông thường là chia chuỗi amino acid thành nhiều đoạn, mỗi đoạn là một cửa sổ chứa từ 13 đến 21 amino acid. Các amino acid trong cùng một cửa sổ sẽ có cấu trúc bậc 2 giống nhau. Khi đó bài toán được đơn giản hóa từ việc chẩn đoán
cấu trúc bậc 2 của mỗi amino acid trong protein thành việc chẩn đoán cấu trúc bậc 2 của một amino acid trung tâm trong mỗi cửa sổ nói trên. Sau đó xây dựng mô hình để ánh xạ từ các cửa sổ amino acid trong chuỗi sang trạng thái cấu trúc bậc 2 tương ứng.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
Độ chính xác của kỹ thuật dự đoán cấu trúc bậc 2 của protein được cải tiến đáng kể sau khi áp dụng mạng thần kinh nhân tạo để huấn luyện quá trình chẩn đoán. Mạng sau khi được huấn luyện sẽ được ghi nhớ để chuẩn bị dự đoán cấu trúc bậc 2 của các chuỗi protein mới. Mạng thần kinh thường được xây dựng trên 3 lớp và áp dụng với số lượng lớn thông tin để tăng độ chi tiết của thông tin huấn luyện, nhằm tăng độ chính xác của giải thuật dự đoán. Độ chính xác của phương pháp dự đoán cấu trúc bậc 2 sử dụng mạng thần kinh
Chân thành cảm ơn!
CHÀO TẠM BIỆT!
Chuỗi axit amin của protein chứa thông tin thú vị và của chính nó. Một chuỗi protein có thể được so sánh và đối chiếu với trình tự của các protein khác để thiết lập mối quan hệ của nó, nếu có, cho các loại protein được biết đến, và để cung cấp thông tin về sự tiến hóa của chức năng sinh hóa. Tuy nhiên, cho mục đích của sự hiểu biết chức năng protein, các cấu trúc 3D của một protein được thêm rất nhiều hữu ích hơn so với trình tự của nó.
Tài sản quan trọng của protein cho phép chúng thực hiện một loạt các chức năng sinh hóa là chuỗi các axit amin trong chuỗi protein, mà bằng cách nào đó xác định duy nhất cấu trúc 3D của protein. 20 loại axit amin, có một số lượng lớn các cách thức họ có thể được kết hợp để tạo nên một chuỗi protein ngắn, có nghĩa là thời gian nhất định, sinh vật có thể phát triển các protein thực hiện thực tế bất kỳ mục đích tưởng tượng.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
Mỗi lần một chuỗi protein đặc biệt được tổng hợp trong tế bào, nó gấp lại với nhau để mà mỗi của các nhóm hóa học quan trọng cho chức năng protein đặc biệt được đưa vào một cấu trúc hình học chính xác. Lần giả định một trình tự protein khác nhau. Mỗi sự xuất hiện của rằng nếp gấp protein đặc biệt vào cùng một cấu trúc chính xác.
Mặc dù tính nhất quán này trên một phần của protein, không có ai đã tìm ra làm thế nào để dự đoán chính xác các cấu trúc 3D rằng một loại protein sẽ gấp nếp thành dựa trên trình tự của nó một mình. Mô hình được rõ ràng trong các chuỗi axit amin của protein, nhưng những mô hình đang thoái hóa, có nghĩa là nhiều hơn một trình tự có thể chỉ định một loại cụ thể của lần. Trong khi có hàng ngàn khi hàng ngàn cách khác nhau amino axit có thể kết hợp để tạo thành một chuỗi có chiều dài đặc biệt, cách duy nhất mà một cấu trúc protein có thể tổ chức chính nó dường như là nhỏ hơn nhiều. Chỉ có một vài trăm nếp gấp protein độc đáo đã được quan sát thấy trong Ngân hàng dữ liệu protein. Protein gần như hoàn toàn nonhomologous chuỗi dù sao lần thành những cấu trúc tương tự như. Và vì thế, tính toán dự báo cấu trúc từ trình tự là một vấn đề khó khăn.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
Nếu chúng tôi thực nghiệm có thể xác định cấu trúc của các protein tinh thể học X-ray hoặc NMR, và cấu trúc dự đoán là khó khăn như vậy, tại sao bận tâm với dự đoán cấu trúc ở tất cả? Câu trả lời là xác định cấu trúc protein thực nghiệm là rất khó, và có tắc nghẽn trong quá trình thử nghiệm.
Cấu trúc 3D đã được xác định cho chỉ có khoảng 35.000 các chuỗi protein (tháng 3 năm 2006), ít hơn nhiều so với số lượng khoảng 264.000 mục trình tự trong cơ sở dữ liệu UniProt / TrEMBL [http://www.expasy.org/sprot/] (tháng 3 năm 2006) . Vì vậy, rất nhiều có liên quan ba cấu trúc chiều sẽ có giá trị để điều tra đang thiếu. Trong ánh sáng của khoảng cách cơ sở dữ liệu, dự báo cấu trúc tính toán là một mục tiêu nóng. Nó thường được gọi là "Chén thánh" của sinh học tính toán, nó là cả hai mục tiêu quan trọng và một mục tiêu, khó nắm bắt, có lẽ không thể,.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
Cơ cấu phương pháp dự đoán là thô được chia thành ba loại:
1.) Tương đồng về mô hình tập trung vào việc sử dụng một mẫu cấu trúc bắt nguồn từ các cấu trúc được biết đến xây dựng một mô hình tất cả các nguyên tử của một protein. Chất lượng của các dự đoán cho thấy cấu trúc dự đoán dựa trên tương đồng rất thành công trong sản xuất các mô hình hợp lý trong mọi trường hợp, trong đó đáng kể tương đồng cấu trúc đã có sẵn. Thách thức đối với dự đoán dựa trên tương đồng, cũng như cho sự liên kết chuỗi cơ bản, là phát hiện tương đồng trình tự có ý nghĩa trong Khu dưới đây Chạng vạng tương đồng chuỗi 25%.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
2) phương pháp Threading chuỗi acid amin của một cấu trúc protein uncharacterized, nhanh chóng tính toán các mô hình dựa trên cấu trúc 3D hiện có, và sau đó đánh giá các mô hình này để xác định tốt như thế nào acid amin không rõ "phù hợp với mỗi cấu trúc mẫu. Tất cả các phương pháp luồng sản xuất mô hình chính xác cấu trúc trong ít hơn một nửa các trường hợp, trong đó họ được áp dụng. Họ là thành công được sử dụng để phát hiện các homologies từ xa mà không thể được phát hiện bởi sự liên kết chuỗi tiêu chuẩn, nếu các bộ phận của một trình tự phù hợp với một giếng lần, liên kết nói chung có thể được suy ra, mặc dù có thể không có đủ thông tin để xây dựng một mô hình hoàn chỉnh.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
3.) Ab-initio phương pháp dự báo tập trung vào việc xây dựng cấu trúc không có thông tin trước khi. Trong khi không có của phương pháp ab-initio sản xuất các mô hình chính xác với độ tin cậy bất kỳ, một loạt các phương pháp hiển thị một số hứa hẹn trong lĩnh vực này. Một chiến lược dựa trên thông tin để dự đoán cấu trúc đã được phát triển thư viện đại diện của các phân đoạn ngắn cấu trúc trong đó có cấu trúc có thể được xây dựng. Kể từ khi cơ cấu "từ" mà không phải là trong thư viện của các phân đoạn giới hạn, không gian cấu trúc được tìm kiếm trong việc xây dựng mô hình có phần hạn chế. Một ab initio phương pháp phổ biến là sử dụng một đại diện giảm của cấu trúc protein để mô phỏng gấp. Trong những phương pháp này, các protein có thể được biểu diễn như là các hạt chuỗi. Mỗi amino acid, hoặc mỗi đơn vị cấu trúc thứ cấp trong một số phương pháp cố định, trở thành một hạt với những tài sản được giao thu hút và đẩy lùi các loại hạt, và thống kê các phương pháp mô phỏng cơ khí được sử dụng để tìm kiếm các không gian conformational có sẵn cho mô hình đơn giản. Những phương pháp này có thể được thành công trong việc xác định các nếp gấp protein, ngay cả khi các chi tiết của cấu trúc không thể được dự đoán.
Trung dự đoán cấu trúc thường được xem như một bước đầu tiên trong dự đoán cấu trúc của một protein. Như với bất kỳ phương pháp dự đoán, giá trị của chủ nghĩa hoài nghi nên được sử dụng trong việc giải thích các đầu ra của các chương trình này là dự đoán thực tế của cấu trúc thứ cấp.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
8/9.1 DỰ ĐOÁN CẤU TRÚC THỨ CẤP
Dự đoán cấu trúc thứ cấp protein là sự phân loại các amino acid trong 1 trình tự protein theo vùng cấu trúc được dự đoán của chúng. Cấu trúc thứ cấp thường chia làm 3 loại (xoắn α, gấ β hoặc cuộn tròn), mặc dù số loại phụ thuộc vào mô hình sử dụng.
Thông thường, mục tiêu của dự đoán cấu trúc thứ cấp thì đem đến khả năng dự đoán chính xác nhất. Nhiều nhà nghiên cứu thực hiện điều này như là 1 mục đích của họ, có thể kết luận trên nhiều móng tay bị ăn mòn và 1 lượng tóc bị rụng. Như đề cập, bài học khô khan về dự đoán cấu trúc thứ cấp protein thì thật không được chính xác cho lắm. Tuy nhiên, những phương pháp dự đoán cấu trúc thứ cấp protein có các ứng dụng đặc biệt trong lĩnh vực tin sinh học, đặc biệt là trong việc dò ra những trình tự tương đồng họ hàng xa nhau. Những công ty dược so sánh các dự đoán cấu trúc thứ cấp cho những trình tự tương đồng có họ hàng xa trong các tìm kiếm nghiên cứu mục tiêu sản xuất thuốc. Các mô hình của cấu trúc thứ cấp được dự đoán có thể cho biết trước những dạng cuộn gấp của các phân tử protein và chọn lựa được các mục tiêu trong nghiên cứu bộ gen.
Các phương pháp dự đoán cấu trúc thứ cấp protein có thể chia làm 2 dạng là cách sắp xếp cơ bản và phương pháp trình tự gốc đơn. phương pháp dùng sự sắp xếp cơ bản trong dự đoán cấu trúc thứ cấp thì hoàn toàn dựa vào trực giác và thay thế cho khái niệm của các mô tả trình tự protein.
Trong 1 dự đoán cách xắp xếp cấu trúc thứ cấp , người nghiên cứu sẽ tìm ra 1 họ của các trình tự mà nó tương tự như nhau trong cấu trúc chưa xác định. Những vùng tương đồng trong họ các trình tự thì được thừa nhận để tham gia cấu trúc thứ cấp tương tự và việc dự đoán không được làm cơ sở cho trình tự đó nhưng dựa trên sự thống nhất của các trình tự trong tập hợp đó. Phương pháp tiếp cận trình tự gốc đơn, trên 1 lĩnh vực khác, dự đoán vùng cấu trúc dành cho 1 trình tự không xác định.
Những công cụ dùng để dự đoán cấu trúc thứ cấp như là predictotein and JPred liên kết các kết quả của một vài phương pháp tiếp cận, bao gồm dự đoán cấu trúc thứ cấp protein và các phương pháp xâu chuỗi protein. Sử dụng các dự đoán về cấu trúc thứ cấp protein từ 1 vài phương pháp bổ sung có thể cho kết quả trong 1 đáp án hay hơn là chỉ sử dụng 1 phương pháp. Nếu toàn bộ các phương pháp đều đồng ý về cấu trúc protein được dự đoán tại vùng nào đó, bạn có thể tin tưởng chắc chắn hơn về việc dự đoán đó hơn là nếu đó chỉ được đem lại bởi chỉ 1 hoặc 2 chương trình.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
1.Các phương pháp tiếp cận trình tự gốc đơn
- Phương pháp dự đóan cấu trúc đầu tiên là vào những năm 1970 là 1 trình tự đơn. Phương pháp Chou-Fasman dùng các quy luật bắt nguồn từ dữ liệu hóa lý về amino acid để dự đoán cấu trúc thứ cấp. Thuật toán GOR (tên đặt theo tên các tác giả: Garnier, Osguthorope và Robson) và những người nối tiếp sau đó dùng thông tin về tần số với bất kì các phần dư nào trong những xoắn, các tấm và những dạng cuộn vòng trong các phân tử protein của cấu trúc đã biết để dự đoán các cấu trúc đó. Cả 2 phương pháp hiện vẫn đang được sử dụng, thường là trên nhiều công cụ hỗ trợ như SDSC Biology Workbench.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
2. dự đoán trình tự sắp xếp cấu trúc thứ cấp
- Các phương pháp hiện đại cho việc dự đoán cấu trúc thứ cấp khai thác thông tin từ sự sắp xếp nhiều trình tự, hoặc nhiều sự phối hợp của các dự đoán từ nhiều phương pháp, hoặc cả 2. Các phương pháp này đòi hỏi độ chính xác khoảng 70 – 77%. Nhiều chương trình này có thể dùng trên Web. Chúng đưa vào 1 trình tự giống như là nạp dữ liệu, thực hiện một vài thủ tục trên chúng, sau đó cho ra 1 sự dự đoán, thường bằng email, từ khi những thuật toán dự đoán đòi hỏi tính toán nhiều và lưu trữ để chạy trong 1 hàng.
Sau đây là danh sách các hương pháp thường dùng:
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
PHD[http://npsa-pbil.ibcp.fr/cgi-in/npsa_automat.pl?page=/NPSA/npsa_phd.html]
PHD kết nối các kết quả từ số lượng lớn hệ thần kinh, mỗi cái như vậy dự đoán cấu trúc thứ cấp của dạng trình tự gốc còn lại và trên toàn bộ trình tự (chiều dài rotein, các tần số xuất hiện amino acid,…). Sau đó, dự đoán cuối cùng đó là trung bình cộng các giá trị của mỗi hệ thần kinh này. Như là các kết nối được biết đến như các phương pháp jury decision winner-take-all.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
PSIPRED [http://bioinf.cs.ucl.ac.uk/psipred/]
PSIPRED kết nối dự đoán hệ thần kinh với nhiều trình tự thẳng hàng lấy từ tìm kiếm dữ liệu PSI-BLAST.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
Jpred [http://www.compbio.dundee.ac.uk/~www-jpred/]
Các dự đoán cấu trúc thứ cấp protein Jpred thì được đưa ra từ sự thống nhất của một vài phương pháp dự đoán hỗ trợ, bổ sung bởi thông tin của nhiều trình tự thẳng hàng. Jpred là 1 trong những các chuyên gia dự đoán hàng đầu về cấu trúc thứ cấp protein.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
PREDATOR [http://bioweb.pasteur.fr/seqanal/interfaces/predator-simple.html]
PredictProtein [http://www.embl-eidelberg.de/predictprotein/predictprotein.html]
PREDATOR kết nối thông tìn của nhiều trình tự chuỗi với các liên kết hydro của amino acid để dự đoán cấu trúc thứ cấp.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
PSA là mô hình cơ bản Markov gần như để dự đoán cấu trúc thứ cấp. Nó nổi bật vì giao diện của mình,Dự đoán cấu trúc protein là một trong những nhiệm vụ quan trọng,nhằm xây dựng cơ sở dữ liệu protein, phục vụ cho việc tìm hiểu chức năng và ý nghĩa của các protein, hiểu được bản chất của sự sống từ đó cải thiện môi trường sống. Tìm ra cấu trúc protein thông qua quá trình phân tích thực nghiệm đòi hỏi nhiều thời gian và công sức. Nhiệm vụ quan trọng của Sinh tin học là giúp dự đoán cấu trúc protein từ một chuỗi các amino acid đã biết hình thành nên protein đó. Tuy nhiên các phương pháp dự đoán cấu trúc protein hiện vẫn chưa thể có độ chính xác tuyệt đối. Tỉ lệ chính xác của các phương pháp chẩn đoán cấu trúc protein hiện nay vẫn chưa vượt quá con số 80%. Việc tìm hiểu chức năng của protein thường dựa vào cấu trúc bậc ba của protein đó.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
Tuy nhiên, việc áp dụng các phương pháp thí nghiệm hoá lý để tìm ra cấu trúc bậc ba của protein vẫn còn gặp nhiều khó khăn và phức tạp. Do đó, đa số các phương pháp xác định cấu trúc bậc ba của một protein phải trải qua một bước trung gian quan trọng là xác định cấu trúc bậc hai của protein đó. Việc xác định được cấu trúc bậc hai của protein sẽ làm tăng thêm độ chính xác trong việc xác định cấu trúc bậc ba lên từ 25 - 50 %.
Phương pháp thí nghiệm hoá lý được sử dụng để xác định cấu trúc bậc hai protein cũng gặp nhiều khó khăn và tốn kém thời gian. Chính những khó khăn này đã thúc đẩy các nhà nghiên cứu tìm cách chẩn đoán cấu trúc bậc hai của các protein mới dựa trên cấu trúc bậc hai của những protein đã biết. Nhiều thuật toán khác nhau được phát triển như thuật toán sử dụng hệ chuyên gia, sử dụng các lý thuyết về đồ thị, sử dụng các phương pháp thống kê, thuật toán người láng giềng gần nhất, sử dụng mạng neural, ...
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
Để giải quyết bài toán trên, phương pháp thông thường là chia chuỗi amino acid thành nhiều đoạn, mỗi đoạn là một cửa sổ chứa từ 13 đến 21 amino acid. Các amino acid trong cùng một cửa sổ sẽ có cấu trúc bậc 2 giống nhau. Khi đó bài toán được đơn giản hóa từ việc chẩn đoán
cấu trúc bậc 2 của mỗi amino acid trong protein thành việc chẩn đoán cấu trúc bậc 2 của một amino acid trung tâm trong mỗi cửa sổ nói trên. Sau đó xây dựng mô hình để ánh xạ từ các cửa sổ amino acid trong chuỗi sang trạng thái cấu trúc bậc 2 tương ứng.
8.9 / DỰ ĐOÁN CẤU TRÚC VÀ CHỨC NĂNG PROTEIN
Độ chính xác của kỹ thuật dự đoán cấu trúc bậc 2 của protein được cải tiến đáng kể sau khi áp dụng mạng thần kinh nhân tạo để huấn luyện quá trình chẩn đoán. Mạng sau khi được huấn luyện sẽ được ghi nhớ để chuẩn bị dự đoán cấu trúc bậc 2 của các chuỗi protein mới. Mạng thần kinh thường được xây dựng trên 3 lớp và áp dụng với số lượng lớn thông tin để tăng độ chi tiết của thông tin huấn luyện, nhằm tăng độ chính xác của giải thuật dự đoán. Độ chính xác của phương pháp dự đoán cấu trúc bậc 2 sử dụng mạng thần kinh
Chân thành cảm ơn!
CHÀO TẠM BIỆT!
* Một số tài liệu cũ có thể bị lỗi font khi hiển thị do dùng bộ mã không phải Unikey ...
Người chia sẻ: Võ Phương Thảo
Dung lượng: |
Lượt tài: 1
Loại file:
Nguồn : Chưa rõ
(Tài liệu chưa được thẩm định)