TIN SINH HỌC P24
Chia sẻ bởi Võ Phương Thảo |
Ngày 23/10/2018 |
66
Chia sẻ tài liệu: TIN SINH HỌC P24 thuộc Bài giảng khác
Nội dung tài liệu:
HVTH: Nguyễn Thị Mỹ Chi
Lớp : SHTN - K12
GVHD: TS. Võ Văn Toàn
NHẬN BIẾT VÀ DỰ ĐOÁN
CẤU TRÚC PROTEIN
Protein là một đại phân tử hữu cơ có rất nhiều chức năng và đóng vai trò rất lớn trong cơ thể sống. Do đó, dự đoán cấu trúc protein là một trong những nhiệm vụ quan trong nhằm xây xây cơ sở dữ liệu protein, phục vụ cho việc tìm hiểu chức năng và ý nghĩa của protein, hiểu được bản chất của sự sống từ đó cải thiện môi trường sống.
Tìm ra cấu trúc protein thông qua quá trình phân tích
thực nghiệm đòi hỏi nhiều thời gian và công sức. Nhiệm
vụ quan trọng của Tin sinh học là giúp dự đoán cấu trúc
protein từ một chuỗi các axit amin đã biết hình thành
nên protein đó.
I. Phương pháp xác định cấu trúc protein bằng thực nghiệm
1.1. X- quang tinh thể
Trước tiên, phân tử này phải được kết tinh, và các
tinh thể phải là số ít (không phải 2 hoặc nhiều hơn bị
dính với nhau) và có chất lượng hoàn hảo.
Các phân tử với các phần kị nước cao thường
không thể kết tinh được, mặc dù trong một vài trường
hợp những tinh thể vẫn tồn tại trong sự hiện diện của
chất tẩy rửa.
Một khi tinh thể thu được, một hình ảnh nhiễu xạ được tạo ra bởi sự chiếu xạ-X. Mô hình này bao gồm hàng ngàn điểm, đó là những dữ liệu thô. Vị trí và cường độ của mỗi điểm là tương đối dễ dàng xác định, nhưng các pha của sóng được thành lập tại mỗi điểm, cũng phải được xác định để tạo ra một bản đồ mật độ điện tử.
Các điện tử của các phân tử trong tinh thể nhiễu xạ X-quang giải thích hình ảnh này bằng cách xây dựng một mô hình của các protein để phù hợp với bản đồ. Một mô hình phân tử của trình tự các axit amin hoặc nucleotide, phải được biết đến độc lập, sau đó được lắp vào bản đồ này mật độ điện tử, và một loạt các cải tiến được thực hiện. Kết quả là một tập hợp X, Y, Z tọa độ Descartes cho mỗi nguyên tử hydro không trong phân tử.
Một tính chất quan trọng của mô hình cuối cùng là độ phân giải của nó. Trung bình, sự không chắc chắn về vị trí của một nguyên tử là khoảng một phần năm tới một phần mười độ phân giải cho các dữ liệu chất lượng cao (yếu tố R 0,20 hoặc ít hơn). Giá trị nhỏ cho độ phân giải có nghĩa là không chắc chắn nhỏ, do đó độ phân giải tốt; giá trị lớn hơn có nghĩa là độ phân giải kém. Ví dụ, 5,0 Å là giải quyết kém cho một protein, 2,5 Å giải quyết được nhiều vị trí nguyên tử một cách chắc chắn hơn, và 1,2 Å là độ phân giải cao cho một protein, nơi mà các nguyên tử hydro có thể bắt đầu được thấy rõ.
Khi cấu trúc tinh thể được gửi vào các PDB, tập tin phối hợp chính thường chứa một đơn vị không đối xứng - một khái niệm mà đã áp dụng duy nhất để tinh thể, nhưng quan trọng là phải hiểu làm thế nào để có được những phân tử có chức năng sinh học.
Một đơn vị bất đối xứng là phần nhỏ nhất của một cấu trúc tinh thể mà đối xứng tinh thể có thể được áp dụng để tạo ra một đơn vị tế bào. Các hoạt động đối xứng thường được tìm thấy trong các cấu trúc phân tử sinh học được phép quay, dịch chuyển , và sự xoay (kết hợp luân chuyển và dịch thuật). Các đơn vị tế bào là đơn vị nhỏ nhất trong tinh thể mà khi dịch chuyển trong ba chiều tạo nên toàn bộ tinh thể.
1.2. Cộng hưởng từ hạt nhân (NMR)
Cộng hưởng từ hạt nhân (NMR) là một hiện tượng vật lý dựa trên đặc tính của các hạt nhân nguyên tử. NMR nghiên cứu hạt nhân từ, như của một nguyên tử hydro, bằng cách sắp xếp nó với một từ trường bên ngoài và nhiễu loạn liên kết này bằng cách sử dụng một trường điện từ.
Phản ứng về lĩnh vực này( các nhiễu loạn), là những
gì được khai thác trong quang phổ NMR và hình ảnh
cộng hưởng từ.
Bằng cách nghiên cứu các đỉnh của quang phổ NMR, có thể xác định cấu trúc của nhiều hợp chất. Nó có thể là một kỹ thuật rất chọn lọc, phân biệt giữa các nguyên tử trong một phân tử hoặc bộ sưu tập của các phân tử cùng loại, nhưng chỉ khác nhau về môi trường hóa học của địa phương.
NMR xác định cấu trúc của các protein trong dung dịch, nhưng được giới hạn những phân tử không lớn hơn 30 kD. NMR là phương pháp được lựa chọn cho các protein nhỏ, không dễ dàng kết tinh, và bộc lộ các vị trí của một số các nguyên tử hydro. Kết quả phân tích NMR là một quần thể của các mô hình thay thế, ngược lại với mô hình duy nhất thu được bằng cách tinh thể.
II. Phương pháp nhận biết và dự đoán cấu trúc Protein bằng tin sinh học
2. 1. Mô hình hóa tương đồng
2.1.1 Mô hình hóa tương đồng là gì?
Mô hình hóa tương đồng là một mô hình ba chiều
cho một protein cấu trúc không rõ (mục tiêu) có thể
được xây dựng dựa trên thông tin từ một hoặc nhiều
protein có liên quan của cấu trúc đã biết (mẫu).
Các điều kiện cần thiết là có sự giống nhau giữa
trình tự mục tiêu và cấu trúc mẫu được phát hiện và có
một sự liên kết chính xác giữa chúng có thể được xây
dựng. Các liên kết nên ở một vị trí chính xác với phần
còn lại của protein.
2.1.2. Các bước trong mô hình hóa tương đồng
* Bước 1: Tìm các mẫu
So sánh mô hình thường bắt đầu bằng cách tìm kiếm
ngân hàng dữ liệu protein (PDB) [http://www.pdb.org/]
của các cấu trúc protein đã biết bằng cách sử dụng
chuỗi mục tiêu như truy vấn.
Tm ki?m năy thu?ng du?c th?c hi?n b?ng câch so
sânh trnh t? m?c tiíu v?i câc trnh t? c?a m?i c?u trc
trong co s? d? li?u.
Một điểm bắt đầu tốt để tìm kiếm mẫu là nhiều
máy chủ cơ sở dữ liệu trên World Wide Web như
BLAST và FASTA tìm kiếm các protein liên quan.
* Bước 2: Lựa chọn mẫu
+ Sự tương tự về trình tự toàn bộ giữa mục tiêu và trình tự các mẫu, thì tốt hơn các mẫu như nhau.
+ Chất lượng của các mẫu tiềm năng.
+ Độ phân giải .
Ví dụ: mẫu có độ phân giải cao thì tăng độ chính xác
mô hình.
+ Mục đích của mô hình.
Ví dụ: nếu ý tưởng của các cấu trúc là có liên quan,
chất lượng là ít quan trọng
* Bước 3: Sự liên kết mục tiêu – mẫu
Để xây dựng một mô hình, tất cả các chương trình mô hình phụ thuộc vào một danh sách các giả định các cấu trúc tương tự giữa mục tiêu và các mẫu còn lại. Danh sách này được xác định bởi sự liên kết của mục tiêu và trình tự mẫu.
Liên kết có được khi sự giống nhau trình tự mẫu
mục tiêu là trên 40%. Sự liên kết chính xác có thể
được lấy tự động bằng cách sử dụng phương pháp
chuỗi liên kết chuẩn.
Nếu sự giống nhau của các mẫu mục tiêu thấp hơn 40%,
sự liên kết có những khoảng trống và cần sự can thiệp thủ
công để giảm thiểu số lượng các phần còn lại bị lệch.
* Bước 4: Xây dựng mô hình
Một khi sự liên kết mục tiêu-mẫu ban đầu được xây dựng, một loạt các phương pháp có thể được sử dụng để xây dựng một mô hình 3D cho các protein mục tiêu.
Phương pháp ban đầu và vẫn còn sử dụng rộng rãi là
mô hình của cơ thể cứng nhắc, lắp ráp. Phương pháp
này xây dựng mô hình từ một vài vùng lõi và từ vòng,
các chuỗi bên, được lấy từ các cấu trúc giải phẫu có
liên quan.
Mô hình hóa bằng cách kết hợp phân đoạn, dựa vào
các vị trí gần đúng của các nguyên tử được bảo tồn từ
các mẫu để tính toán tọa độ của các nguyên tử khác.
Nhóm thứ ba của các phương pháp, mô hình hóa bởi sự hài lòng của các hạn chế về không gian, sử dụng cả hình học từ xa hoặc các kỹ thuật tối ưu hóa để đáp ứng các hạn chế về không gian có được từ sự liên kết của chuỗi mục tiêu với cấu trúc mẫu.
Các yếu tố khác như lựa chọn mẫu và độ chính xác liên kết thường có tác động lớn hơn về tính chính xác mô hình, đặc biệt là cho các mô hình dựa trên ít hơn 40 % giống nhau trình tự cho các mẫu.
* Bước 5: Ước lượng mô hình
Sau khi mô hình được xây dựng, điều quan trọng là kiểm tra xem nó có thể có các lỗi.
Điều đầu tiên để kiểm tra có thể được để áp đặt các cấu trúc mô hình mẫu của mình vào cấu trúc để xác định nếu gấp nếp là mô hình chính xác.
Một đánh giá rất quan trọng là nhận thức về các vùng không đáng tin cậy trong mô hình. Một cách tiếp cận đó là để dự tính một mô tả sơ lược năng lượng của mô hình của một chương trình như PROSA2003. Các mô tả sơ lược báo cáo năng lượng cho từng vị trí trong mô hình và khu vực xấu có thể được xác định.
Một cách khác để tìm các vùng không đáng tin cậy trong một mô hình là để đánh giá lập thể (độ dài liên kết và các góc, góc nhị diện, các va chạm, vv) với các chương trình như WHATCHECK hoặc PROCHECK.
Nhận biết và dự đóan cấu trúc Protein theo kỹ thuật mô hình hóa tương đồng với phần mềm Swiss model và phần mềm Prosa
1. Mở cửa sổ Swess- model workspase
2. Nhập trình tự Protein cần xác định cấu trúc và nhập địa chỉ email cũng như yêu cầu và gửi đi bằng việc click vào Submit
3. Kiểm tra chất lượng của mô hình bằng phần mềm PROSA 2003
4. Xây dựng cấu trúc 3D của mô hình bằng phần mềm Pymol
Bước 1:.Mở cửa sổ Swiss- model workspase
Bước 2: Nhập trình tự Protein cần xác định cấu trúc và nhập địa chỉ email cũng như yêu cầu và gửi đi bằng việc click vào Submit
1. Nhập địa chỉ email
2. Nhập yêu cầu
3..Nhập trình tự Protein cần xác định cấu trúc hoặc mật mã AC UniProt
4.Gửi Trình tự và yêu cầu đã nhập
Bước 3.Kiểm tra chất lượng của mô hình bằng phần mềm PROSA 2003:
GooglePROSA 2003
Chọn và click
Click vào đây
Nhập cấu trúc cần kiểm tra chất lượng mô hình
Nhập các mã về mô hình cần kiểm tra chất lượng
Phân tích để đánh giá mô hình
Tìm kết quả đánh giá
Click vào đây
Bước 4.Xây dựng cấu trúc 3D của mô hình bằng phần mềm Pymol:
GooglePDB
Nhập mã mô hình đã được đánh giá bằng phần mềm Prosa
Lựa chọn mẫu và download
DisplaySquence
Xem cấu trúc 3D của mẫu tương đồng bằng phần mềm Java
Click
2.2. Phương pháp luồng
Phương pháp luồng có trình tự axit amin của một cấu trúc protein không mô tả đặc điểm, các mô hình tính toán nhanh chóng dựa trên các cấu trúc 3D, và sau đó đánh giá các mô hình này để xác định các acid amin chưa rõ như thế nào "phù hợp" mỗi cấu trúc mẫu.
Nó được sử dụng thành công hơn để phát hiện tương
đồng từ xa mà không thể phát hiện bằng sự liên kết trình tự
chuẩn, nếu các phần của một trình tự phù hợp tốt với một
nếp gấp, một liên kết thường có thể được suy ra, mặc dù
có thể không có đủ thông tin để xây dựng một mô hình
hoàn chỉnh.
2.3. Các phương pháp dự báo Ab-initio
Tập trung xây dựng cấu trúc mà không có thông tin trước.
Các protein có thể được biểu diễn như hạt cườm trên
chuỗi. Mỗi axit amin, hoặc từng đơn vị cấu trúc bậc hai
ở một số phương pháp tiếp cận, trở thành một hạt với
thuộc tính được giao mà thu hút và đẩy lùi các loại hạt
khác, và thống kê các phương pháp mô phỏng cơ khí
được sử dụng để tìm kiếm không gian cấu tạo có sẵn
cho các mô hình đơn giản hóa. Những phương pháp
này có thể được thành công trong việc xác định các nếp
gấp protein, ngay cả khi các chi tiết của cấu trúc không
thể tiên đoán được.
III. Ứng dụng
Dự đoán cấu trúc EPITOPE tế bào B không liên tục trên protein MATRIX của Virus H5N1
* Bước 1: Thu nhận và xử lý số liệu
Từ cơ sở dữ liệu CEO và IEBD: thu dữ liệu về cấu trúc
epitope tế bào B không liên tục. Từ cơ sở dữ liệu NCBI,
UniProKB,CEO và IEPD: thư thập trình tự mục tiêu dùng
xây dựng mô hình tạo cấu trúc. Đồng thời thu trình tự
protein MP dùng để dự đoán epitope.Dữ liệu sau khi thu
nhận từ các cơ sở dữ liệu trên được xử lý bằng các đoạn
chương trình Perl để lấy ra các thông tin cần thiết cũng
như định dạng dữ liệu phù hợp với chương trình sử dụng.
* Bước 2: Xây dựng và đánh giá cấu trúc
+ Tìm trình tự mẫu trong cơ sở dữ liệu tương đồng với trình tự mục tiêu bằng câu lệnh blastall của chương trình BLAST.
+ Thực hiện sắp gióng cột giữa trình tự mục tiêu và các trình tự mẫu bằng các chương trình gióng cột Clustal, T-Cofee và một công cụ sắp gióng cột cói sẵn của Modeller.
+ Sử dụng chương trình Modeller để tạo cấu trúc cho trình tự mục triêu từ kết quả sắp gióng cột đa trình tự ở bước 2.
+ Kiểm tra đánh giá độ chính xác của cấu trúc đã tạo bằng chương trình Prosa và Pymol. Các chỉ tiêu đánh giá bao gồm: chênh lệch gia trị z-score thực nghiệm và lý thuyết của cấu trúc không gian quá 3,5; giá trị năng lương rk- comb của cấu trúc dưới 10; giá trị RMSD giữa cấu trúc thực nghiệm và cấu trúc được tạo ra bằng phương pháp mô hình hóa không gian quá 1,5A0.
Để chọn phương án tạo cấu trúc tối ưu nhất sử dụng cho toàn bộ quy trình dự đoán, có 4 lần kiểm tra như sau.
* Bước 3: Ứng dụng
Sau bốn lần kiểm tra chọn phương pháp tối ưu ta xác định được cấu trúc tối ưu là autoclustal và phương án này được sử dụng để tạo cấu trúc cho 53 trình tự protein MP của virus H5N1 ở Việt Nam
* Bước 4: Dự đoán epitope
Cấu trúc của các protein MP đã tạo ra được sắp gióng cột cấu trúc với các cấu trúc epitope mẫu bằng chương trình CEO, nhằm dự đoán epitope trên trình tự mục tiêu . Kết quỉa dự đoán epitope bằng quy trình đó được so sánh với kết quả dự đoán bằng server CEP (một sever dự đoán epitope không liên tục với độ chính xác 75%) để đánh giá khả năng dự đoán của quy trình.
Lớp : SHTN - K12
GVHD: TS. Võ Văn Toàn
NHẬN BIẾT VÀ DỰ ĐOÁN
CẤU TRÚC PROTEIN
Protein là một đại phân tử hữu cơ có rất nhiều chức năng và đóng vai trò rất lớn trong cơ thể sống. Do đó, dự đoán cấu trúc protein là một trong những nhiệm vụ quan trong nhằm xây xây cơ sở dữ liệu protein, phục vụ cho việc tìm hiểu chức năng và ý nghĩa của protein, hiểu được bản chất của sự sống từ đó cải thiện môi trường sống.
Tìm ra cấu trúc protein thông qua quá trình phân tích
thực nghiệm đòi hỏi nhiều thời gian và công sức. Nhiệm
vụ quan trọng của Tin sinh học là giúp dự đoán cấu trúc
protein từ một chuỗi các axit amin đã biết hình thành
nên protein đó.
I. Phương pháp xác định cấu trúc protein bằng thực nghiệm
1.1. X- quang tinh thể
Trước tiên, phân tử này phải được kết tinh, và các
tinh thể phải là số ít (không phải 2 hoặc nhiều hơn bị
dính với nhau) và có chất lượng hoàn hảo.
Các phân tử với các phần kị nước cao thường
không thể kết tinh được, mặc dù trong một vài trường
hợp những tinh thể vẫn tồn tại trong sự hiện diện của
chất tẩy rửa.
Một khi tinh thể thu được, một hình ảnh nhiễu xạ được tạo ra bởi sự chiếu xạ-X. Mô hình này bao gồm hàng ngàn điểm, đó là những dữ liệu thô. Vị trí và cường độ của mỗi điểm là tương đối dễ dàng xác định, nhưng các pha của sóng được thành lập tại mỗi điểm, cũng phải được xác định để tạo ra một bản đồ mật độ điện tử.
Các điện tử của các phân tử trong tinh thể nhiễu xạ X-quang giải thích hình ảnh này bằng cách xây dựng một mô hình của các protein để phù hợp với bản đồ. Một mô hình phân tử của trình tự các axit amin hoặc nucleotide, phải được biết đến độc lập, sau đó được lắp vào bản đồ này mật độ điện tử, và một loạt các cải tiến được thực hiện. Kết quả là một tập hợp X, Y, Z tọa độ Descartes cho mỗi nguyên tử hydro không trong phân tử.
Một tính chất quan trọng của mô hình cuối cùng là độ phân giải của nó. Trung bình, sự không chắc chắn về vị trí của một nguyên tử là khoảng một phần năm tới một phần mười độ phân giải cho các dữ liệu chất lượng cao (yếu tố R 0,20 hoặc ít hơn). Giá trị nhỏ cho độ phân giải có nghĩa là không chắc chắn nhỏ, do đó độ phân giải tốt; giá trị lớn hơn có nghĩa là độ phân giải kém. Ví dụ, 5,0 Å là giải quyết kém cho một protein, 2,5 Å giải quyết được nhiều vị trí nguyên tử một cách chắc chắn hơn, và 1,2 Å là độ phân giải cao cho một protein, nơi mà các nguyên tử hydro có thể bắt đầu được thấy rõ.
Khi cấu trúc tinh thể được gửi vào các PDB, tập tin phối hợp chính thường chứa một đơn vị không đối xứng - một khái niệm mà đã áp dụng duy nhất để tinh thể, nhưng quan trọng là phải hiểu làm thế nào để có được những phân tử có chức năng sinh học.
Một đơn vị bất đối xứng là phần nhỏ nhất của một cấu trúc tinh thể mà đối xứng tinh thể có thể được áp dụng để tạo ra một đơn vị tế bào. Các hoạt động đối xứng thường được tìm thấy trong các cấu trúc phân tử sinh học được phép quay, dịch chuyển , và sự xoay (kết hợp luân chuyển và dịch thuật). Các đơn vị tế bào là đơn vị nhỏ nhất trong tinh thể mà khi dịch chuyển trong ba chiều tạo nên toàn bộ tinh thể.
1.2. Cộng hưởng từ hạt nhân (NMR)
Cộng hưởng từ hạt nhân (NMR) là một hiện tượng vật lý dựa trên đặc tính của các hạt nhân nguyên tử. NMR nghiên cứu hạt nhân từ, như của một nguyên tử hydro, bằng cách sắp xếp nó với một từ trường bên ngoài và nhiễu loạn liên kết này bằng cách sử dụng một trường điện từ.
Phản ứng về lĩnh vực này( các nhiễu loạn), là những
gì được khai thác trong quang phổ NMR và hình ảnh
cộng hưởng từ.
Bằng cách nghiên cứu các đỉnh của quang phổ NMR, có thể xác định cấu trúc của nhiều hợp chất. Nó có thể là một kỹ thuật rất chọn lọc, phân biệt giữa các nguyên tử trong một phân tử hoặc bộ sưu tập của các phân tử cùng loại, nhưng chỉ khác nhau về môi trường hóa học của địa phương.
NMR xác định cấu trúc của các protein trong dung dịch, nhưng được giới hạn những phân tử không lớn hơn 30 kD. NMR là phương pháp được lựa chọn cho các protein nhỏ, không dễ dàng kết tinh, và bộc lộ các vị trí của một số các nguyên tử hydro. Kết quả phân tích NMR là một quần thể của các mô hình thay thế, ngược lại với mô hình duy nhất thu được bằng cách tinh thể.
II. Phương pháp nhận biết và dự đoán cấu trúc Protein bằng tin sinh học
2. 1. Mô hình hóa tương đồng
2.1.1 Mô hình hóa tương đồng là gì?
Mô hình hóa tương đồng là một mô hình ba chiều
cho một protein cấu trúc không rõ (mục tiêu) có thể
được xây dựng dựa trên thông tin từ một hoặc nhiều
protein có liên quan của cấu trúc đã biết (mẫu).
Các điều kiện cần thiết là có sự giống nhau giữa
trình tự mục tiêu và cấu trúc mẫu được phát hiện và có
một sự liên kết chính xác giữa chúng có thể được xây
dựng. Các liên kết nên ở một vị trí chính xác với phần
còn lại của protein.
2.1.2. Các bước trong mô hình hóa tương đồng
* Bước 1: Tìm các mẫu
So sánh mô hình thường bắt đầu bằng cách tìm kiếm
ngân hàng dữ liệu protein (PDB) [http://www.pdb.org/]
của các cấu trúc protein đã biết bằng cách sử dụng
chuỗi mục tiêu như truy vấn.
Tm ki?m năy thu?ng du?c th?c hi?n b?ng câch so
sânh trnh t? m?c tiíu v?i câc trnh t? c?a m?i c?u trc
trong co s? d? li?u.
Một điểm bắt đầu tốt để tìm kiếm mẫu là nhiều
máy chủ cơ sở dữ liệu trên World Wide Web như
BLAST và FASTA tìm kiếm các protein liên quan.
* Bước 2: Lựa chọn mẫu
+ Sự tương tự về trình tự toàn bộ giữa mục tiêu và trình tự các mẫu, thì tốt hơn các mẫu như nhau.
+ Chất lượng của các mẫu tiềm năng.
+ Độ phân giải .
Ví dụ: mẫu có độ phân giải cao thì tăng độ chính xác
mô hình.
+ Mục đích của mô hình.
Ví dụ: nếu ý tưởng của các cấu trúc là có liên quan,
chất lượng là ít quan trọng
* Bước 3: Sự liên kết mục tiêu – mẫu
Để xây dựng một mô hình, tất cả các chương trình mô hình phụ thuộc vào một danh sách các giả định các cấu trúc tương tự giữa mục tiêu và các mẫu còn lại. Danh sách này được xác định bởi sự liên kết của mục tiêu và trình tự mẫu.
Liên kết có được khi sự giống nhau trình tự mẫu
mục tiêu là trên 40%. Sự liên kết chính xác có thể
được lấy tự động bằng cách sử dụng phương pháp
chuỗi liên kết chuẩn.
Nếu sự giống nhau của các mẫu mục tiêu thấp hơn 40%,
sự liên kết có những khoảng trống và cần sự can thiệp thủ
công để giảm thiểu số lượng các phần còn lại bị lệch.
* Bước 4: Xây dựng mô hình
Một khi sự liên kết mục tiêu-mẫu ban đầu được xây dựng, một loạt các phương pháp có thể được sử dụng để xây dựng một mô hình 3D cho các protein mục tiêu.
Phương pháp ban đầu và vẫn còn sử dụng rộng rãi là
mô hình của cơ thể cứng nhắc, lắp ráp. Phương pháp
này xây dựng mô hình từ một vài vùng lõi và từ vòng,
các chuỗi bên, được lấy từ các cấu trúc giải phẫu có
liên quan.
Mô hình hóa bằng cách kết hợp phân đoạn, dựa vào
các vị trí gần đúng của các nguyên tử được bảo tồn từ
các mẫu để tính toán tọa độ của các nguyên tử khác.
Nhóm thứ ba của các phương pháp, mô hình hóa bởi sự hài lòng của các hạn chế về không gian, sử dụng cả hình học từ xa hoặc các kỹ thuật tối ưu hóa để đáp ứng các hạn chế về không gian có được từ sự liên kết của chuỗi mục tiêu với cấu trúc mẫu.
Các yếu tố khác như lựa chọn mẫu và độ chính xác liên kết thường có tác động lớn hơn về tính chính xác mô hình, đặc biệt là cho các mô hình dựa trên ít hơn 40 % giống nhau trình tự cho các mẫu.
* Bước 5: Ước lượng mô hình
Sau khi mô hình được xây dựng, điều quan trọng là kiểm tra xem nó có thể có các lỗi.
Điều đầu tiên để kiểm tra có thể được để áp đặt các cấu trúc mô hình mẫu của mình vào cấu trúc để xác định nếu gấp nếp là mô hình chính xác.
Một đánh giá rất quan trọng là nhận thức về các vùng không đáng tin cậy trong mô hình. Một cách tiếp cận đó là để dự tính một mô tả sơ lược năng lượng của mô hình của một chương trình như PROSA2003. Các mô tả sơ lược báo cáo năng lượng cho từng vị trí trong mô hình và khu vực xấu có thể được xác định.
Một cách khác để tìm các vùng không đáng tin cậy trong một mô hình là để đánh giá lập thể (độ dài liên kết và các góc, góc nhị diện, các va chạm, vv) với các chương trình như WHATCHECK hoặc PROCHECK.
Nhận biết và dự đóan cấu trúc Protein theo kỹ thuật mô hình hóa tương đồng với phần mềm Swiss model và phần mềm Prosa
1. Mở cửa sổ Swess- model workspase
2. Nhập trình tự Protein cần xác định cấu trúc và nhập địa chỉ email cũng như yêu cầu và gửi đi bằng việc click vào Submit
3. Kiểm tra chất lượng của mô hình bằng phần mềm PROSA 2003
4. Xây dựng cấu trúc 3D của mô hình bằng phần mềm Pymol
Bước 1:.Mở cửa sổ Swiss- model workspase
Bước 2: Nhập trình tự Protein cần xác định cấu trúc và nhập địa chỉ email cũng như yêu cầu và gửi đi bằng việc click vào Submit
1. Nhập địa chỉ email
2. Nhập yêu cầu
3..Nhập trình tự Protein cần xác định cấu trúc hoặc mật mã AC UniProt
4.Gửi Trình tự và yêu cầu đã nhập
Bước 3.Kiểm tra chất lượng của mô hình bằng phần mềm PROSA 2003:
GooglePROSA 2003
Chọn và click
Click vào đây
Nhập cấu trúc cần kiểm tra chất lượng mô hình
Nhập các mã về mô hình cần kiểm tra chất lượng
Phân tích để đánh giá mô hình
Tìm kết quả đánh giá
Click vào đây
Bước 4.Xây dựng cấu trúc 3D của mô hình bằng phần mềm Pymol:
GooglePDB
Nhập mã mô hình đã được đánh giá bằng phần mềm Prosa
Lựa chọn mẫu và download
DisplaySquence
Xem cấu trúc 3D của mẫu tương đồng bằng phần mềm Java
Click
2.2. Phương pháp luồng
Phương pháp luồng có trình tự axit amin của một cấu trúc protein không mô tả đặc điểm, các mô hình tính toán nhanh chóng dựa trên các cấu trúc 3D, và sau đó đánh giá các mô hình này để xác định các acid amin chưa rõ như thế nào "phù hợp" mỗi cấu trúc mẫu.
Nó được sử dụng thành công hơn để phát hiện tương
đồng từ xa mà không thể phát hiện bằng sự liên kết trình tự
chuẩn, nếu các phần của một trình tự phù hợp tốt với một
nếp gấp, một liên kết thường có thể được suy ra, mặc dù
có thể không có đủ thông tin để xây dựng một mô hình
hoàn chỉnh.
2.3. Các phương pháp dự báo Ab-initio
Tập trung xây dựng cấu trúc mà không có thông tin trước.
Các protein có thể được biểu diễn như hạt cườm trên
chuỗi. Mỗi axit amin, hoặc từng đơn vị cấu trúc bậc hai
ở một số phương pháp tiếp cận, trở thành một hạt với
thuộc tính được giao mà thu hút và đẩy lùi các loại hạt
khác, và thống kê các phương pháp mô phỏng cơ khí
được sử dụng để tìm kiếm không gian cấu tạo có sẵn
cho các mô hình đơn giản hóa. Những phương pháp
này có thể được thành công trong việc xác định các nếp
gấp protein, ngay cả khi các chi tiết của cấu trúc không
thể tiên đoán được.
III. Ứng dụng
Dự đoán cấu trúc EPITOPE tế bào B không liên tục trên protein MATRIX của Virus H5N1
* Bước 1: Thu nhận và xử lý số liệu
Từ cơ sở dữ liệu CEO và IEBD: thu dữ liệu về cấu trúc
epitope tế bào B không liên tục. Từ cơ sở dữ liệu NCBI,
UniProKB,CEO và IEPD: thư thập trình tự mục tiêu dùng
xây dựng mô hình tạo cấu trúc. Đồng thời thu trình tự
protein MP dùng để dự đoán epitope.Dữ liệu sau khi thu
nhận từ các cơ sở dữ liệu trên được xử lý bằng các đoạn
chương trình Perl để lấy ra các thông tin cần thiết cũng
như định dạng dữ liệu phù hợp với chương trình sử dụng.
* Bước 2: Xây dựng và đánh giá cấu trúc
+ Tìm trình tự mẫu trong cơ sở dữ liệu tương đồng với trình tự mục tiêu bằng câu lệnh blastall của chương trình BLAST.
+ Thực hiện sắp gióng cột giữa trình tự mục tiêu và các trình tự mẫu bằng các chương trình gióng cột Clustal, T-Cofee và một công cụ sắp gióng cột cói sẵn của Modeller.
+ Sử dụng chương trình Modeller để tạo cấu trúc cho trình tự mục triêu từ kết quả sắp gióng cột đa trình tự ở bước 2.
+ Kiểm tra đánh giá độ chính xác của cấu trúc đã tạo bằng chương trình Prosa và Pymol. Các chỉ tiêu đánh giá bao gồm: chênh lệch gia trị z-score thực nghiệm và lý thuyết của cấu trúc không gian quá 3,5; giá trị năng lương rk- comb của cấu trúc dưới 10; giá trị RMSD giữa cấu trúc thực nghiệm và cấu trúc được tạo ra bằng phương pháp mô hình hóa không gian quá 1,5A0.
Để chọn phương án tạo cấu trúc tối ưu nhất sử dụng cho toàn bộ quy trình dự đoán, có 4 lần kiểm tra như sau.
* Bước 3: Ứng dụng
Sau bốn lần kiểm tra chọn phương pháp tối ưu ta xác định được cấu trúc tối ưu là autoclustal và phương án này được sử dụng để tạo cấu trúc cho 53 trình tự protein MP của virus H5N1 ở Việt Nam
* Bước 4: Dự đoán epitope
Cấu trúc của các protein MP đã tạo ra được sắp gióng cột cấu trúc với các cấu trúc epitope mẫu bằng chương trình CEO, nhằm dự đoán epitope trên trình tự mục tiêu . Kết quỉa dự đoán epitope bằng quy trình đó được so sánh với kết quả dự đoán bằng server CEP (một sever dự đoán epitope không liên tục với độ chính xác 75%) để đánh giá khả năng dự đoán của quy trình.
* Một số tài liệu cũ có thể bị lỗi font khi hiển thị do dùng bộ mã không phải Unikey ...
Người chia sẻ: Võ Phương Thảo
Dung lượng: |
Lượt tài: 1
Loại file:
Nguồn : Chưa rõ
(Tài liệu chưa được thẩm định)