TIN SINH HỌC P70

Chia sẻ bởi Võ Phương Thảo | Ngày 23/10/2018 | 64

Chia sẻ tài liệu: TIN SINH HỌC P70 thuộc Bài giảng khác

Nội dung tài liệu:

GIỚI THIỆU VỀ CẤU TRÚC PROTEIN
BÀI 6
Giảng viên: T S. Võ Văn Toàn
Học viên : Nguyễn Hoàng Sơn
Lớp : Sinh học thực nghiệm k14
6.1 Nền
6.1.1. Chức năng của protein
Protein đóng vai trò quan trọng trong quá trình sinh học. Nó có thể thực hiện nhiều nhiệm vụ lớn. Là enzym xúc tác tập hợp các phản ứng hóa học được gọi chung là sự sống. Mặt khác những phản ứng hóa học theo quy định của protein, mà hành động một cách trực tiếp bởi các thành phần của các enzym hoặc gián tiếp trong các hình thức truyền tin hóa học, hoặc các thụ thể của nó. Nó tham gia vào việc vận chuyển và lưu trữ các chất sinh học quan trọng như các ion kim loại, ôxy, glucose, chất béo, và các phân tử khác. Trong hình thức của các sợi cơ và lắp ráp co lại khác, protein tạo ra các chuyển động cơ học của quá trình phối hợp nhiều quá trình sinh học, bao gồm cả việc phân chia các nhiễm sắc thể trong quá trình phân chia tế bào và chuyển động của đôi mắt của bạn khi bạn đọc văn bản này.
6.1.2. Cấu trúc của protein
Chức năng Protein chỉ có thể được hiểu trong mối quan hệ với cấu trúc của protein. Điều đó có nghĩa là cấu trúc của một protein xác định chức năng sinh hóa của nó. Cấu trúc của protein được mô tả ở bốn cấp độ, đó là:
• Cấu trúc bậc 1: là chuỗi acid amin của các chuỗi protein polypeptide.
• Cấu trúc bậc 2: là sự sắp xếp không gian xung quanh của các nguyên tử polypeptide xương sống mà không liên quan đến hình thể chuỗi phụ của nó.
• Cấu trúc bậc 3: ("xếp"), là sự sắp xếp tổng thể các yếu tố cấu trúc bậc 2.
• Cấu trúc bậc 4: là sự sắp xếp của các chuỗi polypeptide.
Các bậc cấu trúc của protein
K. Linderstrøm-Lang là người đầu tiên đề xuất sự phân loại này. Chúng ta có thể phân loại các protein bằng cách phân loại này, mức độ bổ sung của cấu trúc protein đã được giới thiệu, để tạo điều kiện phân loại các protein thành các gia đình về cấu trúc và chức năng. Các cấp bổ sung được gọi là siêu cấu trúc bậc 2. Các siêu cấu trúc bậc 2 cũng được gọi là các họa tiết mô tả mối liên kết của các yếu tố cấu trúc bậc 2 thông qua các chuỗi tương tác phụ.
6.1.2. Cấu trúc của protein
6.1.2.1. Cấu trúc bậc 1
Protein là polimer tuyến tính của 20 axit amin khác nhau nối lại với nhau qua liên kết cộng hóa trị, gọi là chuỗi polipeptide. Thứ tự các axit amin được gọi là chuỗi axit amin.Các trình tự của tất cả các chuỗi polypeptide của protein được xác định như cấu trúc bậc 1.
6.1.2.2. Cấu trúc bậc 2
Có 3 kiểu phổ biến của cấu trúc bậc 2 trong các protein, cụ thể là xoắn α , nếp gấp β và quay. Tất cả các phần còn lại không thể phân loại vào một trong 3 kiểu này thường được gọi là cuộn dây ngẫu nhiên. Ngoài những yếu tố phổ biến của cấu trúc bậc 2, một số yếu tố khác đã được đề xướng. Tuy nhiên chúng chỉ chiếm một phần nhỏ và không thể là một nguyên tắc cấu trúc chung cho protein. Để phân biệt các mô hình cấu trúc, người ta phải điều tra hình học của xương sống peptide.
Hình 6-1: peptide liên kết trong các protein
Như chúng ta có thể nhìn thấy từ hình 6.1 có 3 gốc xoắn chính trong xương sống. Chúng được gọi là phi, psi và omega. Một phần liên kết đôi của liên kết amin, omega thường bằng 180 độ. Sự hình thành của các yếu tố cấu trúc bậc 2 được thực hiện bằng cách thay đổi góc phi và psi. Không phải mọi sự kết hợp giữa phi và psi đều xảy ra trong tự nhiên.
6.1.2.2. Cấu trúc bậc 2
Hình 6-2: Các loại xoắn khác nhau xảy ra trong protein
6.1.2.2. Cấu trúc bậc 2
Mô hình cấu trúc bậc 2 nổi bật nhất là xoắn. Có 3 kiểu xoắn được biết đến xảy ra trong các protein là xoắn 310, xoắn α và xoắn π .Kiểu xoắn phổ biến nhất là xoắn α. Cấu trúc của nó lặp đi lặp lại chính nó 5,4A0 dọc theo trục xoắn, vùng xoắn α có 3,6 gốc amino axit chiều cao tương ứng là 5,4A0. Sự bền vững của cấu trúc xoắn α bắt nguồn từ các kiên kết hidro của xương sống giữa nhóm C=O và nhóm N-H. Các chuỗi bên điểm ra ngoài trục xoắn và nói chung là hướng về phía cuối amino.
                                                                

Hình : Ví dụ cấu trúc xoắn alpha. A: mô hình giản lược, B: mô hình phân tử, C: nhìn từ đỉnh, D: mô hình không gian
Xoắn 310
Xoắn α
- Phiến gấp β
Pauling và Corey là người đầu tiên đề xuất phiến gấp. Như với xoắn α, hình thể phiến gấp β lặp đi lặp lại góc phi và psi và sử dụng năng lượng của liên kết hidro của xương sống polypeptide. Trong nếp gấp β, tuy nhiên liên kết hidro xảy ra giữa các chuỗi polypeptide kề nhau. Phiến gấp β có nguồn gốc tên của nó từ thực tế, các nguyên tử C kế cận nhau tuần tự được xen kẽ trên và dưới mặt phẳng của phiến gấp β song song và không song song.
6.1.2.2. Cấu trúc bậc 2
Hình 6-3: song song và antiparallel tấm beta pleated.
Trong phiến gấp β Không song song, các chuỗi hidro lân cận ngoại quan chạy theo hướng ngược nhau và trong phiến gấp β song song, các chuỗi hidro chạy cùng hướng.
6.1.2.2. Cấu trúc bậc 2
- Quay
Mô hình cấu trúc thứ 3 được xác định là quay. Các kiểu phổ biến nhất của mô hình này là quay kiểu I và kiểu II. Chúng bao gồm 4 axit amin tạo thành một vòng quay 1800 của xương sống. Cấu trúc này ổn định bởi liên kết hidro giữa axit amin đầu tiên và axit amin cuối cùng. Hai kiểu này khác nhau về sự sắp xếp của các axit amin tức là giá trị của phi và psi giữa axit amin i+1 và i+2.
6.1.2.2. Cấu trúc bậc 2
Hình 7-4: Hai loại kiểu quay phổ biến: loại I và loại II
6.1.2.3. Cấu trúc siêu bậc 2
Protein, đặc biệt là protein dài (có nghĩa là tất cả các protein sinh hóa quan trọng) hầu như không thể chỉ có một loại cấu trúc bậc 2. Hơn nữa riêng các loại khác nhau của mô hình cấu trúc bậc 2 trong nhiều trường hợp trình tự của các mô hình cấu trúc bậc 2 là tương tự như giữa các protein khác nhau, trình tự như vậy của các mô hình cấu trúc bậc 2 được gọi là cấu trúc siêu bậc 2. Mô hình cấu trúc bậc 2 phổ biến nhất là siêu mô hình tấm chuyễn tờ, trong đó một lượng lớn các mảng tờ  trong một protein có thể được hình thành. Một ví dụ khác là mô hình vòng xoắn-quay-vòng xoắn.
6.1.2.4. Cấu trúc bậc 3
Khi chúng ta quan sát một chuỗi polypeptide thực tế, các hình dạng cuối cùng được tạo nên từ đặc tính phổ thông, có lẽ đặc tính cấu trúc siêu bậc 2, và một số conformations dường như ngẫu nhiên. Cấu trúc tổng thể này được gọi là cấu trúc bậc 3. Cấu trúc bậc 3 này cuối cùng đã xác định các chức năng của protein. Điều đó có nghĩa là các protein khác nhau với cấu trúc bậc 3 tương tự có thể có một chức năng tương tự.
6.1.2.5. Cấu trúc bậc 4
Cuối cùng, nhiều protein sinh học xây dựng nên các chuỗi polypeptide. Cách thiết lập nhiều chuỗi polypeptide phù hợp với nhau tạo thành cấu trúc bậc bốn của protein. Việc bố trí các chuỗi polypeptide khác nhau với nhau là rất quan trọng với chức năng của protein.
6.1.3 Protein cấu trúc và chức năng: Một cách tiếp cận thực tế
Sau khi cô lập protein mới sẽ không biết được cấu trúc ba chiều của nó. Những gì người ta sẽ biết được là các tính chất hóa học và cấu trúc bâc 1, tức là trình tự. Chỉ điều đó ta cũng có thể biết được về chức năng của protein. Nhưng để hiểu đầy đủ chức năng và các đặc tính của protein, một cấu trúc ba chiều là không thể tránh khỏi. Mặc dù rất nhiều nghiên cứu đã được thực hiện trong lĩnh vực này, nhưng vẫn không thể hoàn toàn xác định được cấu trúc bậc 2 và cao hơn của một protein trong chuỗi acid amin của nó.

6.1.3 Protein cấu trúc và chức năng: Một cách tiếp cận thực tế
Tầm quan trọng của sự hiệu biết về cấu trúc protein xuất phát từ hai yếu tố hợp tác cùng nhau. Đầu tiên trong số này là chức năng của protein hoàn toàn phụ thuộc vào cấu trúc của nó. Trong thực tế, một trong những cách phổ biến nhất là protein để mất chức năng của nó, được gọi là biến tính, tức là mất cấu trúc không gian ban đầu của nó, ví dụ do nhiệt hoặc căng thẳng cơ học. Yếu tố thứ hai là đặc biệt khó khăn để xác định cấu trúc của protein thực nghiệm. Nhưng ngày nay, cấu trúc cơ bản của nhiều trình tự đã được xác định (hơn 100.000). Ngược lại, cấu trúc bậc 3 chỉ có khoảng 1000 protein đã được xác định. Rõ ràng, nó sẽ có giá trị tuyệt vời nếu cấu trúc bậc 3 có thể được xác định từ cấu trúc bậc 1. Sẻ không phải quá đáng khi nói rằng chúng ta có khả năng dự đoán chính xác các cấu trúc của protein. Từ đó, protein chức năng sẽ cách mạng hóa y học, dược học, hóa học và sinh thái học.


6.2. Xác định và trực quan của cấu trúc protein
6.2.1. Nguồn gốc và hạn chế của cấu trúc dữ liệu 3D
Thông tin về cấu trúc 3-D của các đại phân tử sinh học có thể được tìm thấy trong các Ngân hàng dữ liệu Protein (www.pdb.org). Hầu hết các cấu trúc dữ liệu trong cơ sở dữ liệu PDB đã thu được bằng một trong các phương pháp: tinh thể học tia X hay X-ray (trên 80%), giải pháp cộng hưởng từ hạt nhân (NMR) (khoảng 16%).














Bảng 6-1: Danh sách các PDB Holdings (04-May-2006)
Hình 6-5: Số lượng cơ cấu tìm kiếm được mỗi năm trong PDB (04-May-2006)
6.2. Xác định và trực quan của cấu trúc protein
6.2.1. Nguồn gốc và hạn chế của cấu trúc dữ liệu 3D
Việc đầu tiên là hai phương pháp thực nghiệm. Kết quả thực nghiệm của các phương pháp thí nghiệm mô tả chính xác cấu trúc 3D của phân tử trong tiểu bang, trong đó các phép đo được thực hiện. Kết tinh đôi khi làm biến dạng các phần của một cấu trúc do liên lạc giữa các phân tử lân cận trong tinh thể. Tuy nhiên, các tinh thể protein được sử dụng cho nghiên cứu nhiễu xạ được đánh giá cao ngậm nước nên các cấu trúc xác định từ tinh thể không có nhiều khác nhau từ các cấu trúc của các protein hòa tan trong dung dịch nước.
NMR xác định cấu trúc của các protein trong dung dịch, nhưng được giới hạn không có nhiều phân tử lớn hơn 30 kD. NMR là phương pháp được lựa chọn cho các protein nhỏ, không dễ dàng kết tinh, và sản lượng các vị trí của một số các nguyên tử hydro. Kết quả phân tích NMR là một quần thể của các mô hình thay thế, ngược lại với mô hình duy nhất thu được bằng cách tinh thể.
Cấu trúc thu được từ mô hình lý thuyết có xu hướng ít chính xác hơn so với những người thu được bằng phương pháp thực nghiệm. Một loại mô hình, được gọi là mô hình tương đồng, liên quan đến một chuỗi phù hợp được biết đến với cấu trúc 3D thực nghiệm xác định của một phân tử chuỗi tương tự.
6.2.1. Nguồn gốc và hạn chế của cấu trúc dữ liệu 3D
6.2.1. Nguồn gốc và hạn chế của cấu trúc dữ liệu 3D
Có một số trở ngại thử nghiệm phải được vượt qua trước khi các cấu trúc 3D của các đại phân tử có thể được xác định bằng nhiễu xạ tia X từ các tinh thể. Trước tiên, phân tử này phải được kết tinh, và các tinh thể phải là số ít (không phải 2 hoặc nhiều hơn bị dính với nhau) và có chất lượng tốt. Vô số những nỗ lực để xác định cấu trúc phân tử đã thất bại ở giai đoạn này. Protein kết tinh như một nghệ thuật nhiều như một khoa học. Nhiều phân tử quan trọng vắng mặt từ các PDB vì những nỗ lực để sản xuất tinh thể phù hợp không thành công. Các phân tử với các phần kỵ nước cao thường không thể kết tinh, mặc dù trong một vài trường hợp tinh thể đã được đạt được trong sự hiện diện của chất tẩy rửa.
Một khi tinh thể thu được một hình ảnh nhiễu xạ được tạo ra bởi sự chiếu xạ-X. Mô hình này bao gồm hàng ngàn điểm, đó là những dữ liệu thô. Vị trí và cường độ của mỗi điểm là tương đối dễ dàng xác định, nhưng các giai đoạn của sóng, hình thành mỗi điểm, cũng phải được xác định để sản xuất một bản đồ mật độ điện tử.



6.2.1. Nguồn gốc và hạn chế của cấu trúc dữ liệu 3D
Giải quyết các "vấn đề giai đoạn" là trở ngại thứ hai. Một giải pháp cho vấn đề giai đoạn liên quan đến việc sử dụng bức xạ synchrotron nhiều ở các bước sóng. Điều này rất quan trọng trong việc đẩy nhanh tốc độ giải quyết các cấu trúc tinh thể. Một mô tả đầy đủ của mỗi phản xạ cường độ, vị trí và giai đoạn được gọi là một "yếu tố cấu trúc". Cấu trúc yếu tố tập tin dữ liệu có sẵn tại PDB khoảng 25% các mục tinh thể. Xuất bản các yếu tố cấu trúc cho phép người khác tạo ra và kiểm tra các bản đồ mật độ điện tử, cố gắng sàng lọc thay thế hoặc các phương pháp loại bỏ dần các điện tử của các phân tử trong nhiễu xạ tinh thể X-quang, vì vậy kết quả của sự kết tinh thành công và giải pháp của vấn đề giai đoạn là một hình ảnh 3D của các đám mây electron của phân tử (một bản đồ mật độ điện tử). Diễn giải hình ảnh này bằng cách xây dựng một mô hình của các protein để phù hợp với bản đồ. Một mô hình phân tử của chuỗi các axit amin, nucleotide, mà phải được biết đến độc lập, sau đó được gắn vào bản đồ mật độ điện tử, và một loạt các cải tiến được thực hiện. Kết quả là một tập hợp X, Y, Z Cartesian tọa độ cho mỗi nguyên tử hydro trong phân tử.
Kết quả của sự tinh tế là sự phân công của một yếu tố nhiệt độ cho từng nguyên tử trong mô hình cuối cùng. Yếu tố nhiệt độ cao cho thấy một trong hai rối loạn hoặc chuyển động nhiệt. Rối loạn có nghĩa là nguyên tử chiếm vị trí khác nhau trong các phân tử tinh thể khác nhau, trong khi "chuyển động nhiệt đề cập đến sự rung động của một nguyên tử về vị trí còn lại của nó". Những khả năng này không thể chỉ được phân biệt duy nhất từ ​​các dữ liệu nhiễu xạ tinh thể. Nếu các phần của một chuỗi có tính di động cao, rối loạn, chúng sản xuất mật độ điện tử thấp và khá đồng bộ, làm cho chúng không thể chỉ định vị trí các nguyên tử trong phần này. Vì lý do này, chúng không phải là hiếm để tìm thấy những kết thúc của một chuỗi protein, và có lẽ một hoặc hai vòng lặp ở giữa, mất tích từ một tập tin phối hợp tinh thể nguyên tử.
6.2.1. Nguồn gốc và hạn chế của cấu trúc dữ liệu 3D
Một tính chất quan trọng của mô hình cuối cùng là độ phân giải của nó. Tính trung bình, sự không chắc chắn về vị trí của một nguyên tử là khoảng 1/5 đến 1/10 của độ phân giải chất lượng dữ liệu (R-yếu tố 0,20 hoặc ít hơn). Giá trị số nhỏ cho độ phân giải có nghĩa là ít chắc chắn, do đó độ phân giải tốt, giá trị lớn hơn có nghĩa là độ phân giải kém. Ví dụ, 5,0 Å độ phân giải khá nghèo protein, 2,5 Å giải quyết vị trí hơn nguyên tử một cách chắc chắn hơn, và 1,2 Å là độ phân giải cao cho một protein, nơi mà các nguyên tử hydro có thể bắt đầu được được phân biệt. Khi cấu trúc tinh thể lắng đọng trong PDB, các tập tin phối hợp chính thường có một đơn vị bất đối xứng
Một đơn vị không đối xứng là phần nhỏ nhất của một cấu trúc tinh thể đối xứng, tinh thể có thể được áp dụng để tạo ra một đơn vị tế bào. Các hoạt động đối xứng phổ biến nhất được tìm thấy trong các cấu trúc phân tử sinh học được phép quay, bản dịch, và đinh vít (kết hợp luân chuyển và dịch thuật). Các đơn vị tế bào là đơn vị nhỏ nhất trong một tinh thể khi dịch ba chiều cho toàn bộ các tinh thể.
6.2.1. Nguồn gốc và hạn chế của cấu trúc dữ liệu 3D
Hình dưới đây là một ví dụ đơn giản của hai kích thước. Ở đây, đơn vị không đối xứng (mũi tên trở lên) xoay 180 độ để tạo ra một bản sao thứ hai (mũi tên đi xuống). Cả hai mũi tên bao gồm các đơn vị tế bào. Các đơn vị tế bào sau đó translationally lặp đi lặp lại theo hai hướng để làm cho toàn bộ các tinh thể. Hình bầu dục màu đen trong mỗi đơn vị tế bào đại diện cho các trục đối xứng quay hai lần có liên quan tới hai mũi tên. Trong một tinh thể thực tế, bản sao bổ sung của đơn vị không đối xứng có thể được yêu cầu để làm cho các đơn vị tế bào và toàn bộ hệ thống sẽ tồn tại trong ba chiều.










Hình 6-6: đơn vị không đối xứng tinh thể
Các đơn vị không đối xứng được sử dụng bởi các crystallographer để tinh chỉnh cấu trúc đối với dữ liệu thử nghiệm và không nhất thiết phải đại diện cho một phân tử sinh học chức năng .
Một đơn vị không đối xứng có thể bao gồm:
• Một phân tử sinh học
• Một phần của một phân tử sinh học
• Nhiều phân tử sinh học
Nội dung của đơn vị không đối xứng phụ thuộc vào vị trí của phân tử trong tế bào đơn vị có liên quan đến các yếu tố đối xứng tinh thể và mức độ tương đồng cấu trúc giữa nhiều bản sao và cấu trúc tương đồng của phân tử. Tùy thuộc vào điều kiện kết tinh và hạn chế đóng gói địa phương, tương đồng bản sao của một protein, chuỗi, hoặc tên miền có thể mất conformations hơi khác nhau và gây ra các đơn vị không đối xứng có chứa nhiều cấu trúc tương tự, nhưng không chính xác giống hệt bản sao.
Các phân tử sinh học (còn được gọi là một đơn vị sinh học) là đại phân tử đã được chứng minh hoặc được cho là có chức năng. Ví dụ, các phân tử hemoglobin chức năng có bốn chuỗi protein (alpha-beta dimers). Tùy thuộc vào đơn vị không đối xứng thì không gian nhóm hoạt động đối xứng bao gồm một trong hai phép quay hoặc bản dịch phải được thực hiện theo thứ tự để có được những đơn vị sinh học hoàn chỉnh. Tuy nhiên, nếu đơn vị không đối xứng có chứa nhiều phân tử sinh học thì sau đó một bản có thể được lựa chọn.
Hình 6-7: đơn vị sinh học của Hemoglobin
6.2.3. Cộng hưởng từ hạt nhân (NMR)
Cộng hưởng từ hạt nhân (NMR) là một hiện tượng vật lý dựa trên nguyên liệu của hạt nhân nguyên tử. NMR nghiên cứu một hạt nhân từ, như của một nguyên tử hydro bằng cách sắp xếp nó với một từ trường bên ngoài và nhiễu loạn này liên kết bằng cách sử dụng một điện từ trường. Đáp ứng với các lĩnh vực (gây nhiễu), là những gì được khai thác trong quang phổ NMR và hình ảnh cộng hưởng từ. Hạt nhân được bao quanh bởi các electron quay xung quanh, mà cũng quay quanh các hạt tích điện [tức là nam châm] và do đó nó là một phần lá chắn hạt nhân. Số lượng che chắn phụ thuộc vào bộ phận xung quanh chính xác. Ví dụ, một hydro liên kết với oxy sẽ được bảo vệ khác với một hydro ngoại quan đến một nguyên tử carbon. Ngoài ra, hai hạt nhân hydrogen có thể tương tác thông qua một quá trình được gọi là khớp nối quay spin-nếu chúng đang ở trên cùng một phân tử, mà sẽ phân chia các dòng của quang phổ một cách nhận biết. Bằng cách nghiên cứu các đỉnh của NMR quang phổ, các nhà hoá học giỏi có thể xác định cấu trúc của nhiều hợp chất. Nó có thể là một kỹ thuật rất chọn lọc, phân biệt giữa các nguyên tử trong một phân tử hoặc bộ sưu tập của các phân tử cùng loại, nhưng chỉ khác nhau về môi trường hóa học của từng bộ phận.
6.2.3. Cộng hưởng từ hạt nhân (NMR)
Giải quyết cấu trúc của protein bằng cách sử dụng NMR là một công việc cần thiết. Các nhà nghiên cứu tiến hành một loạt các thí nghiệm, mỗi thí nghiệm cung cấp một phần manh mối về bản chất của các nguyên tử trong mẫu phân tử - chẳng hạn như khoảng cách giữa hai nguyên tử với nhau, cho dù những nguyên tử này được thể chất ngoại quan với nhau, hoặc trong trường hợp các nguyên tử nằm trong cùng một acid amin. Các thí nghiệm khác cho thấy các liên kết giữa các axit amin liền kề đã làm lộ ra các khu vực linh hoạt trong protein. Thách thức của NMR là sử dụng một số bộ thí nghiệm như vậy để trêu chọc tính chất độc đáo cho từng nguyên tử trong mẫu. Sử dụng chương trình máy tính, với máy quang phổ NMR có thể có được một ý tưởng sơ bộ về hình dạng tổng thể của protein và có thể xem các thỏa thuận có thể có của các nguyên tử trong các bộ phận khác nhau của nó. Mỗi thiết lập mới của các thí nghiệm tiếp tục lọc các cấu trúc này có thể xảy ra. Cuối cùng, các nhà khoa học một cách cẩn thận lựa chọn 20 đến 40 giải pháp tốt nhất đại diện cho các dữ liệu thí nghiệm của họ và hiện tại trung bình của các giải pháp này là cấu trúc cuối cùng của họ.
6.2.4. Cấu ​​trúc cơ sở dữ liệu protein
Cath (http://www.biochem.ucl.ac.uk/bsm/cath_new/index.html) là một phân loại thứ bậc của các cấu trúc protein trong ngân hàng dữ liệu protein Brookhaven. Cụm protein ở bốn cấp độ lớn, Class (C), Kiến trúc (A), Cấu trúc liên kết (T) và họ chất tương đồng (H) [Orengo, CA, Michie, AD, Jones, S., Jones, DT, Swindells, MB,Thornton, JM (1997) Cơ cấu. Vol 5. Không 8. p.1093-1108].
Lớp: được xác định theo thành phần cấu trúc thứ cấp và đóng gói bên trong cấu trúc. Nó có thể được gán tự động cho hơn 90% cấu trúc được biết đến bằng cách sử dụng các phương pháp của Michie et al. (1996). Đối với phần còn lại, kiểm tra thủ công được sử dụng và thông tin cần thiết từ tài liệu đưa vào tài khoản. Ba loại chính được công nhận: chủ yếu-alpha, beta và alpha-beta. Trong đó lớp cuối cùng (alpha-beta) bao gồm cả cấu trúc xen kẽ alpha / beta và alpha + beta cấu trúc, như ban đầu được xác định bởi Levitt và Chothia (1976). Một lớp thứ tư cũng được xác định, trong đó có lĩnh vực protein, với nội dung cấu trúc thứ cấp thấp.


Topology hoặc gấp: cấu trúc được chia thành các nhóm gia đình ở mức độ tùy thuộc vào hình dạng tổng thể và kết nối của các cấu trúc thứ cấp. Điều này được thực hiện bằng cách sử dụng SSAP cấu trúc thuật toán so sánh (Taylor & Orengo (1989)). Các thông số để phân nhóm các lĩnh vực vào cùng một gia đình đã được xác định bằng các thí nghiệm thực nghiệm trong suốt hàng dữ liệu (Orengo et al (1992), Orengo et al (1993)). Kiến trúc, trong đó có một số điểm SSAP 70 và ít nhất 60% protein lớn hơn phù hợp với protein nhỏ hơn, được giao nhiệm vụ giống nhau ở cùng một cấp độ cấu trúc liên kết hoặc gia đình. Một số gia đình rất đông dân cư (Orengo et al (1994)) đặc biệt trong phạm vi chủ yếu là beta-kiến trúc bánh sandwich 2-layer và alpha-beta 3-lớp kiến ​​trúc bánh sandwich. Để đánh giá cao mối quan hệ cấu trúc bên trong các gia đình dễ dàng hơn, họ đang chia nhỏ bằng cách sử dụng một cách cao hơn số điểm SSAP (75 cho một số gia đình chủ yếu là phiên bản beta và alpha-beta, 80 đối với một số gia đình chủ yếu là-alpha, cùng với một chồng lên nhau cao hơn yêu cầu (70%).
6.2.4. Cấu ​​trúc cơ sở dữ liệu protein
Họ chất tương đồng (H-) nhóm mức độ lĩnh vực protein được cho là để chia sẻ một tổ tiên chung và do đó có thể được mô tả như là tương đồng. Các giống nhau được xác định trước bằng cách so sánh trình tự và sau đó so sánh cấu trúc bằng cách sử dụng SSAP. Cấu trúc tập trung vào họ chất tương đồng giống nhau nếu đáp ứng một trong các tiêu chuẩn sau đây:
• Trình tự nhận dạng >= 35%, 60% tương đương với cấu trúc lớn nhỏ
SSAP số điểm> = 80,0 và bản sắc thứ tự> = 20, 60% cấu trúc lớn hơn tương đương với nhỏ hơn.
• SSAP số điểm> = 80,0, 60% cấu trúc lớn hơn tương đương với nhỏ hơn, và các lĩnh vực, trong đó có chức năng liên quan.
Cấu trúc bên trong mỗi cấp độ-H được tiếp tục nhóm dựa trên chuỗi nhận dạng. Lĩnh vực được nhóm vào cùng một gia đình thứ tự có những nhận dạng chuỗi> 35% (với ít nhất là 60% lĩnh vực tương đương nhỏ hơn), cho thấy cấu trúc rất giống.
6.2.4. Cấu ​​trúc cơ sở dữ liệu protein
Cơ sở dữ liệu SCOP (Phân loại cấu trúc của protein, http://scop.mrc -lmb.cam.ac.uk/scop/) nhằm mục đích cung cấp mô tả một cách chi tiết và toàn diện về mối quan hệ cấu trúc và tiến hóa giữa tất cả các protein có cấu trúc được biết đến, bao gồm tất cả các mục trong dữ liệu Protein Ngân hàng [AG Murzin, Brenner SE, Hubbard T., Chothia C. (1995) J. Mol. Biol. 247, 536-540]. Nó có sẵn như một tài liệu siêu văn bản liên kết chăt chẻ làm cho cơ sở dữ liệu lớn dễ hiểu và dễ tiếp cận.
Hiện có trình tự tự động và các công cụ so sánh cấu trúc có thể xác định tất cả các mối quan hệ cấu trúc và tiến hóa giữa các protein. Việc phân loại SCOP protein đã được xây dựng bằng tay, bằng cách kiểm tra hình ảnh và so sánh các cấu trúc, nhưng với sự hỗ trợ của các công cụ để thực hiện nhiệm vụ quản lý và giúp cung cấp tổng quát. Công việc này được thực hiện với nhiều thử thách và khó khăn về mặt lý thuyết bởi thực tế các đối tượng được tổ chức không đồng nhất: đôi khi nó làm cho ý nghĩa hơn để tổ chức các lĩnh vực cá nhân, và thời gian khác bằng toàn bộ miền protein.
6.2.4. Cấu ​​trúc cơ sở dữ liệu protein
Protein được phân loại để phản ánh cả hai quan hệ cấu trúc và tiến hóa. Nhiều cấp độ tồn tại trong hệ thống phân cấp, nhưng các cấp chính là gia đình, họ chất và gấp, mô tả dưới đây. Các vị trí chính xác ranh giới giữa các cấp ở một mức độ chủ quan. Phân loại tiến hóa của chúng tôi là bảo thủ: nơi mà bất cứ nghi ngờ về quan hệ tồn tại, bộ phận mới tại gia đình và mức độ siêu họ đã được thực hiện. Như vậy, một số nhà nghiên cứu có thể thích để tập trung vào mức độ cao hơn của cây phân loại, protein với cấu trúc tương tự như nhóm. Các mức khác nhau trong hệ thống phân cấp là:
- Gia đình (rõ ràng tiến hóa mối quan hệ): Protein nhóm cùng với gia đình rõ ràng là tiến hóa có liên quan. Nói chung, điều này có nghĩa là cặp dư lượng bản sắc khôn ngoan giữa các protein là 30% và cao hơn. Tuy nhiên, trong một số trường hợp tương tự như chức năng và cơ cấu cung cấp bằng chứng có nguồn gốc chung trong trường hợp không nhận dạng trình tự cao, ví dụ, globin nhiều tạo thành một gia đình mặc dù một số thành viên có những nhận dạng trình tự chỉ có 15%.
6.2.4. Cấu ​​trúc cơ sở dữ liệu protein
Siêu họ (có thể xảy ra nguồn gốc tiến hóa chung): Protein có những bản sắc chuỗi thấp, nhưng có tính năng cấu trúc và chức năng cho rằng một nguồn gốc tiến hóa thông thường là có thể xảy ra được đặt cùng trong superfamilies. Ví dụ, actin, miền ATPase của các protein sốc nhiệt, và hexakinase với nhau tạo thành một hợp chất. Fold (tương tự như cấu trúc chính): Protein được xác định là có một lần phổ biến nếu họ có cùng một cấu trúc thứ cấp lớn trong việc bố trí giống nhau và với các kết nối cùng một topo. Các protein khác nhau với cùng một lần thường có những yếu tố ngoại vi của cấu trúc thứ cấp và biến khu vực khác nhau về kích thước và cấu tạo.Trong một số trường hợp, những khu vực ngoại vi khác nhau có thể bao gồm một nửa cấu trúc. Protein được đặt cùng nhau trong cùng một thể loại lần có thể không có một nguồn gốc tiến hóa phổ biến: những điểm tương đồng về cấu trúc có thể phát sinh từ vật lý và hóa học của protein ưu sắp xếp một số bao bì và chuỗi cấu trúc liên kết.
6.2.4. Cấu ​​trúc cơ sở dữ liệu protein
6.3. Cấu trúc thứ cấp của protein
Chương trình DSSP [Kabsch, W. và Sander, C. Biopolymers 22, 2577-2637 (1983)] định nghĩa cấu trúc thứ cấp, các tính năng hình học và tiếp xúc với dung môi của các protein, được tọa độ nguyên tử ở định dạng ngân hàng dữ liệu protein.Chương trình không dự đoán cấu trúc protein. Cấu trúc thứ cấp được phân công dựa trên mô hình liên kết hydro và ký hiệu trong các tập tin đầu ra với một từ viết tắt một bức thư:
• G = 3- lượt xoắn (3_10 xoắn). Min chiều dài 3 dư lượng.
• H = 4-biến xoắn (xoắn alpha). Min chiều dài 4 dư lượng.
• I = 5-turn xoắn (xoắn pi). Min chiều dài 5 dư lượng.
• T = hydro ngoại quan lần lượt (3, 4 hoặc bật 5).
• E = song song và / hoặc tấm beta chống song song. Min chiều dài 2 dư lượng.
• B = dư lượng beta-cầu bị cô lập (beta cặp duy nhất tờ trái phiếu hình thành hydrogen).
• S = uốn cong .


XIN CHÂN THÀNH CẢM ƠN!
* Một số tài liệu cũ có thể bị lỗi font khi hiển thị do dùng bộ mã không phải Unikey ...

Người chia sẻ: Võ Phương Thảo
Dung lượng: | Lượt tài: 1
Loại file:
Nguồn : Chưa rõ
(Tài liệu chưa được thẩm định)