TIN SINH HỌC P5

Chia sẻ bởi Võ Phương Thảo | Ngày 23/10/2018 | 61

Chia sẻ tài liệu: TIN SINH HỌC P5 thuộc Bài giảng khác

Nội dung tài liệu:

Bài báo cáo môn: TIN SINH HỌC
Người hướng dẫn: TS Võ Văn Toàn
Người thực hiện: Võ Thị Hoanh
Lớp Cao học Sinh học TN K13
NỘI DUNG:
Tìm kiếm thông tin sinh học trên internet.
Tìm kiếm trình tự sinh học
2.1 . Tìm kiếm trình tự ADN
2.2 . Tìm kiếm trình tự protein
3. Tìm kiếm trình tự tương đồng
4. Phân tích trình tự AND, tìm khung đọc mở ORF.
5. So sánh tương đồng và tạo cây phát sinh từ trình tự AND.
6. Tìm vị trí trình tự AND nhờ phần mềm ADNclub.
I. TÌM KIẾM THÔNG TIN SINH HỌC TRÊN INTERNET
Nếu chúng ta quan tâm đến những thông tin khoa học sinh học
đáng tin cậy, thường là những bài báo khoa học, thì việc tìm kiếm sẽ có hiệu quả cao nhất khi ta tìm kiếm thông tin trong những tạp chí khoa học chuyên ngành trên mạng Internet (ví dụ tạp chí Applied Environmental Microbiology), hoặc những cơ sở dữ liệu thông tin về Sinh học (NCBI, Medscape, BioMedNet.).
Trong bài này chúng ta sẽ tìm kiếm thông tin bằng cách sử dụng cơ sở dữ liệu trong trang chủ NCBI (National Center for Biotechnology Information -NCBI, USA) tại địa chỉ Internet là http://www.ncbi.nlm.nih.gov/. Khi truy cập vào địa chỉ này, chúng ta sẽ nhìn thấy một trang chủ dạng như sau:
Chúng ta thực hiện tìm kiếm thông tin sinh học trong trang Entrez. Trang Entrez là một trang web của NCBI.
. Nhấn dòng chữ Entrez để vào trang Entrez.
Trong Entrez, bạn có thể tìm kiếm nhiều dạng cơ sở dữ liệu khác nhau. Mỗi cơ sở dữ liệu là một liên kết được biểu thị bằng dòng văn bản được đổi màu khi ta di chuyển đến. Ví dụ: PubMed, Protein...
Ca�c do�ng vaín bạn �oơi ma�u ����c gói la� ca�c lieđn keât sieđu vaín bạn (hay lieđn keât) va� th���ng m�� ra moôt trang m��i khi ta nhaân va�o. Trong Entrez chu�ng ta co� theơ nhaôp va�o nh��ng yeđu caău t�m kieâm c� s�� d�� lieôu veă ca�c ba�i ba�o thuoôc l�nh v��c Y - Sinh hóc (PubMed), tr�nh t�� nucleic acid (Nucleotide), tr�nh t�� protein (Protein), caâu tru�c 3 chieău (Structure), boô gen (Genome). �� �ađy, chu�ng ta s�� dúng trang PubMed �eơ t�m kieâm ca�c ba�i ba�o veă thođng tin lieđn quan �eân cađy lu�a.
II. TÌM KIẾM TRÌNH TỰ SINH HỌC
1. MỤC ĐÍCH VÀ NGUYÊN TẮC
Trong nghiên cứu sinh học phân tử, chúng ta thường xuyên phải làm việc trên các đối tượng là nucleic acid (DNA) và protein. Đây là các dạng trình tự sinh học được lưu trữ phổ biến trong các cơ sở dữ liệu sinh học. Hiện nay, các thông tin này được lưu trữ chủ yếu trong các cơ sở dữ liệu lớn trên thế giới như hệ thống GenBank (NCBI, USA), EMBL (European Molecular Biology Laboratory, UK), DDBJ (DNA Database of Japan, JP) và một số hệ thống cơ sở dữ liệu khác trên thế giới. Thông tin trong các cơ sở dữ liệu này rất lớn và luôn được cập nhật thường xuyên (sau mỗi 24 giờ). Để tìm những trình tự sinh học này, chúng ta sử dụng công cụ tìm kiếm Entrez Nucleotide (tìm trình tự DNA) hoặc Entrez Protein (tìm trình tự protein).
2. CÔNG CỤ VÀ CÁCH SỬ DỤNG
2.1. Tìm trình tự ADN
Để tìm những trình tự DNA ta sử dụng Entrez Nucleotide để tìm kiếm trong hệ thống cơ sở dữ liệu về trình tự DNA. Các cơ sở dữ liệu này bao gồm hệ thống GenBank (NCBI, USA) và liên kết với cơ sở dữ liệu của EMBL, DDBJ và một số hệ thống dữ liệu khác trên thế giới.
. Từ trang PubMed, nhấn vào dòng Nucleotide để đưa ta đến trang Entrez
Nucleotide.
. Nhập vào yêu cầu (thường là tên gen như: Bph-10 gene. Đây là gen kháng rầy nâu ở lúa.) và nhấn nút Go (hoặc nhấn Enter?).
. Kết quả sẽ xuất hiện một danh sách trình tự DNA tương tự như sau:
Đây là 3 dạng gen kháng 3 biotype rầy nâu có ở Việt Nam, đây là kết quả nghiên cứu của Tiến sĩ di truyền học Nguyễn Thị Lang (Việt Nam)
. Nhấn vào các mục bài để xem chi tiết trình tự DNA. Ví dụ nhấp vào 1, sẽ hiện bảng sau:
Hoặc nhấp vào Fasta ta có được trình tự nucleotit của gen Bph-1
2.2. Tìm trình tự Protein
Để tìm trình tự protein, cũng tương tự việc tìm kiếm trình tự DNA. Việc tìm kiếm trình tự protein cũng được thực hiện trong hệ thống Genbank, EMBL và DDBJ.
. Nhấn vào dòng Protein trong trang Entrez để mở trang Entrez Protein.
. Nhập vào yêu cầu (thường là tên protein như: "SSB", "ST",.) và nhấn nút Go (hoặc nhấn Enter?).
. Sau vài phút, kết quả sẽ xuất hiện một danh sách trình tự protein tương tự như trường hợp DNA.
. Nhấn vào mã số truy cập của các mục bài để xem chi tiết trình tự protein.
3. Thực hành
Ví dụ: Tìm thông tin và tìm trình tự nucleotit và protein của gen mới phát hiện ở lúa.
Xác định được gen quy định chiều cao, sản lượng và thời gian cây lúa trổ bông.
 BTO- Các nhà khoa học Trung Quốc đã xác định được một gen đơn lẻ có tên là GHD7, có vai trò kiểm soát sản lượng, cũng như chiều cao và thời gian trổ bông của cây lúa. Đây sẽ là một tiến bộ vượt bậc, giúp ích rất nhiều cho nỗ lực toàn cầu trong việc tăng năng suất cây trồng.
Những nghiên cứu trước đây đã từng định dạng được một vùng trên nhiễm sắc thể số 7, được cho là nơi quyết định 3 đặc điểm trên của cây lúa, nhưng không  thể tập trung vào  một gen cụ thể nào.
Tiến sĩ Zhang Qifa và đồng nghiệp ở Trường Đại học Huazhong, tỉnh Vũ Hán đã thực hiện cuộc nghiên cứu này ở 19 đồng lúa khác nhau trên khắp châu Á và thấy rằng, những cây lúa thấp hơn, ít hạt hơn và trổ sớm hơn có dấu hiệu thiếu gen GHD7. Sau khi được bổ sung loại gen này  đã xuất hiện sự thay đổi theo chiều hướng tăng rõ rệt: tăng năng suất, tăng thời gian trổ bông và tăng 67% chiều cao.

Ông Zhang phân tích: “Nghiên cứu của chúng tôi cho thấy một gen đơn lẻ có thể quy định những đặc tính chủ chốt của cây lúa với những ảnh hưởng rất lớn. Trước đây, chúng ta chỉ nghĩ rằng cần phải thay đổi nhiều gen thì mới thay đổi được sản lượng cây lúa. Nhưng ngày nay, chúng ta chỉ cần điều khiển  chỉ 1 gen đơn lẻ là có thể tăng năng suất”.
Ở nghiên cứu này, các nhà khoa học đã phát hiện có 5 phiên bản khác nhau của gen GHD7. Phiên bản hoạt động tích cực nhất đã có mặt ở những vùng khí hậu ấm áp, cho phép cây lúa khai thác triệt để nguồn ánh sáng và nhiệt độ bằng cách kéo dài thời gian trổ hoa. Còn kiểu ít tích cực hơn hay phiên bản thụ động của gen GHD7 thì xuất hiện ở các khu vực lạnh hơn, làm cho cây lúa khả năng phát triển được ở những nơi có mùa gieo trồng ngắn hơn.
P.Lan (Theo Reuters)
Ta vào trang web của NCBI để tìm thông tin liên quan, để giới hạn thông tin trong bài này chỉ tìm bài viết liên quan đến gen GHD7 của tác giả Zhang Qifa
Tìm trình tự protein :
. Trở về trang Entrez hoặc từ trang Entrez Nucleotide, nhấn vào dòng
Protein để mở trang Entrez Protein.
Trang Entrez protein sẽ xuất hiện có dạng:
Chúng ta thực tập tìm kiếm trình tự protein là GHD7 của tác giả Zhang.Q
toxin).
. Nhập dòng "(GHD7) Zhang .Q" vào khung yêu cầu, nhấn Go, và chờ kết quả.
Thực hiện tìm hiểu chi tiết các mục bài vừa tìm kiếm được bằng cách nhấn lên các mã số mục bài (tương tự cách dùng với trình tự DNA). Ví dụ Ghd7 ở
vị trí số 1
Nhấp chuột vào FASTA ta có trình tự axit amin của protein Ghd7 như sau:
Tìm kiếm trình tự nucleotit tương tự như trên :
Nếu tìm kết quả nghiên cứu của tập đoàn lúa ở Nhật Bản thì kết quả là:
Nếu tìm kết quả nghiên cứu có tác giả Zhang.Q thì kết quả là:
Có 4 kết quả nghiên cứu liên quan đến tác giả Zhang.Q, ta vào kết quả nghiên cứu 1 thì trình tự nu là:
Ta vào FASTA để tìm trình tự nucleotit
Muốn lưu trình tự nu này ta vào send -file- create File, chọn đuôi FASTA để lưu và sử dụng so sánh trình tự nu. Ta chọn 4 kết quả để lưu file so sánh trình tự nu ở mục sau.
III. TÌM KIẾM CÁC TRÌNH TỰ TƯƠNG ĐỒNG
1. Mục đích, nguyên tắc
Một chương trình tìm kiếm và so sánh trình tự tương đồng được nhiều người dùng nhất hiện nay có tên là BLAST (Basic Local Alignment Search Tool). Chương trình này thực hiện so sánh trình tự DNA và protein nhập vào với những trình tự trong các cơ sở dữ liệu (GenBank, EMBL.) và lựa chọn các trình tự có mức độ tương đồng từ cao đến thấp. Chúng ta dùng BLAST� khi có câu hỏi đặt ra "Liệu có trình tự nào trong ngân hàng dữ liệu giống hoặc gần giống với trình tự của bạn không?".
Chương trình BLAST giúp chúng ta nhanh chóng tìm ra những trình tự sinh học tương đồng (nếu có) với trình tự bạn yêu cầu. Ngoài ra, BLAST còn cung cấp cho bạn những số liệu về tỉ tệ tương đồng, nguồn gốc các trình tự tương đồng..
2. Công cụ và cách sử dụng
Để truy cập vào trang BLAST, chúng ta nhấn vào dòng BLAST trong trang chủ của NCBI. Chúng ta có thể thực hiện tìm kiếm trình tự tương đồng DNA (Nucleotide -Nucleotide BLAST) hoặc protein (Protein - Protein BLAST).
2.1. Nucleotide - Nucleotide BLAST
Mở chương trình BLAST bằng cách nhấn vào dòng BLAST trong các trang của NCBI.
Mở chương trình Nucleotide BLAST bằng cách nhấn lên dòng blastn. Trang kết quả Nucleotide BLAST sẽ xuất hiện dưới dạng HTML (chúng ta có thể thay đổi dạng hiển thị tại menu Format).
Nhập trình tự DNA cần tìm kiếm vào khung nhập trình tự (Search). Lựa chọn chức năng blastn và nr (non-redundant), đặt chiều dài giới hạn vùng cần tìm (From:............To: ............ ).
Nhấn lên nút BLAST! để bắt đầu chương trình.
Kết quả sẽ hiện lên trang formatting BLAST.
Nhấn vào nút Format! để mở trang kết quả tìm kiếm và chờ đợi kết quả.
2.2. Protein - Protein BLAST
Sử dụng tương tự chức năng Nucleotide BLAST.
. Mở trang Protein BLAST bằng cách nhấn vào dòng blastp trong trang BLAST.
Trang protein BLAST sẽ có dạng tương tự nu-nu BLAST
Chọn chiều dài giới hạn vùng cần tìm (From: ooooo To: ooooo ), cơ sở dữ liệu là nr (non-redundant).
. Nhấn vào nút Format! và đợi đến khi xuất hiện kết quả.
3. Thực hành
3.1. Nucleotide - Nucleotide BLAST
Tìm một đoạn trình tự DNA GHD7 mà ta đã lưu
. Mở chương trình BLAST bằng cách nhấn vào dòng BLAST trong các trang
của NCBI. Mở chương trình Nucleotide BLAST bằng cách nhấn lên dòng
blastn.
. Chép trình DNA tự trong tập tin vào khung nhập trình tự
(Search). Lựa chọn chức năng blastn và nr, đặt chiều dài giới hạn từ 1 đến
200 trong mục From và To, chọn others (so với các loài khác)
. Nhấn nút BLAST! để bắt đầu chương trình.
Kết quả sẽ hiện lên trang formatting BLAST.
. Nhấn vào nút Format! để mở trang kết quả tìm kiếm và chờ đợi (có thể kéo dài vài phút hoặc lâu hơn).
Kích vào ô View report ta được bảng sau:
Kết quả sẽ hiện lên một trang web mới chứa nội dung tìm được. Thông thường kết quả không hiện lên tức thì mà yêu cầu chúng ta chờ đợi trong một khoảng thời gian. Kết quả gồm phần đồ thị, danh sách mục bài có trình tự tương đồng với trình tự DNA nhập vào với mức độ ngày càng giảm dần. Ngoài ra còn có danh sách các trình tự sắp xếp theo trị số Score.
Ví dụ với trình tự nu của gen GDH7, hiện kết quả ở bảng sau trong đó gi|168188198|gb|EU286801.1| Oryza sativa Indica... - là mã số truy cập vào các trình tự tương đồng trong GenBank.
3.2. Protein - Protein BLAST
Mở thư mục GHD7-protein chứa trình tự protein GHD7đã lưu.
. Mở trang Protein BLAST bằng cách nhấn vào dòng blastp trong trang BLAST.
. Trong hộp nhập thông tin (Search), chép trình toàn bộ trình tự amino acid
trong tập tin GHD7 -protein. Chọn trình tự BLAST (ví dụ từ 1 đến 60),
chọn cơ sở dữ liệu là nr.
. Nhấn vào nút BLAST!, một cửa sổ mới sẽ xuất hiện.
. Nhấn vào nút Format! để mở trang kết quả tìm kiếm và đợi đến khi xuất
hiện kết quả.
Kết quả xuất hiện tương tự dạng Nucleotide BLAST.
IV. PHÂN TÍCH TRÌNH TỰ DNA- TÌM KHUNG ĐỌC MỞ ORF
1. Mục đích, nguyên tắc
Các trình tự DNA mã hóa thông tin di truyền dưới dạng các bộ ba nucleotide.
Khi có một trình tự DNA, chúng ta cần phải tìm trình tự protein nếu muốn xác định sản phẩm sau dịch mã của trình tự này. Tuy nhiên, các trình tự DNA, sau khi được phiên mã, chỉ được dịch mã thành protein khi chúng là một khung đọc mở (Open Reading Frame - ORF). Các khung đọc mở phải là những trình tự DNA có codon bắt đầu và codon kết thúc dịch mã (Stop Codon) như TAA, TGA, TAG.
2. Công cụ và cách thực hiện
Để tìm các khung đọc mở có thể có trong một trình tự DNA, chúng ta sử dụng một chương trình có tên là ORF finder của NCBI. Chương trình này sẽ tìm kiếm những khung đọc mở có thể có của trình tự nhập vào và trình tự bổ sung của nó. Sau đó đưa ra bản đồ khung đọc mở với các trình tự đã dịch mã thành trình tự amino acid.
. Mở trang ORF finder từ trang chủ NCBI bằng cách nhấn vào dòng ORF finder.
Nhập trình tự DNA vào hộp trình tự (sequence in FASTA format) hoặc mã số trình tự vào hộp GI or ACESSSION (nếu muốn dùng toàn bộ trình tự trong cơ sở dữ liệu).
Lựa vị trí dịch mã (From: ....To:..... ) và kiểu mã di truyền.
Nhấn nút OrfFind để thực hiện chương trình.
Đợi kết quả xuất hiện sau vài phút (hoặc có thể lâu hơn). Kết quả có sáu khung dịch mã xuất hiện. Các khung đọc mở (nếu có) sẽ là những thanh có màu sậm hơn. Lựa chọn giới hạn cách thể hiện bằng trị số trong mục Redraw (50, 100, 300).
Nhấn lên trình tự khung đọc mở sẽ thấy hiện lên trình tự DNA và trình tự dịch mã amino acid tương tự kết quả bên dưới.
3. Thực hành
Chúng ta thực hành xác định khung đọc mở của trình tự gen GHD7. Mở tập tin GDH7b -nu đã lưu.
. Mở trang ORF finder từ trang chủ NCBI.
. Chép trình tự DNA trong tập tin GDH7 -nu (dạng tập tin văn bản text) vào hộp trình tự (sequence in FASTA format).
. Lựa chọn dịch mã từ 1 đến 1000 và mã di truyền là Genetic code.
. Nhấn nút OrfFind để thực hiện chương trình.
Kết quả có sáu bản dịch xuất hiện và mỗi bản là một khung đọc mở. GHD7 là một protein có mạch polypeptide là 253 amino acid nên cần có một khung đọc mở với 762 base.
Muốn xem cụ thể khung đọc mở nào ta kích vào ô xanh đó (ví dụ khung +1), Nhấn lên trình tự khung đọc mở sẽ thấy hiện lên trình tự DNA và trình tự dịch mã amino acid.
V. SO SÁNH TƯƠNG ĐỒNG VÀ TẠO CÂY PHÁT SINH LOÀI TỪ TRÌNH TỰ DNA
1. Mục đích, nguyên tắc
Cây phát sinh loài là công cụ thể hiện mức độ tương đồng giữa các trình tự qua quá trình tiến hóa. Chúng ta có thể tạo cây phát sinh loài từ kết quả so sánh các trình tự tương đồng thông qua hai phần mềm ClustalX (1.81) và TreeView (có thể download từ Internet).
2. Công cụ và cách sử dụng
ClustalX là một phần mềm (giao diện Windows) dùng để so sánh tương đồng
nhiều trình tự DNA. Nó mô tả kết quả bằng hệ thống các màu sắc và làm nổi bật những nét đặc trưng trong những đoạn tương đồng.
TreeView là một phần mềm dùng để vẽ cây phát sinh loài. Phần mềm này
thực hiện đọc kết quả so sánh từ những tập tin dạng NEXUS (NEXUS tree) của các chương trình PAUP và COMPONENT NEXUS hoặc những tập tin dạng PHYLIP (PHYLIP tree) của các chương trình fastDNAml, ClustalX và ClustalW.

Mở chương trình ClustalX trên desktop.
Lựa chọn chức năng Multiple Alignment Mode.
Từ menu File, chọn Append Sequences. Trong hộp Open, chọn tập tin chứa các trình tự cần so sánh. Nhấn nút Open.
Chọn Do Complete Alignment trong menu Alignment. Xác định vị trí cho tập tin xuất rồi nhấn nút Align.
Kết quả xuất hiện các trình tự so sánh tương đồng. Các vị trí trình tự giống nhau sẽ được thể hiện cùng một màu sắc (mỗi loại nucleotide một màu) và được đánh dấu * là vị trí giống nhau
Ta có thể nhận xét mức độ tương đồng của các trình tự thông qua sự tương đồng về màu sắc và dạng đồ thị bên dưới.
Để tạo cây phát sinh loài dạng PHYLIP chúng ta lần lượt thực hiện các bước:
Trong menu Trees, chọn chức năng Draw N-J Trees.
Trong hộp DRAW TREE ta chọn nút OK để lưu tập tin dạng *.ph.
Mở chương trình TreeView trên desktop. Từ menu File, chọn Open.
Trong hộp Open, chọn tập tin *.ph và Files of type là All tree files.
Một trang kết quả cây phát sinh loài sẽ xuất hiện.
Chúng ta có thể thay đổi kiểu trình bày cây phát sinh loài bằng cách nhấn vào các nút Phylogram, Rectanglar Cladogram, Cladogram, Radial tree.
3. Thực hành
. Mở chương trình ClustalX trên desktop.
. Lựa chọn chức năng Multiple Alignment Mode.
. Chọn trình tự trong tập tin đa �lưu ở trên.
. Nhấn nút Open. Chọn do complete alignment.
Ta nhận xét mức độ tương đồng của các trình tự sự tương đồng về màu sắc (mỗi loại nucleotide một màu) và dạng đồ thị bên dưới.
Tạo cây phát sinh bằng cách:
. Trong menu Trees, chọn chức năng Draw N-J Trees.
. Trong hộp DRAW TREE ta chọn nút OK để lưu tập tin dạng *.ph.( ví dụ: hoanh1*ph)
. Mở chương trình TreeView trên desktop. Từ menu File, chọn Open.
. Trong hộp Open, chọn tập tin hoanh1 .ph trong thư mục đã lưu và Files of type là All tree files.
Một trang kết quả cây phát sinh loài sẽ xuất hiện
VI. TÌM VỊ TRÍ TRÌNH TỰ DNA BẰNG PHẦN MỀM ADNclub.
DNAclub cung cấp cho chúng ta một công cụ tìm kiếm hữu hiệu. Nhờ đó, ta
có thể tìm một trình tự DNA trong toàn bộ bộ gen một cách nhanh chóng và chính xác. Ví dụ ta nhập trình tự nu gen GHD 7 bằ�ng cách vào File- import - chọn sequence.fasta 11 đã lưu ta được:
Ta đi tìm vị trí của đoạn có trình tự nu : AGTTGTTGTTTGTAGCTCGATCGAGTTTGATTTATCCGTTCATGTCGATGGGACCAGCAGC ta làm như sau:
- Gọi DNAclub, nhập dữ liệu phân tích. Kích hoạt menu Edit, chọn Find.
- Nhập trình tự cần tìm vào khung đợi lệnh và chọn Find. Vị trí và chiều dài của trình tự cần tìm sẽ dược trình bày trên màn hình cùng với dấu hiệu chọn chuỗi
trình tự ấy dưới dạng bôi đen
* Một số tài liệu cũ có thể bị lỗi font khi hiển thị do dùng bộ mã không phải Unikey ...

Người chia sẻ: Võ Phương Thảo
Dung lượng: | Lượt tài: 1
Loại file:
Nguồn : Chưa rõ
(Tài liệu chưa được thẩm định)