TIN SINH HỌC P33

Chia sẻ bởi Võ Phương Thảo | Ngày 23/10/2018 | 95

Chia sẻ tài liệu: TIN SINH HỌC P33 thuộc Bài giảng khác

Nội dung tài liệu:

Giảng viên hướng dẫn: TS. Võ Văn Toàn
Học viên thực hiện: Phùng Tấn Thi
Lớp: Sinh học thực nghiệm khóa 12

Qui Nhơn, tháng 3 năm 2011
TIN SINH HỌC

PHƯƠNG PHÁP XÁC ĐỊNH
TRÌNH TỰ ADN VÀ ỨNG DỤNG

What is bioinformatics?
Tin sinh h?c l� gỡ?
?? Bio: Sinh h?c phan t? (Molecular Biology)
?? Informatics: Khoa h?c tớnh toỏn
?? Bioinformatics: Gi?i quy?t cỏc b�i toỏn
sinh h?c b?ng vi?c s? d?ng cỏc phuong
phỏp c?a khoa h?c tớnh toỏn.

Synonyms: Computational biology,Computational molecular biology, Biocomputing
NỘI DUNG

NGUYấN Lí C?A C�C PHUONG PH�P PH�N T�CH TRèNH T? GEN
PHUONG PH�P SANGER
PHUONG PH�P MAXAM-GILBERT
PHUONG PH�P PH�N T�CH TRèNH T? GEN T? D?NG
HểA H?C/ PH?N ?NG CHU?I (D�Y CHUY?N) POLYMERASE
THI?T B?
C�C PH?N M?M/ C�C CSDL GEN QU?C T?

C�C ?NG D?NG

DNA/RNA
CẤU TRÚC PHÂN TỬ CỦA ĐƯỜNG RIBOSE VÀ DEOXYRIBOSE
Trạng thái tự nhiên
Trạng thái biến tính sợi đơn
Trạng thái lại tính
ĐỊNH NGHĨA GIẢI TRÌNH TỰ GEN
Là phương pháp thực nghiệm để xác định trình tự nucleotide của một đoạn ADN
Xác định chính xác trật tự sắp xếp của các cặp trong một đoạn ADN www.accessexcellence.org/AE/AEPC/NIH/gene27.html
Phân tích trình tự của các đơn vị mang thông tin di truyền. www.mwgbiotech.com/html/glossary/glossary_overview.shtml
LỊCH SỬ PHÂN TÍCH TRÌNH TỰ GEN
1870 Mischer: PH�T MINH DNA
1940 Avery: DNA L� "CH?T LI?U DI TRUY?N"
1953 Watson & Crick: C?U TR�C XO?N KẫP C?A DNA
1965 Holley: TRèNH T? C?A t RNA N?M MEN
1977 Wu: TRèNH T? C?A D?U D�NH DNA TR?C KHU?N ?
1977 Sanger: PHUONG PH�P D?NG CHU?I B?NG DIDEOXY
Maxam & Gilbert: PHUONG PH�P PH�N Gi?I HểA H?C

1980 Messing: CH?N L?C DềNG TR?C KHU?N M13
1986 Hood et al: T? D?NG HểA M?T PH?N
1990 PH�N T�CH TRèNH T? B?NG CHU TRèNH NHI?T (PCR); C�C ENZYME DU?C HO�N THI?N D? D?C TRèNH T?; C�C H? TH?NG Dề HU?NH QUANG DU?C HO�N THI?N (D?C QUA ?NG MAO D?N)
2002 T? D?NG HểA PHềNG TH� NGHI?M
1
15

150
1.500

25.000

50.000

200.000
HI?U SU?T
BP/NGU?I/NAM
53.000.000
PHÂN BỐ SỐ LƯỢNG GENOM ĐÃ ĐƯỢC GIẢI TRÌNH TỰ HOÀN TOÀN Ở CÁC SINH VẬT

Archea (16)
Eukarya (20)
Bacteria (139)
Viruses (1500)
NGUYÊN LÝ CỦA CÁC PHƯƠNG PHÁP PHÂN TÍCH TRÌNH TỰ GEN
PHƯƠNG PHÁP SANGER
Frederick (Fred) Sanger
PHƯƠNG PHÁP MAXAM-GILBERT
Walter Gilbert
PHẢN ỨNG CHUỖI/DÂY CHUYỀN
(CỦA/BẰNG/NHỜ/DO) POLYMERASE
Polymerase Chain Reaction (PCR)
Kary Mullis
GIẢI NOBEL VỀ HÓA HỌC, 1993
POLYMERASE CHAIN REACTION - PCR
A `licence` to do molecular biology
A key central technique that has revolutionised molecular and consequently cell biology
Schematic illustration of PCR steps
Sơ đồ minh họa các buớc PCR

From: Recombinant DNA by Watson, Gilman, Witkowski & Zoller
Target Amplification
M?C TIấU KHU?CH D?I
No. of No. Amplicon Cycles Copies of Target
1 2
2 4
3 8
4 16
5 32
6 64
20 1,048,576
30 1,073,741,824
1 cycle = 2 Amplicon
2 cycle = 4 Amplicon
3 cycle = 8 Amplicon
4 cycle = 16 Amplicon
5 cycle = 32 Amplicon
6 cycle = 64 Amplicon
7 cycle = 128 Amplicon
CÁC PHƯƠNG PHÁP XÁC ĐỊNH TRÌNH TỰ GENE
Phương pháp Maxam-Gilbert (hoá học)
Phương pháp được phát minh đầu tiên nhưng đến nay ít được sử dụng, chỉ dùng cho “footprinting”

Phương pháp Sanger (enzyme)
Sử dụng DNA polymerase, primer, dNTP và một lượng nhỏ ddNTP (để kết thúc chuỗi)
5’-
Xử lý bằng hoá chất cắt đặc hiệu tại một base nào đó
4 ống
G-rxn
A>G
-rxn
T>C
-rxn
C-rxn
5’-
5’-
5’-
C
Khi phản ứng kết thúc mỗi sợi chỉ được cắt 1 lần
ddNTP Reaction Mix
PHƯƠNG PHÁP MAXAM-GILBERT
Sợi đánh dấu (P32)
C
C
Trình tự được đọc trực tiếp
autoradiograph of dried sequencing gel
C T A G

3’
G
C
A
T
T
C
C
A
T
A
G
G
5’
D?a v�o s? th?y phõn d?c trung phõn t? DNA c?n xỏc d?nh trỡnh t? b?ng phuong phỏp húa h?c.

- Tru?c h?t DNA du?c dỏnh d?u b?ng P32 ? m?t d?u.
- Sau dú, chỳng du?c chia th�nh nam phõn do?n, m?i phõn do?n du?c x? lớ v?i m?t ch?t húa h?c chuyờn bi?t (cú kh? nang bi?n d?i d?c hi?u 1 lo?i nucleotide) ? phõn c?t DNA ngay t?i v? trớ cú nucleotide b? bi?n d?i.

K?t qu?: t?o ra 5 t?p h?p, m?i t?p h?p l� cỏc oligonuclotide cú kớch thu?c khỏc nhau nhung d?u k?t thỳc t?i cựng m?t lo?i nucleotide.
Ti?n h�nh di?n di trờn gel polyacrilamide, v? trớ cỏc oligonucleotide tuong ?ng v?i kớch thu?c c?a chỳng.
Cỏc húa ch?t s? d?ng trong x? lớ cỏc base chuyờn bi?t
5’-
DNA Polymerase
+dNTPs
+ one of:
primer
4 tubes
ddCTP
ddTTP
ddATP
ddGTP
5’-
5’-
5’-
C
C
C
In the ddGTP reaction there is a random chance a ddGTP will be incorporated across from a C
C T A G
ddNTP Reaction Mix

5’
C
G
T
A
A
G
G
T
A
T
C
C
3’
PHƯƠNG PHÁP SANGER
End labeled
Sequence is complementary
to the strand (sự đứng) being sequenced!
autoradiograph of dried sequencing gel
D?a v�o s? t?ng h?p nh? enzyme DNA polymerase m?ch b? sung cho trỡnh t? DNA m?ch don c?n xac d?nh trỡnh t?.
S? d?ng 4 lo?i nucleotide thụng thu?ng + 4 dideoxynucleotide.
Dideoxynucleotide l� deoxynucleotide, nhúm 3` OH du?c thay th? b?ng H2
Khi cỏc Dideoxynucleotide b?t c?p b? sung v?i nucleotide tuong ?ng trờn m?ch g?c thỡ ph?n ?ng t?ng h?p ng?ng l?i do khụng t?o du?c liờn k?t phosphodister.
DNA Sequencing sau khi tạo dòng phân tử
Plasmid (or phage) with cloned DNA fragment
Dideoxy-Nucleotides
O
(P)-(P)-(P)-
H
Base
dNTP
ddNTP
If a ddNTP is added to a growing DNA chain, the sequence is terminated, because another base can not be added
OH
Dideoxynucleotides
DNA Sequencing using the Sanger method involves the use of 2`3`-dideoxynucleotide triphosphates in addition to regular 2`-deoxynucleotide triphosphates
Because 2`3`-dideoxynucleotide triphosphates lack a 3` hydroxyl group, and DNA polymerization occurs only in the 3` direction, once 2`3`-dideoxynucleotide triphosphates are incorporated (lk ch?t), primer extension stops
2’-dideoxynucleotide
monophosphate
2`3`
dideoxy-nucleotides
Terminate
DNA
Replicaton
(gi?i h?n sao b?n AND)
PHƯƠNG PHÁP PHÂN TÍCH TRÌNH TỰ GEN TỰ ĐỘNG
HÓA HỌC: PHẢN ỨNG CHUỖI (DÂY CHUYỀN) POLYMERASE
CÁC THIẾT BỊ
CÁC PHẦN MỀM/CÁC CSDL GEN QUỐC TẾ
The dideoxy method has been modified (bổ sung) so it can be done in one tube. In this case all of the ddNTP’s are labeled with different, coloured fluorescent molecules
This makes automation much simpler, reduces the cost of the reactions, and speeds up the process tremendously (rất lớn). Large sequencing centres use this method and can read millions of bp every single day
Trong ki thu?t n�y, khụng dựng cỏc d?ng v? phúng x?, thay v�o dú l� cỏc húa ch?t cú kh? nang phỏt hu?nh quang (fluochrome).
M?i lo?i Dideoxynucleotide du?c dỏnh d?u b?ng fluochrome cú m�u khỏc nhau.
T?t c? cỏc oligonucleotide cựng ch?m d?t t?i m?t lo?i Dideoxynucleotide s? cú cựng m?t m�u.
Di?n di ? k?t qu? du?c d?c nh? h? th?ng vi tớnh

K?t h?p phuong phỏp PCR v� s? d?ng cỏc Dideoxynucleotide
Ch? s? d?ng khi vựng c?n xỏc d?nh trỡnh t? dó du?c bi?t tru?c, v� trong phỏt hi?n d?t bi?n di?m.
Sequencing Data
Máy giải trình tự DNA tự động
(Automated DNA Sequencers)
ABI: ABI 377, 310, 3100, 3100 Avant, 3700, 3730.
Amersham: MegaBace 500, 100
Beckman-Coulter: CE2000, 8000
Li-Cor:
Shimatzu: DSQ1000, 2000.
.Tại Việt Nam:
ABI 3100 Avant (4 capillaries): 5/ VCNSH, TTCNSH (ĐHQGHN); ĐHYHN, VVSDTTW .
ABI 310 (1 Capillary): 4/ĐH Thái Nguyên; VDTNN, VKHHS, ĐH Cần Thơ.
ABI 377: 1/ VKHHS
Pharmacia Biotech ALF: 4/ĐHKHTN ĐHQGHN, ĐHKHTN ĐHQGtpHCM, VCNSH, ĐHBK
Beckman- Coulter CE2000: 2/Viện Pasteur TPHCM; TT Welcome Trust)
Viện Chăn nuôi, VQY108, HVQY...
ABI sequencers
ABI 377
ABI 373
ABI 371
ABI Automated Sequencers (contd.)
ABI 310
ABI 3700
ABI 3100Avant
ABI 3100
Lý giải trình tự DNA
123123123
654654654
Khung đọc mở 2
Khung đọc mở 1
Các Cơ sở dữ liệu gen Quốc tế

EMBL/EBI (EU);
NCBI (USA);
C? S? D? LI?U GEN C?A EMBL/EBI
CSDL trỡnh t? nucleotide c?a EMBL l� m?t th�nh viờn cỏc nu?c chõu �u trong 3 CSDL l?n nh?t th? gi?i. Cú th? truy c?p v�o h�ng tram trỡnh t? genom ho�n ch?nh cựng v?i cỏc s?n ph?m protein d?ch mó nh? mỏy ch? c?a EBI.
ASD: CSDL phõn c?t n?y sinh (Alternative Splicing Database) ch?a d? li?u v? cỏc exon phõn c?t phỏt sinh cựng v?i cỏc thụng tin b? sung di kốm. D? ỏn ASD nh?m hi?u rừ hon v? co ch? c?t ghộp n?y sinh ? quy mụ genome.
ATD: CSDL da d?ng v? cỏc b?n phiờn mó n?y sinh (Alternate Transcript Diversity Database ATD) ch?a d? li?u v? cỏc b?n phiờn mó trong dú m?i b?n phiờn mó du?c mụ t? cho m?t d?ng c?t ghộp n?y sinh v� s? polyadenyl húa n?y sinh (alternative polyadenylation).
EMBL-Align database: CSDL so sỏnh nhi?u trỡnh t?.
EMBL-Bank: Ngõn h�ng EMBL cũn du?c g?i l� CSDL trỡnh t? nucleotide EMBL, dúng gúp v�o ngu?n trỡnh t? nucleotide so c?p c?a chõu �u.
EMBL CDS: l� m?t CSDL c?a trỡnh t? nucleotide c?a trỡnh t? mó húa (CDS coding sequence)
Ensembl: Mụ t? t? d?ng c?a cỏc genome eukaryote.
Genomes Server: m?t cỏi nhỡn t?ng quan c?a cỏc genom ho�n ch?nh ? EBI. Nh?ng trang web n�y cho phộp truy c?p v?i m?t s? lu?ng l?n cỏc genom ho�n ch?nh.
Genome Reviews: CSDL genom du?c ch?nh s?a bao g?m cỏc phiờn b?n chớnh xỏc c?a cỏc m?c tra c?u (entry) genom ho�n ch?nh t? CSDL trỡnh t? nucleotide c?a EMBL/GenBank/DDBJ
Karyn`s Genomes: thu th?p v� mụ t? m?t s? trỡnh t? genom.
IMGT/HLA: CSDL di truy?n mi?n d?ch, bao g?m CSDL IMGT/HLA c?a ph?c h? phự h?p t? ch?c (MHC). CSDL di truy?n mi?n d?ch IMGT/LIGM bao g?m CSDL IMGT/LIGM c?a cỏc Ig v� cỏc th? th? t? b�o T.
IPD: CSDL da hỡnh mi?n d?ch (Immuno Polymorphism Database IPD), bao g?m cỏc gen da hỡnh c?a h? th?ng mi?n d?ch, ch?ng h?n nhu KIR, HPA v� MHC khụng ph?i c?a ngu?i.
LGICdb: CSDL cỏc ch?t g?n cỏc kờnh Ion (Ligand Gated Ion Channel Database)
Mutations: D? ỏn CSDL s? da hỡnh trỡnh t? (Sequence variation database project)
Parasites: CSDL genome ký sinh (Parasite Genome databases).
CễNG C? PH�N T�CH TRèNH T? AND C?A EMBL/EBI
S? d?ng r?t nhi?u phuong phỏp tin sinh h?c d? xỏc d?nh ch?c nang sinh h?c, c?u trỳc c?a cỏc gen v� protein m� chỳng mó húa.
Cỏc cụng c? nhu Transeq cú th? giỳp xỏc d?nh cỏc vựng mó húa protein c?a m?t trỡnh t? DNA. ClustalW du?c s? d?ng d? so sỏnh trỡnh t? DNA ho?c protein d? l�m sỏng t? m?i quan h? cung nhu ngu?n g?c ti?n húa c?a chỳng.
Cỏc cụng c? phõn tớch do EBI cung c?p:
CO S? D? LI?U GEN C?A NCBI
GenBank: T?p h?p t?t c? cỏc trỡnh t? nucleotide v� axit amin hi?n cú
GenBankđ l� CSDL trỡnh t? di truy?n c?a NIH. Cú kho?ng 51.674.486.881 base trong 46.947.388 b?n trỡnh t? trong cỏc nhỏnh c?a GenBank v� 53.346.605.784 base trong 10.276.161 b?n ghi trỡnh t? ? nhỏnh WGS v�o 8/2005.
Ch?ng h?n, chỳng ta cú th? xem b?n ghi cho m?t gen c?a Saccharomyces cerevisiae thỡ GenBank dó cung c?p d?y d?. C? sau 2 thỏng, m?t phiờn b?n update du?c dua ra.
GenBank l� m?t ph?n c?a (International Nucleotide Sequence Database Collaboration) bao g?m ? DDBJ, EMBL v� NCBI. Ba t? ch?c n�y trao d?i d? li?u v?i nhau h�ng ng�y.
Trong l?n cụng b? g?n dõy nh?t, INSDC cho bi?t CSDL trỡnh t? DNA dó vu?t quỏ 100 Gb. GenBank l� m?t th�nh viờn quan tr?ng dúng gúp cho m?c n�y v� t?t nhiờn dú l� k?t qu? dúng gúp c?a r?t nhi?u cỏc nh� khoa h?c trờn to�n th? gi?i.

dbEST (data base of Expressed Sequence Tags): Theo Nature Genetics 4:332-3; 1993 thỡ dbEST l� m?t t?p h?p c?a cỏc trỡnh t? deo th? ho?c cỏc trỡnh t? ng?n, duy nh?t l?y t? mRNA (cDNA). dbEST cung l� m?t nhỏnh c?a GenBank.
dbGSS (data base of Genome Survey Sequences): cung l� m?t nhỏnh c?a GenBank nhung khỏc v?i dbEST l� h?u h?t cỏc trỡnh t? d?u cú ngu?n g?c t? genomic ch? khụng ph?i l� cDNA (mRNA). Nhỏnh dbGSS ch?a cỏc d?ng d? li?u sau:
Single - pass genom sequence
Cỏc trỡnh t? t?n cựng c?a cosmid/BAC/YAC
Cỏc trỡnh t? Alu PCR
Cỏc trỡnh t? transposon du?c deo th? (transposon -tagged).

dbSNP (data base of Single-base Nucleotide Polymorphism): l� CSDL cỏc da hỡnh do s? thay th? ho?c thờm, b?t m?t nucleotide.
RefSeq: CSDL c?a cỏc trỡnh t? tra c?u khụng cú s? du th?a (non-redundant reference sequence) bao g?m: cỏc do?n contig DNA genom, cỏc mRNA, cỏc protein c?a cỏc gen dó bi?t.
dbSTS (data base of sequence tagged sites): CSDL c?a cỏc v? trớ trỡnh t? du?c deo th? ho?c cỏc trỡnh t? ng?n thu?ng ch? cú m?t m?t l?n duy nh?t trong genom.
UniSTS: l� m?t co s? d? li?u to�n di?n c?a cỏc STS (cỏc v? trớ dỏnh d?u trỡnh t?) du?c l?y t? cỏc b?n d? STS v� cỏc thớ nghi?m khỏc.
UniGene: T?p h?p c?a cỏc trỡnh t? EST v� cỏc trỡnh t? mRNA cú chi?u d�i d?y d? du?c nhúm v�o cỏc c?m v� m?i c?m d?i di?n cho m?t gene duy nh?t du?c bi?t ho?c gene ngu?i du?c mụ t? cựng v?i b?n d? v� nh?ng thụng tin v? quỏ trỡnh bi?u hi?n gen.
dbHTG (data base of high-throughput genom sequence): t?p h?p c?a cỏc trỡnh t? genom thu du?c t? cỏc trung tõm xỏc d?nh trỡnh t? genom.
HomoloGene: S? d?ng d? so sỏnh trỡnh t? nucleotide gi?a hai sinh v?t d? dỏnh giỏ m?c d? ortholog gi? d?nh.
MGC: (Mamalian Gene Collection) cung c?p cỏc dũng d?y d? chi?u d�i cỏc khung d?c m? (full-length open reading frame FL-ORF) cho ngu?i, chu?t nh?t v� chu?t c?ng.
PopSet: PopSet l� m?t h? th?ng cỏc trỡnh t? DNA du?c thu th?p d? phõn tớch m?i quan h? ti?n húa c?a m?t qu?n th?.
RefSeq: Cung c?p h? th?ng cỏc trỡnh t?: DNA, cỏc lo?i RNA v� s?n ph?m protein d? nghiờn c?u cỏc sinh v?t.
TPA: Third Party Annotation (TPA) Sequence: Du?c thi?t k? d? thu hỳt cỏc k?t qu? th?c nghi?m v� h? tr? cho nh?ng ngu?i dang ký mụ t?, gi?i thớch v? trỡnh t? m� ngu?i dang ký khụng xỏc d?nh du?c tr?c ti?p nhung cú th? l?y t? d? li?u so c?p c?a GenBank.
RHdb: l� m?t co s? d? li?u c?a cỏc d? li?u thụ du?c s? d?ng trong vi?c thi?t k? cỏc b?n d? lai phúng x?. Nú bao g?m cỏc d? li?u STS, di?m s?, cỏc di?u ki?n thớ nghi?m v� cỏc tra c?u chộo.
C�C CễNG C? PH�N T�CH TRèNH T? AND
C?A NCBI
Cluster of Orthologous Groups (COGs): M?t h? th?ng c?a cỏc h? gen t? cỏc genom ho�n ch?nh.
Gene Expression Omnibus (GEO): Kho d? li?u gen bi?u hi?n v� cỏc ngu?n tr?c tuy?n cho vi?c thu nh?n cỏc d? li?u gen bi?u hi?n.
HomoloGene: So sỏnh cỏc trỡnh t? nucleotide gi?a cỏc c?p sinh v?t d? xỏc d?nh cỏc gen ? cỏc lo�i khỏc nhau du?c ti?n húa t? m?t gen t? tiờn chung do quỏ trỡnh phõn lo�i v� chỳng thu?ng v?n gi? du?c nguyờn ch?c nang trong quỏ trỡnh ti?n húa.
CSDL cỏc vựng b?o th? (Conserved Domain Database CDD): T?p h?p cỏc b?n so sỏnh trỡnh t? (sequence alignment) v� cỏc profile c?a cỏc vựng b?o th? c?a cỏc phõn t? protein trong quỏ trỡnh ti?n húa phõn t?.
T?p h?p cỏc gen d?ng v?t cú vỳ (Mammalian Gene Collection MGC): M?t n? l?c m?i c?a NIH d? thu du?c cỏc ngu?n cDNA v?i chi?u d�i d?y d?.
Clone Registry: M?t CSDL du?c s? d?ng b?i s? tham gia c?a cỏc trung tõm trỡnh t? genom ngu?i v� chu?t d? luu gi? nh?ng dũng du?c l?a ch?n t? vi?c d?c trỡnh t?, cỏc dũng dang du?c d?c trỡnh t? v� cỏc dũng dó ho�n t?t v� du?c luu gi? ? GenBank
Trace Archive: Du?c phỏt tri?n d? luu gi? cỏc d? li?u trỡnh t? thụ du?c t?o ra t? cỏc d? ỏn xỏc d?nh trỡnh t?.
Tỡm khung d?c m? (ORF Finder): M?t cụng c? phõn tớch hi?n th? du?i d?ng d? ho? cho phộp tỡm cỏc khung d?c m? c?a m?t do?n trỡnh t? ho?c m?t trỡnh t? cú trong CSDL.
VecScreen: M?t cụng c? cho phộp xỏc d?nh cỏc do?n trỡnh t? nucleotide m� cú th? l� c?a vector, cỏc vựng linker ho?c cỏc di?m kh?i d?u sao chộp (origin) tru?c khi s? d?ng cỏc cụng c? phõn tớch trỡnh t? ho?c dang ký trỡnh t?.
Electronic-PCR (e-PCR): Cú th? du?c s? d?ng d? so sỏnh m?t trỡnh t? truy v?n (query sequence) v?i cỏc v? trớ trong trỡnh t? dỏnh d?u (sequence-tagged sites) d? tỡm ra m?t v? trớ b?n d? cú th? cho trỡnh t? truy v?n.
Tỡm khung d?c m? (ORF Finder)
Cỏc trỡnh t? DNA mó húa thụng tin di truy?n du?i d?ng cỏc b? ba nucleotide. Khi cú m?t trỡnh t? DNA, chỳng ta c?n ph?i tỡm trỡnh t? protein n?u mu?n xỏc d?nh s?n ph?m sau d?ch mó c?a trỡnh t? n�y. Tuy nhiờn, cỏc trỡnh t? DNA, sau khi du?c phiờn mó, ch? du?c d?ch mó th�nh protein khi chỳng l� m?t khung d?c m? (Open Reading Frame - ORF). Cỏc khung d?c m? ph?i l� nh?ng trỡnh t? DNA cú codon b?t d?u v� codon k?t thỳc d?ch mó (Stop Codon) nhu TAA, TGA, TAG.
D? tỡm cỏc khung d?c m? cú th? cú trong m?t trỡnh t? DNA, chỳng ta s? d?ng m?t chuong trỡnh cú tờn l� ORF finder c?a NCBI. Chuong trỡnh n�y s? tỡm ki?m nh?ng khung d?c m? cú th? cú c?a trỡnh t? nh?p v�o v� trỡnh t? b? sung c?a nú. Sau dú dua ra b?n d? khung d?c m? v?i cỏc trỡnh t? dó d?ch mó th�nh trỡnh t? amino acid.

Bu?c 1: T? google chỳng ta nh?p v�o t? khúa orf finder
Bu?c 2: M? trang ORF finder t? trang ch? NCBI b?ng
cỏch nh?n v�o dũng ORF finder.
ATGCCGGTCGGCACCGCGCGAACTTGCATGAATGGCCTCAATGCCCTGTCCGGTGCGTACATGTTGCTCG
AGATCTTCTAGCTACCTTGCAGTCTTGCTTAATTGCTTGCGTTGATTTACCGTGCGCACTCATGCCGCTA
TATATTCTCTGATCGACCAGGGGTTGGCTTGCTCACCGTGCCCTACGCCCTCTCCGAGGGGGGCTGGGTG
AGCCTCGCGCTGCTCGCCGCCGTGGCCGCCGCCTGCTGGTACACCGGGATCCTCCTCTGCCGCTGCATGG
ACGCCGACGACGCCATCCGGACGTACCCGGACATCGGCGAGCGCGCGTTCGGCCGCACGGGCCGCCTCCT
CGTGTCCGCCTTCACGTACGTCGAGCTCTACCTCGTCGCCACCGGCTTCCTCATCCTCGAGGGCGACAAC
CTCGACAAGCTCTTCCCAGGAGCCAGAGTCACCCTGGGGACGGTGTCCCTCGCCGGGAAGCGGCTGTTCG
TCGTGCTCGTCGCGCTCGTGGTGGCGCCCACGACGTGGCTGCGCAGCCTCGGCGTGCTCGCGTACGTCTC
CGCCACGGGCGTGTTCGCGTCCGTCGTCATCGTGCTCAGCGTGCTGTGGCCGCGGCCGTCGACGGCGTCG
GATTCTCCGGACGAGGGACGACGACGCCGCTACGGATCGCGGGGCTCCCGACGGCTCTCGGGCTGTACAT
CTTCTGCTACGGGGGACACCCCATGTTCCCGACGCTCTACACATCTATGAAGAGGAAGTCTCAGTTTCCA
AAGGTATACCCGTATACGCATGCGCATAACACTATGCTATTTATCAGTCGTGATTTTTTCTTATCCGTTA
GTCAACCAATTTGCAAAGGTCATTTACTAAACTTGCACACTACTATATATAAAAAAAACACTGCAACTTT
TAGCTTTGCTTTTTTAAAAAAATATTTTCTGGACCAATTTAGTGCATTATTATGTTTATATGAAGAGAAA
TTTCCCTATGTACCCCTAAAAGTTCGTCCAATCCCTTCTATATTCCTGAGATTTGATTATTTACTTCCAT
ACTCCTAAATTTTACTTTGAATCCCCTCTATACTCCTTTTGTCAGTTGACCGTTAAATTCATATCATAAA
CTCCATTTTACCCTTTGGTATAAAAAAATAAATTTGTGAAGTATATTGATGGAGTGTATAAATTTATTGT
ATGCGACTATTATATTTATGAGTTTATTTTGTAAGATATTATTTAACAAAAATAATTTTTATCTCATATA
ACAAGATTTATCTTATAAAAATTTGCGTACTACTATAACAAACTATGCTATATATATACAGTTTTCAATG
ATAAAAAATATTATTTTTTGTTTTATCTAAAATAAATTGTCATAGATAAAAATTACTTTTGTTTTCCCTT
CGCGAGGCGAAACTAAAATATTACTTTTATTAAATAATATCTCACAAAATAAACTCATACATATAATAGT
CCCATACAATAAATTTATACACTACATCAATATATTTCATAAATTTATATTTTCTCGATACCAAAGGGCA
AAATGAACTTTATGATAGAAATTTAACGGCTAACTAATGGAAGAGGTATAGAAGGGACATAGAAGATATA
CCAAAAAATATTTTTTAAACTTTTAGGTTAGAATATTATTTTCTTCACCACAAGGAGAAAGAACATAAGG
ATGAGTTTGTTGATATATATTGATCTAGCTAGTGTTAAAAATGCGATTGATAGATAAGAAAAAAAATCTC
TTGACAAATAGATAATCCTGAGAAATAATGTAGTAGAAGAAATCACGTTTTTGAGAAAACATATATTTTT
AAAGCAAGTTATAAACAATCTGGTGCATAATCAGAATGGATTAATTGATGGTCGATCAATATACTGACCA
ACTCTTCAATTGATTATTGATCAATTAATTATTATCAAATATCAACCAGATGCTAGTGATATGCTTCCTG
CTGTGCACGCTCAACTACGGTGCAATGGCGGTGCTCGGCTACCTCATGTACGGCGACGGCGTGCTGTCCC
AGGTGACGCTCAACCTCCCGTCGGCGAGGCTCAGCTCCAAGGTCGCCATATACACGACGCTGCTCAACCC
GGTCACCAAGTACGCACTGGTGGTGACGCCGATCGCTGCCGCCGTCGAGGAGAGGATCCGCGGCGCCGCC
GGCAAGGGAGCGCGCGCCGTCTCCGTGGCGGTGAGGACGCTGCTGGTGCTCAGCACGGTGGCCGTGGCGC
TTGCGCTGCCGTTCTTCGCGGACCTCATGGCGCTGGTGGGATCGATGCTCAACGTGGCCGTCTGCATGCT
GCTGCCCTGCGCCTGCTACGTCAGGATCTTCGGGGCGCCGTCGATGAGCAGCGTGGAGGCCGTGGCGATC
GGCGGGATACTGGTGCTGGGCTCGCTGGTGGCTGTCACGGGGACTTACTATTCCCTGATGAAAATTATCC
GTGAGTTGGTGTGA
Nh?p trỡnh t? cỏc nucleotid bờn trờn v�o ụ
or sequence in FASTA format
Bước 3: Nhập trình tự DNA vào hộp trình tự (sequence in FASTA format) hoặc mã số trình tự vào hộp GI or ACESSSION (nếu muốn dùng toàn bộ trình tự trong cơ sở dữ liệu).

. L?a v? trớ d?ch mó (From: To: ) v� ki?u mó di truy?n.
. Nh?n nỳt OrfFind d? th?c hi?n chuong trỡnh. (Xem hỡnh trờn)
D?i k?t qu? xu?t hi?n sau v�i phỳt (ho?c cú th? lõu hon). K?t qu? cú sỏu khung d?ch mó xu?t hi?n. Cỏc khung d?c m? (n?u cú) s? l� nh?ng thanh cú m�u s?m hon. L?a ch?n gi?i h?n cỏch th? hi?n b?ng tr? s? trong m?c Redraw (50, 100, 300).
K?t qu? th? hi?n cú d?ng tuong t?:
Nhấn lên trình tự khung đọc mở sẽ thấy hiện lên trình tự DNA
và trình tự dịch mã amino acid tương tự kết quả bên dưới.
CÁC ỨNG DỤNG CỦA VIỆC PHÂN TÍCH
TRÌNH TỰ GEN
So sánh một đoạn ADN bất kỳ với các dữ liệu trong ngân hàng gen có thể chúng ta xác định được đoạn ADN đó của sinh vật nào (Bài thực hành tìm kiếm trình tự tương đồng).
Biết được trình tự sắp xếp các nucleotit của một đoạn ADN có thể suy ra trình tự các axit amin tương ứng trên mạch polypeptide nếu đoạn ADN đó mã hóa (Bài thực hành dịch mã 1 phân tử ADN sang trình tự axit amin).
Xác định đột biến, sự sai khác về trình tự nucleotit trong cùng một sản phẩm gen (isozyme, allozyme…) có ý nghĩa trong nghiên cứu tiến hóa và ứng dụng thực tiễn.
V? m?t phõn lo?i sinh h?c, d?i v?i m?t s? gen cú tớnh b?o th? cao, mang tớnh d?c thự lo�i, ch?ng h?n cỏc gen mó húa cho ARN ribosome (rRNA). D?a v�o nh?ng trỡnh t? ADN c?a cỏc gen n�y ? nh?ng lo�i sinh v?t khỏc nhau m� ngu?i ta cú th? so sỏnh chỳng trờn co s? xỏc d?nh m?c d? sai khỏc v? trỡnh t? nucleotit t? dú mụ ph?ng m?i quan h? lo�i, du?i lo�i.
Hỡnh thỏi gi?ng nhau ? V?t ch?t di truy?n nhu th? n�o?
Bi?t du?c trỡnh t? c?a m?t gen (ch?ng h?n gen ung thu hay s? cú m?t c?a cỏc virus nguy hi?m ch?ng h?n H5N1, b?nh virus d?m tr?ng ? tụm.) ngu?i ta cú th? phỏt hi?n s?m b?ng k? thu?t PCR, lai ADN d? ngan ch?n, di?u tr?.
Thi?t k? nh?ng c?p m?i (primer) d? nhõn b?n cỏc do?n n�y cho nh?ng m?c dớch nghiờn c?u khỏc nhau nhu�: Nghiờn c?u s? cú m?t c?a gen dú trong cỏc sinh v?t khỏc nhau (xỏc d?nh s? cú m?t gen ch?ng b?nh b?c lỏ, d?o ụn, xỏc d?nh gi?i tớnh, b?nh di truy?n.). Ngo�i ra, cũn s? d?ng cỏc k? thu?t microarray, DNA chip d? phỏt hi?n s? cú m?t v� m?c d? ho?t d?ng c?a cỏc gen trong nh?ng di?u ki?n nh?t d?nh.
T? trỡnh t? nucleotit c?a m?t phõn t? ADN cú th? bi?t du?c b?n d? cỏc v? trớ nh?n bi?t c?a cỏc enzym c?t h?n ch?. Di?u n�y d?c bi?t cú ý nghia trong k? ngh? ADN tỏi t? h?p.
M?t trong nh?ng phuong phỏp tr? li?u gen (gene therapy) d?a trờn trỡnh t? ribonucleotit trờn phõn t? mRNA d? t?ng h?p s?i b? sung (antisense) nh?m ngan ch?n s? ho?t d?ng c?a cỏc gen dú.
M?t trong nh?ng ?ng d?ng quan tr?ng dú l� chuy?n gen d? t?o ra cỏc sinh v?t m?i mang nh?ng d?c tớnh mong mu?n ho?c cú th? chuy?n gen v�o cỏc t? b�o vi khu?n, n?m men. d? s?n xu?t s?n ph?m gen theo con du?ng tỏi t? h?p (protein, enzym, vaccine v� cỏc h?p ch?t cú ho?t tớnh sinh h?c).
N?u nhu chỳng ta bi?t du?c th�nh ph?n, trỡnh t? s?p x?p c?a cỏc axit amin trong phõn t? protein, enzym n�o dú cú th? dỏnh giỏ du?c s? sai khỏc gi?a cỏc axit amin trong cỏc phõn t? protein, enzym cựng ch?c nang ? cỏc lo�i khỏc nhau d? bi?t du?c th�nh ph?n axit amin n�o dúng vai trũ quan tr?ng.
T�i li?u tham kh?o:

1. H? Tỳ B?o, B�i gi?ng Power point Gi?i thi?u v? tin sinh h?c, Vi?n Cụng ngh? Thụng tin, TTKHTN v� CNQG; Viờn KH v� CN Tiờn ti?n Nh?t B?n (JAIST).
2. Nguy?n Van Cỏch, 2005, Tin Sinh h?c, Nxb KHKT H� N?i.
3. Nụng Van H?i, B�i gi?ng Power point K? thu?t xỏc d?nh trỡnh t? gen, Vi?n Cụng ngh? Sinh h?c.
4. Phan Tr?ng Nh?t, B�i gi?ng Power point Tin Sinh h?c, Tru?ng D?i h?c NN H� N?i.
5. Tr?n Linh Thu?c, 2003, Th?c t?p Bioinformatics, T�i li?u luu h�nh n?i b? Tru?ng D?i h?c KHTN Tp H? Chớ Minh.
6. Trang Web:
http://www.ncbi.nlm.nih.gov/sites/entrez?db=nuccore&cmd=search&term=Oryza%20sativa%20Japonica%20Group%20DNA
http://www.ncbi.nlm.nih.gov/gorf/orfig.cgi
C?M ON TH?Y V� C�C B?N D� THEO DếI!

* Một số tài liệu cũ có thể bị lỗi font khi hiển thị do dùng bộ mã không phải Unikey ...

Người chia sẻ: Võ Phương Thảo

Dung lượng: | Lượt tài: 1

Loại file:

Nguồn : Chưa rõ

(Tài liệu chưa được thẩm định)

Tải tài liệu

Báo cáo sai sót

Đề suất chỉnh sửa , phân lại mục