TIN SINH HỌC P23

Chia sẻ bởi Võ Phương Thảo | Ngày 23/10/2018 | 51

Chia sẻ tài liệu: TIN SINH HỌC P23 thuộc Bài giảng khác

Nội dung tài liệu:

MÔN: TIN SINH HỌC
CÂU HỎI: CÁC PHƯƠNG PHÁP TÌM KIẾM DỮ LIỆU SINH HỌC VÀ ỨNG DỤNG TRONG VIỆC THỰC HIỆN ĐỀ TÀI NGHIÊN CỨU
Giáo viên hướng dẫn : TS. Võ Văn Toàn
Học viên thực hiện : Nguyễn Thị Bình Nguyên
Lớp : Cao học SHTN Khóa 12
1. Tin sinh học
- Tin sinh học là ứng dụng công nghệ thông tin để quản lý dữ liệu sịnh học hoặc nghiên cứu các vấn đề sinh học.
- Những lĩnh vực nghiên cứu chính của tin sinh học bao gồm bắt cặp trình tự (sequence alữignment), bắt cặp cấu trúc protein (protein structural alignment), dự đoán cấu trúc protein (protein structure prediction), dự đoán biểu hiện gene (gene expression) và tương tác protein - protein (protein-protein interactions), và mô hình hóa quá trình tiến hoá.
- Các ứng dụng của tin sinh học:
Nghiên cứu về chuỗi trình tự
Nghiên cứu về bộ gene
Nghiên cứu bằng sự tiến hoá của sinh học bằng máy tính
Nghiên cứu đa dạng di truyền
Nghiên cứu các đột biến của tế bào ung thư
So sánh bộ gene
I. PHƯƠNG PHÁP TÌM KIẾM DỮ LIỆU SINH HỌC
2. Cơ sở dữ liệu
Năm cơ sở dữ liệu trình tự chính trong Internet cung cấp thông tin về trình tự nucleotide và protein. Đó là các EMBL Nucleotide Cơ sở dữ liệu trình tự, chuỗi cơ sở dữ liệu GenBank và các ngân hàng dữ liệu DNA Nhật Bản (DDBJ) cung cấp thông tin chuỗi nucleotide và protein cũng như các chú thích thư mục và sinh học. The-Prot Thụy Sĩ là một protein cơ sở dữ liệu trình tự chú thích và cung cấp các chuỗi protein được chú thích với các liên kết với cơ sở dữ liệu khác. Các cơ sở dữ liệu chuỗi protein thứ hai là các protein thông tin tài nguyên (PIR)
3.1. Trình tự DNA
- GenBank http://www.ncbi.nlm.nih.gov/Genbank/GenbankOverview.html
- Cơ sở dữ liệu http://www.ebi.ac.uk/embl/index.html EMBL Nucleotide
- DDBJ (ngân hàng dữ liệu DNA Nhật Bản) http://www.ddbj.nig.ac.jp/
3.2.Trình tự Protein
- UniProt (Universal Resource Protein) http://www.expasy.uniprot.org/
- SWISS-PROT bao gồm TrEMBL, PIR
- Protein cơ sở dữ liệu (NCBI) http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=Protein
3.3.Cấu trúc Protein
- Ngân hàng dữ liệu protein (PDB) http://www.rcsb.org/pdb/
- Mô hình hóa phân tử cơ sở dữ liệu (NCBI)
http://www.ncbi.nlm.nih.gov/Structure/MMDB/mmdb.shtml
3.4.Cơ sở dữ liệu di truyền
- Toàn bộ hệ gen (NCBI) http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=Genome
- Toàn bộ hệ gen vi sinh vật (TIGR) http://www.tigr.org/tigr-scripts/CMR2/CMRGenomes.spl
- Chưa xong hệ gen (TIGR) http://tigrblast.tigr.org/ufmg/
- Cơ sở dữ liệu đa hình đơn nucleotide http://www.ncbi.nlm.nih.gov/SNP/
- Đột biến gen của con người http://www.uwcm.ac.uk/uwcm/mg/hgmd0.html
Các cơ sở dữ liệu có thể được tìm kiếm có hệ thống, bởi các từ khoá, hoặc bằng trình tự giống nhau.
3. Một số trang web tìm kiếm cơ sở dữ liệu:
4. Các công cụ tìm kiếm thông tin trên Internet:
www.google.com/
www.altavista.com/
www.infoseek.com/
www.excite.com/
www.nlsearch.com/
www.valdo.com/
www.pdb.com/
5. Tìm kiếm thông tin qua cơ sở dữ liệu sinh học:
NCBI: Cơ sở dữ liệu của Mỹ
EMBL: Cơ sở dữ liệu của Châu Âu
6. Nguyên tắc tìm kiếm thông tin trên mạng Internet qua các bước sau:

6.1. XÁC ĐỊNH THÔNG TIN CẦN TÌM
Để có nhiều thông tin hơn, ta phải dịch nội dung chính của vấn đề sang tiếng Anh vì dữ liệu trên internet là tiếng Anh
ví dụ: chuyển gen kháng virus ở cây dưa leo
Transformation cucumber viral resistance
6.2. XÁC ĐỊNH TỪ KHÓA
Để tìm kiếm thông tin chúng ta phải xác định một từ hay một nhóm từ khóa mang nội dung chủ yếu hay quan trọng nhất của vấn đề quan tâm
Từ khóa: Trasformation cucumber , viral resistance
6.3. CHỌN CÔNG CỤ TÌM KIẾM
- Google Patent Search-Tìm kiếm bằng sáng chế
- Google Scholar-Công cụ tìm kiếm dành cho học giả
- Google Books- công cụ tìm kiếm sách
6.4. LỌC THÔNG TIN
- Đọc lướt nhanh rồi đối chiếu với nội dung ta cần tìm. Nếu đúng là thông tin ta cần tìm thì lưu lại trang web.
- Từ khóa càng chuyện biệt thì kết quả tìm kiếm càng gần với thông tin ta quan tâm.
6.5. KẾT QUẢ CẦN TÌM
II. ỨNG DỤNG TRONG VIỆC TÌM CÁC THÔNG TIN VỀ CÂY DƯA LEO ( CUCUMIS SATIVUS)
Tìm kiếm thông tin trên cơ sở dữ liệu NCBI
1. Vào google/NCBI
2. Gõ Cucumber rồi nhấp vào search
3. Đây là trang thông tin về Cucumber gồm các thông tin về sinh lý, gen, protein,....Chọn thông tin cần tìm rồi nhấp vào
4. Nhấp vào “PedMed: biomedical literature citations and abstracts” ta được các thông tin về sinh lý ở cây dưa leo
5. Chọn thông tin “Differential regulation of vacuolar H(+)-ATPase and H(+)-PPase in Cucumis sativus roots by zinc and nickel”. ( Bài dịch ở trang sau)
Sự sai khác về hoạt động của H (+)-ATPase và H (+)-PPase trong rễ cây dưa leo dưới sự tác động của kẽm và niken.
Tác giả: Kabała K, Janicka-Russak M.
Khoa sinh lý thực vật, Viện Sinh học thực vật, Đại học Wrocław, Kanonia 6 / 8, 50-328 Wrocław, Ba Lan.
Tóm tắt
Kẽm và niken, là những chất vi lượng, rất cần thiết cho tất cả sinh vật. Chúng tôi nghiên cứu sự ảnh hưởng của 10 và 100μM Zn và Ni trên hai máy bơm proton tonoplast, vacuolar H (+)-ATPase (V-ATPase) (EC 3.6.3.14) và vacuolar H (+)-pyrophosphatase (V-PPase) (EC 3.6.1.1), trong rễ dưa chuột. ATP proton phụ thuộc vào vận tải cũng như thủy phân ATP, xúc tác bởi V-ATPase, giảm trong rễ của cây sau khi tiếp xúc với cả hai Zn và Ni theo các điều kiện kiểm tra. Ngược lại, V-PPase hoạt động, đo như thủy phân (i) PP và PP (i)-driven H (+) vận chuyển, được kích thích bởi nồng độ thấp hơn của kim loại. Tuy nhiên, ở nồng độ kim loại cao hơn, hoạt động thủy phân của V-PPase vẫn không thay đổi, trong khi PP (i) phụ thuộc vào bơm proton vào túi tonoplast đã giảm. Khi các kim loại nặng được đưa vào môi trường phản ứng enzyme, cả V-ATPase và V-PPase hoạt động đã bị hạ xuống bởi Zn và Ni một cách tương tự. Khi phân tích biểu hiện gen và immunoblot mô tả, quan sát những thay đổi trong hoạt động của cả hai máy bơm proton tonoplast để đáp ứng với kẽm và niken không phải do sự thay đổi trong biểu hiện của các-CsVHA A, CsVHA c-và gen mã hóa CsVP V-ATPase tiểu đơn vị A và C, và V-PPase, tương ứng, trong rễ dưa chuột hoặc với số lượng của các protein enzyme. Hơn nữa, Zn cũng như các ion Ni đã không tăng cường peoroxy hóa lipid trong các phần phân đoạn tonoplast gốc. So sánh các ATP và pyrophosphate trong kiểm soát nguồn gốc và rễ được điều trị bằng các kim loại nặng cho thấy Zn và Ni không ảnh hưởng đến lượng ATP, nhưng giảm PP (i) cấp.


6. Chọn “ Protein: sequence database” ta sẽ có thông tin về các loại proetin trong cây dưa leo
7. Đây là trang gồm 20 chuỗi protein trong tổng số 4596 chuỗi protein của cây dưa leo đã được phát hiện
8. Nhấp vào “Chain A, Cucumber Basic Protein, A Blue Copper Protein” ta được trang thông tin chi tiết về chuỗi protein này ( Slide 16, 17, 18)
Chain A, Cucumber Basic Protein, A Blue Copper Protein
PDB: 2CBP_A
FASTA Graphics
Go to:
LOCUS 2CBP_A 96 aa linear PLN 29-OCT-2010
DEFINITION Chain A, Cucumber Basic Protein, A Blue Copper Protein.
ACCESSION 2CBP_
AVERSION 2CBP_A GI:157834735
DBSOURCE pdb: molecule 2CBP, chain 65, release Aug 27, 2007; deposition: Mar 16, 1996; class: Electron Transport; source: Mol_id: 1; Organism_scientific: Cucumis Sativus; Organism_common: Cucumber; Other_details: From Seedlings; Exp. method: X-Ray Diffraction.
KEYWORDS .
SOURCE Cucumis sativus (cucumber)
ORGANISM Cucumis sativus Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta; Spermatophyta; Magnoliophyta; eudicotyledons; core eudicotyledons; rosids; fabids; Cucurbitales; Cucurbitaceae; Cucumis.
REFERENCE 1 (residues 1 to 96)
AUTHORS Colman,P.M., Freeman,H.C., Guss,J.M., Murata,M., Norris,V.A., Ramshaw,J.A., Venkatappa,M.P. and Vickery,L.E.
TITLE Preliminary crystallographic data for a basic copper-containing protein from cucumber seedlings
JOURNAL J. Mol. Biol. 112 (4), 649-650 (1977)
PUBMED 875035
REFERENCE 2 (residues 1 to 96)
AUTHORS Guss,J.M., Merritt,E.A., Phizackerley,R.P., Hedman,B., Murata,M., Hodgson,K.O. and Freeman,H.C.
TITLE Phase determination by multiple-wavelength x-ray diffraction: crystal structure of a basic `blue` copper protein from cucumbers
JOURNAL Science 241 (4867), 806-811 (1988)
PUBMED 3406739
REFERENCE 3 (residues 1 to 96)
AUTHORS Guss,J.M., Merritt,E.A., Phizackerley,R.P. and Freeman,H.C.
TITLE The structure of a phytocyanin, the basic blue protein from cucumber, refined at 1.8 A resolution
JOURNAL J. Mol. Biol. 262 (5), 686-705 (1996)
PUBMED 8876647
REFERENCE 4 (residues 1 to 96)
AUTHORS Guss,J.M. and Freeman,H.C.
TITLE Direct Submission
JOURNAL Submitted (16-MAR-1996)
COMMENT SEQRES.
FEATURES Location/Qualifiers source 1..96 /organism="Cucumis sativus" /db_xref="taxon:3659" SecStr 1..5 /sec_str_type="sheet" /note="strand 1" Region 11..89 /region_name="Cu_bind_like" /note="Plastocyanin-like domain; cl03522" /db_xref="CDD:186576" SecStr 28..34 /sec_str_type="sheet" /note="strand 2" Het join(bond(39),bond(79),bond(84),bond(89)) /heterogen="( CU, 97 )" SecStr 40..44 /sec_str_type="sheet" /note="strand 3" SecStr 45..52 /sec_str_type="helix" /note="helix 1" Bond bond(52,85) /bond_type="disulfide" SecStr 58..62 /sec_str_type="sheet" /note="strand 4" SecStr 64..70 /sec_str_type="sheet" /note="strand 5" SecStr 72..79 /sec_str_type="sheet" /note="strand 6" SecStr 89..96 /sec_str_type="sheet" /note="strand
ORIGIN 1 avyvvggsgg wtfnteswpk gkrfragdil lfnynpsmhn vvvvnqggfs tcntpagakv 61 ytsgrdqikl pkgqsyficn fpghcqsgmk iavnal //
9. Đây là mô hình cấu trúc 3D của chuỗi protein trên
10. Chọn “ Genome: whole genome sequence” ta sẽ có thông tin về gen của cây dưa leo
11. Đây là trang liệt kê 20 trong tổng số 26 gen của cây dưa leo đã được phát hiện
12. Đây là trang thông tin về một loại gen của cây dưa leo mới được công bố ngày 20/08/2010, kí hiệu NC 014452 (Slide 22 đến slide 41)
Stichopus sp. SF-2010 mitochondrion, complete genome
GenBank: HM85368++3.2
FASTA Graphics
LOCUS HM853683 16257 bp DNA circular INV 22-FEB-2011
DEFINITION Stichopus sp. SF-2010 mitochondrion, complete genome.
ACCESSION HM853683
VERSION HM853683.2 GI:323690828
KEYWORDS .
SOURCE mitochondrion Stichopus sp. SF-2010
ORGANISM Stichopus sp. SF-2010 Eukaryota; Metazoa; Echinodermata; Eleutherozoa; Echinozoa; Holothuroidea; Aspidochirotacea; Aspidochirotida; Stichopodidae; Stichopus.
REFERENCE 1 (bases 1 to 16257)
AUTHORS Fan,S. and Hu,C. TITLE Complete mitochondrial genome of the sea cucumber Stichopus sp.
JOURNAL Unpublished
REFERENCE 2 (bases 1 to 16257)
AUTHORS Fan,S. and Hu,C.
TITLE Direct Submission
JOURNAL Submitted (24-JUL-2010) Laboratory of Marine Bio-resources Sustainable Utilization (LMB), South China Sea Institute of Oceanology, Chinese Academy of Sciences, Road Xingangxilu 164, Guangzhou, Guangdong 0086-510301, China
REFERENCE 3 (bases 1 to 16257)
AUTHORS Fan,S. and Hu,C. TITLE Direct Submission
JOURNAL Submitted (22-FEB-2011) Laboratory of Marine Bio-resources Sustainable Utilization (LMB), South China Sea Institute of Oceanology, Chinese Academy of Sciences, Road Xingangxilu 164, Guangzhou, Guangdong 0086-510301, China
REMARK Sequence update by submitter
COMMENT On Feb 22, 2011 this sequence version replaced gi:302633010.
FEATURES Location/Qualifiers
source 1..16257 /organism="Stichopus sp. SF-2010" /organelle="mitochondrion" /mol_type="genomic DNA" /specimen_voucher="weizhou-1" /db_xref="taxon:871532"
gene 1..1554 /gene="COX1"
CDS 1..1554 /gene="COX1" /codon_start=1 /transl_table=9 /product="cytochrome c oxidase subunit I" /protein_id="ADL59788.1" /db_xref="GI:302633011" /translation="MNLSRWLFSTNHKDIGTLYLIFGAWAGMVGTAMSVIIRTELAQP GSLLQDDQIYNVVVTAHALVMIFFMVMPIMIGGFGNWLIPLMIGAPDMAFPRMNNMSF WLVPPSFILLLASAGVESGVGTGWTIYPPLSSNIAHAGGSVDLAIFSLHLAGASSILA SINFITTIINMRTPGVTFDRLPLFVWSVFITAFLLLLSLPVLAGAITMLLTDRNINTT FFDPAGGGDPILFQHLFWFFGHPEVYILILPGFGMISHVIAHYSGKQEPFGYLGMVYA MVAIGILGFLVWAHHMFTVGMDVDTRAYFTAATMIIAVPTGIKVFSWMATLQGSKLVW ETPLLWALGFVFLFTVGGLTGIVLANSSIDVILHDTYYVVAHFHYVLSMGAVFAIFSG FTHWFPLFSGTALHPLWSKVQFFIMFIGVNLTFFPQHFLGLAGMPRRYSDYPDAYTTW NTVSSIGSIISLVGALFFLFLIWEAFASQRPVPAPSFVPASLEWQYESFPPSHHTFEE TPTTFLPIK"
tRNA 1560..1627 /product="tRNA-Arg“
gene 1628..1924 /gene="ND4L"
CDS 1628..1924 /gene="ND4L" /codon_start=1 /transl_table=9 /product="NADH dehydrogenase subunit 4L" /protein_id="ADL59789.1" /db_xref="GI:302633012" /translation="MNILSAILFSLFFLGVVGVIINRLHLLSLLLCLELLLVSLFLNI STWSQIHENFSSLNFSILLLTFSACEASAGLALMVSLSRSHNTDLLANINLLQS"
gene 1925..2614 /gene="COX2"
CDS 1925..2614 /gene="COX2" /codon_start=1 /transl_table=9 /product="cytochrome c oxidase subunit II" /protein_id="ADL59790.1" /db_xref="GI:302633013" /translation="MATWAQLGLQDASSPLMEELVYFHDYTLIILTLIIILVFYGLLS LLSSSFTNRFFLEGQELETIWTIVPALILIFIAFPSLQLLYLMDEVNNPFLTIKAIGH QWYWSYEYTDYHEIEFDSYMVPTSDLEVGQPRLLEVDNRLVLPFQNPIRILVSSADVL HSWAVPSLGVKMDAVPGRLNQTSFLINRTGLFYGQCSEICGANHSFMPIVIESVPFEN FENWITQNIEE"
tRNA 2637..2701 /product="tRNA-Lys"
gene 2702..2878 /gene="ATP8"
CDS 2702..2878 /gene="ATP8" /codon_start=1 /transl_table=9 /product="ATP synthase F0 subunit 8" /protein_id="ADL59791.1" /db_xref="GI:302633014" /translation="MPQLDLLWFLFNFLLAWLLVVTFLFCLLKQSWFSTSLENNEDIT SSAQKQDNQQSWTW"
gene 2872..3555 /gene="ATP6"
CDS 2872..3555 /gene="ATP6" /codon_start=1 /transl_table=9 /product="ATP synthase F0 subunit 6" /protein_id="ADL59792.1" /db_xref="GI:302633015" /translation="MVTSLFGQFSPDIVAFLPLQVVSSILALSWLLFIFPTNFFSGRV LYIWNTIRLEVMKIIFQNSKKTAAPWIPTLTVVFFIIISINLMGLFPYAFSITSHASF TYSLAVPLWMSVNILGFYLAFNSRLSHLVPQGTPSFLIPIMVLIETLSLIAQPIALGL RLAANLTAGHLLIFLLSTATWILASSPLLSFLTLIILGLLFILEVGVACIQAYVFTSL VNFYLDQNL"
gene 3558..4340 /gene="COX3"
CDS 3558..4340 /gene="COX3" /codon_start=1 /transl_table=9 /product="cytochrome c oxidase subunit III" /protein_id="ADL59793.1" /db_xref="GI:302633016" /translation="MTHQHPFHLVDQSPWPLIAAFGALIMTSGLVVWFHSGSIYLLIL GLIATSICAASWWRDVIREATFQGHHTLVVINGLRYGMILFITSEVCFFFAFFWAFFH SSLAPSVEIGVTWPPTGISPLNPFLVPLLNTAVLLSSGVTITWAHHSIIENNRAEAIQ ALGLTVALGLYFTGLQAWEYLDAPFTIADSVYGSTFFVATGFHGLHVIIGSTFLAVCF FRLINHHFSNHHHFGFEAAAWYWHFVDVVWLFLYVCIYWWGS"
tRNA complement(4339..4409) /product="tRNA-Ser"
gene 4442..4786 /gene="ND3"
CDS 4442..4786 /gene="ND3" /codon_start=1 /transl_table=9 /product="NADH dehydrogenase subunit 3" /protein_id="ADL59794.1" /db_xref="GI:302633017" /translation="MNLLIFFSLAIFLSLLLLIVGHFLPNRSLELEKASPYECGFDPI NSARLPFSFRFFLVAILFLIFDLEIALLFPIIPASNTNLNVLLPLSSIFLIILAAGLA YEWDQGGLEWAE"
gene 4791..6161 /gene="ND4"
CDS 4791..6161 /gene="ND4" /codon_start=1 /transl_table=9 /product="NADH dehydrogenase subunit 4" /protein_id="ADL59795.1" /db_xref="GI:302633018" /translation="MNDNLINLIPFLVNNIFSEALNMSSTILLSIFNDFFFSIHHQKS QNHQMIISQLPLCYSWSLSPANCLKMLTCPSMFLSAENTEENENESPNKISPPILNHS HFPYTDVLFLNNFIFLRLFRSHPHTDPNYHYTMSSNSSTSPSSYLLPFLHTVRLLTPT YLHYFYKKTNILPITHNNNTHNSPIILILHENMMVNNNYSILSNDANIWFPPMTPQGT RGSPNSRINDISSDTPNVSSLRYYSPENTIPSSNTSSSILIIFCCWGSLITSILCTRQ TDLKALIAYSSVGHMSLVSAWSLLFSEWSINGALILMIAHGLVSSALFALANVLYERT HTRNIFITRGFKTITVLLPLWWLIACAANLGLPPFPNLIGEIFIITNAISWSIFLTPL VGIATIFGAIYSLLIFQNTNTQKNANHTLSFLNVNPREHLLFFLHLFPLIGIIINPNS CMLWFK" tRNA 6152..6219 /product="tRNA-His"
tRNA 6222..6289 /product="tRNA-Ser"
gene 6290..8134 /gene="ND5"
CDS 6290..8134 /gene="ND5" /codon_start=1 /transl_table=9 /product="NADH dehydrogenase subunit 5" /protein_id="ADL59796.1" /db_xref="GI:302633019" /translation="MTLSSTTLNTSITLSIFIILILTSTFSNKNNSNVTSIRNANESY ICLLSMKTLSILAILNLLLFIVGSNTPISSSLLPWINNTSVSSILSINIDSSFIFFST VALLVTWSIVEFSIYYMHSDPFSSNFFRLLIIFLLNMLILTAAENLFLFFIGWEGVGF LSFLLISWWTTRTDANSSALQAIIYNRIGDLGIIVLLSVALFNLGSWSITNIYSLNGN EDQWWTSIILFAALIGAIGKSAQFGLHPWLPAAMEGPTPVSALLHSSTMVVAGVFLLI RITNILQPTSAFLNTTLVVGSLTAIFAATSAFRQHDIKKIIAYSTTSQLGLMMVSIGL NNPMVALFHICTHAFFKAMLFLCSGSIIHSFNNEQDLRKMSNISQSLPITASCLFLGS VALMGIPFLSGFYSKDLILELIIENPSNLFSFLLSSIATLLTAAYSFRIVTFCFSNNS SNASINPINEENQNLFFPLVRLAIGSIFVGWTMSLWIFNLPTLFPLSTIKNTPIIVTI IGATIASTTILFLNTNTTSNSFFSKTWFFTNTVHSSIAATTNLTAFSLSTRTLDRGWS ETLGAQGIFLSNNEATKKQQITQTGYIKQYLLSITLLGLLTATTLLII"
gene complement(8147..8635) /gene="ND6"
CDS complement(8147..8635) /gene="ND6" /codon_start=1 /transl_table=9 /product="NADH dehydrogenase subunit 6" /protein_id="ADL59797.1" /db_xref="GI:302633020" /translation="MVFYLFMLFLLLGSTLVFYSLSPYYAALGLMISSLFGCVLLVSL GLSFLALLLLLIYMGGMLVVFVYSSALSADRYPTISNLGEVMILFVLLSSWVFIIFED FLESGVSIVSNHVLLDLGSLCHLYDLGGFYLLIGGLALLVVLVLALVVSFGTSLSSLR AL"

gene 8644..9786 /gene="CYTB"
CDS 8644..9786 /gene="CYTB" /codon_start=1 /transl_table=9 /product="cytochrome b" /protein_id="ADL59798.1" /db_xref="GI:302633021" /translation="MTGPLRKSHPLFRIINGSLIDLPAPSNLSIWWNFGSLLGLCLIV QLITGTFLAMHYTADISLAFSSVSHICRDVNYGWLLRNIHANSASFFFICLYCHIGRG IYYGSYVNEETWNIGVILFLITMITAFVGYVFPWGQMSFWAATVITNLLSAVPYLGET LVQWVWGGFSVDNATLTRFFTFHFLFPFIIAALSIIHLSFLHQNGSNNPTGLDSSYDK TPFHVYFSTKDLVGFLFLLAGILALALLAPTALNDPENFIPANPLVTPTHIQPEWYFL FAYAILRSIPNKLGGVIALVAAVLVWFLVPILHTSSNQASTFRPLSQITFWILIATFL ILTWIGSQPVEEPFILIGQVASILYFSIFIVFFPTISILENKLLLR"
tRNA 9787..9857 /product="tRNA-Phe" rRNA 9858..10667 /product="small subunit ribosomal RNA“
tRNA 10678..10746 /product="tRNA-Glu" tRNA 10750..10819 /product="tRNA-Thr" misc_feature 10820..11493 /note="putative control region" tRNA 11494..11560 /product="tRNA-Pro"
tRNA complement(11557..11626) /product="tRNA-Gln" tRNA 11644..11712 /product="tRNA-Asn" tRNA 11721..11792 /product="tRNA-Leu" tRNA complement(11807..11874) /product="tRNA-Ala" tRNA 11876..11945 /product="tRNA-Trp" tRNA 11950..12015 /product="tRNA-Cys" tRNA complement(12017..12088) /product="tRNA-Val" tRNA complement(12100..12167) /product="tRNA-Asp" tRNA 12181..12248 /product="tRNA-Tyr" tRNA 12298..12366 /product="tRNA-Gly" tRNA 12369..12437 /product="tRNA-Met" tRNA 12451..12522 /product="tRNA-Leu" gene 12523..13494 /gene="ND1" CDS 12523..13494 /gene="ND1" /codon_start=1 /transl_table=9 /product="NADH dehydrogenase subunit 1" /protein_id="ADL59799.1" /db_xref="GI:302633022" /translation="MNVILFLLQALIFLVPILLSVAFLTLVERKVLGYMQFRKGPNVV GPYGLLQPFADALKLFIMETLKPSTASPYLFFFSPFLFLVLALILWSLIPAPVPTLNV NLSLLLILGISSLAVYALLGSGWASNSKYSLLGGIRAVAQTISYEISIGLILLSLIIW SGSFSLSEIVKTQNYCWMLLPHFPLFLMWLVSTLAETNRAPFDLTEGESELVSGYNVE YAGGPFALFFIAEYANIIFMNVLSTVLFLGAGSPFNETSILGPSCLAVKTIGLVFLFL WVRASYPRFRYDQLMHLTWKNYLPLSLGIFSMALAFLISSNASSSVI"
tRNA 13502..13569 /product="tRNA-Ile“
gene 13570..14604 /gene="ND2" CDS 13570..14604 /gene="ND2" /codon_start=1 /transl_table=9 /product="NADH dehydrogenase subunit 2" /protein_id="ADL59800.1" /db_xref="GI:302633023" /translation="MNRLIIILLLTSLLIGTSLVLLSSHWFPIWLGLELSTLSIIPLL NMNGHSRSTEATLKYFLVQAFSAALLLNGAVLNLWLSNSWSLAETSSPLCYYTISTAL IIKLGLAPCHFWFPDVLSGISFPNVIIIACWQKVAPMFLLLSLSSYISSEILILCSTL SVIVGGWGGLNQISTRKILAYSSISHLGWVTCASFFLPEVSFLLFLFYIINNTAILLI CNNSSLFSLSSLSKASIIPTNIILFSLALLSLGGLPPLGGFINKIVPLIIFSFNSSNI IIPLFLGGSLLNLFFYLRIVYNTSLTLFPQSSIILLSSRNTSSQTISSFLISILFPLC LFGLLLLPPV" rRNA 14605..16257 /product="large subunit ribosomal RNA"
ORIGIN
1 atgaacttaa gacgttgact tttttctaca aaacacaagg acattggaac tctttaccta
61 atttttgggg cgtgagcagg aatggtaggc acagcaatga gagtaattat tcgaacagag
121 ctagctcagc ctggatccct tcttcaagac gaccaaattt ataatgtagt tgtaacagcc
181 catgctttag tgatgatctt ttttatggta atgcctataa tgattggtgg atttggaaat
241 tgactaatac cattaatgat aggagccccc gatatggcat tcccacggat gaataaaatg
301 agcttttgac tagtcccccc ttcttttatt cttcttttag cctcagcggg agtcgaaaga
361 ggtgttggaa ctggatggac aatttacccc ccactttcga gaaacattgc gcacgccgga
421 gggtcagtgg atttggccat tttttcccta catttagctg gagcgtcttc catacttgct
481 tcaattaact ttatcactac aataataaaa atgcgaacac cgggagttac ttttgatcga
541 cttcctttat ttgtttggtc ggtttttata acagcattcc ttcttcttct tagactccca
601 gtcctagcag gagctataac tatgcttctc acagaccgaa aaataaaaac tacctttttt
661 gaccctgctg gagggggtga cccaatttta ttccaacatc ttttctgatt ttttgggcac
721 ccagaagttt acatcctcat tcttccagga tttggaatga tttcccacgt aatagctcac
781 tacagaggaa agcaagaacc ctttggctac ctaggaatgg tttacgccat ggtcgccatc
841 ggaattctag gtttcttagt ttgagcccac catatgttta cagtaggaat ggacgttgac
901 acccgagcct attttacagc agctacaatg attatagcgg taccaactgg tataaaggta
961 tttagctgaa tggccactct tcaaggttca aagctggtct gggaaacacc actactatgg
1021 gcattagggt ttgtcttttt atttacagtt ggcgggttaa caggaatagt acttgccaat
1081 tcctctattg acgttattct tcacgacacc tactatgttg tggctcactt ccactacgta
1141 ctatcaatgg gtgctgtgtt tgctattttt tccggcttca cacactgatt cccactgttt
1201 tcaggcacag cccttcatcc actttgatcg aaggtacaat ttttcattat gtttattggt
1261 gttaatctta ctttcttccc acaacatttt ctaggattag caggaatgcc acgacggtac
1321 tcagattacc cagacgccta cactacttga aaaactgttt cgtctatagg ctccattatc
1381 tctttagtag gtgccttatt ctttttattc ctaatttgag aagcctttgc ctcacagcga
1441 ccagtacccg caccttcttt tgtaccagct tccttagaat gacagtacga aagttttcct
1501 ccttcccacc atacctttga agaaactccc actacatttc tccctattaa gtaattaaaa
1561 gaagactagt ttaaaaaaca tgaagtttcg accttcaaat tcttagtaaa taacctaagg
1621 tcttcaaatg aaaattttat ctgccatttt attttccctt ttctttctag gagtagtagg
1681 cgttattata aaacgtcttc atcttttatc cctccttctt tgtctagaac ttctcttagt
1741 atccctattt ctaaaaatat ctacctgatc tcaaatccac gaaaacttct cctccctcaa
1801 attttccata cttctgctaa ccttctcagc ctgtgaagca agagctggtt tggccttaat
1861 ggtatctcta tcacgaagac ataaaacaga tcttcttgct aaaattaacc ttcttcaaag
1921 ttaaatggca acttgagcac aactaggtct acaagatgcg tcctctcctc tcatggaaga
1981 gcttgtttac tttcacgact acactcttat tatactaaca ctcataatta ttctagtatt
2041 ttatggtctc ttatcccttc tttcttcgtc ctttaccaaa cgattctttt tagaaggaca
2101 agaactagaa acaatatgga ccattgtacc agcactcatt ttaatcttta ttgccttccc
2161 ctcccttcaa ctcctttact taatggatga agtaaaaaac ccatttttga ctataaaggc
2221 catcggacat caatgatact ggagctacga atatactgat taccacgaaa tagaatttga
2281 ctcctatatg gtaccaacat cagacctaga agtaggtcaa cctcgactcc tagaagtaga
2341 caaccgacta gtcctccctt tccaaaatcc cattcgcatc ctagtatcgt cagcagacgt
2401 tctccactca tgagccgttc cttccctagg agtcaagatg gatgcagttc caggacgact
2461 caatcaaacc tcttttctca ttaatcgaac aggtttattt tatgggcaat gctcagaaat
2521 ttgcggtgcc aaccatagat ttatgcccat tgttattgaa tcagttccct ttgaaaactt
2581 tgagaactga atcacccaaa acatcgaaga ataaataaag ttaatcatat aatagacctt
2641 taggtagctt aaaaaaagcc tcagcctctt gatctgaaga tgggagatcc tccccctgga
2701 gatgccacaa ctagaccttt tatgatttct attcaaattt ttactagcat gacttttagt
2761 agtcactttt ctcttctgtc tacttaagca aagatgattc tctacctcct tagaaaacaa
2821 agaagacatc acttccagag ctcaaaagca ggacaaccaa caaagatgaa catggtaact
2881 agactttttg gtcaattttc cccagacatt gtagctttcc ttccccttca ggttgtttct
2941 tcaatcttag ccctaagatg actactattc atttttccaa ccaatttttt cagaggacga
3001 gtcttataca tatgaaacac cattcgactc gaagttatga agatcatttt ccaaaaaaga
3061 aagaagacag cagctccatg aatacccaca ctaacagtag tattttttat tataatctcg
3121 ataaacctaa tgggactttt tccttacgca ttctctatca ccagacacgc ttccttcact
3181 tacagcttag cagtcccgct ctgaatgagc gttaaaatac ttggctttta cctagcattt
3241 aaaagacgac tcaggcattt agtcccccaa ggaactccgt cattcctaat cccaataatg
3301 gtactaatag aaacactaag acttatagca cagcccatag cactcgggtt acgactagca
3361 gccaatttaa cagcaggaca cctcttaata tttcttctct caactgccac ttggatcttg
3421 gcttcttccc ctttactaag atttttaacg ctaataattt taggcctcct ttttatatta
3481 gaagtaggtg tagcttgcat ccaagcatat gtctttactt ccctagtaaa cttttatctt
3541 gatcaaaacc tataattatg acccatcaac accctttcca cctcgtagac caaagacctt
3601 gaccattaat agcagccttc ggagccttaa taatgacttc cgggctggta gtatggtttc
3661 attcaggaag aatttaccta ttaattctag gactcatagc aacctcgata tgcgcagcta
3721 gatgatggcg agacgttatt cgagaagcaa cctttcaagg acatcacact ttagtcgtta
3781 taaaaggatt acgttatgga atgatattat ttattacctc agaagtatgt tttttctttg
3841 cctttttctg agcatttttc cacagaagcc tagctccaag agttgaaatt ggagttacat
3901 gacctcctac gggaatctca cctctcaacc cttttctagt accattactt aacacagccg
3961 tcctcctttc ctctggagta acaataacat gagcacacca tagaattata gagaaaaatc
4021 gagcggaagc catacaagcc ctaggtctta cagttgcttt aggactttac tttaccggac
4081 tccaagcttg agaatacttg gatgcgccat ttaccatagc cgacagagtc tatggttcta
4141 ctttcttcgt agcgacagga tttcatggac ttcacgtcat cataggctcc acttttctag
4201 cagtatgctt ctttcggctg ataaaacacc acttttctaa ccatcatcac tttggtttcg
4261 aagcagcagc ctgatactga cacttcgtag acgttgtctg actattttta tacgtatgca
4321 tctactgatg aggatcataa gaggaggaag gaattaaacc ttcgtctatt gatttcaagt
4381 caaacgcaat aacattctgc cactcctcct ttctttatat aaataacaaa atttaagaca
4441 aatgaaactt ttaatcttct tttctcttgc catctttctt tcccttcttc tcctcattgt
4501 tggacacttc ttaccaaaac gctccctaga gttagaaaag gcatccccat acgaatgtgg
4561 attcgacccc attaactcag cccgccttcc attttcattt cggtttttct tagtagccat
4621 actattcctc atatttgact tagaaattgc cctcctcttc cccattatcc cagcctcaaa
4681 caccaaactg aaagttcttt tacccttatc ctctatcttc ctaataattt tagctgccgg
4741 cctagcctac gaatgagacc aaggaggtct ggagtgagca gaatagttaa atgaatgata
4801 accttattaa ccttatccct ttcctcgtta acaatatttt ctctgaagcg ctgaaaatga
4861 gcagcactat tctcctctct atctttaatg actttttttt ctctatccac catcaaaaga
4921 gccaaaacca ccaaatgatc atttctcagc taccactttg ctatagatgg tctctcagcc
4981 ccgctaattg tcttaagatg ttgacttgcc cctctatgtt tcttagcgca gaaaatactg
5041 aagaaaaaga gaaagaaaga ccaaaaaaga tttctcctcc tatcctcaac catagtcatt
5101 ttccttatac tgacgttctc ttccttaaaa attttatctt tcttcgtctg tttcgaagcc
5161 accctcatac cgaccctaat tatcattaca cgatgaggag caaaagtaga acgtctccaa
5221 gcaggtactt acttcctttt ctacacactg ttcggctcct tacccctact tatctccatt
5281 atttttataa gaagacaaaa attctcccta tcactcacaa taacaaaact cataaatccc
5341 caattatcct tattctccat gaaaatatga tggttaataa caattacagc attcttagta
5401 aagatgccaa tatatggttt ccacctatga ctccccaagg cacacgtgga agccccaata
5461 gccggatcaa tgatattagc agcgatactc ctaaagttag gaggctacgg tattattcgc
5521 ctgaaaacac tattcccaga agtaaaacct cttcaagaat tttaataatc ttctgctgct
5581 gaggttcact cataaccaga atattatgta cacggcaaac ggacctaaag gctctaatag
5641 cgtattcatc tgtaggtcac atgagacttg tttcagcatg atctctttta ttttccgaat
5701 gaagaattaa aggagcgcta atcctaatga tagcacacgg attagtctcc tcggccttgt
5761 tcgccctagc aaaagtactc tacgaacgaa cacatacccg taaaatattt attacacgag
5821 gatttaagac aattacagtc ctcctaccac tttgatgact catagcttgt gctgccaaac
5881 taggtcttcc cccctttcca aaactgatag gggaaatatt tataattaca aaagccataa
5941 gatggtcaat tttcctaacc ccattggtag gcatagccac tatatttgga gcaatttact
6001 ctcttctcat cttccaaaaa acaaaaaccc aaaagaaagc taaccatacg ctctcattcc
6061 tgaaagtcaa ccctcgagaa cacttattgt tttttcttca cttattccct ctaattggga
6121 taattataaa acccaactcg tgcatgttat gatttaagta gtttattaaa ataccaattt
6181 gtggcattgg agatggcgaa tacacaccgc ccttaaatcc agagcgctat gagaatattc
6241 ttggcctgct aagccctaga atccgtggtt taactccatg gagcgctcga tgaccctatc
6301 atccactacc ctaaaaactt cgataactct atcaatcttc attatactta tattaacctc
6361 taccttttcc aacaagaaca acagcaaagt aacatcaatt cgaaaagcca aagaaagcta
6421 tatttgtctc ctttccatga agaccctctc tatcctggcc atcttaaaat tattattatt
6481 tatagtagga tcaaaaactc caatatcatc ttctcttcta ccgtgaataa acaaaacaag
6541 agtaagatct atactgtcta tcaacattga tagaagattc atattcttct ccaccgtagc
6601 cttactagtc acatgatcga tagtggaatt ctcaatctac tacatgcaca gagacccgtt
6661 tagaagaaaa ttcttccgac ttttaataat ttttcttctt aaaatgctaa tactgaccgc
6721 agcagaaaac ctgtttttgt tcttcatagg atgagaagga gtaggatttc tttcattcct
6781 cctcataaga tgatgaacaa cacgaacaga tgcaaaatcc tccgctctcc aagccatcat
6841 ttacaaacga ataggagatc ttggaataat agtcctccta tccgttgccc tatttaaatt
6901 aggaagatga agaataacaa aaatctattc tctaaaagga aaagaagacc aatgatggac
6961 ctccataata ctttttgccg cgctgatagg ggcaataggc aagtcagcgc agtttggatt
7021 acatccatgg cttccagcag caatggaagg tccaacaccc gtatcagccc tcctccacag
7081 ctccacaatg gttgtagcag gcgtttttct acttatacgg ataaccaaca tactgcaacc
7141 cacttcagcc ttcctcaaaa ccaccctagt agtagggtcc ttaacagcca ttttcgcggc
7201 cacctcagct ttccgacaac acgacataaa gaagattatc gcttactcaa ccaccagaca
7261 actaggactt atgatggtat ccataggact aaaaaatcct atggttgccc tattccatat
7321 atgcacacac gcattcttta aggctatgtt gtttctttgc tcaggaagaa ttatacacag
7381 attcaacaaa gaacaggacc tacgaaagat gtcgaaaatt agacaaagtc tcccaataac
7441 cgcatcatgc ctatttctgg gaagagtagc cctcatggga atcccattcc taagagggtt
7501 ttactcaaag gacctaattc tagaactaat aatagaaaat ccttccaatt tattctcctt
7561 tctcctctct tccatcgcaa cactactaac agccgcctac agattccgga ttgtgacgtt
7621 ttgcttctca aaaaactcca gaaaagcttc tataaaccca ataaaagagg aaaaccaaaa
7681 actttttttt ccccttgtac gactagcaat aggttccatt tttgtaggct gaacaatgtc
7741 cttgtgaata ttcaatctac ccactttatt cccgctatca accataaaga aaacccccat
7801 tatagtaact attattgggg caacgatagc ttcaacaacc atcctgttcc taaaaacaaa
7861 aacaaccaga aaaagttttt tctcaaagac ctggttcttc accaaaacag tacattcctc
7921 tatagcagca acgaccaacc taacagcttt ctccctttcc acacggacac tagatcgtgg
7981 atgaagagag acactaggag cccaagggat cttcctctct aaaaaagagg caacaaagaa
8041 gcaacaaatc actcaaaccg ggtatattaa gcaatacctt ctctctataa cccttctagg
8101 cctcctaacg gcaaccacgc tcttaattat ttaagctcat caaatcttaa agagcccgaa
8161 gtcttctaag agaggtccca aaagaaacga ccagagccaa aaccaaaact actaataaag
8221 ccaaacctcc aataagtaag taaaaacccc ccaagtcgta aagatggcac aaactaccca
8281 ggtccaataa gacatgatta gaaactatac tcacgccgga ttcaaggaaa tcttcaaaga
8341 taatgaacac ccaagatgac aacaaaacaa acagtatcat aacctccccc agatttctaa
8401 ttgtaggata ccgatccgcc gacaaagcac tagaatagac aaacactact aacatacctc
8461 ccatgtagat aagcaacaaa agcaaagcca agaaacttaa ccctagtgaa accaacaaga
8521 cacagccaaa caaagatctt atcatcagac caagagcagc ataataggga gacaaactat
8581 aaaacactaa agttctcccg agaagaagaa acaacataaa caagtaaaat accatttata
8641 taaatgacag gaccacttcg aaagagccac ccacttttcc gaattataaa aggctcactt
8701 atagacttac cagccccgag caacctctca atctgatgaa aatttggttc actcctagga
8761 ctttgtctta tcgtacaatt aatcacagga acctttctgg cgatgcacta caccgcagac
8821 atttccttag cgttctcctc agtaagacac atctgtcgag acgtaaaata tggatgactc
8881 ctacgaaaaa tacacgccaa aagagcatcc ttctttttca tatgccttta ctgccacata
8941 ggtcgaggaa tttattatgg atcctacgta aaagaggaaa catgaaatat aggagtaatc
9001 ttatttctca ttacaatgat tacagcattc gtaggttacg tttttccttg aggtcagatg
9061 tccttttgag cagctaccgt tattaccaac ctcctctcag cggtaccata cctaggagaa
9121 accctcgtac agtgagtatg aggagggttc tcagtggaca atgccaccct aactcgattc
9181 tttacctttc actttttgtt tccattcatt atagccgccc tctccattat tcacctctcg
9241 tttctacacc agaaaggttc taacaatcca acagggctag acagaagata cgacaagaca
9301 ccattccacg tctatttctc aactaaggac ctagtaggct ttttatttct tcttgcagga
9361 atcctagcac tagcactcct agcccccacc gccctaaaag acccagaaaa cttcattccg
9421 gccaaacccc ttgtaacacc aacacacatt cagccagaat gatacttcct ctttgcttac
9481 gccatcctcc gctcaatccc taaaaagcta ggaggagtta tagcccttgt agcagccgtt
9541 ctcgtctgat ttttagtacc aatcctccac acttcctcta atcaagcctc tacgtttcgt
9601 cccctctccc aaatcacgtt ctgaattcta atagcaacat tcctcattct cacatgaata
9661 gggagacaac ccgtggagga gccatttata cttataggac aagtagcgtc aatactttac
9721 ttctctatat ttatagtctt cttcccaact atatcaatat tagaaaaaaa gcttctgcta
9781 cggtaaatta aagtagctta aggaaaaagc ttggcgttga aaatgccaga tcaaaggtta
9841 aactcctttc tttaatacaa gcttggttct agcttaaaat ttagctttcc tctatctgcc
9901 acatgcaagc tccgaagcga cccagcaaga tgaaaacact ttacaaaaac ttttcaacag
9961 ataagttctt acctaactac taatcataac ttgcggtcag cagtgcttaa ctttataaaa
10021 tttgggaaac caagaaatag acaagagaaa gaaggatggt taataacgtg ccagcagccg
10081 cggttacacg ttaagcctga gttaaattat accggtccaa agaaggaaag gctaaaaaga
10141 cttattttaa agagaactcc cagcagtagc aagctaaagc ccagaaaata aaataaaaaa
10201 gcccaaccaa aaaagcgaga aataaactgg aattagatac tccactatac tcgctggtaa
10261 actagacaga caccagagta gtacggtttg aactaaaact taaagaactt ggcggttttc
10321 tagccctttt cggaggagct tgtcattgaa ttgataaccc acaagggacc ccaccattct
10381 tagaacatca gcttgtatac catcgtcgtc agctcacctc caagaaagtg aacaaaaagg
10441 aataccccct acgtcagatc aaggtgcagc caatagaatg ggaatcgatg agctacttta
10501 cttgataaca gaggacttat cactgaaaag tgattctgaa agaggattcg acagtaattt
10561 tttaaagaaa tacccaatga aaccagctct agaatgcgca cacatcgccc gtcactctcg
10621 tcaaacgagg agaaaagtcg taacatagta ggtgtactgg aaagtgtacc tggtaaagcc
10681 tttatagttt agctaaaaca agggcttttc aagccctaga cccaggttaa caccctggta
10741 aaagtagaag ctgtaaaagt ttaggctaaa caaccagtct tgtaaactgg caaagaaagt
10801 taaactcttt cttacagcta cccaaaaact aacctaacaa gaacacccgg aaagcttcct
10861 taaactcttt aaaaataaaa accccccaac tcttaccact tacgattgac tgaaatccca
10921 agccaaaatt ttgacacttt ccctttctaa aaaagtgtca aaacctaaaa aaaagtcttc
10981 atttaacttt tacctttctt tcccctcccc tacaaaacgc cccctatgaa cccccccccc
11041 ctcttgttcg tcctctccct cttactccta ccgaaaaatt cataggactc caatcggggg
11101 aaaatctttc tctttcccta tttttcccct gttccgggct ccccacgctc tcactaccca
11161 aaccttatat gttcccaagg atgttgctcg gacaccttca ctcgcctgac cctctattaa
11221 ctgttttcac tatacctcgc aacgttttta ggggttctac acctccatta ccgtccccct
11281 aaaaacgctt gcttggtgtt caaacagtta atagagactc agtagttact caggttcgtt
11341 cttctttttt ttttgattct tttgggacta gattgcttat acctcctaac cggtttcaat
11401 aaagctgata ttgtatattg atctcacctt cttaaccgct cggtgtgacg ataaaaattg
11461 ataccgtcat ttatataaat ggtaaacctt ctacaaaggc tagtttatta aaatggctgc
11521 tttgggggca gcagatatag gaaaattcct atgcttttga aaaggtaaga aacgaactta
11581 catctaggga atcaaaatcc cttatttttc attaaaatac ttctcagagt ctaactgttc
11641 tcttgagttg aagctgaagc aagcatttgg ccgttaacca aaagaatgaa ggtttaactc
11701 ctttcaactc agaggggtaa gtttaaatag caaagaaagt aatgcaatag atttaggctc
11761 tataaccagg ggtgcaagtc ctcttttaaa ctcgccattt tcacaatgtg gtatccaaga
11821 agtaacttgg atcttctgct tgcaaagcgg atatttttgt taaactaaaa ccacggaaga
11881 cttaagttta ataaaactgt gagccttcaa agctcaaaac atagattaaa attctatagt
11941 ctttggaccg gtcttaaggt gtccaacata tttaattgca aattaaaagt tactggttag
12001 cgccagttaa gacttatcga ggcagtttga attgcacaaa catcggctcc gcgtaaagga
12061 gacacttaac tggtttagct atgcttcgaa ccttgctttc gagatctatg agattttaac
12121 tcatgtcttc ggtctgacag tccaacgttt ttcttaactt agatctccct cgcctttcct
12181 ggcaagatga ctgaaatagt agaggattgt aaattctctt atgtaagtgg aagccttact
12241 cttcgccaac aacggtgctg tcatttatat aaatgacaaa accaaacatg tcatgacaca
12301 tttttattat aactaatata cctaacttcc aattaggaga ccttggttca agcccaagaa
12361 aatgtaccag caaggtaagc taaacaagct tttgggctca tactccaaga atggtggtta
12421 aaatcctccc tttgcaaaag ccaacgaaaa accttagtag caaagtggtt aatgcagggg
12481 acctaagatc ccttaccaaa agttcaattc ttttttaagg ttgtgaaagt tattcttttt
12541 ctcctacaag ctttaatatt cctagtacct attctcttat cagtagcatt tttaactctg
12601 gtagaacgga aggtactggg ctatatgcaa ttccgtaagg gccccaaagt agttggccca
12661 tatggactac tccaaccctt tgctgacgcc ttaaagctat ttattatgga aaccctaaag
12721 ccttccacag cttcaccata cctattcttt ttctccccat ttctgtttct tgtgcttgcc
12781 ttaatccttt gatcgctgat cccagcccct gtcccgaccc taaaagttaa cctttcactt
12841 cttctcatcc ttggtatttc tagattagcc gtttacgccc ttctaggctc cgggtgagcc
12901 tctaaatcca agtactcact tctcggaggt attcgagcgg tagcacaaac catatcttat
12961 gaaataagaa tagggttaat tcttctatcc ctcattatat gatcaggttc attctctcta
13021 tcagaaatag tcaagaccca gaaatactgc tgaatgttat taccacattt tcccttattc
13081 ctaatgtgac tagtttctac cttagccgaa acgaaacgag cgccatttga cctaacagaa
13141 ggggaatcag aattggtctc aggttataac gtagagtatg ctggagggcc gttcgcactg
13201 tttttcatcg ccgaatacgc taaaataatc ttcatgaaag ttttaagaac cgttctattt
13261 ctaggagccg gaagaccatt taaagaaaca agaatcctag ggccttcatg tctagccgta
13321 aagacgatag gcttagtatt cttatttcta tgggtgcgag catcttaccc gcgatttcga
13381 tacgaccagc tcatgcactt aacctggaag aaatatctcc ctctttctct gggaatcttc
13441 tcaatggcac tagcatttct gatatcttcg aaagcctcat cttccgttat ctaagtgaaa
13501 agagtttact cctagcagga atacctgacc gataatcaga tagaagaggt taaagtcctc
13561 ttgaactcta tgaaacgtct cataattatt cttcttttga caagccttct tataggaacc
13621 agactggttc tactttctag acattggttc cccatttgac taggcctcga actaagaact
13681 ctctccataa ttcccttact aaacatgaaa ggacattctc gaagaacgga agccaccttg
13741 aagtactttt tagttcaagc tttcagagca gcgctccttc taaaaggagc tgtactcaac
13801 ctctgactct ctaaaagatg aagtctagcg gaaacctcat cccccctttg ctactacacc
13861 atatccacag ccctaattat taagctcgga ttagcaccgt gtcacttttg gttcccagac
13921 gttctaagag gtatttcatt tccgaaagta ataatcatcg catgttgaca aaaggtagca
13981 cccatgttcc tccttctatc cctgtcaaga tacatatcct cagagatact aattctctgc
14041 tctacactat cagtaattgt gggaggatga gggggattaa accagataag aactcgtaag
14101 atcttagcct actcttctat cagtcacctg gggtgagtga cttgtgcctc cttcttcctt
14161 cccgaagtat cttttttatt attcctgttc tacattatca aaaaaaccgc aattttactc
14221 atatgcaaaa acagatctct tttctccctt tcctcactaa gaaaggcaag aataatacca
14281 acaaaaatca ttctcttttc ccttgccctt ttgtccctgg gaggactccc tcctctcggc
14341 ggatttataa aaaagatagt acctttaata atcttttcat ttaaaagaag aaaaatcatt
14401 atcccactat tcttaggagg cagccttctc aacctcttct tttatttacg gatcgtctac
14461 aaaactagcc tgaccctctt tccacagaga agaataatcc tgctgtcttc ccgaaaaaca
14521 tcctcccaga ccatatcctc tttcttgata agaattcttt ttcccctttg tttatttggc
14581 ctacttttat taccccctgt ttaatctatt tatataaaga aattctgatc atagatgaaa
14641 tttttaaagt aataacttcc aattctctca caaatcttct actataaaag taccacaagg
14701 gaaaactgaa ataaagtgaa aattaaaagg agtaaaagag tctttcgtac cttttgtatt
14761 atggtttaac aagatttttc aggaaaattc tccaaagccc gaaacctaga gagctaaccc
14821 tcttcctctt aatcaagaga atcctcccac tgttacaaga gtggggaaag aggaagggtt
14881 agaaatgaaa tgttaaacgc gctaggtgat agctggtttc tcaagaaaga agtttaagct
14941 tcccctcctt accccctcta ttatgaacat tctcaatttt taacaagagc acctttaaag
15001 gaaggaaaga aagagggaga caagttcctc tttcaagaag gaaacaacca agagaccagg
15061 aaaggacaat aagatcatcc aaggtttatt atttaagtag gcctaaaagc tgccatcatt
15121 tcggaaagcg ttaaagctca taaaacgaaa taaccaaaaa tatctgtgtt cccacccaaa
15181 cctatcaaaa tggtattgag aaaaattata atgttaaaac gagtaagtat acaaaacagc
15241 tctgggcaac ggaaaactaa cccgatcaac caagaatagt tttggaaacc caagaaaaaa
15301 aacccttgct atccctccaa cacaggagcc cccagaacag tggaaaaagg aaaaggaagg
15361 aactaggcaa acctagagga tgactgttta ccaaaaacat agccccttgg aactcataag
15421 gggttaggcc tgcccagtgg gaagcacttt cctaaacggc cgcggtatct tgaccgtgca
15481 aaggtagcat aatcacttgt ctcttaaatg gggacccgta tgaatggctt ttcatccttt
15541 aactgtctcc ctttttttcc acacaaactc ctatttacgt gaagaagcgt acttcagaga
15601 gaaagacgag aagaccctgt cgagctttag cctaccctac tcacttacac tcatccttcc
15661 ccagggaaaa acctctgtag gccaggcttt ggttggggca accatggaga aaaaatatcc
15721 tccagttttc taggaagaga atcaactctc cttccccatt tttgagaacc aatacttttg
15781 gaaaacggaa aaagttaccg cagggataac agcgttatct tttctaagag cccttattga
15841 cgaaaaggat tgcgacctcg atgttggatt ggggtaacca gagggtgcag cagctcttta
15901 aggttggact gttcgtccat taattcccta catgatctga gttcagaccg acgtgagtca
15961 ggtcagcttc tatcttctat taattctccc tagtacgaaa ggaccggaaa aaagtcttaa
16021 atagttttca cgaaaagaca aaaaacaaaa aaaaaaaaaa aaaaaaagcc ttctatcgga
16081 aacacaatgt gactaaaaac ttctgccttt ttcaatcatt aggtttttcc atacaaaaaa
16141 atttaaaaaa aaatatacaa ggggtccccc tttggttttt tttaattttt caggaaaaat
16201 aaaaagtttt ttaactttag ccaggtgtta atatcaaatg cttttaactt aagaaac //
Trên đây là 3 ví dụ về việc sử dụng cơ sở dữ liệu NCBI tìm kiếm thông tin về cây dưa leo.
Với phương pháp này chúng ta còn có thể tìm nhiều thông tin khác về cây dưa leo và cả trên nhiều loài sinh vật khác.
* Một số tài liệu cũ có thể bị lỗi font khi hiển thị do dùng bộ mã không phải Unikey ...

Người chia sẻ: Võ Phương Thảo
Dung lượng: | Lượt tài: 1
Loại file:
Nguồn : Chưa rõ
(Tài liệu chưa được thẩm định)