Bai giang tin sinh hoc 2

Chia sẻ bởi Lê Khắc Đường | Ngày 23/10/2018 | 45

Chia sẻ tài liệu: Bai giang tin sinh hoc 2 thuộc Bài giảng khác

Nội dung tài liệu:

TÌM KIẾM TRÌNH
TỰ SINH HỌC VÀ ĐĂNG KÝ TRÌNH TỰ TRÊN CƠ SỞ DỮ LIỆU
Mục tiêu của bài học
Có khả tìm kiếm được những trình tự sinh học như DNA, RNA, Protein.




Đăng ký những trình tự đã nghiên cứu được lên Cơ sở dữ liệu sinh học bằng phần mềm Sequin.



Tìm kiếm trình tự sinh học
2
Nguyên tắc trong giải trình tự
Phương pháp Sanger: là phương pháp dựa trên sự tổng hợp gián đoạn DNA.


Dựa theo phương pháp này chúng ta có thể xác định được trình tự nucleotide của DNA hay RNA (ATGC…TTT)

3
Tìm kiếm trình tự sinh học
Nhiễm sắc thể, DNA, Gene, Nucleotide
Giới thiệu môn học
4
Gửi trình tự lên Genebank của NCBI


Trình tự đã giải
Giới thiệu môn học
5
Đưa vào cơ sở dữ liệu sinh học:

-NCBI
- Các cơ sở dữ liệu khác



Sequin


Nguyên tắc tìm kiếm trình tự sau khi đã giải trình tự
1.Tìm bằng từ khóa: 2.Công cụ tìm kiếm
-Mã số truy cập
-Tên (gene hay Protein)
-GI
-Độ dài trình tự
-Trọng lượng phân tử
-Tên tác giả giải trình tự




3. Lọc trình tự

6
Tìm kiếm trình tự sinh học
Kết quả cần tìm
Tìm kiếm trình tự sinh học
7
Tìm kiếm trình tự sinh học qua NCBI
Click
Tìm kiếm trình tự sinh học
8
Tìm kiếm trình tự DNA
Tìm kiếm trình tự qua mã số truy cập
Tìm kiếm trình tự sinh học
9


Mã số truy cập của một trình tự là mã số do các nhà quản trị CSDLSH đặt cho một trình tự, thường có dạng :
8 ký tự : 2 chữ và 6 số ví dụ như AY690640
6 ký tự : 1 chữ và 5 dố ví dụ như U20068
TÌM KIẾM TRÌNH TỰ SINH HỌC QUA MÃ SỐ TRUY CẬP
Tìm kiếm trình tự sinh học
10
Kết quả tìm trình tự DNA qua mã số truy cập
Giới thiệu môn học
11
Tìm kiếm trình tự sinh học
12

Tìm kiếm trình tự qua tên gene

Tìm kiếm trình tự sinh học
13
Cách lấy trình tự theo định dang FASTA
Giới thiệu môn học
14
Định dạng FASTA
FASTA là một giải thuật bắt cặp trình tự được David J. Lipman và William R. Pearson miêu tả lần đầu tiên vào năm 1985 (Rapid and sensitive protein similarity searches).
Nhiều phần mềm tin sinh học cần dữ liệu trình tự gene hoặc protein theo kiểu định dạng FASTA như ví dụ minh hoạ dưới đây:
>tên trình tự gattctcacttggtctgctgcaaggacgcggaccattaaaactgttcatggcccttgtggcgttctcgtttcctaacaatcccaccaacagcagggatactaaaaagatggggaacgatcaaaaaatcaaaagctatcaatgtcttgagagggttcaggaaagagattggaaggatgctgaacatcttgaacaggagacgcaggacagcaggcgtgattgttatgttgattccacagcgatggcgttccatttaaccacacgcaatgg



Tìm kiếm trình tự sinh học
15
Một số mã số truy cập của RefSeq database
1. mRNAs and Proteins
NM_123456 Curated mRNA
NP_123456 Curated Protein
NR_123456 Curated non-coding RNA
XM_123456 Predicted mRNA
XP_123456 Predicted Protein
XR_123456 Predicted non-coding RNA

2. Chromosome
NC_123455 Microbial replicons, organelle
genomes, human chromosomes
4. Assemblies
NT_123456 Contig
Tìm kiếm trình tự sinh học
16


Ví dụ 1: NM_123456 Curated mRNA

Tìm kiếm trình s sinh học
17
NM_123456
V í dụ 2: NC_12345
Giới thiệu môn học
18
Kết quả tìm kiếm bộ gene
Giới thiệu môn học
19
Thẻ giới hạn phạm vi tìm kiếm DNA
[ALL] : Tất cả các trường tìm kiếm
[ACCN]: Mã số truy cập của trình tự - Accession number
[GI] : Số gi
[AUTH] : Tên tác giả giải trình tự- author name
[PDAT] : Ngày trình tự được chỉnh sửa hay ngày trình tự được cập nhật (update) – publication date
[ORGN] : Sinh vật chứa trình tự đó - organism
[TITL] :Định nghĩa trình tự trong mẫu tin – title
[SLEN] :Chiều dài của trình tự - Sequence length
[GENE] : Tên gene
 
Tìm kiếm trình tự môn học
20
BÀI TẬP
Chúng ta thực tập tìm kiếm trình tự gen có tên là ST GENE và lấy đoạn nucleotide theo định dạng FASTA.
Câu hỏi 1: Kết quả có bao nhiêu mục tìm thấy ?
Trả lời 1:

Câu hỏi 2: Trình tự DNA này dài bao nhiêu ?
Nó mã hoá cho gen gì?
Công trình này được đăng tải bởi tạp chí nào?
Tác giả là ai?
Trả lời 2:
Giới thiệu môn học
21
Tìm kiếm trình tự protein
Tìm kiếm trình tự sinh học
22
Tìm kiếm trình tự qua tên sinh vật
Giới thiệu môn học
23
Định dạng trình tự dạng FASTA
Giới thiệu môn học
24
Thẻ giới hạn phạm vi tìm kiếm trình tự protein
[ALL] : Tất cả các trường tìm kiếm
[ACCN] : Mã số truy cập của trình tự - Accession number
[GI] : Số gi
[AUTH] :Tên tác giả giải trình tự- author name
[PDAT] : Ngày trình tự được chỉnh sửa hay ngày trình tự được cập nhật (update) – publication date
[ORGN] : Sinh vật chứa trình tự đó - organism
[TITL] : Định nghĩa trình tự trong mẫu tin – title
[SLEN] : Chiều dài của trình tự - Sequence length
[PROT] : Tên protein – Protein name
[MOLWT] : Trọng lượng phân tử protein

Giới thiệu môn học
25
Bài tập
Chúng ta thực tập tìm kiếm trình tự protein là độc tố bền nhiệt có tên là ST (ST toxin).
Câu hỏi: Có bao nhiêu mục bài liên quan đến trình tự protein yêu cầu được tìm thấy
Trình tự protein ST toxin chủ yếu liên quan đến loài nào ?
Đặc điểm của protein này?
Trả lời:
Cách mã hóa dùng trong trình tự amino acid
Giới thiệu môn học
26
Tìm kiếm trình tự sinh học
27
Phần mềm Sequin
Tìm kiếm trình tự sinh học
28
Giới thiệu môn học
29
Các download phần mềm sequin trong NCBI
Giới thiệu môn học
30
Cách đăng ký trình tự đã được giải mã qua
phần mềm sequin
Giới thiệu môn học
31
Chọn Genebank (NCBI)
Bước 1: Điền thông tin
Giới thiệu môn học
32
Tìm kiếm trình tự sinh học
33
Giới thiệu môn học
34
Giới thiệu môn học
35
Giới thiệu môn học
36
Giới thiệu môn học
37
Giới thiệu môn học
38
Giới thiệu môn học
39
Giới thiệu môn học
40
Giới thiệu môn học
41
Giới thiệu môn học
42
Giới thiệu môn học
43
Giới thiệu môn học
44
BÀI TẬP

Tìm kiếm trình tự gene mà bạn muốn, sau đó đăng ký lên trên gene bank bằng sequen
Tìm kiếm trình tự sinh học
45
ĐỪNG NGỦ TRONG LỚP

Giới thiệu môn học
46
* Một số tài liệu cũ có thể bị lỗi font khi hiển thị do dùng bộ mã không phải Unikey ...

Người chia sẻ: Lê Khắc Đường
Dung lượng: | Lượt tài: 1
Loại file:
Nguồn : Chưa rõ
(Tài liệu chưa được thẩm định)