TIN SINH HỌC P29

Chia sẻ bởi Võ Phương Thảo | Ngày 23/10/2018 | 75

Chia sẻ tài liệu: TIN SINH HỌC P29 thuộc Bài giảng khác

Nội dung tài liệu:

Giảng viên hướng dẫn: TS. Võ Văn Toàn
Học viên thực hiện: Ngô Kim Khuê
Lớp: SHTN - K12
CÁC PHƯƠNG PHÁP TÌM KIẾM DỮ LIỆU SINH HỌC
VÀ ỨNG DỤNG TRONG VIỆC THỰC HIỆN ĐỀ TÀI
Tính đến năm 2004, đã có khoảng 500 cơ sở dữ liệu sinh học công cộng và thương mại. Những cơ sở dữ liệu này thường lưu trữ dữ liệu bộ gene (genomics) và protein (proteomics). Thông tin của chúng là trình tự nucleotide của gene hoặc trình tự amino acid của protein. Ngoài ra chúng còn chứa thông tin về chức năng, cấu trúc, vị trí trên nhiễm sắc thể hay những tác động lâm sàng của các đột biến cũng như sự tương tự của các trình tự sinh học được tìm thấy.

1.1. Các cơ sở dữ liệu sinh học
CƠ SỞ DỮ LIỆU SINH HỌC TRÊN
MẠNG INTERNET
Chúng ta có thể tìm kiếm các dữ liệu sinh học trên mạng
Internet thông qua các cơ sở dữ liệu sinh học và các công cụ
tìm kiếm.


Cơ sở dữ liệu trình tự nguyên thủy
Gồm các cơ sở dữ liệu lớn sau:

1. DDBJ (DNA DataBase of Japan)
http://www.ddbj.nig.ac.jp/Welcome-e.html
2. EMBL Nucleotide DB (European Molecular Biology Laboratory )
http://www.ebi.ac.uk/embl/
3. NCBI (National Center for Biotechnology Information)
http://www.ncbi.nlm.nih.gov/







Cơ sở dữ liệu biến đổi
Tập hợp thông tin từ những nguồn khác nhau và có nhiều tiện ích mới thuận tiện cho người dùng.

Ví dụ:
1. Entrez (Nat.Center for Biotechn.Inf.)
http://www.ncbi.nlm.nih.gov/gquery/gquery.fcgi
2. euGenes (Univ. of Indiana)
http://iubio.bio.indiana.edu:8089/


Cơ sở dữ liệu trình tự protein
1. SWISS-PROT Protein knowledgebase
(Swiss Institute of Bioinformatics)
http://www.expasy.org/sprot/
2. UCSC Genome Bioinformatics
(Genome Browser and Tools (UCSC) )
http://genome.ucsc.edu/
3. Ensembl Genome Browser
(Sanger Institute and EBI)
http://www.ensembl.org/index.html




4. PEDANT Protein Extraction, Description
and Analysis Tool (Forschungszentrum f.
Umwelt & Gesundheit)
http://pedant.gsf.de/
5. PROSITE Database of Protein Families
and Domains
http://www.expasy.org/prosite/
6. DIP Database of Interacting Proteins
(Univ. of California)
http://dip.doe-mbi.ucla.edu/dip/Main.cgi


7. Pfam Protein families database of alignments and HMMs (Sanger Institute)
http://www.sanger.ac.uk/resources/software/

8. SignalP Server for signal peptide prediction
http://www.cbs.dtu.dk/services/SignalP/
Cơ sở dữ liệu cấu trúc
1. PDB Protein Data Bank (Research Collaboratory for
Structural Bioinformatics (RCSB))
http://www.rcsb.org/pdb/home/home.do
2. SCOP Structural Classification of Proteins
http://scop.mrc-lmb.cam.ac.uk/scop/
3. SWISS-MODEL Server and Repository for Protein
Structure Models
http://swissmodel.expasy.org/
4. ModBase Database of Comparative Protein Structure Models (Sali Lab, UCSF)
http://modbase.compbio.ucsf.edu/modbase-cgi/index.cgi
Cơ sở dữ liệu Microarray
1. ArrayExpress (European Bioinformatic Institute)
http://www.ebi.ac.uk/arrayexpress/
2. Gene Expression Omnibus (National Center for Biotechnology Information)
http://www.ncbi.nlm.nih.gov/projects/geo/
3. Maxd (Univ. of Manchester)
http://www.bioinf.man.ac.uk/microarray/maxd/index.html
4. SMD (Univ. of Stanford)
http://smd.stanford.edu/
5. GPX (Scottish Centre for Genomic Technology and Informatics)
http://www.ed.ac.uk/schools-departments/pathway-medicine
Cơ sở dữ liệu chuyên biệt
1. CGAP Cancer Genes (National Cancer Institute)
http://cgap.nci.nih.gov/Genes/GeneFinder

2. DBGET H.sapiens (Univ. of Kyoto)
http://www.genome.jp/dbget-bin/www_bfind?h.sapiens

3. Ensembl Genome BrowserAnnotated Genomes
(EMBL-EBI and Sanger Inst.)
http://www.ensembl.org/index.html


4. KEGG Functional Db (Univ. of Kyoto)
http://www.genome.jp/kegg/
5. MGI Mouse Genome (Jackson Lab.)
http://www.informatics.jax.org/
6. NCBI-UniGene (National Center for
Biotechnology Information)
http://www.ncbi.nlm.nih.gov/sites/entrez?db=unigene
7. OMIM Inherited Diseases (National Center
for Biotechnology Information)
http://www.ncbi.nlm.nih.gov/sites/entrez?db=omim


1.2. Các công cụ tìm kiếm
Phổ biến nhất hiện nay gồm có:
www.google.com
www.altavista.com
www.infoseek.com
www.excite.com
www.nlsearch.com


NCBI

EMBL

Giao diện một số trang web tìm kiếm và cơ sở dữ liệu sinh học trên mạng Internet
www.google.com
www.altavista.com

www.excite.com

www.nlsearch.com
1.3. Một số trang web về sinh học
- Về động vật học
http://jas.fass.org/search.dtl
- Chẩn đoán phân tử
http://jmd.amjpathol.org/search.dtl
- Virus học
http://jvi.asm.org/search.dtl
- Sinh lý thực vật
http://www.plantphysiol.org/search.dtl
- Tế bào thực vật
http://www.plantcell.org/search.dtl
- Sinh học phân tử và tiến hóa
http://mbe.oupjournals.org/search.dtl
- Tế bào mầm
http://stemcells.alphamedpress.org/search.dtl
- Thú y
http://www.vetpathology.org/search.dtl
- Nghiên cứu về ARN
http://www.rnajournal.org/search.dtl
- Nghiên cứu về acid nucleic
http://nar.oupjournals.org/search.dtl


2. NGUYÊN TẮC TÌM KIẾM THÔNG
TIN TRÊN MẠNG INTERNET
2.1. XÁC ĐỊNH THÔNG TIN CẦN TÌM
Để có nhiều thông tin hơn, ta phải dịch nội dung chính của vấn đề sang tiếng Anh vì dữ liệu trên Internet là tiếng Anh.
Ví dụ: Loài mối.
 Isoptera
2.2. XÁC ĐỊNH TỪ KHÓA
Để tìm kiếm thông tin chúng ta phải xác định một từ hay một nhóm từ khóa mang nội dung chủ yếu hay quan trọng nhất của vấn đề quan tâm.
Từ khóa: Isoptera
2.3. CHỌN CÔNG CỤ TÌM KIẾM
- Google Patent Search -Tìm kiếm bằng sáng chế.
- Google Scholar - Công cụ tìm kiếm dành cho học giả.
- Google Books - Công cụ tìm kiếm sách.
2.4. LỌC THÔNG TIN
- Đọc lướt nhanh rồi đối chiếu với nội dung ta cần tìm. Nếu đúng là thông tin ta cần tìm thì lưu lại trang web.
- Từ khóa càng chuyện biệt thì kết quả tìm kiếm càng gần với thông tin ta quan tâm.

TÌM KIẾM CÁC BÀI BÁO BẰNG PUBMED

Thẻ giới hạn phạm vi tìm kiếm
[AB]: Tóm tắt – Abstract
[AU]: Tên tác giả – Author name
[DP]: Ngày xuất bản – Publication date
[CY]: Nơi phát xuất bản tạp chí – Country
[IP]: Số phát hành của tạp chí
[IS]: International Standard Serial Number of Journal
(ISSN)
[LA]: Ngôn ngữ của bài báo – Language
[PG]: Số trang – Page number
[TI]: Tựa đề – Title word
[VI]: Tập (số) – Volume
Để tìm chính xác các từ khóa, chúng ta có thể sử dụng toán tử Boolean (AND, OR, NOT) và dùng thẻ (tag) trong ngoặc vuông ([]) đặt sau từ khóa để giới hạn phạm vi tìm kiếm từ khóa đó.
Ví dụ: “ DNA microarray” [ti] AND Curtis [au] 2002[dp]
 Nghĩa là: Tìm bài báo có chữ DNA microarray (trong tựa đề bài báo) của tác giả Curtis năm 2002.
Lưu ý: Để tìm một cụm từ (phrase) thì chúng ta phải được đặt trong dấu ngoặc kép (“”). Entrez tự động hiểu có toán tử AND giữa các từ cách nhau bằng khoảng trắng (không nằm trong dấu ngoặc kép).
3. ỨNG DỤNG TRONG THỰC HIỆN ĐỀ TÀI
Nhập từ khóa “Isoptera” vào khung tìm kiếm.
Nhấn nút “Tìm với Google”.
Kết quả tìm kiếm hiện ra. Chọn kết quả nào có nội dung sát nội dung cần tìm nhất và lưu lại.
TÌM KIẾM TÀI LIỆU BẰNG GOOGLE
Kết quả tìm kiếm
Nhập từ khóa
Nhấn Tìm kiếm
Kết quả tìm kiếm
TÌM KIẾM VỚI
GOOGLE SCHOLAR
Nhập từ khóa
Nhấn Tìm kiếm
TÌM KIẾM VỚI
GOOGLE BOOKS
Nhập từ khóa
Nhấn Tìm kiếm
Kết quả tìm kiếm
TÌM KIẾM NÂNG CAO VỚI GOOGLE
Chỉ tìm định dạng file Word (có thể tùy chọn các định dạng file khác).
Từ khóa
Ví dụ: Tìm kiếm cấu trúc enzym cellulase của trùng roi sống trong ruột Mối.


TÌM KIẾM TRÊN PDB PROTEIN DATA BANK
http://www.pdb.org/pdb/home/home.do

Nhập từ khóa
Kết quả tìm kiếm hiện ra. Chọn kết quả cần tìm.
Các tùy chọn với kết quả tìm kiếm
Click chuột để xem hình ảnh của protein cần tìm
Click chuột để xem hình ảnh của protein cần tìm
Tải về máy tính để xem bằng phần mềm
Mở xem file trực tuyến
Mở xem file PDB trực tuyến

Tải về máy
1
2
4
3
Tải hình về máy tính
Tải hình về máy tính

TÌM KIẾM CÁC BÀI BÁO BẰNG PUBMED http://www.ncbi.nlm.nih.gov/sites/entrez?db=pubmed

Tìm kiếm với từ khóa Isoptera trong tựa đề các bài báo xuất bản năm 2011. Sử dụng thẻ giới hạn [ti] và [dp].
Từ khóa: Isoptera [ti] 2011 [dp]

Kết quả tìm kiếm hiện ra. Chọn kết quả cần tìm và lưu lại.
Kết quả
Nhấn tìm kiếm
Từ khóa
* Một số tài liệu cũ có thể bị lỗi font khi hiển thị do dùng bộ mã không phải Unikey ...

Người chia sẻ: Võ Phương Thảo
Dung lượng: | Lượt tài: 1
Loại file:
Nguồn : Chưa rõ
(Tài liệu chưa được thẩm định)