TIN SINH HỌC P35
Chia sẻ bởi Võ Phương Thảo |
Ngày 23/10/2018 |
48
Chia sẻ tài liệu: TIN SINH HỌC P35 thuộc Bài giảng khác
Nội dung tài liệu:
Giảng viên hướng dẫn : TS. Võ Văn Toàn
Học viên thực hiện : Trương Quang Nam
Lớp : Sinh học thực nghiệm K12
CÁC PHƯƠNG PHÁP TÌM KIẾM DỮ LIỆU SINH HỌC
VÀ ỨNG DỤNG TRONG VIỆC THỰC HIỆN ĐỀ TÀI
1. CÁC CÔNG CỤ TÌM KIẾM VÀ CƠ
SỞ DỮ LIỆU SINH HỌC TRÊN
MẠNG INTERNET
1.1. Các công cụ tìm kiếm
Các công cụ tìm kiếm được sử dụng phổ biến hiện nay như:
- www.google.com
- www.altavista.com
- www.infoseek.com
- www.excite.com
- www.nlsearch.com
www.google.com
www.altavista.com
www.infoseek.com
www.excite.com
www.nlsearch.com
Cơ sở dữ liệu sinh học có vai trò quan trọng trong việc hỗ trợ các nhà khoa học tìm hiểu và khám phá những hiện tượng sinh học: từ cấu trúc của các phân tử sinh học và sự tương tác giữa chúng đến toàn bộ quá trình biến dưỡng của sinh vật và về sự tiến hóa của các loài. Kiến thức này giúp con người dễ dàng hơn trong cuộc cuộc chiến chống bệnh tật, hỗ trợ việc phát triển thuốc dược liệu và trong việc khám phá mối quan hệ giữa các loài trong lịch sử tiến hóa.
1.2. Các cơ sở dữ liệu sinh học
a. Cơ sở dữ liệu trình tự nguyên thủy
Những ngân hàng dữ liệu này trình bày những hiểu biết hiện nay của con người về những trình tự của tất cả các sinh vật. Chúng trao đổi thông tin lưu trữ với nhau và là nguồn tài nguyên thông tin của nhiều cơ sở dữ liệu khác.
1. DDBJ (DNA DataBase of Japan)
http://www.ddbj.nig.ac.jp/Welcome-e.html
2. EMBL Nucleotide DB (European Molecular Biology Laboratory )
http://www.ebi.ac.uk/embl/
3. NCBI (National Center for Biotechnology Information)
http://www.ncbi.nlm.nih.gov/
NCBI
(National Center for Biotechnology Information)
EMBL
(European Molecular Biology Laboratory)
DDBJ
(DNA DataBase of Japan)
b. Cơ sở dữ liệu biến đổi
Cơ sở dữ liệu biến đổi là cơ sở dữ liệu tập hợp thông tin từ những nguồn khác nhau và thường tạo ra nhiều tiện ích mới thuận tiện cho người dùng.
1. Entrez (Nat.Center for Biotechn.Inf.)
http://www.ncbi.nlm.nih.gov/gquery/gquery.fcgi
2. euGenes (Univ. of Indiana)
http://iubio.bio.indiana.edu:8089/
c. Cơ sở dữ liệu chuyên biệt
1. CGAP Cancer Genes (National Cancer Institute)
http://cgap.nci.nih.gov/Genes/GeneFinder
2. DBGET H.sapiens (Univ. of Kyoto)
http://www.genome.jp/dbget-bin/www_bfind?h.sapiens
3. Ensembl Genome BrowserAnnotated Genomes
(EMBL-EBI and Sanger Inst.)
http://www.ensembl.org/index.html
4. KEGG Functional Db (Univ. of Kyoto)
http://www.genome.jp/kegg/
5. MGI Mouse Genome (Jackson Lab.)
http://www.informatics.jax.org/
6. NCBI-UniGene (National Center for
Biotechnology Information)
http://www.ncbi.nlm.nih.gov/sites/entrez?db=unigene
7. OMIM Inherited Diseases (National Center
for Biotechnology Information)
http://www.ncbi.nlm.nih.gov/sites/entrez?db=omim
d. Cơ sở dữ liệu trình tự protein
1. SWISS-PROT Protein knowledgebase
(Swiss Institute of Bioinformatics)
http://www.expasy.org/sprot/
2. UCSC Genome Bioinformatics
(Genome Browser and Tools (UCSC) )
http://genome.ucsc.edu/
3. Ensembl Genome Browser
(Sanger Institute and EBI)
http://www.ensembl.org/index.html
4. PEDANT Protein Extraction, Description
and Analysis Tool (Forschungszentrum f.
Umwelt & Gesundheit)
http://pedant.gsf.de/
5. PROSITE Database of Protein Families
and Domains
http://www.expasy.org/prosite/
6. DIP Database of Interacting Proteins
(Univ. of California)
http://dip.doe-mbi.ucla.edu/dip/Main.cgi
7. Pfam Protein families database of alignments and
HMMs (Sanger Institute)
http://www.sanger.ac.uk/resources/software/
8. SignalP Server for signal peptide prediction
http://www.cbs.dtu.dk/services/SignalP/
e. Cơ sở dữ liệu cấu trúc
1. PDB Protein Data Bank (Research Collaboratory for
Structural Bioinformatics (RCSB))
http://www.rcsb.org/pdb/home/home.do
2. SCOP Structural Classification of Proteins
http://scop.mrc-lmb.cam.ac.uk/scop/
3. SWISS-MODEL Server and Repository for Protein
Structure Models
http://swissmodel.expasy.org/
4. ModBase Database of Comparative Protein Structure Models (Sali Lab, UCSF)
http://modbase.compbio.ucsf.edu/modbase-cgi/index.cgi
f. Cơ sở dữ liệu Microarray
1. ArrayExpress (European Bioinformatic Institute)
http://www.ebi.ac.uk/arrayexpress/
2. Gene Expression Omnibus (National Center for Biotechnology Information)
http://www.ncbi.nlm.nih.gov/projects/geo/
3. Maxd (Univ. of Manchester)
http://www.bioinf.man.ac.uk/microarray/maxd/index.html
4. SMD (Univ. of Stanford)
http://smd.stanford.edu/
5. GPX (Scottish Centre for Genomic Technology and Informatics)
http://www.ed.ac.uk/schools-departments/pathway-medicine
1.3. Một số trang Web về Công nghệ sinh học
và các công trình nghiên cứu sinh học
- Sinh học phân tử và tiến hóa
http://mbe.oupjournals.org/search.dtl
- Tế bào mầm
http://stemcells.alphamedpress.org/search.dtl
- Thú y
http://www.vetpathology.org/search.dtl
- Nghiên cứu về ARN
http://www.rnajournal.org/search.dtl
- Nghiên cứu về acid nucleic
http://nar.oupjournals.org/search.dtl
- Về động vật học
http://jas.fass.org/search.dtl
- Chẩn đoán phân tử
http://jmd.amjpathol.org/search.dtl
- Virus học
http://jvi.asm.org/search.dtl
- Sinh lý thực vật
http://www.plantphysiol.org/search.dtl
- Tế bào thực vật
http://www.plantcell.org/search.dtl
2. NGUYÊN TẮC TÌM KIẾM THÔNG
TIN TRÊN MẠNG INTERNET
2.1. XÁC ĐỊNH THÔNG TIN CẦN TÌM
Để có nhiều thông tin hơn, ta phải dịch nội dung chính của vấn đề sang tiếng Anh vì dữ liệu trên Internet là tiếng Anh.
Ví dụ: Bệnh ở tôm sú
Penaeus monodon
2.2. XÁC ĐỊNH TỪ KHÓA
Để tìm kiếm thông tin chúng ta phải xác định một từ hay một nhóm từ khóa mang nội dung chủ yếu hay quan trọng nhất của vấn đề quan tâm.
Từ khóa: Penaeus monodon
2.3. CHỌN CÔNG CỤ TÌM KIẾM
- Google Patent Search -Tìm kiếm bằng sáng chế.
- Google Scholar - Công cụ tìm kiếm dành cho học giả.
- Google Books - Công cụ tìm kiếm sách.
2.4. LỌC THÔNG TIN
- Đọc lướt nhanh rồi đối chiếu với nội dung ta cần tìm. Nếu đúng là thông tin ta cần tìm thì lưu lại trang web.
- Từ khóa càng chuyện biệt thì kết quả tìm kiếm càng gần với thông tin ta quan tâm.
TÌM KIẾM CÁC BÀI BÁO BẰNG PubMed http://www.ncbi.nlm.nih.gov/sites/entrez?db=pubmed
Thẻ giới hạn phạm vi tìm kiếm
[AB]: Tóm tắt – Abstract
[AU]: Tên tác giả – Author name
[DP]: Ngày xuất bản – Publication date
[CY]: Nơi phát xuất bản tạp chí – Country
[IP]: Số phát hành của tạp chí
[IS]: International Standard Serial Number of
Journal (ISSN)
[LA]: Ngôn ngữ của bài báo – Language
[PG]: Số trang – Page number
[TI]: Tựa đề – Title word
[VI]: Tập (số) – Volume
Để tìm chính xác các từ khóa, chúng ta có thể sử dụng toán tử Boolean (AND, OR, NOT) và dùng thẻ (tag) trong ngoặc vuông ([]) đặt sau từ khóa để giới hạn phạm vi tìm kiếm từ khóa đó.
Ví dụ: “ DNA microarray” [ti] AND Curtis [au] 2002[dp]
Nghĩa là: Tìm bài báo có chữ DNA microarray (trong tựa đề bài báo) của tác giả Curtis năm 2002.
Lưu ý: Để tìm một cụm từ (phrase) thì chúng ta phải được đặt trong dấu ngoặc kép (“”). Entrez tự động hiểu có toán tử AND giữa các từ cách nhau bằng khoảng trắng (không nằm trong dấu ngoặc kép).
3. ỨNG DỤNG TRONG THỰC HIỆN ĐỀ TÀI
Nhập từ khóa “Orchid diseases”.
Nhấn nút “Tìm với Google”
TÌM KIẾM TÀI LIỆU BẰNG GOOGLE
Kết quả tìm kiếm hiện ra. Chọn kết quả nào có nội dung sát nội dung cần tìm nhất và lưu lại.
Kết quả tìm kiếm
Kết quả tìm kiếm
TÌM KIẾM NÂNG CAO VỚI Google
Chỉ tìm định dạng file pdf
Từ khóa
TÌM KIẾM VỚI Google Scholar
Nhập từ khóa
Nhấn Tìm kiếm
TÌM KIẾM VỚI Google Books
Nhập từ khóa
Nhấn Tìm kiếm
Sách cần tìm
TÌM KIẾM CÁC BÀI BÁO QUA TẠP CHÍ CHUYÊN NGÀNH
http://www.plantcell.org/search.dtl
Tìm theo tựa đề
Xuất hiện trang tìm kiếm
Đánh từ khóa cần tìm vào mục Title. Sau đó nhấn Submit
Kết quả tìm kiếm sẽ hiện ra. Chọn tài liệu nào có nội dung cần tìm.
Tải văn bản về máy tính dưới dạng file pdf
Xem tóm tắt
Xem đầy đủ văn bản
Ví dụ: Tìm kiếm cấu trúc các protein của nấm Fusarium
(gây bệnh héo trên phong lan).
TÌM KIẾM DỮ LIỆU CẤU TRÚC PROTEIN TRÊN PDB Protein Data Bank
http://www.pdb.org/pdb/home/home.do
Nhập từ khóa
Kết quả tìm kiếm hiện ra. Chọn kết quả cần tìm.
Các tùy chọn với kết quả tìm kiếm
Mở xem file online
Tải về máy tính để xem bằng phần mềm
Click chuột để xem hình ảnh của protein cần tìm
Hình cấu trúc của protein sau khi click vào hình nhỏ
Click chuột để tải hình về máy tính
TÌM KIẾM CÁC BÀI BÁO BẰNG PubMed http://www.ncbi.nlm.nih.gov/sites/entrez?db=pubmed
Tìm kiếm với từ khóa penaeus monodon trong tựa đề các bài báo. Sử dụng thẻ giới hạn [ti].
Kết quả tìm kiếm hiện ra. Chọn kết quả cần tìm và lưu lại.
Học viên thực hiện : Trương Quang Nam
Lớp : Sinh học thực nghiệm K12
CÁC PHƯƠNG PHÁP TÌM KIẾM DỮ LIỆU SINH HỌC
VÀ ỨNG DỤNG TRONG VIỆC THỰC HIỆN ĐỀ TÀI
1. CÁC CÔNG CỤ TÌM KIẾM VÀ CƠ
SỞ DỮ LIỆU SINH HỌC TRÊN
MẠNG INTERNET
1.1. Các công cụ tìm kiếm
Các công cụ tìm kiếm được sử dụng phổ biến hiện nay như:
- www.google.com
- www.altavista.com
- www.infoseek.com
- www.excite.com
- www.nlsearch.com
www.google.com
www.altavista.com
www.infoseek.com
www.excite.com
www.nlsearch.com
Cơ sở dữ liệu sinh học có vai trò quan trọng trong việc hỗ trợ các nhà khoa học tìm hiểu và khám phá những hiện tượng sinh học: từ cấu trúc của các phân tử sinh học và sự tương tác giữa chúng đến toàn bộ quá trình biến dưỡng của sinh vật và về sự tiến hóa của các loài. Kiến thức này giúp con người dễ dàng hơn trong cuộc cuộc chiến chống bệnh tật, hỗ trợ việc phát triển thuốc dược liệu và trong việc khám phá mối quan hệ giữa các loài trong lịch sử tiến hóa.
1.2. Các cơ sở dữ liệu sinh học
a. Cơ sở dữ liệu trình tự nguyên thủy
Những ngân hàng dữ liệu này trình bày những hiểu biết hiện nay của con người về những trình tự của tất cả các sinh vật. Chúng trao đổi thông tin lưu trữ với nhau và là nguồn tài nguyên thông tin của nhiều cơ sở dữ liệu khác.
1. DDBJ (DNA DataBase of Japan)
http://www.ddbj.nig.ac.jp/Welcome-e.html
2. EMBL Nucleotide DB (European Molecular Biology Laboratory )
http://www.ebi.ac.uk/embl/
3. NCBI (National Center for Biotechnology Information)
http://www.ncbi.nlm.nih.gov/
NCBI
(National Center for Biotechnology Information)
EMBL
(European Molecular Biology Laboratory)
DDBJ
(DNA DataBase of Japan)
b. Cơ sở dữ liệu biến đổi
Cơ sở dữ liệu biến đổi là cơ sở dữ liệu tập hợp thông tin từ những nguồn khác nhau và thường tạo ra nhiều tiện ích mới thuận tiện cho người dùng.
1. Entrez (Nat.Center for Biotechn.Inf.)
http://www.ncbi.nlm.nih.gov/gquery/gquery.fcgi
2. euGenes (Univ. of Indiana)
http://iubio.bio.indiana.edu:8089/
c. Cơ sở dữ liệu chuyên biệt
1. CGAP Cancer Genes (National Cancer Institute)
http://cgap.nci.nih.gov/Genes/GeneFinder
2. DBGET H.sapiens (Univ. of Kyoto)
http://www.genome.jp/dbget-bin/www_bfind?h.sapiens
3. Ensembl Genome BrowserAnnotated Genomes
(EMBL-EBI and Sanger Inst.)
http://www.ensembl.org/index.html
4. KEGG Functional Db (Univ. of Kyoto)
http://www.genome.jp/kegg/
5. MGI Mouse Genome (Jackson Lab.)
http://www.informatics.jax.org/
6. NCBI-UniGene (National Center for
Biotechnology Information)
http://www.ncbi.nlm.nih.gov/sites/entrez?db=unigene
7. OMIM Inherited Diseases (National Center
for Biotechnology Information)
http://www.ncbi.nlm.nih.gov/sites/entrez?db=omim
d. Cơ sở dữ liệu trình tự protein
1. SWISS-PROT Protein knowledgebase
(Swiss Institute of Bioinformatics)
http://www.expasy.org/sprot/
2. UCSC Genome Bioinformatics
(Genome Browser and Tools (UCSC) )
http://genome.ucsc.edu/
3. Ensembl Genome Browser
(Sanger Institute and EBI)
http://www.ensembl.org/index.html
4. PEDANT Protein Extraction, Description
and Analysis Tool (Forschungszentrum f.
Umwelt & Gesundheit)
http://pedant.gsf.de/
5. PROSITE Database of Protein Families
and Domains
http://www.expasy.org/prosite/
6. DIP Database of Interacting Proteins
(Univ. of California)
http://dip.doe-mbi.ucla.edu/dip/Main.cgi
7. Pfam Protein families database of alignments and
HMMs (Sanger Institute)
http://www.sanger.ac.uk/resources/software/
8. SignalP Server for signal peptide prediction
http://www.cbs.dtu.dk/services/SignalP/
e. Cơ sở dữ liệu cấu trúc
1. PDB Protein Data Bank (Research Collaboratory for
Structural Bioinformatics (RCSB))
http://www.rcsb.org/pdb/home/home.do
2. SCOP Structural Classification of Proteins
http://scop.mrc-lmb.cam.ac.uk/scop/
3. SWISS-MODEL Server and Repository for Protein
Structure Models
http://swissmodel.expasy.org/
4. ModBase Database of Comparative Protein Structure Models (Sali Lab, UCSF)
http://modbase.compbio.ucsf.edu/modbase-cgi/index.cgi
f. Cơ sở dữ liệu Microarray
1. ArrayExpress (European Bioinformatic Institute)
http://www.ebi.ac.uk/arrayexpress/
2. Gene Expression Omnibus (National Center for Biotechnology Information)
http://www.ncbi.nlm.nih.gov/projects/geo/
3. Maxd (Univ. of Manchester)
http://www.bioinf.man.ac.uk/microarray/maxd/index.html
4. SMD (Univ. of Stanford)
http://smd.stanford.edu/
5. GPX (Scottish Centre for Genomic Technology and Informatics)
http://www.ed.ac.uk/schools-departments/pathway-medicine
1.3. Một số trang Web về Công nghệ sinh học
và các công trình nghiên cứu sinh học
- Sinh học phân tử và tiến hóa
http://mbe.oupjournals.org/search.dtl
- Tế bào mầm
http://stemcells.alphamedpress.org/search.dtl
- Thú y
http://www.vetpathology.org/search.dtl
- Nghiên cứu về ARN
http://www.rnajournal.org/search.dtl
- Nghiên cứu về acid nucleic
http://nar.oupjournals.org/search.dtl
- Về động vật học
http://jas.fass.org/search.dtl
- Chẩn đoán phân tử
http://jmd.amjpathol.org/search.dtl
- Virus học
http://jvi.asm.org/search.dtl
- Sinh lý thực vật
http://www.plantphysiol.org/search.dtl
- Tế bào thực vật
http://www.plantcell.org/search.dtl
2. NGUYÊN TẮC TÌM KIẾM THÔNG
TIN TRÊN MẠNG INTERNET
2.1. XÁC ĐỊNH THÔNG TIN CẦN TÌM
Để có nhiều thông tin hơn, ta phải dịch nội dung chính của vấn đề sang tiếng Anh vì dữ liệu trên Internet là tiếng Anh.
Ví dụ: Bệnh ở tôm sú
Penaeus monodon
2.2. XÁC ĐỊNH TỪ KHÓA
Để tìm kiếm thông tin chúng ta phải xác định một từ hay một nhóm từ khóa mang nội dung chủ yếu hay quan trọng nhất của vấn đề quan tâm.
Từ khóa: Penaeus monodon
2.3. CHỌN CÔNG CỤ TÌM KIẾM
- Google Patent Search -Tìm kiếm bằng sáng chế.
- Google Scholar - Công cụ tìm kiếm dành cho học giả.
- Google Books - Công cụ tìm kiếm sách.
2.4. LỌC THÔNG TIN
- Đọc lướt nhanh rồi đối chiếu với nội dung ta cần tìm. Nếu đúng là thông tin ta cần tìm thì lưu lại trang web.
- Từ khóa càng chuyện biệt thì kết quả tìm kiếm càng gần với thông tin ta quan tâm.
TÌM KIẾM CÁC BÀI BÁO BẰNG PubMed http://www.ncbi.nlm.nih.gov/sites/entrez?db=pubmed
Thẻ giới hạn phạm vi tìm kiếm
[AB]: Tóm tắt – Abstract
[AU]: Tên tác giả – Author name
[DP]: Ngày xuất bản – Publication date
[CY]: Nơi phát xuất bản tạp chí – Country
[IP]: Số phát hành của tạp chí
[IS]: International Standard Serial Number of
Journal (ISSN)
[LA]: Ngôn ngữ của bài báo – Language
[PG]: Số trang – Page number
[TI]: Tựa đề – Title word
[VI]: Tập (số) – Volume
Để tìm chính xác các từ khóa, chúng ta có thể sử dụng toán tử Boolean (AND, OR, NOT) và dùng thẻ (tag) trong ngoặc vuông ([]) đặt sau từ khóa để giới hạn phạm vi tìm kiếm từ khóa đó.
Ví dụ: “ DNA microarray” [ti] AND Curtis [au] 2002[dp]
Nghĩa là: Tìm bài báo có chữ DNA microarray (trong tựa đề bài báo) của tác giả Curtis năm 2002.
Lưu ý: Để tìm một cụm từ (phrase) thì chúng ta phải được đặt trong dấu ngoặc kép (“”). Entrez tự động hiểu có toán tử AND giữa các từ cách nhau bằng khoảng trắng (không nằm trong dấu ngoặc kép).
3. ỨNG DỤNG TRONG THỰC HIỆN ĐỀ TÀI
Nhập từ khóa “Orchid diseases”.
Nhấn nút “Tìm với Google”
TÌM KIẾM TÀI LIỆU BẰNG GOOGLE
Kết quả tìm kiếm hiện ra. Chọn kết quả nào có nội dung sát nội dung cần tìm nhất và lưu lại.
Kết quả tìm kiếm
Kết quả tìm kiếm
TÌM KIẾM NÂNG CAO VỚI Google
Chỉ tìm định dạng file pdf
Từ khóa
TÌM KIẾM VỚI Google Scholar
Nhập từ khóa
Nhấn Tìm kiếm
TÌM KIẾM VỚI Google Books
Nhập từ khóa
Nhấn Tìm kiếm
Sách cần tìm
TÌM KIẾM CÁC BÀI BÁO QUA TẠP CHÍ CHUYÊN NGÀNH
http://www.plantcell.org/search.dtl
Tìm theo tựa đề
Xuất hiện trang tìm kiếm
Đánh từ khóa cần tìm vào mục Title. Sau đó nhấn Submit
Kết quả tìm kiếm sẽ hiện ra. Chọn tài liệu nào có nội dung cần tìm.
Tải văn bản về máy tính dưới dạng file pdf
Xem tóm tắt
Xem đầy đủ văn bản
Ví dụ: Tìm kiếm cấu trúc các protein của nấm Fusarium
(gây bệnh héo trên phong lan).
TÌM KIẾM DỮ LIỆU CẤU TRÚC PROTEIN TRÊN PDB Protein Data Bank
http://www.pdb.org/pdb/home/home.do
Nhập từ khóa
Kết quả tìm kiếm hiện ra. Chọn kết quả cần tìm.
Các tùy chọn với kết quả tìm kiếm
Mở xem file online
Tải về máy tính để xem bằng phần mềm
Click chuột để xem hình ảnh của protein cần tìm
Hình cấu trúc của protein sau khi click vào hình nhỏ
Click chuột để tải hình về máy tính
TÌM KIẾM CÁC BÀI BÁO BẰNG PubMed http://www.ncbi.nlm.nih.gov/sites/entrez?db=pubmed
Tìm kiếm với từ khóa penaeus monodon trong tựa đề các bài báo. Sử dụng thẻ giới hạn [ti].
Kết quả tìm kiếm hiện ra. Chọn kết quả cần tìm và lưu lại.
* Một số tài liệu cũ có thể bị lỗi font khi hiển thị do dùng bộ mã không phải Unikey ...
Người chia sẻ: Võ Phương Thảo
Dung lượng: |
Lượt tài: 1
Loại file:
Nguồn : Chưa rõ
(Tài liệu chưa được thẩm định)