Dung ADN mã hóa cuốn sách > 5 MG bit

Chia sẻ bởi Phạm Huy Hoạt | Ngày 16/10/2018 | 20

Chia sẻ tài liệu: Dung ADN mã hóa cuốn sách > 5 MG bit thuộc Tư liệu tham khảo

Nội dung tài liệu:

Dùng AND mã hóa một cuốn sách 5,27 megabit
Ngày nay, với sự phát triển của công nghệ thông tin kĩ thuật số, người ta có thể lưu trữ cả một thư viện đồ sộ hành trăm gian kho sách chỉ trong một gian phòng bằng các ổ cứng, đĩa DVD, đĩa flash…. Nhưng như thế vẫn chưa tiện và chưa bền vì các chất liệu từ tính có thể bị phá hủy.
Các nhà khoa học đã nghĩ đến loại công cụ, chất liệu khác, đó là AND. ADN có cấu tạo gồm các nucleotide, và ít nhất trên lí thuyết mỗi nucleotide có thể dùng để mã hóa 2 bit dữ liệu. Điều này có nghĩa là mật độ lưu trữ là một triệu gigabit trên mỗi millimet khối, và chỉ cần 4 gram ADN trên lí thuyết là có thể mã hóa toàn bộ dữ liệu số được tạo ra mỗi năm. Mật độ này dày đặc hơn nhiều so với các phương tiện lưu trữ kĩ thuật số như ổ đĩa flash và bền hơn, vì các chuỗi ADN có thể được đọc lúc hàng nghìn năm sau khi chúng đã được mã hóa.
Một cơ thể sống hàng tỷ tỷ thông tin cho hàng triệu triệu tế bào còn được AND lưu trữ, và hàng tỷ năm sau vẫn còn tra cứu được từ chỗi AND đó. Vậy sao không thể tận dụng nó !
Vấn đề đang được các nhà khoa học nghiêm túc nghiên cứu. Một đội các nhà khoa học ở Mĩ vừa mã hóa thành công một quyển sách 5,27 megabit bằng các vi chip ADN, sau đó họ đã đọc quyển sách bằng sự xâu chuỗi ADN. Thí nghiệm của họ cho thấy ADN có thể dùng để lưu trữ dài hạn thông tin kĩ thuật số.
George Church và Sriram Kosuri thuộc Viện Kĩ thuật Xúc tiến Sinh học Wyss thuộc trường Harvard, và các cộng sự, đã mã hóa quyển sách “Tái sinh” của Church gồm khoảng 53.400 từ vào những chuỗi ADN, cùng với 11 hình ảnh ở định dạng JPG và một chương trình JavaScript. Dữ liệu lần này cao gấp 1.000 lần dữ liệu đã mã hóa ở ADN trước đây.


Hình minh họa Ghi & đọc thông tin qua ADN
Sự thành công của thí nghiệm trên đặt chiến lược mã hóa dữ liệu vào những chuỗi ADN ngắn thay vì những chuỗi ADN dài, và như vậy sẽ làm giảm khó khăn và chi phí của việc đọc và ghi dữ liệu. Tiến sĩ Kosuri cho biết quá trình trên tương tự với việc ghi dữ liệu trên ổ đĩa cứng, trong đó dữ liệu được ghi thành những đơn vị nhỏ gọi là sector.
Lần đầu tiên họ đã chuyển định dạng một quyển sách, một chương trình và các hình ảnh sang định dạng HTML, sau đó dịch thông tin này thành một chuỗi gồm 5,27 triệu số 0 và 1, và sau đó 5,27 megabit này được xâu chuỗi thành đoạn của các nucleotide dài 96 bit, sử dụng một ADN nucleotide cho một bit. Các nucleotide base A và C mã hóa cho 0, còn G và T thì mã hóa cho 1. Mỗi đơn vị còn chứa một địa chỉ 19 bit mã hóa vị trí của đơn vị đó trong toàn chuỗi. Các bản sao bội của mỗi đơn vị được tổng hợp để giúp hiệu chỉnh sai sót.
Sau khi quyển sách và những thông tin khác được mã hóa vào ADN, các giọt ADN được gắn vào những con chip ma trận micro để lưu trữ. Các con chip đó được giữ ở 4oC trong ba tháng, sau đó đem đi hòa tan và xâu chuỗi. Mỗi bản sao của mỗi đơn vị nucleotide được xâu chuỗi lên tới 3.000 lần nên có thể đạt tới sự liên ứng. Theo cách này, họ giảm sai số bit trong 5,27 megabit xuống còn 10 bit.
Thao tác đó, được mô tả trong một bài báo đăng trên tạp chí Science, không thể dùng để ghi-lại dữ liệu (ghi lần hai) nhưng có thể dùng để lưu trữ dữ liệu rất lâu. Một ưu điểm của việc sử dụng ADN là mật độ thông tin lưu trữ có thể lớn hơn nhiều, nhưng một ưu điểm lớn nữa là ADN là một phân tử sinh học sẽ luôn luôn có thể đọc trên phương diện sinh học mà không cần một thiết bị đặc biệt nào như máy CD hay DVD, những cái có thể trở nên sớm lỗi thời.
Nhược điểm chính của hệ này là hiện nay các công nghệ dùng để tổng hợp và xâu chuỗi ADN là quá tốn kém nên không thực tế cho công dụng hàng ngày. Một vấn đề nữa là trong khi ADN đã được xâu chuỗi từ những nguồn như các xác ướp hàng nghìn năm tuổi, nhưng ADN có xu hướng bị phân đoạn, và cần có thêm nghiên cứu để cải tiến tính ổn định của ADN trong hàng thế kỉ hoặc lâu hơn.

ST & chỉnh lí bổ sung: PHH – 3-2013 ----- Nguồn 123physics (thuvienvatly.com)

* Một số tài liệu cũ có thể bị lỗi font khi hiển thị do dùng bộ mã không phải Unikey ...

Người chia sẻ: Phạm Huy Hoạt
Dung lượng: 292,60KB| Lượt tài: 0
Loại file: rar
Nguồn : Chưa rõ
(Tài liệu chưa được thẩm định)