lunes, 29 de noviembre de 2010

Microbios que empaquetan 200 gigas



Investigadores chinos logran que las bacterias almacenen y descifren los datos
JAVIER SAMPEDRO - Madrid - 27/11/2010
Las bases de datos de la próxima generación se podrán cultivar en placas de Petri. Científicos de la Universidad China de Hong Kong han creado un sistema para encriptar, almacenar y descifrar datos cuyo soporte no es un disco duro, sino secuencias de ADN (aggatcctg...) introducidas en una población de bacterias.

Las bases de datos de la próxima generación se podrán cultivar en placas de Petri. Científicos de la Universidad China de Hong Kong han creado un sistema para encriptar, almacenar y descifrar datos cuyo soporte no es un disco duro, sino secuencias de ADN (aggatcctg...) introducidas en una población de bacterias. Un gramo de estos microbios puede almacenar 200 gigas (gigabytes). Los discos duros no pasan de 4 gigas por gramo.

El sistema aprovecha que el ADN es, literalmente, un texto: una ristra de letras (bases, en la jerga) cuyo significado depende del orden exacto que ocupan en la ristra, como el significado de una novela depende del orden exacto de las letras en el texto.

Para almacenar el mensaje (una frase, por ejemplo, o una enciclopedia entera), los científicos empiezan por traducirlo a un lenguaje genético arbitrario. El ADN solo usa cuatro bases (a, g, c y t, por las iniciales de sus nombres químicos). Usando palabras de dos bases, solo salen 16 (4 elevado a 2) palabras distintas. Con palabras de tres bases, salen 64 (4 elevado a 3) palabras distintas: esta es justo la estructura del código genético real, donde cada palabra de tres bases significa un aminoácido (los bloques con que se construyen las proteínas).

Chan King Ming y sus colaboradores de la Universidad China de Hong Kong han usado palabras de cuatro bases, con lo que disponen de 256 (4 elevado a 4) palabras distintas. Han asignado cada una a una letra, signo de puntuación u otro símbolo de la escritura humana mediante un código convencional, como las tablas ASCII que se usan en los ordenadores.

Esta frase, que tiene 66 caracteres, ocuparía 264 bases en el ADN. Este artículo completo, de unos 4.000 caracteres, ocuparía 16.000 bases. La frase está en el límite de lo que puede almacenarse en una sola bacteria. El factor limitante no es el espacio disponible en la bacteria -cuyo genoma natural tiene millones de bases-, sino las limitaciones actuales de la técnica para sintetizar ristras artificiales de ADN, que no pasa de 200 o 300 bases.

Por esta razón, para almacenar el artículo completo -incluso después de comprimir el texto con los algoritmos convencionales que se usan en los pdf, jpg o mp3- se necesitarían seis bacterias. Y para almacenar 200 gigas haría falta un gramo de bacterias. Eso es un pequeño cultivo a nuestras escalas de tamaño, pero contiene cerca de un billón de microbios.

Los 200 gigas no son ningún límite de la técnica: basta aumentar el tamaño del cultivo bacteriano para incrementar el número de gigas que se pueden almacenar. Incluso a gran escala, la base de datos microbiana seguirá ocupando entre 50 y 100 veces menos que su equivalente en un disco duro.

Pero el sistema de Chan y sus colegas no se limita a almacenar la información. También se ocupa de encriptarla, esto es, de convertirla en un mensaje secreto que solo su propietario puede luego descifrar, o desencriptar. El encriptado consiste en una especie de barajado molecular que invierte de orientación y desordena el texto de ADN. Es el análogo de arrancar las páginas de un libro y barajarlas, o mejor, de cortar cada página en trocitos y arrojar al aire el confeti resultante.

Los científicos han aprovechado para esto una trituradora de libros que también existe en la naturaleza. Se trata de una enzima (recombinasa; las enzimas son proteínas que catalizan reacciones químicas) que reconoce ciertos pares de secuencias de ADN, las corta y las vuelve a pegar en la orientación inversa. Estas enzimas son las que usan los virus y otros elementos móviles, como los trasposones, o segmentos de ADN que se mueven por el genoma. Los investigadores han domesticado la enzima para que sirva a sus propósitos, pero la actividad no es nada insólito en la naturaleza.

Ese tipo de recombinasas son también el fundamento de un sistema ideado por estudiantes de la Universidad de Tokio que es capaz de resolver sudokus. Usa 16 tipos de una bacteria, cada uno con una identidad genética y un color distinto dependiendo del cuadradito que ocupe en la cuadrícula del sudoku (cuatro por cuatro). El intercambio de ADN entre unas cuadrículas y otras, mediado por la recombinasa, computa la solución con facilidad.

La adaptación de los microbios del mundo real a las nuevas condiciones del entorno utiliza rutinariamente mecanismos parecidos.

No hay comentarios:

Publicar un comentario

Cada vez que lees un artículo y no dejas un comentario, alguien mata a un gatito en alguna parte del mundo...