Capítulo 7 Genética de Poblaciones Microbianas

7.1 Genómica y mecanismos de herencia en procariotas

  • Una diferencia genética importante entre eucariotas y procariotas es que mientras que en los primeros gran parte de los genomas son diploides o poliploides, en los segundos la mayor parte son monoploides (haploides), aunque con excepciones importantes en ambos grupos.

  • Mientras que en los eucariotas los cromosomas son lineales, lo que implica un gran problema respecto a la conservación de los extremos, en el caso de los procariotas la mayor parte de las especie poseen cromosomas circulares, sin bordes libres por lo tanto.

  • Los mecanismos clásicos de intercambio genético de las bacterias incluyen la transducción, la transformación y la conjugación.

  • En la transducción un bacteriófago se adsorbe sobre la superficie bacteriana para inyectar su material genético en la célula. Dependiendo de si se trata de un fago virulento o moderado, el programa genético puede derivar en un ciclo lítico donde se producirán múltiples copias del mismo y luego se producirá la lisis celular o el fago puede integrar su ADN en el genoma bacteriano, transformándose en un profago. En este proceso el fago puede arrastrar material genético adicional de unas bacterias a otras.

  • En la transformación, luego de entrar en un estado particular conocido como competencia, las células bacterianas son capaces de captar ADN libre de doble cadena e incoroporarlo en su genoma. En las bacterias Gram-positivas la bacteria no discrimina entre ADN homólogo y heterólogo, aunque la incorporación depende de la similaridad de secuencias, mientras que en el caso de las Gram-negativas la bacteria reconoce la diferencia y en general solo incorporá material de la misma especie o de especies estrechamente relacionadas.

  • En la congujación, existen bacterias (\(F^+\)) que poseen un plásmido conjugativo, que lleva a la formación de varios pili en la superficie que le permiten hacer contacto con bacterias con ausencia de ese plásmido (\(F^-\)). Luego de ese contacto, la despolimerización en la base de los pelos lleva a que las bacterias se acerquen y hagan conatcto íntimo, formándose un puente citoplasmático por donde se transfiere el material genético del plásmido.

  • Una diferencia importante entre eucariotas y procariotas es en lo que hace a la organización interna de los cromosomas y la arquitectura de los genes. Mientras que en eucariotas los genes están generalmente organizados en una estructura de exones separados por intrones, además de poseer secuencias reguladoras que pueden encontrarse a miles de pares de bases, en el caso de los procariotas la arquitectura de los genes es extremadamente sencilla, por lo general solo una secuencia codificantes continua, con regulación en la región inmediata upstream.



7.2 Dinámica de las poblaciones bacterianas

  • En el caso del modelo exponencial discreto de crecimiento poblacional

\[\begin{equation} n(t+1)=(1-d)(1+b)\ n(t) \end{equation}\]

  • Si definimos \(R=(1-d)(1+b)\) como el factor reproductivo (el número de individuos sobreviviente por padre), entonces la ecuación de recursión se simplifica a

\[\begin{equation} n(t+1)=R\ n(t) \end{equation}\]

  • Normalmente, para la mejor interpretación de la dinámica de la población nos interesa ver el cambio del número de individuos entre dos generaciones, es decir \(\Delta n\), que es

\[\begin{equation} \Delta n=n(t+1)\ -\ n(t)=R\ n(t)\ -\ n(t)=n(t)\ (R-1) \end{equation}\]

Además, \(r=(R-1)=b-d-bd\) es el cambio per cápita en el número de individuos de una generación a la siguiente.

  • En el caso del modelo exponencial en tiempo continuo, tenemos que

\[\begin{equation} \frac{dn}{dt}=(b-d)\ n = r_c\ n \tag{7.1} \end{equation}\]

que con \(r_c=b-d\) la tasa neta de crecimiento para el modelo continuo.

  • La solución de la ecuación diferencial que representa la tasa de cambio en la población nos da el tamaño poblacional en función del tiempo \(t\), la tasa de crecimiento \(r_c\) y el número inicial de individuos y tiene la forma

\[\begin{equation} n(t)=n(0) e^{r_c\ t} \end{equation}\]

  • El modelo exponencial no da cuenta adecuadamente de las condiciones de restricción a las que normalmente están sujetas las poblaciones. Una alternativa es el modelo logístico, donde \(R(n)\) es una función lineal de la densidad de población

\[\begin{equation} R(n)=1+r_d\left[1-\frac{n(t)}{K}\right] \end{equation}\]

Al parámetro \(K\) le llamamos capacidad de carga del sistema y representa el número máximo de individuos que puede acomodar el sistema.

  • Usando \(R(n)\), el número de individuos en la generación \(t+1\) será

\[\begin{equation} n(t+1)=R\ n(t)=n(t)+n(t)\ r_d\left(1-\frac{n(t)}{K}\right) \end{equation}\]

  • El cambio de frecuencia entre generaciones para este modelo surge de restarle \(n(t)\) a ambos lados de la ecuación anterior y es, por lo tanto, igual

\[\begin{equation} \Delta n=n(t+1)-n(t)=n(t)\ r_d\left(1-\frac{n(t)}{K}\right) \end{equation}\]

  • En forma análoga, para el modelo continuo la tasa de cambio en la población queda determinada por

\[\begin{equation} \frac{dn}{dt}=n(t)\ r_c\left(1-\frac{n(t)}{K}\right) \end{equation}\]

  • La solución a la ecuación diferencial anterior nos da el número de individuos en el tiempo \(t\) a partir del número inicial de individuos \(n_0\), la capacidad de carga del sistema \(K\) y la tasa de crecimiento \(r_c\) y tiene la siguiente forma

\[\begin{equation} n(t)=\frac{K\ n_0\ e^{r_c\ t}}{K+n_0\ (e^{r_c\ t}-1)} \end{equation}\]

  • La mayor tasa de crecimiento instantánea \(\frac{dn}{dt}\) se da cuando \(n(t)=\frac{K}{2}\) (que es el punto de inflexión en la curva de \(n(t)\)) y por lo tanto, sustituyendo en \(\frac{dn}{dt}=n(t)\ r_c\left(1-\frac{n(t)}{K}\right)\) ese valor de \(n(t)\), tenemos que la tasa máxima de crecimiento instantáneo será \(\frac{K r_c}{4}\).

  • El tiempo requerido para llegar a la mitad de la capacidad de carga del sistema, es decir \(\frac{K}{2}\) es igual a \(t=\frac{\ln \left(\frac{K-n_0}{n_0}\right)}{r_c}\).



7.3 Modelos haploides de selección natural

  • En el modelo discreto de selección haploide con dos alelos, los fitness absolutos están dados por

\[\begin{equation} \begin{split} W_1=(1-d_1)(1+b_1)\\ W_2=(1-d_2)(1+b_2) \end{split} \end{equation}\]

con \(b_1\), \(b_2\) las tasas netas de nacimientos para los individuos de ambos alelos y \(d_1\), \(d_2\), las tasas de muertes de ambos.

  • En el modelo discreto de selección, el cambio esperado en la frecuencia del alelo \(A_1\) estará dado por

\[\begin{equation} \Delta_sp=p(t+1)-p(t)=\frac{W_1\ p(t)}{W_1\ p(t)\ +\ W_2\ q(t)}-p(t) \end{equation}\]

  • Si los factores ambientales varían en el tiempo de acuerdo a una función \(\sigma(t)\), pero afectan en la misma proporción a los dos genotipos, es decir, si \(W'_1=\sigma(t)\ W_1\), entonces

\[\begin{equation} w'_1 = \frac{W'_1}{W'_2}=\frac{\sigma(t)\ W_1}{\sigma(t)\ W_2}=\frac{W_1}{W_2}=w_1 \end{equation}\]

y por lo tanto el fitness relativo del genotipo 1 respecto al 2 es independiente de la forma de \(\sigma(t)\).

  • Por otro lado, si \(s_d=(W_1-W_2)/W_2\), entonces una forma alternativa de calcular el cambio de frecuencia del alelo \(A_1\) en una generación estará dado por

\[\begin{equation} \Delta_sp=\frac{s_d\ pq}{1+s_d\ p} \end{equation}\]

  • En el caso del modelo continuo, si \(r_1=b_1-d_1\), \(r_2=b_2-d_2\) son las tasas de crecimiento instantáneo para los individuos de los dos alelos y \(s_c=r_1-r_2\) es la diferencia entre ambas, entonces la tasa de cambio de frecuencia del alelo \(A_1\) estará dada por

\[\begin{equation} \frac{dp}{dt}=s_c\ pq=0,5 \times 0,45 \times (1-0,45)=0,12375 \end{equation}\]



7.4 Los modelos de Moran y de Fisión versus el de Wright-Fisher

  • El algoritmo del modelo de Moran es muy sencillo: a cada instante en el tiempo un individuo es elegido para reproducirse y va a dejar una copia, mientras que un individuo es elegido para morir (puede ser el mismo individuo que acaba de dejar una copia, pero no la copia). Por lo tanto, la posible descendencia de un individuo (considerándose a si mismo como descendencia) en cada instante es 0, 1 o 2 descendientes.

  • La probabilidad de dejar 0 descendientes es \(p_0=\frac{(N-1)}{N}\frac{1}{N}=\frac{(N-1)}{N^2}=p_2\), igual que la probabilidad de que un individuo deje 2 hijos. Como \(p_1=1-p_0-p_2\), entonces

\[\begin{equation} p_1=1-\frac{(N-1)}{N^2}-\frac{(N-1)}{N^2}=\frac{N^2-2(N-1)}{N^2}=\frac{(N-1)^2+1}{N^2} \end{equation}\]

por lo que cuando \(N \to \infty\), \(p_1 \to 1\) y \(p_0=p_2 \to 0\), es decir la mayor parte de los individuos solo dejarán un descendiente en este modelo.

  • En general, las probabilidades de transición en el modelo de Moran están dadas por

\[\begin{equation} p_{i,i-1}=\frac{(N-i)i}{N^2}, p_{i,i+1}=\frac{i(N-i)}{N^2}, p_{i,i}=\frac{i^2+(N-1)^2}{N^2} \end{equation}\]

  • Vimos que es posible escalar el modelo coalescente para que no dependa del tamaño poblacional. Si aplicamos la transformación \(T_k=T_k^N/N\), entonces la siguiente aproximación es valida

\[\begin{equation} P(T_k>v) \approx e^{-\frac{k(k-1)}{2} v} \tag{7.2} \end{equation}\]

  • El factor de escalado que permite que los tiempos de coalescencia sigan una distribución exponencial con tasa \(k(k-1)/2\) es el tamaño efectivo poblacional correspondiente a cada uno de los modelos. Para tamaños poblacionales grandes \(N_e^{_{WF}}=N\), mientras que para el modelo de Moran \(N_e^{_{M}}=N^2/2\).

  • Un modelo alternativo Es el modelo de Fisión, en el cual, en el instante \(t\) cada individuo deja 0, 1 o 2 descendientes con probabilidades \(p_0\), \(p_1\) y \(p_2\). En principio este modelo no asume tamaño constante, pero para que se cumpla la restricción de tamaño constante (y que sea comparable con lo que hemos asumido en otros modelos) es necesario que \(p_0=p_2 \leqslant \frac{1}{2}\).

  • Para el modelo de Fisión el factor de escala es \(N_e^{_{F}}=N/(2p_2)\). En el caso de \(p_2=1/N\), como sería en el modelo de Moran, entonces \(N_e^{_{F}}=N/(2p_2)=N/[2(1/N)]=N^2/2=N_e^{_{M}}\) que es el mismo factor de escala que vimos para Moran, mientras que en el caso de que \(p_2=\frac{1}{2}\), entonces \(N_e^{_{F}}=N/(2p_2)=N/[2(1/2)]=N=N_e^{_{WF}}\), que es el factor de escalado para el modelo de Wright-Fisher.



7.5 El rol de la transferencia horizontal

  • Los eventos de transferencia horizontal de genes involucran el pasaje de material genético entre individuos (generalmente) de diferentes especies.

  • En el caso de que en el genoma receptor existan secuencias homólogas a las transferidas, se genera una nueva relación evolutiva entre las mismas que se llama xenología (porque su origen es de diferentes especies).

  • En procariotas es relativamente sencillo identificar eventos recientes de HGT en los casos en que las diferencias composicionales (nucleotídicas, uso de codones, etc.) entre las dos especies sean relativamente importantes.

  • Los eventos de HGT son de gran importancia en la evolución pero también en la genética de poblaciones, por ejemplo a través de la transferencia de genes de resistencia a antimicrobianos, o de tolerancia a concentraciones elevadas de cito-tóxicos.



7.6 Selección vs Neutralismo: los procariotas en el debate

  • El debate entre las teorías neutralista y seleccionista de la evolución molecular persiste aún hoy en día, aunque la teoría Neutral en su forma original no es capaz de explicar la distribución de la variabilidad en la mayor parte de los casos conocidos.

  • Una arena interesante donde batirse ha resultado ser el contenido G+C de los procariotas ya que el mismo muestra una enorme variabilidad entre especies y porque en procariotas la mayor parte de los sitios está posiblemente sujeta a selección, directamente o por ligamiento con regiones bajo selección.

  • En procariotas parece bastante claro que el sesgo mutacional-sustitucional es hacia los nucléotidos AT, por lo que para explicar la distribución, con muchos genomas hacia G+C alto, requiere de otras explicaciones que el sesgo mutacional.

  • La teoría Neutral de la evolución no alcanza a explicar esta enorme variabilidad en contenido G+C pero el Biased Gene Conversion, un mecanismo de recombinación homóloga independiente de la selección, ha sido propuesto como otra posible explicación del incremento del contenido GC.

  • Diferentes factores ambientales y evolutivos han sido propuestos para explicar la distribución de contenido G+C en procariotas, entre ellos la temperatura óptima de crecimiento, la fijación de nitrógeno, el parasitismo y la aerobiosis. Algunos han soportado bien el paso del tiempo y son bastante generales, mientras que otros apenas pueden explicar algo en un entorno filogenético muy restringido o han sido descartados por evidencia más reciente.

  • Como el mecanismo de Biased Gene Conversion es dependiente de la recombinación, mientras que la selección se ve favorecida por la recombinación, es bastante difícil conseguir resolver cuál de estas dos explicaciones alternativas funciona mejor.



7.7 Genómica poblacional

  • En la metagenómica el objetivo suele ser comprender la diversidad de organismos presentes, así como sus proporciones en diferentes muestras, a partir de la identificación y cuantificación de ácidos nucléicos, ADN o ARN. En los estudios clásicos de filogenética se emplea el ARNr 16S ya que se trata de una molécula altamente conservada durante la evolución, lo que nos permite apreciar diferencias en grandes tiempos evolutivos.

  • Las tecnologías de secuenciación masiva (o Next Generation Sequencing, NGS) permitieron extender los estudios metagenómicos a un amplio rango de problemas, incluyendo aquellos de composición y dinámica poblacional microbiana.

  • Las tecnologías NGS de segunda generación aumentaron enormemente la capacidad de secuenciado, pero mientras que dos de ellas (Illumina y SOLiD) eran de fragmentos cortos o muy cortos, la tercera presentaba problemas con los homopolímeros (454) y los fragmentos apenas alcanzaban el largo de los obtenidos por el método de Sanger.

  • Las tecnologías NGS de tercera generación abarataron aún más el costo de secuenciación, universalizando el acceso a estas tecnologías. Mientras que una de ellas (IonTorrent) aún presenta problemas con los homopolímeros, las otras dos (Oxford Nanopore y PacBio) permiten obtener fragmentos de largos considerables, aún de decenas de miles de pares de bases, con relativamente alta precisión. Esto no solo permite identificar variaciones a nivel de las bases individuales, sino que también permite identificar variabilidad estructural.

  • La cantidad de datos generados a bajo costo por las tecnologías de tercera generación y el largo de los fragmentos permiten acceder a otras técnicas, como la genómica funcional o la metatranscriptómica, que además de los aspectos composicionales y de dinámica de poblaciones permite identificar vías metabólicas expresadas en forma diferencial, lo que ayuda a comprender los cambios a nivel molecular entre condiciones (por ejemplo, entre ambientes).



7.8 Genes de resistencia

  • La resistencia a los antimicrobianos (AMR) es un fenómeno extendido en el que los microbios desarrollan resistencia frente a tratamientos con drogas que anteriormente resultaban eficaces para su control y eliminación.

  • La base genética del desarrollo de esta resistencia está en los elevados tamaños poblacionales de los microbios en general y de los procariotas en particular, así como en la flexibilidad de los genomas procariotas y los distintos mecanismos para compartir novedades evolutivas. El intercambio de plásmidos de resistencia es un mecanismo muy usado y extremádamente flexible ya que las poblaciones bacterianas pueden adquirirlos frente a un evento de presión selectiva inducido por drogas y luego perderlos cuando la amenza desaparece.

  • Existen cinco diferentes mecanismos descritos que han ido evolucionando para este fenómeno de resistencia:

  1. Inactivación o modificación de la droga mediante la acción enzimática en la bacteria

  2. Alteración del “target” o del sitio de unión de la droga

  3. Alteración de la vía metabólica en la bacteria, evitando por ejemplo, el uso de la vía blanco de la dorga

  4. Reducción de la concentración de la droga, por reducción de la permeabilidad a la misma o por aumento de la tasa de eflujo de la misma

  5. Desbloqueo y liberación de los ribosomas en bloqueos inducidos por antibióticos

  • En algunos casos, debido en parte al manl uso de los antibióticos, por ejemplo a través de una secuencia de drogas todas con resultados fallidos, se genera en las poblaciones bacterianas individuos con resistencia a múltiples drogas de familias diferentes, a los que se les conoce como MDR (MultiDrug Resistant). Estos organismos se constituyen en una enorme amenaza para los sistemas de salud ya que la posibilidad de diseminación de esta resistencia múltiple aumenta con el mal manejo de las terapias antibióticas.

  • Las tecnologías de secuenciación masiva de segunda y especialmente de tercera generación son una excelente herramienta la el diagnóstico rápido de los patógenos causantes de infecciones, así como de las estrategias de resistencia que tienen desarrolladas, por lo que debería ser la alternativa inmediata para un uso racional de los antibióticos. Las tecnologías de proteómica masiva, con equipos MALDI-TOF son otra alternativa barata y ya estandarizada para este manejo racional.



7.9 Introducción a la epidemiología: modelos compartimentales

  • Los modelos epidemiológicos compartimentales son una clase de modelos que nos permite entender la dinámica de una epidemia.

  • Los modelos SIR poseen tres compartimentos: susceptibles (S), infectados (I) y recuperados (R).

  • En el caso del modelo SIR con dinámica de vida y tamaño poblacional constante, las ecuaciones diferenciales que lo describen son

\[\begin{equation} \frac{dS}{dt}=\Lambda-\mu S-\frac{\beta IS}{N}, \frac{dI}{dt}=\frac{\beta IS}{N}-\gamma I-\mu S, \frac{dR}{dt}=\gamma I-\mu S \end{equation}\]

con \(\Lambda=bN=\mu(S+I+R)=\mu N\), ya que al ser el tamaño poblacional constante \(N\) los nacimientos deben igualar las muertes.

  • En el modelo SIR con dinámica de vida y tamaño poblacional constante el tiempo promedio de una infección estará dado por \(\frac{1}{(\mu+\gamma)}\) y el número reproductivo básico por

\[\begin{equation} R_0=\frac{\beta }{(\mu+\gamma)} \tag{7.3} \end{equation}\]

  • Existen dos equilibrios estables para este modelo, uno correspondientes al estado libre de enfermedad (DFE) cuya solución es

\[\begin{equation} e_1=(S^*,I^*,R^*)=(N,0,0) \end{equation}\]

y otro correspondiente al estado endémico, cuya solución es

\[\begin{equation} e_2=(S^*,I^*,R^*)=(\frac{N}{R_0},Nc_1(R_0−1),Nc_2(R_0−1)) \end{equation}\]

con \(c_1=\mu/\beta\) y \(c_2=\gamma/\beta\).