Capítulo 3 Deriva Genética

3.1 El rol de los procesos estocásticos en la genética

  • La importancia de las proporciones de partida puesto que estas determinaran las probabilidades de obtener cierto resultado.

  • Las barreras absorbentes serán aquellos valores que no podremos sobrepasar, y representarán los “límites” de los que no podremos escapar hacia otros valores.


3.2 El modelo de Wright-Fisher

  • El modelo de Wright-Fisher asume que de un pool infinito de gametos, con las frecuencias de los alelos proporcionales a lo muestreado para constituir la generación anterior, muestreamos nuevamente \(2N\) alelos, que será mi nueva población.

  • La suposición de un pool infinito de gametos es equivalente, desde el punto de vista matemático a un muestreo con reposición.

  • Al generarse la nueva población a partir de \(2N\) muestreos independientes de Bernoulli, la distribución de la nueva población será una Binomial con probabilidad \(p\) y tamaño \(2N\).

  • Si una población tiene \(i\) copias del alelo \(A\) y \(2N-i\) copias del alelo \(a\), la probabilidad de transición de pasar de \(i\) copias a \(j\) copias en el modelo de Wright-Fisher se encuentra dada por la siguiente ecuación:

\[\begin{equation} T_{ij}={2N \choose j}\left(\frac{i}{2N}\right)^{j}\left(\frac{2N-i}{2N}\right)^{2N-j}=\frac{(2N)!}{j!(2N-j)!}p^jq^{2N-j} \end{equation}\]

  • La varianza de las frecuencias del alelo A (\(p\)) entre poblaciones, por generación, debida al efecto de la deriva genética es:

\[\begin{equation*} \sigma^2(p)=\frac{pq}{2N_e}=\frac{p-p^2}{2N_e} \tag{3.1} \end{equation*}\]

siendo \(p\) y \(q\) (con \(q=1-p\)) las frecuencias de los alelos y \(N_e\) el tamaño efectivo de las poblaciones que forman el ensemble. Como la varianza crece linealmente con el tiempo (en generaciones), tenemos también que para el tiempo \(t\) para las líneas que continúan segregando:

\[\begin{equation*} \sigma_t^2(p)=t\frac{pq}{2N_e}=t\frac{(p-p^2)}{2N_e} \tag{3.2} \end{equation*}\]


3.3 El rol de la subdivisión poblacional en la evolución de las frecuencias alélicas

Homocigosidad y Heterocigosidad

  • La recursión para el coeficiente de fijación \(F\) en la generación \(t\), \(F_t\) es igual a: \[\begin{equation*} 1-F_t=\left(1-\frac{1}{2N}\right)^t(1-F_0) \end{equation*}\]

  • Cuando \(F_0=0\), es decir que asumimos que en la generación inicial la probabilidad de que dos alelos en un locus de un individuo diploide es cero, entonces la recursión anterior se simplifica a:

\[\begin{equation*} F_t=1-\left(1-\frac{1}{2N}\right)^t \end{equation*}\]

  • El número de heterocigotos en un ensemble de poblaciones de tamaño finito \(N\) se ve reducido de generación en generación respecto a lo esperado para el equilibrio de Hardy-Weinberg. Esa reducción es a la tasa de \(\left(1-\frac{1}{2N}\right)\) por generación, por lo que la frecuencia de heterocigotos en la generación \(t\) se calcula de acuerdo a la siguiente ecuación:

\[\begin{equation*} H_t=\left(1-\frac{1}{2N}\right)^t H_0 \approx H_0 e^{\frac{-t}{2N}} \end{equation*}\]


3.4 Tamaño efectivo poblacional

  • El tamaño efectivo de una población (\(N_e\)) raramente coincide con el tamaño censal de la misma (\(N\)), siendo las razones para esto diversas (variación del tamaño en el tiempo, diferente número de machos que de hembras, diferencias muy importantes en el número de descendientes entre reproductores candidatos, etc.).

  • El efecto conocido como cuello de botella (bottleneck) poblacional se refiere a la reducción drástica del número de reproductores en algún momento de la vida de una población determinada y aunque luego la misma experimente una nueva expansión, el cuello de botella dejará huellas indelebles a nivel de la variabilidad genómica.

  • El tamaño efectivo poblacional cuando varía el tamaño de la población en el tiempo se puede calcular como la media armónica entre los tamaños a cada generación:

\[\begin{equation*} N_e=\frac{t}{\left(\frac{1}{N_0}+\frac{1}{N_1}+\frac{1}{N_2}+...+\frac{1}{N_{t-1}} \right)} \end{equation*}\]

  • Cuando el número de reproductores machos es diferente del número de reproductores hembras, el tamaño efectivo de la población es inferior a la suma de individuos y lo podemos calcular como

\[\begin{equation*} N_e=\frac{4N_mN_h}{N_m+N_h} \end{equation*}\]

  • Si asumimos que se trata de un proceso de Wright-Fisher perfecto, podemos obtener un estimado del tamaño efectivo poblacional que se corresponde con la varianza en la media de frecuencias alélicas entre generaciones a partir de la dicha varianza observada mediante

\[\begin{equation*} N_e^v=\frac{pq}{2 Var(\Delta p)} \end{equation*}\]


3.5 Aproximación de difusión

Caminatas al azar y procesos de difusión

PARA RECORDAR

Bajo la condición de que la deriva sea la única fuerza evolutiva actuando, en una población de \(N\) individuos diploides, en un locus con dos alelos:

  • La ecuación hacia adelante de Kolmogorov (KFE) analiza el comportamiento de la función de densidad de probabilidad \(\phi(p,x,t)\), es decir la distribución de las frecuencias alélicas \(x\), a medida de que avanza el tiempo y tiene la siguiente forma

\[\begin{equation*} \frac{\partial \phi(p,x,t)}{\partial t}=-\frac{\partial [M(x)\phi(p,x,t)]}{\partial x}+\frac{1}{2}\frac{\partial^2[V(x)\phi(p,x,t)]}{\partial x^2} \end{equation*}\]

  • La ecuación hacia atrás de Kolmogorov (KBE) es la generalmente más útil en genética de poblaciones. Analiza el comportamiento de la función de densidad de probabilidad \(\phi(p,x,t)\) respecto a la frecuencia inicial \(p\), a medida de que voy hacia atrás en el tiempo y tiene la siguiente forma

\[\begin{equation*} \frac{\partial \phi(p,x,t)}{\partial t}=M(p)\frac{\partial \phi(p,x,t)}{\partial p}+\frac{V(p)}{2}\frac{\partial^2 \phi(p,x,t)}{\partial p^2} \end{equation*}\]


3.6 Probabilidad de fijación y tiempos de fijación

Bajo la condición de que la deriva sea la única fuerza evolutiva actuando, en una población de \(N\) individuos diploides, en un locus con dos alelos:

  • La probabilidad de fijación de un alelo es igual a su frecuencia \(p=\frac{1}{2N}\)

  • El tiempo a la eventual fijación de ese alelo es \(\bar{t_1}(p)=-4N \frac{(1-p) \ln(1-p)}{p}\)

  • La probabilidad de perder un alelo es igual a \(1-p\)

  • El tiempo a la eventual pérdida de ese alelo es \(\bar{t_0}(p)=-4N \frac{(p) \ln(p)}{(1-p)}\)

  • El tiempo segregando en ese locus, es decir el tiempo a eventual fijación o pérdida es \(\bar{t}(p)=-4N [p \ln(p) + (1-p) \ln(1-p)]\)

  • El tiempo máximo segregando se alcanza cuando el punto de partida es \(p=\frac{1}{2}\) y es igual a \(\sim 2,77N\) generaciones.


3.7 El modelo coalescente

  • En organismos diploides, en poblaciones de N individuos, la probabilidad de coalescer de dos alelos en la generación anterior es

\[\begin{equation*} \mathbb{Pr}(\text{coalescer})=\frac{k(k-1)}{4N} \end{equation*}\]

  • Como los eventos de coalescencia en cada generación son independientes de la previa, el tiempo a la coalescencia (\(u_k\)) tiene distribución geométrica, usualmente aproximada por una distribución exponencial con tasa inversa a la probabilidad de coalescer por generación, es decir

\[\begin{equation*} \mathbb{E}(u_k)=\frac{4N}{k(k-1)} \end{equation*}\]

Mientras que para el tiempo total se puede aplicar:

\[\begin{equation} t=4N(1-\frac{1}{k}) \end{equation}\]

  • Como además en cada evento de coalescencia \(k\) se reduce en uno, los tiempos hacia atrás serán cada vez más largos.

  • El tamaño poblacional juega un papel muy importante en los tiempos de coalescencia (está en el numerador de la esperanza), por lo que si el mismo varía a lo largo del tiempo entonces no se cumple uno de los supuestos fundamentales del coalescente. Sin embargo, en los casos en que el tamaño poblacional es una función del tiempo cuya inversa sea integrable, es posible aplicar una transformación del tiempo tal que se puede trabajar en esta escala temporal ficticia con el coalescente sin modificar.