INVESTIGADORES
PRATTA Guillermo Raul
congresos y reuniones científicas
Título:
Exploración de una región genómica del cromosoma 06 involucrada a la maduración del fruto de tomate a través de secuenciación de tercera generación
Autor/es:
PAOLO, CACCHIARELLI; GUILLERMO R. PRATTA; ELIZABETH, TAPIA
Lugar:
Encuentro virtual
Reunión:
Workshop; I Reunión Argentina ? Chile de Ciencias Agrarias y VII Jornadas de Ciencia y Tecnología de la Facultad de Ciencias Agrarias UNR; 2022
Institución organizadora:
FCA-UNR
Resumen:
El tomate es una de las hortalizas más importantes a nivel global y en el 2012 fue secuenciado sugenoma de manera completa, revelando la presencia de unos 35.000 genes en sus 12 cromosomas.El análisis de su contenido genético indica que este sufrió reorganizaciones en su estructura,implicando nuevas disposiciones y/o repeticiones en sus genes. Estos eventos explicarían cambiosque contribuyeron a la aparición de nuevas especies y su diversificación. Hasta el momento se han secuenciado diversas especies de tomate alrededor del mundo. La secuenciación de genomas tuvo su inicio alrededor del año 1977 y al conjunto de técnicos empleado en aquel momento se las conoce como “de primera generación”. Luego se desarrollaron técnicas de ‘segunda generación’, que tenían un potencial masivo y simultáneo para la obtención de miles de fragmentos de ADN en un tiempo acotado. Estas aproximaciones permitieron el ensamblado de genomas, para lo que fue necesario desarrollar análisis estadísticos e informáticos de alta resolución que dieron origen a la Bioinformática, pero presentaban dificultades en el abordaje de las zonas genómicas repetitivas. En la actualidad es usual desarrollar experimentos con tecnologías “de tercera generación”, capaces de secuenciar fragmentos de ADN de gran tamaño y con el potencial de detectar regiones que pueden presentar rearreglos y repeticiones en su estructura génica. En este contexto, en el grupo de trabajo se obtuvieron por técnicas de segunda generación las secuencias genómicas de dos genotipos (cv. Caimanta, C, y acceción LA0722, P), a partir de cuyo cruzamiento se desarrollaron diversas poblaciones que son la base para diversos programas de mejoramiento genético. También se obtuvieron transcriptomas de estos materiales en frutos en diferentes estados de maduración mediante la técnica de RNA-seq. A partir de estos estudios se evidenció que existe una región del cromosoma 06 en la que se localiza un grupo de 4 pequeñas proteínas de choque térmico (small Heat Shock Proteins, sHSPs) de expresión diferencial a lo largo de la madurez. Estos genes de sHSPs presentan copias múltiples en muchos de sus genes que, como se mencionó previamente, son un desafío frente a la mayoría de las estrategias de ensamblaje que se usan en secuenciaciones de segunda generación. La alta identidad de secuencia entre genes duplicados dentro de una misma especie (genes parálogos) genera que las lecturas provenientes del secuenciador muchas veces colapsen en una única copia, no siendo posible distinguir entre ellas. En consecuencia, el objetivo fue explorar mediante secuenciación de tercera generación la región genómica del cromosoma 06 descripta en el párrafo anterior a fin de lograr una mayor precisión en el conocimiento de su estructura génica. Para llevar a cabo este objetivo se extrajo ADN de tejido foliar joven de cada genotipo (C, P y su F 1 CxP) y se verificó su calidad mediante NanoDrop®. Se desarrollaron cebadores para amplificar esta región en particular (20 kb aproximado) de manera escalonada. Se realizó la extracción de la región bajo estudio desde los genomas de C y P informados por Cambiaso et al. (2019), con la herramienta faidx perteneciente a SAMtools. A través de su alineamiento con la herramienta needle, se detectaron regiones conservadas sobre las que se desarrollaron cebadores para amplificar diferentes fragmentos largos de esta región. A fin de detectar otras posibles variaciones en la secuencia genómica, principalmente de P, se comparó su secuencia con la de la accesión de referencia para su especie, LA2093, con la herramienta AlignMiner. Así se generaron, con la herramienta online Primer3, cebadores adicionales de manera de contar con alternativas para amplificar dicha región y ampliar el espectro de variabilidad explorada. La amplificación del ADN genómico se realizó a través de PCR customizadas. Se hicieron amplificaciones de cada fragmento seleccionado, separando los pares por un lado y los impares por otro para evitar el solapamiento de los amplicones escalonados. La separación de los fragmentos amplificados se llevó a cabo con geles de agarosa al 2% p/v, realizando corridas electroforéticas de 2 horas a 140 V constantes con buffer TAE en concentración de 1X. La visualización de amplicones se hizo mediante tinción con SYBR® Safe. Se utilizaron 3 Barcodes provenientes de la empresa ArgenTAG® a fin de etiquetar los fragmentos genómicos de cada genotipo y luego realizar la secuenciación de tercera generación mediante el equipo MinION de Oxford Nanopore®, usando una flow-cell completa puesto que la capacidad del instrumento fue suficiente para explorar la región con gran profundidad. Se utilizó el programa Canu Assembler con parámetros predeterminados para ensamblar las lecturas. La comparación entre P y LA2093 (ambas de S. pimpinellifolium) demostró que esta especie silvestre presenta regiones conservadas y regiones con variaciones entre sus secuencias. El total de cebadores para el genotipo silvestre fue de 5 pares, con un tamaño de amplicón variable para cadasector de la región pero que supera en su mayoría los 4 kb. Para C, se desarrollaron un total decebadores de 7 pares, con un tamaño de amplicón de 4 kb, y de 6 pares, con un tamaño de amplicónde 6 kb. Los geles realizados revelaron la amplificación de fragmentos con distinto tamaño, quevariaron entre los 400 y los 4100 pb de bases aproximadamente. Se obtuvieron secuencias entre las400 bases y los 5,5 kb, inclusive algunas superaron los 6 kb. La cantidad de lecturas totales fue de3,09 millones. Luego de la demultiplexación, para Caimanta se obtuvo un total de 208.764 lecturas,mientras que para P, 123.394 lecturas y para F 1 CxP, 292.250 lecturas. Finalmente, el ensambladode cada uno de los genotipos en esta primera exploración determino para C la formación de 2contigs con un total de 12011 pares de bases, mientras que para P se obtuvieron 3 contigs con untotal de 10006 pares de bases y para F1 CxP, 4 contigs con un total de 13945 pares de bases. Elensamblador dejó secuencias sin poder montar, que podrían ser potenciales fuentes de informaciónpara seguir rearmando la región. En C, quedaron 261 secuencias sin ensamblar con un promedio de1596 pares de bases; estos números fueron de 37 secuencias con un promedio de 1939 pares debases para P y de 743 secuencias de 1173 pares de bases en promedio para F1 CxP. Los contigs 1de C y 2 tanto de P como de F1 CxP mapearon en la misma región. Este fragmento pertenece alinicio de la región de interés abarcando desde el inicio del gen Solyc06g07510 hasta el final del genSolyc06g076540. Al realizar un alineamiento múltiple entre estas secuencias, se identificó que laregión presenta la misma arquitectura que el genoma de referencia, aunque se detectó la presenciade una inserción/deleción de 39 bases en la región promotora del gen de sHSPs Solyc06g076520que no había sido detectada en la secuenciación de segunda generación. El resto de los contigs decada genotipo mapearon en la sección final de la región abordada en este estudio, comprendidaentre el gen de sHSPs Solyc06g076570 y el gen Solyc06g076590. En F1 CxP, el contig 1 abarcó atoda la región del gen Solyc06g076550, llegando hasta el inicio del gen de sHSPs Solyc06g076560.La información generada por secuenciación de tercera generación podría utilizarse en el corto plazopara desarrollar nuevos cebadores a fin de poder explorar esta región de interés en toda su extensión y dilucidar los efectos de su variabilidad sobre el proceso de madurez. Además, esta primera exploración permitió poner a punto una metodología novedosa para amplificar región genómica altamente repetitivas.