BECAS
CACCHIARELLI Paolo
congresos y reuniones científicas
Título:
Secuenciación genómica de tercera generación de una región del cromosoma 06 de tomate
Autor/es:
CACCHIARELLI, PAOLO; PRATTA, GUILLERMO R.; TAPIA, ELIZABETH
Lugar:
Zavalla
Reunión:
Jornada; VII Jornadas de Ciencia y Tecnología/I Reunión Argentina-Chile de Ciencias Agrarias; 2022
Institución organizadora:
Facultad de Ciencias Agrarias (Universidad Nacional de Rosario) y la Facultad de Agronomía (Universidad de Concepción)
Resumen:
El tomate cultivado (Solanum lycopersicum) es una de las hortalizas más importantes a nivel globaly en el 2012 fue secuenciado su genoma de manera completa, revelando la presencia de unos35.000 genes en sus 12 cromosomas. El análisis de su contenido genético indica que este sufrióreorganizaciones en su estructura, implicando nuevas disposiciones y/o repeticiones en sus genes.Estos eventos explicarían cambios que contribuyeron a la aparición de nuevas especies y sudiversificación. Hasta el momento se han secuenciado diversas especies de tomate alrededor delmundo. La secuenciación de genomas tuvo su inicio alrededor del año 1977 y al conjunto detécnicas empleado en aquel momento se las conoce como “de primera generación”. Luego sedesarrollaron técnicas de ‘segunda generación’, que tenían un potencial masivo y simultáneo para laobtención de miles de fragmentos de ADN en un tiempo acotado. Estas aproximaciones permitieronel ensamblado de genomas, para lo que fue necesario desarrollar análisis estadísticos e informáticosde alta resolución que dieron origen a la Bioinformática, pero presentaban dificultades en elabordaje de las zonas genómicas repetitivas. En la actualidad es usual desarrollar experimentos contecnologías “de tercera generación”, capaces de secuenciar fragmentos de ADN de gran tamaño ycon el potencial de detectar regiones que pueden presentar rearreglos y repeticiones en su estructuragénica. En este contexto, Cambiaso et al. (2019) obtuvieron por técnicas de segunda generación lassecuencias genómicas de dos genotipos (cv. Caimanta, C, tomate cultivado y accesión LA0722, P,de la especie silvestre S. pimpinellifolium), a partir de cuyo cruzamiento se desarrollaron diversaspoblaciones que son la base para diversos programas de mejoramiento genético. También,Cacchiarelli et al. (2021) obtuvieron transcriptomas de estos materiales en frutos en diferentesestados de maduración mediante la técnica de RNA-seq. A partir de estos estudios se evidenció queexiste una región del cromosoma 06 en la que se localiza un grupo de 4 proteínas pequeñas dechoque térmico (small Heat Shock Proteins, sHSPs) de expresión diferencial a lo largo de lamadurez. Estos genes de sHSPs presentan copias múltiples, y como se mencionó previamente, sonun desafío frente a la mayoría de las estrategias de ensamblaje que se usan frente a secuenciacionesde segunda generación. La alta identidad de secuencia entre genes duplicados dentro de una mismaespecie (genes parálogos) genera que las lecturas provenientes del secuenciador muchas vecescolapsan en una única copia, no siendo posible distinguir entre ellas (Krsticevic et al., 2016). Enconsecuencia, el objetivo fue secuenciar con tecnología de tercera generación la región genómicadel cromosoma 06 de tomate, descripta en el párrafo anterior, a fin de lograr una mayor precisión enel conocimiento de su estructura génica. Para llevar a cabo este objetivo se extrajo ADN de tejidofoliar joven de cada genotipo (C, P y su F 1 CxP) y se verificó su calidad en gel de agarosa al 1%p/v. Previo al inicio del experimento se realizó una segunda verificación de la calidad del ADNmediante NanoDrop®. Se desarrollaron cebadores para amplificar esta región en particular (detamaño aproximado a 20 kilobases, kb) de manera escalonada. Se realizó la extracción de la regiónbajo estudio desde los genomas de C y P informados por Cambiaso et al. (2019), con la herramientafaidx perteneciente a SAMtools. A través de su alineamiento con la herramienta needle, sedetectaron regiones conservadas sobre las que se desarrollaron cebadores para amplificar diferentesfragmentos largos de esta región. A fin de detectar otras posibles variaciones en la secuenciagenómica, principalmente de P, se comparó su secuencia con la de la accesión de referencia para suespecie, S. pimpinellifolium LA2093, con la herramienta AlignMiner. Así se generaron, con laherramienta online Primer3, cebadores adicionales de manera de contar con alternativas paraamplificar dicha región y ampliar el espectro de variabilidad explorada. La amplificación del ADNgenómico se realizó a través de PCR, donde fueron modificadas la temperatura de anillamiento yextensión. Se hicieron amplificaciones de cada fragmento seleccionado, separando los pares por unlado y los impares por otro para evitar el solapamiento de los amplicones escalonados. Laseparación de los fragmentos amplificados se llevó a cabo con geles de agarosa al 2% p/v,realizando corridas electroforéticas de 2 horas a 140 V constantes con buffer TAE en concentraciónde 1X. La visualización de amplicones se hizo mediante tinción con SYBR® Safe. Se utilizaron 3barcodes o etiquetas a fin de multiplexar el total de muestras en una sola corrida, es decir, mezclarequimolarmente cada genotipo en un único tubo previo al ingreso del secuenciador. Estos barcodesfueron provistos por la empresa ArgenTAG®, a fin de etiquetar los fragmentos genómicos de cadagenotipo. Así, el próximo paso fue la secuenciación de tercera generación mediante equipo MinIONde Oxford Nanopore®, usando una flow-cell completa, puesto que la capacidad del instrumento fuesuficiente para visitar la región con gran profundidad. Se utilizó el programa Canu Assembler conparámetros predeterminados para ensamblar las lecturas. La comparación entre P y LA2093 (ambasde S. pimpinellifolium) demostró que esta especie silvestre presenta regiones conservadas y regionescon variaciones entre sus secuencias. El total de cebadores para el genotipo silvestre P fue de 5pares, con un tamaño de amplicón variable para cada sector de la región pero que supera en sumayoría los 4 kb. Para C, se desarrollaron dos grupos de cebadores. Un grupo fue de 7 pares decebadores con un tamaño de amplicón de 4 kb, y otro grupo de 6 pares de cebadores, con un tamañode amplicón de 6 kb. Los geles realizados luego de la amplificación revelaron fragmentos condistinta longitud, que varió entre los 400 pares de bases (pb) y los 4,1 kb. Luego de esto se llevó acabo la secuenciación en equipo MinION Oxford Nanopore® y este instrumento arrojó en tiemporeal la obtención de secuencias cuya longitud estuvo entre las 400 pb y 5,5 kb en su mayoría, yalgunas lecturas superaron los 6 kb. La cantidad de lecturas totales luego de esta secuenciación fuede 3,09 millones. Luego de la demultiplexación, es decir la recuperación de las lecturaspertenecientes a cada genotipo individual, para C se obtuvo un total de 208.764 lecturas, mientrasque para P, 123.394 lecturas y para F 1 CxP, 292.250 lecturas. Finalmente, el ensamblado de cadauno de los genotipos determinó para C la formación de 2 contigs con un total de 12011 (pb),mientras que para P se obtuvieron 3 contigs con un total de 10006 pb y para F 1 CxP, 4 contigs conun total de 13945 pb. El ensamblador dejó secuencias sin poder montar, que podrían ser potencialesfuentes de información para seguir rearmando la región. En C, quedaron 261 secuencias sinensamblar con un promedio de 1596 pb; estos números fueron de 37 secuencias con un promedio de1939 pb para P y de 743 secuencias de 1173 pb en promedio para F 1 CxP. Los contigs 1 de C y 2tanto de P como de F 1 CxP mapearon en la misma región. Este fragmento pertenece al inicio de laregión de interés abarcando desde el inicio del gen Solyc06g07510 hasta el final del genSolyc06g076540. Al realizar un alineamiento múltiple entre estas secuencias, se identificó que laregión presenta la misma arquitectura que el genoma de referencia, aunque se detectó la presenciade una inserción/deleción de 39 bases en la región promotora del gen de sHSPs Solyc06g076520que no había sido detectada en la secuenciación de segunda generación, en la comparación entre elprogenitor C y P. El resto de los contigs de cada genotipo mapearon en la sección final de la regiónabordada en este estudio, comprendida entre el gen de sHSPs Solyc06g076570 y el genSolyc06g076590. En F 1 CxP, el contig 1 abarcó a toda la región del gen Solyc06g076550, llegandohasta el inicio del gen de sHSPs Solyc06g076560. La información generada por secuenciación detercera generación podría utilizarse en el corto plazo para desarrollar nuevos cebadores a fin depoder explorar esta región de interés en toda su extensión y dilucidar los efectos de su variabilidadsobre el proceso de madurez. Además, esta primera exploración permitió poner a punto unametodología novedosa para amplificar regiones genómicas altamente repetitivas.