CEDIE   05498
CENTRO DE INVESTIGACIONES ENDOCRINOLOGICAS "DR. CESAR BERGADA"
Unidad Ejecutora - UE
congresos y reuniones científicas
Título:
Estudio de la variabilidad genómica del virus Epstein Barr en aislamientos de Argentina
Autor/es:
BERENSTEIN, ARIEL J; LORENZETTI, MARIO; IZQUIERDO AGUSTIN; BLAZQUEZ CATALINA; PRECIADO, MARIA VICTORIA
Reunión:
Simposio; 5to Simposio Argentino de Jóvenes Investigadores en Bioinformática; 2020
Institución organizadora:
Argentinian Regional Student Group Member of the ISCB Student Council
Resumen:
Introducción: El virus de Epstein Barr (EBV), agente etiológico de la mononucleosis infecciosa, se asocia además a patologías malignas de origen linfoide y epitelial. Existen 2 tipos, EBV1 y EBV2, que se diferencian por polimorfismos en los genes EBNA2, EBNA3A, 3B y 3C. Se han descripto variantes virales asociadas a patologías y otras restrictas a ciertas regiones geográficas.Anteriormente se caracterizaron marcadores de patogenicidad o localización geográfica en genes puntuales de EBV; sin embargo, con el advenimiento de las nuevas tecnologías de secuenciación masiva (NGS) ya se han secuenciado más de 800 genomas completos de diversas regiones del mundo aunque América del Sur continúa subrepresentada. Objetivo: Caracterizar las variantes intrínsecas de los genomas de EBV de Argentina en el contexto de las secuencias de otras regiones geográficas. Materiales y métodos: Se secuenciaron 15 aislamientos de pacientes pediátricos argentinos con patologías asociadas a EBV y carga viral mayor a 106 copias/ug de ADN en el equipo NexSeq500. Las librerías se construyeron con reactivos SureSelectQXT Custom Target Enrichment. Paralelamente, se descargaron 202 FASTQ de aislamientos de distintas regiones geográficas disponibles en la base de datos SRA-NCBI. Los 217 archivos FASTQ se procesaron con el mismo pipeline bioinformático de desarrollo propio, basado en una estrategia de mapeo contra referencia y que contempla la información del VCF en la construcción de la secuencia consenso. Las secuencias se alinearon utilizando MAFFT, y el análisis filogenético se desarrolló con el software IQTree. El análisis de componentes principales (PCA) se realizó con Adegenet. Resultados: A partir del número de variantes por unidad de longitud mapeadas contra EBNA2 y EBNA3, se identificaron 192 aislamientos EBV1, 20 EBV2 y 4 recombinantes. Los genomas recombinantes no se incluyeron en el análisis posterior. En el árbol filogenético se observan 2 clados principales, EBV1 y EBV2. Mientras que el clado EBV2 está principalmente compuesto por aislamientos de origen Argentino y Africano, el clado EBV1 es cosmopolita; sin embargo, se observó un subclado conformado casi exclusivamente por secuencias asiáticas. La marcada estructura geográfica observada en las secuencias Asiáticas, es consistente con el PCA. Además este análisis nos permitió reconocer dos importantes subpoblaciones dentro de Asia: Asia continental y Asia Insular. Los genomas EBV1 provenientes de Argentina, segregan junto a las secuencias de África y Europa. Las secuencias argentinas presentan un número de variantes heterogéneo frente a la referencia, mientras que el clado asiático presenta mayor variabilidad frente a la referencia pero menor variabilidad intra clado. Conclusiones: El análisis de todos los FASTQ con un mismo pipeline de desarrollo propio, permitió analizar los primeros genomas de Argentina conjuntamente con los de otras regiones y nos independizó de los diversos criterios aplicados por otros grupos de investigación para construir secuencias consenso. Nuestros resultados preliminares sobre EBV1, sugieren que la clasificación en EBV1 y EBV2 no refleja la compleja variabilidad de los genomas virales, que presenta una marcada estructura geográfica. Este trabajo incrementó el número de genomas virales completos de nuestra región geográfica y permitió inferir la relación filogenética de nuestras secuencias con las de África y Europa, lo que podría reflejar la historia de migratoria de nuestro país.