Esta publicación se encuentra cerrada
Análisis de datos usando InfoStat
Fecha límite de inscripción
07-06-2024
Tema/resumen
Se trabajarán los siguientes conceptos básicos: dato, información, conocimiento. Manejo del software estadístico InfoStat. Estadística descriptiva univariada y multivariada. Modelación estadística. Aplicaciones.
Objetivo
El objetivo de este taller es presentarle al alumno las diferentes etapas que permiten realizar un análisis de datos y, de esta manera,obtener información a partir de un conjunto de datos.
Objetivos específicos
Se espera que los alumnos puedan:
· Comprender y aplicar los conocimientos básicos relacionados con el análisis de datos y datamining (en general, ciencia de datos).
· Adquirir competencias para detectar problemáticas que puedan ser resueltas mediante el análisis de datos,
·Identificar las técnicas pertinentes de ser aplicadas dependiendo de los objetivos y brindar un espacio para la discusión de las similitudes y diferencias entre técnicas estadísticas.
Disciplina
Otras Ciencias Agrícolas
Modalidad
Virtual
Institución
UNICEN - UNIVERSIDAD NACIONAL DEL CENTRO DE LA PROVINCIA DE BUENOS AIRES
FACULTAD DE AGRONOMIA
Requisitos
Metodología
En este curso se brindarán herramientas para el análisis de datos y la posterior toma de decisiones. Es por esto que se centrará especialmente en la comprensión de los conceptos y en la interpretación de resultados.
Las clases serán teórico-prácticas. En cada una de ellas se expondrán los temas y conceptos propuestos, teniendo presente la necesidad que conlleva a estudiar cada uno de dichos temas. Se planteará la resolución de problemas concretos con la finalidad de “interpretar” cada uno de los conceptos, produciendo de esta manera, una retroalimentación constante entre teoría y práctica. Una vez conceptualizados los puntos más importantes, se hará especial énfasis en el trabajo en datos, esto es, en la práctica de trabajar con conjuntos de datos y decidir las técnicas a aplicar para obtener información a partir de los mismos.
Se trabajará con el software estadístico InfoStat licencia estudiantil (Di Rienzo et al., 2018) y la resolución de problemas se centrará en aplicaciones de las ciencias agrarias.
Evaluación
Para aprobar este curso, se deberá cumplir con los requisitos de asistencia y aprobar con una nota mayor o igual a 7 (siete). Se evaluará con un cuestionario y con un trabajo domiciliario que se expondrá al finalizar el curso.
Duración del curso
40 horas distribuidas de la siguiente manera: 20 horas de clases teórico-prácticas que se dictarán de forma virtual y sincrónica; 10 horas de consulta virtual sincrónica, y 10 horas correspondientes a un trabajo final a ser realizado por los alumnos.
Más información
El mismo estará a cargo de la Dra. María del Carmen Romero.
Se trata de 8 encuentros dictados en modalidad virtual los días 10, 12, 14, 19, 24, 26, 28 de junio y 01 de julio de 8 a 12h.
Programa
Unidad 1. Datos
Dato. Información. Conocimiento. Ciencia de datos.
Etapas del Descubrimiento de Conocimiento en Bases de Datos (KDD: KnowledgeDiscovery Databases). Pre-procesamiento de datos. Limpieza de datos.Datos faltantes: métodos de imputación. Integración y reducción de datos.
El proceso de Data Mining. Tipos de análisispara “extracción” de información. Problemas supervisados y no supervisados.
Postprocesamiento de datos. Utilización del conocimiento.
Introducción a la problemática de trabajar con datos de alta dimensionalidad. Big Data.
Unidad 2. Presentación del software InfoStat
Carga de tablas. Manejo de datos. Edición de datos (inserción y eliminación de filas y columnas, activación de casos). Edición de etiquetas. Tipos dedatos. Ordenamiento. Creación de variables. Unión de tablas.Cargar y exportar resultados. Tipografía.
UNIDAD 3: Preprocesamiento de datos
Datos. Tipos de datos. Calidad. Necesidad del preprocesamiento de datos. Técnicas estadísticas básicas de descripción. Visualización de datos.
Técnicas de preprocesamiento de datos. Limpieza.Datos faltantes: métodos de imputación.Transformación. Integración y reducción de datos.
UNIDAD 4: Problemas supervisados y no supervisados
Principales técnicas estadísticas para la clasificación(supervisada y no supervisada). Estadística descriptiva univariada. Tablas de distribución de frecuencias. Gráficos.Indicadores.
Estadística descriptiva bivariada. Tablas y gráficos para datos bivariados. Medidas de asociación entre variables.
Estadística descriptiva multivariada. Análisis de componentes principales. Análisis de correspondencias múltiples. Análisis de conglomerados (cluster). Análisis discriminante. Análisis de Regresión Lineal Simple y Múltiple.
Análisis de Varianza.
Casos de aplicación en InfoStat: resoluciónde problemas estadísticos aplicados a las ciencias agrarias.
UNIDAD 5: Big-Data
Introducción a la problemática de trabajar con datos de alta dimensionalidad (y datos masivos).La necesidad de plantear métodos nuevos de preprocesamiento y análisis.
Introducciónal Big Data. Definición.Variedad, velocidad y volumen. Fundamentos y Usos del Big Data. Introducción a tecnologías que permiten el almacenamiento y procesamiento de datos masivos o big data.
Nuevas tendencias en Big Data.Aplicaciones.
Para ver más detalles, haga click aquí.