IQUIFIB   02644
INSTITUTO DE QUIMICA Y FISICOQUIMICA BIOLOGICAS "PROF. ALEJANDRO C. PALADINI"
Unidad Ejecutora - UE
congresos y reuniones científicas
Título:
Transformación de datos en información
Autor/es:
DI DOMENICO TOMAS; ELIN TEPPA; JOSE MARIA DELFINO; MORTEN NIELSEN; CRISTINA MARINO BUSLJE
Lugar:
Facultad de Farmacia y Bioquímica. UBA
Reunión:
Jornada; 153ª Jornada Científica. Academia Nacional de Farmacia y Bioquímica. "Herramientas modernas para el estudio de aspectos estructurales de proteínas"; 2009
Institución organizadora:
Facultad de Farmacia y Bioquímica. UBA
Resumen:
<!--
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
{mso-style-parent:"";
margin:0cm;
margin-bottom:.0001pt;
mso-pagination:widow-orphan;
font-size:12.0pt;
font-family:"Times New Roman";
mso-fareast-font-family:"Times New Roman";
mso-ansi-language:ES-AR;}
@page Section1
{size:612.0pt 792.0pt;
margin:70.85pt 3.0cm 70.85pt 3.0cm;
mso-header-margin:36.0pt;
mso-footer-margin:36.0pt;
mso-paper-source:0;}
div.Section1
{page:Section1;}
-->
SUMARIO
Pfam es una base de datos
comprehensiva y precisa de familias y dominios de proteínas. Cada familia de
PfamA posee un alineamiento múltiple de secuencias generado con un perfil de
Hidden Markov models (HMMs). Este alineamiento comprende todas las secuencias
proteicas detectadas como de la familia. La versión 23 del NCBI-PfamA, liberada
en Septiembre 2008, contiene 10340 familias de proteínas que cubren el 72% de
las proteínas depositadas en UNIPRO-KB. Además contiene accesion numbers
permanentes, anotación estructural y funcional, cross-referencias con otras
bases de datos y la posibilidad de fácil manejo a través del administrador de
bases de datos SQL.
En este trabajo
presentamos los resultados de la explotación de los datos contenidos en Pfam
(minería de datos) ya que es la mayor base de datos posible de familias de
proteínas y sin duda una mina de datos. El desafío es transformar esos datos en
información valiosa. Discutiremos características generales de las proteínas
como: conservación y redes de coevolución implicadas en enzimas catalíticas,
información acerca de los puentes disulfuro, estadística descriptiva, entre
otras.