Introducción

La información, en el sentido más amplio, se ha convertido en una de las piezas principales del funcionamiento del mundo actual. La creciente disponibilidad de datos y el incremento acelerado en el poder de cómputo está incidiendo fuertemente en la generación del conocimiento, incluyendo a las ciencias sociales. En particular, el impacto ha sido enorme dentro del quehacer de la política pública y en la organización de las empresas. Los fenómenos como la movilidad social, la criminalidad y la pobreza son actualmente estudiados de forma más fructífera con grandes bases de datos y algoritmos sofisticados. En el sector privado, el otorgamiento de créditos y seguros, la focalización de la publicidad y segmentación de productos y el diseño de estrategias son igualmente alimentados por información granular y algoritmos predictivos.

En la actualidad, el proceso de toma de decisiones debe cumplir, de la mejor manera, con objetivos buscados. Elementos como textos, imágenes, reportes financieros, censos, sonidos, precios, etcétera, deben ser previstos, diagnosticados y descritos para tomar una decisión adecuada a esa información. Hoy en día, este proceso es sumamente complejo y al conjunto de materias teóricas y habilidades técnicas que permiten transformar al caos informático en conocimiento útil para este proceso de decisión, se le denomina ciencia de datos.