El origen de las actuales bases de datos se puede encontrar en el año 1884, en Nueva York, atribuyéndosele a Herman Hollerlith, quien inventó una máquina estadística de fichas perforadas para la realización del censo de Estados Unidos de 1890, siendo capaz de procesar los datos de 60 millones de ciudadanos en menos de 3 años. Esta máquina es considerada por algunos como el primer ordenador de la historia.
Con el paso del tiempo, la necesidad de almacenamiento y procesamiento de información fue creciendo, generando ya los primeros pasos de la analítica de datos, pues los volúmenes eran cada vez más grandes y se necesitaban mecanismos para ser procesados.
Durante los años 30 y 40 del siglo XX surgen grandes avances en la materia, considerando esta época también por algunos como el inicio de la era de la computación. Sin embargo, fue después de la II Guerra Mundial cuando la informática vivió sus primeros avances significativos.
Uno de los principales, donde ya se puede hablar de Procesamiento del Lenguaje Natural (PLN), es un experimento que tuvo lugar en 1954, llamado “Experimento Georgetown – IBM”, el cual ya muestra signos de Machine Learning o Aprendizaje Automático.