MS Excel es una herramienta muy versátil, útil e intuitiva. Además la curva de aprendizaje es muy rápida para funcionalidades simples, lo que permite obtener resultados de manera rápida.

Por estos motivos, es una de las herramientas informáticas más usadas en el mundo.

 

Las funcionalidades de MS Excel incluyen, entre otras:

  • La carga de datos externos.
  • La transformación de esos datos mediante fórmulas.
  • La visualización de datos en forma de tablas, tablas dinámicas y gráficos.

Es decir, MS Excel contiene los componentes básicos de un sistema de Business Intelligence (BI).

Esto explica porqué hay organizaciones que utilizan MS Excel como su herramienta de BI.

Hoy voy a exponer los 3 motivos principales por los cuales considero que BI no puede ser considerada una herramienta de BI:

  • La limitación en el número de filas
  • La carga y transformación de datos
  • El rendimiento

Limitación en el número de filas

El número de filas de una hoja (pestaña) de MS Excel es de 1.048.576 (220). Ahora estamos de suerte, puesto que en versiones anteriores a MS Excel 2007, esta limitación era tan solo de 65.536 filas (216).

En algunos entornos, este volumen de datos es suficiente. Si no se dispone de una gran cantidad de datos, MS Excel es capaz de acomodarlos en su poco más de un millón de filas por pestaña.

Sin embargo, esta situación podría no darse si la organización decide ampliar el objeto de su solución de BI. Quizá los nuevos procesos de negocio a analizar requieren el uso de más datos, con lo que chocaríamos con esta limitación.

En mi vida como consultor me he encontrado con clientes muy contentos con su solución de BI basada en MS Excel. Pero algunos de ellos no podían analizar todo su negocio porque algunas áreas de éste tenía demasiados datos, con lo cual tenían que pedir a IT una solución técnica cada vez que necesitaban sacar información de esas áreas de negocio. Esto implica la existencia de diferentes procesos de gestión de los datos y la imposibilidad de cruzar información de distintas áreas de negocio en una única solución de BI.

La conclusión es que la existencia de un número máximo de filas puede ser una limitación para el crecimiento de una solución de BI.

Y aún otra limitación para los que necesitan muchos datos: El número de columnas en una hoja de MS Excel es de 16.384 (214).

Carga y transformación de datos

En BI, el proceso de carga y extracción de datos (también conocido como ETL, del inglés Extraction, Transformation and Load), permite obtener datos de fuentes externas, adaptarlos a una estructura nueva (el modelo de datos) y realizar transformaciones en los valores (como puede ser usar un formato común).

La gran variedad de fuentes de datos existentes hoy en día hacen que cualquier herramienta de ETL necesite conectores a una gran cantidad de fuentes de datos para poder ser versátil.

En este apartado, Microsoft ha hecho un buen trabajo ampliando la conectividad de MS Excel. Actualmente, cuenta con conectores a los siguientes tipos de fuentes de datos:

  • Fichero
  • Base de datos
  • Microsoft Azure
  • Servicios Online
  • Otras fuentes de datos

Podéis obtener una lista completa y actualizada en el siguiente enlace:

Import data from external data sources (Power Query)

Sin embargo, en el área de la transformación de los datos, ésta se realiza a partir de las fórmulas disponibles en MS Excel.

MS Excel contiene una gran variedad de fórmulas. Con ellas podemos realizar una gran variedad de transformaciones en los datos, ya sean de tipo texto, como numérico o fecha. Su sintaxis es clara y concisa, pero cuando debemos realizar transformaciones complejas que incluyen el uso de distintas fórmulas, el resultado es una fórmula compleja por su difícil lectura y mantenimiento.

Cierto es que podemos simplificar las fórmulas partiéndolas en componentes, usando columnas para calcular los pasos intermedios, pero este procedimiento tiene un inconveniente: Incrementa los datos en la hoja MS Excel por el uso de nuevas columnas, hecho que dificulta la gestión del fichero y aumenta el número de cálculos a realizar para mantener los datos actualizados.

Además, para poder guardar los datos en pasos intermedios (como sería una tabla temporal en un proceso de ETL), los datos deben guardarse en la misma hoja MS Excel, lo que puede generar grandes volúmenes de datos y confusión a la hora de gestionar el fichero.

En resumen, el uso de las fórmulas de MS Excel proporciona la capacidad de transformar los datos, pero no es una solución cómoda desde el punto de vista del mantenimiento de la solución de BI.

Rendimiento

MS Excel realiza un recálculo de los valores de las celdas en función de sus dependencias. Toda celda puede tener dependencias si contiene una fórmula basada en otras celdas. Por tanto, cada vez que el valor de una celda cambia, MS Excel debe recalcular el valor de las celdas que dependen de esa celda cuyo valor se ha modificado.

Si realizamos una carga de datos externa, MS Excel deberá cambiar las celdas (dependientes) que dependan del valor de las filas cargadas. Y si las celdas dependientes han cambiado su valor, deberá propagar los cambios a otras celdas con dependencias sobre éstas. Y éstas a su vez pueden tener dependencias, con lo que el proceso debe hacer cálculos hasta que no se encuentren más dependencias entre celdas.

Por tanto, si el número de celdas cargadas es elevado, el número de dependencias en toda la hoja MS Excel puede crecer rápidamente. Y esto hace que MS Excel tenga que realizar una gran cantidad de cálculos.

Si el usuario trabaja con un ordenador personal, normalmente no suele ser un ordenador de grandes prestaciones. Con lo cual, en una situación así, puede darse el caso de que MS Excel deba dedicar unos segundos (o hasta minutos) a la realización de cálculos para poder actualizar todos los valores dependientes. En este caso, se produce una experiencia de usuario pobre debido al bloqueo de MS Excel durante el tiempo de recálculo. Una situación nunca deseada.

Conclusión

MS Excel tiene muchas funcionalidades muy interesantes desde el punto de vista del análisis de datos. Cuando los requerimientos que puede tener una organización lo permiten, MS Excel puede ser una buena solución para analizar datos.

Sin embargo, hay ciertas limitaciones a tener en cuenta, como son la limitación en el número de filas, la carga y transformación de datos, y el rendimiento de un fichero MS Excel.

Yo soy partidario de conocer bien los requerimientos y necesidades de mi cliente, tanto a corto como medio plazo, antes de proponer una tecnología. Pensando en grande, no recomendaría el uso de MS Excel. Sin embargo, si una organización está utilizando esta herramienta y ésta no le supone ningún problema, no veo mal que continúen utilizándola… a corto plazo, puesto que tarde o temprano, estoy seguro de que se encontrarán con alguna de estas limitaciones.

Deja una respuesta