Capítulo 1. ¿Qué entendemos por "basado en datos"?

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Sin datos no eres más que otra persona con una opinión.

William Edwards Deming

La orientación a los datos es sobre la creación de herramientas, capacidades y, lo que es más importante, una cultura que actúe sobre los datos. Este capítulo esbozará lo que distingue a las organizaciones basadas en datos. Comienzo con algunos requisitos previos iniciales sobre la recopilación y el acceso a los datos. A continuación, contrastaré con cierto detalle los informes y las alertas frente a los análisis, porque se trata de una distinción muy importante. Hay muchos tipos diferentes de análisis prospectivos, con distintos grados de sofisticación. Por tanto, dedico algún tiempo a repasar esos tipos, describiéndolos en términos de "niveles de análisis" y "madurez analítica", en particular, discutiendo las características de una organización analíticamente madura. ¿Qué aspecto tiene eso?

Iniciemos el camino para responder a nuestra primera pregunta: ¿qué significa para una organización estar basada en datos?

Recogida de datos

Quitemos de en medio un par de requisitos previos obvios de .

Prerrequisito nº 1: Una organización debe estar recopilando datos.

Sin duda, los datos son un ingrediente clave. Por supuesto, no pueden ser datos cualesquiera; tienen que ser los datos adecuados. El conjunto de datos tiene que ser relevante para la pregunta en cuestión. También tienen que ser oportunos, precisos, limpios, imparciales y, quizás lo más importante, fiables.

Es una tarea difícil. Los datos siempre están más sucios de lo que imaginas. Puede haber sutiles sesgos ocultos que pueden influir en tus conclusiones, y limpiar y masajear los datos puede ser una operación ardua, larga y costosa. A menudo oigo que los científicos de datos dedican el 80% de su tiempo a obtener, limpiar y preparar datos, y sólo el 20% a construir modelos, analizar, visualizar y sacar conclusiones de esos datos (por ejemplo, http://bit.ly/nyt-janitor y http://bit.ly/im-data-sci). Según mi experiencia, esto es totalmente plausible. En el próximo capítulo, trataré los aspectos de la calidad de los datos con mucho más detalle.

Aunque tengas datos de calidad, y aunque tengas muchos datos de calidad, sólo llegarás hasta cierto punto y; a pesar del bombo y platillo que puedas oír, eso no te convierte en una empresa basada en datos. Algunas personas, especialmente ciertos vendedores de big data y proveedores de servicios, pregonan los big data como una panacea: si lo recopilas todo, en algún lugar hay diamantes (o pepitas de oro o agujas o una de tantas otras metáforas) que harán que cualquier empresa tenga éxito. La dura verdad es que los datos por sí solos no bastan. Una pequeña cantidad de datos limpios y fiables puede ser mucho más valiosa que petabytes de basura.

Acceso a los datos

Requisito nº 2: Los datos deben ser accesibles y consultables.

Sin embargo, disponer de datos precisos, oportunos y relevantes no es suficiente para considerar que se basa en datos. También debe serlo:

Unible

Los datos deben estar en una forma que pueda unirse a otros datos de la empresa cuando sea necesario. Hay muchas opciones, como las bases de datos relacionales, los almacenes NoSQL o Hadoop. Utiliza la herramienta adecuada para el trabajo. Por ejemplo, durante mucho tiempo, los analistas financieros de Warby Parker utilizaron Excel para calcular las métricas clave de las que informaban a la alta dirección. Obtenían enormes cantidades de datos en bruto de diferentes fuentes y ejecutaban VLOOKUPS (una función de Excel para encontrar referencias cruzadas en los datos) para unir todos esos datos y obtener una visión de alto nivel de las cifras. Al principio funcionó bien, pero a medida que las ventas y la base de clientes de la empresa aumentaban rápidamente, los datos se hacían cada vez más grandes, el archivo de Excel se acercaba a los 300 MB, sus ordenadores agotaban la RAM y los VLOOKUPS tardaban 10 horas o más, se bloqueaban con frecuencia y había que reiniciarlos. Habían estirado la herramienta y el enfoque todo lo que podían. Excel había sido una herramienta adecuada, pero el hipercrecimiento de la empresa lo cambió. La mecánica de obtener esas cifras se convirtió en una enorme pérdida de tiempo para los analistas y en una fuente de estrés por saber si obtendrían sus cifras o tendrían que esperar otras 10 horas para volver a ejecutar esos VLOOKUPS. Pasaron de ser analistas a ingenieros de datos de Microsoft. Mi equipo ayudó a introducir todo ese conjunto de datos en una base de datos relacional MySQL. Escribimos consultas para hacer los cálculos por ellos, lo que les permitió centrarse en el análisis, las tendencias y la presentación de esos datos, un uso mucho mejor de su tiempo. Ahora que disponen de mejores herramientas y más tiempo, están produciendo análisis más profundos y ricos.

Compartible

Debe existir una cultura de intercambio de datos en la organización para poder unir los datos, como combinar el flujo de clics de los clientes con su historial transaccional. Imagina a un paciente ingresado en urgencias de un hospital, que recibe tratamiento y luego se le da el alta con la obligación de acudir a una clínica ambulatoria para recibir tratamiento y revisiones adicionales. El paciente va a recibir un peor servicio al cliente y, lo que es más importante, una peor atención si el hospital y la clínica no comparten datos: cuándo, dónde y por qué ingresó, qué problemas presentaba, qué tratamiento recibió, etc. Desde la perspectiva de los proveedores sanitarios, a sus analistas les va a resultar difícil o imposible analizar y mejorar el proceso y la atención si no tienen una imagen coherente y precisa del flujo de pacientes, los procesos de diagnóstico y los datos longitudinales completos de esos pacientes. Así pues, los datos en silos siempre van a inhibir el alcance de lo que se puede conseguir. Cuando más datos están disponibles para más partes de un sistema, el todo es mayor que la suma de las partes.

Consultable

Debe haber herramientas adecuadas para consultar y trocear los datos. Todos los informes y análisis requieren filtrar, agrupar y agregar datos para reducir las grandes cantidades de datos en bruto a un conjunto más pequeño de cifras de nivel superior que ayuden a nuestro cerebro a comprender lo que ocurre en una empresa. Necesito poder ver tendencias o comprender diferencias entre segmentos de clientes. Los analistas tienen que disponer de herramientas que les permitan calcular esas métricas con relativa facilidad.

(Todos estos temas se tratarán con más detalle en capítulos posteriores).

Vale, ahora tenemos datos y son accesibles. ¿Es suficiente? No, todavía no. Necesitas personas con los conocimientos adecuados para utilizar esos datos. Eso puede significar la mecánica de filtrar y agregar datos, como mediante un lenguaje de consulta o macros de Excel, pero también significa personas que diseñen y elijan las métricas apropiadas para extraer y seguir (este tema se trata en el Capítulo 6). Esas métricas pueden ser tasas de resuscripción (para servicios de suscripción como Netflix o el Wall Street Journal), valores de por vida o métricas de crecimiento, pero alguien tiene que decidirlas y alguien (otro) tiene que crear algún proceso para proporcionar esos valores.

Así pues, para que una organización se rija por los datos, tiene que haber seres humanos en el bucle, seres humanos que hagan las preguntas adecuadas a los datos, seres humanos que tengan las habilidades para extraer los datos y las métricas adecuadas, y seres humanos que utilicen esos datos para informar de los pasos siguientes. En resumen, los datos por sí solos no van a salvar tu organización.

Informar

Supongamos que tienes un grupo analítico con acceso a datos precisos. El grupo extrae datos de ventas y genera un informe en el que afirma con orgullo que las reservas de la empresa crecieron un 5,2% de abril a mayo(Figura 1-1).

Alt Text
Figura 1-1. ¡Crecimiento intermensual de las ventas del 5,2%!

Sin duda, ahora parece más una empresa basada en datos. Sin embargo, esto sigue siendo profundamente insuficiente. Desde luego, es bueno que hagan un seguimiento de estas métricas. El director financiero y el director general estarán sin duda interesados en esas cifras. Sin embargo, ¿qué te dice realmente este valor del 5,2%? Muy poco, de hecho. Hay muchas razones posibles por las que las ventas de la empresa crecieron esa cantidad:

  • Supongamos que vendes un producto muy estacional, como ropa de playa. Puede que el 5,2% sea mucho más bajo de lo normal. Quizá la mayoría de los años, el crecimiento de mayo es superior al 7% respecto al mes anterior y el de este año está muy por debajo de la media.
  • Quizá tu director de marketing gastó mucho dinero en una campaña nacional para dar a conocer la marca. ¿Cuánto de ese 5,2% de crecimiento se generó a partir de esa campaña, y fue esa campaña una buena relación calidad-precio?
  • Quizá tu director general apareció en Good Morning America, o tu producto apareció en Techcrunch, o un vídeo se hizo viral, y ese fue el motor. Es decir, el crecimiento puede remontarse a un acontecimiento impulsor específico e inusual (que puede impulsar un crecimiento transitorio o sostenido).
  • Puede que las ventas mensuales sean de bajo volumen y muy variables. Puede que ese crecimiento fuera pura suerte y que la tendencia general sea a la baja. (Si alguna vez has negociado con acciones, seguro que lo entiendes).
  • Puede que los datos sean erróneos. Si tus ventas son relativamente estables, y observas un pico, y no tienes constancia de ningún acontecimiento inusual, tal vez haya un problema de calidad de los datos.

Todas ellas son posibilidades. La cifra comunicada es sólo eso, un valor numérico sin apenas contexto .

"A medida que las orgs se hacen más grandes y complejas, las personas en la cima dependen menos de la experiencia de primera mano y más de los datos fuertemente procesados". - John Gardner

John Maeda (@johnmaeda) 16 de agosto de 2014

Alerta

¡Ding, ding, ding! El servidor de la aplicación web nº 14 acaba de promediar más de un 98% de utilización de la CPU durante los últimos cinco minutos.

Las alertas son esencialmente informes sobre lo que está ocurriendo en ese momento. Suelen proporcionar datos muy concretos con métricas bien diseñadas. Pero, al igual que los informes, no te dicen por qué estás viendo un pico en la utilización de la CPU, ni te dicen qué hacer, ahora mismo, para rectificar el problema. Como tales, al igual que los informes, carecen de este contexto crucial. No hay explicación causal. Este es el punto en el que los ingenieros de rendimiento o los administradores de sistemas se sumergen en los registros de producción para averiguar qué está pasando, por qué ocurre y qué opciones hay para solucionarlo: revertir algún código, poner en marcha más servidores, reconfigurar el equilibrador de carga, etc.

La Figura 1-2 muestra un ejemplo de la carga del servidor a lo largo del tiempo. Hay cierta variabilidad, pero la mayor parte del día se pasa con una cola de ejecución de alrededor de 0,5 o menos. A la 1 de la madrugada, la carga empieza a aumentar, disparándose a más de 5, un aumento diez veces superior al "normal", en el espacio de 30 minutos. Parece muy inusual. ¿Qué ocurre? Quizá alguien debería arreglarlo, pero ¿cómo?

En este caso, sólo se trata de la ejecución de las copias de seguridad semanales. Esto ocurre todos los jueves a la 1 de la madrugada: perfectamente normal, no hay nada que ver aquí. Esto pone de manifiesto que aquí hay grandes datos y una buena métrica que se presenta con claridad. Pero falta el contexto: que se debe a las copias de seguridad, que ocurre en un horario concreto y que se espera que ocurra a la 1 de la madrugada, y que el servidor puede gestionar esta carga sin problemas.

Alt Text
Figura 1-2. Ejemplo de carga del servidor a lo largo del tiempo (de http://bit.ly/bwf-back).

De los informes y las alertas al análisis

Informes y las alertas son características necesarias, pero no suficientes, de estar basado en datos. Sin embargo, no debemos subestimar la importancia de ambas actividades. Especialmente la elaboración de informes es un componente muy valioso de una organización basada en datos. No se puede tener una organización eficaz sin ella. Sin embargo, lo contrario no es cierto: hay muchas organizaciones que se centran en la elaboración de informes y pueden tener poco o ningún análisis real (objetivo). Por un lado, los informes pueden estar impulsados por requisitos y responsabilidades legales, como el cumplimiento de la ley Sarbanes-Oxley y la generación de informes de resultados para los accionistas, y no por un impulso cultural interno para mejorar el negocio.

Los informes te dicen lo que ocurrió en el pasado. También proporciona una línea de base a partir de la cual observar los cambios y las tendencias. Puede ser interesante y mantener contentos a algunos inversores y accionistas, pero es una visión del mundo fundamentalmente atrasada. Para basarse en los datos, hay que ir más allá. Para tener visión de futuro y dedicarte al análisis, indagar y averiguar por qué cambian las cifras y, en su caso, hacer predicciones comprobables o realizar experimentos para reunir más datos que arrojen luz sobre el porqué.

Seamos más explícitos y comparemos y contrastemos ambas. He aquí un conjunto de definiciones:

Informar

"El proceso de organizar los datos en resúmenes informativos para controlar el rendimiento de las distintas áreas de una empresa"1

Análisis

"Transformar los activos de datos en perspectivas competitivas que impulsen las decisiones y acciones empresariales utilizando personas, procesos y tecnologías"2

Los informes dicen lo que ocurrió: alcanzamos un pico de 63.000 visitantes simultáneos en el sitio web el jueves a las 10:03 a.m. Suelen proporcionar un alcance muy específico.

El análisis dice por qué ocurrió -la empresa fue mencionada en un reportaje del programa de televisión 60 Minutos a las 10:01 de la mañana- y debe recomendar lo que la organización puede o debe hacer para generar más o menos de lo mismo.

El informe es objetivo, descriptivo. El análisis, en cambio, es prescriptivo.

En el Cuadro 1-1, resumimos las diferencias entre ambos. Esperemos que ahora esté claro por qué el análisis y el hecho de basarse en datos es una faceta o un componente cultural tan poderoso de una empresa. Es lo que puede impulsar a una empresa en nuevas direcciones o hacia mayores niveles de eficacia.

Tabla 1-1. Atributos clave del informe frente al análisis (en su mayor parte extraídos de Dykes, 2010).
Informar Análisis
Descriptivo Prescriptivo
¿Cómo? ¿Por qué?
Mirando hacia atrás Previsiones
Plantea preguntas Responde a las preguntas
Datos → información Datos + información → conocimientos
Informes, cuadros de mando, alertas Conclusiones, recomendaciones, predicciones
Sin contexto Contexto + narración

Un marco útil para entender la analítica es el de Davenport et al.3 (ver Tabla 1-2).

Tabla 1-2. Preguntas clave hipotéticas de Davenport abordadas por la analítica (modificado de Davenport et al., 2010). D) es una analítica valiosa, pero sólo E) y F) se basan en datos, y sólo si se actúa en consecuencia (más explicaciones en el texto).
Anterior Presente Futuro
Información

A) ¿Qué ha pasado?

Informar

B) ¿Qué está pasando ahora?

Alertas

C) ¿Qué ocurrirá?

Extrapolación

Insight

D) ¿Cómo y por qué ocurrió?

Modelización, diseño experimental

E) ¿Cuál es la siguiente mejor acción?

Recomendación

F) ¿Qué es lo mejor/peor que puede pasar?

Predicción, optimización, simulación

Aquí podemos ver actividades impulsoras de la comprensión en la fila inferior. Como he señalado antes, los informes (A) y las alertas (B) simplemente no se basan en datos: afirman lo que ocurrió en el pasado o que algo inusual o indeseable está ocurriendo ahora; no explican por qué está ocurriendo o por qué ocurrió, ni recomiendan cómo resolver o reproducir la situación. Indagar para comprender los factores causales mediante modelos o experimentos (D) es un precursor de la orientación a los datos. Sólo comprendiendo por qué ha ocurrido algo puedes formular un plan o un conjunto de recomendaciones (E). E) y F) se basan realmente en los datos, pero sólo si se actúa en función de la información, como se explica en detalle más adelante.

(C es una zona peligrosa: puede ser bastante fácil extender una tendencia percibida hacia el futuro -en Excel, haz clic en "Gráfico" y luego en "Añadir línea de tendencia"-, es decir, extrapolar fuera del rango de datos actuales y hacer una predicción ingenua. Incluso haciendo una elección sensata sobre una forma funcional para el modelo, hay muchas razones por las que esa predicción puede ser engañosa o simplemente errónea. Para tener confianza en esas predicciones, debes esforzarte por tener un modelo causal. Los tipos de análisis se tratan en el Capítulo 5).

En resumen, la fila inferior destaca las actividades orientadas al futuro que incluyen elementos de explicación causal. Ahora empezamos a tocar lo que significa estar basado en datos.

Los rasgos distintivos de la orientación a los datos

Hay varios tipos de actividades que realizan las organizaciones verdaderamente basadas en datos:

  • Una organización basada en datos puede estar realizando pruebas continuamente. Puede que esté haciendo pruebas A/B del flujo de pago en un sitio web o probando las líneas de asunto de los correos electrónicos en una campaña de marketing. LinkedIn, por ejemplo, realiza 200 experimentos al día, mientras que Etsy realiza docenas de experimentos simultáneamente. Las pruebas también pueden incluir pruebas con usuarios: trabajar directamente con clientes o usuarios reales para obtener opiniones directas sobre posibles nuevas funciones o productos.
  • Una organización basada en datos puede tener una mentalidad de mejora continua. Puede estar implicada en la optimización repetida de los procesos básicos, como recortar minutos a los tiempos de fabricación o disminuir el coste por adquisición. Esto se consigue mediante un análisis minucioso, la elaboración de modelos matemáticos o estadísticos y la simulación.
  • Una organización impulsada por los datos puede estar implicada en el modelado predictivo, la previsión de ventas, las cotizaciones bursátiles de o los ingresos de la empresa, pero, lo que es más importante, retroalimentando los errores de predicción y otros aprendizajes a los modelos para ayudar a mejorarlos (tratamos esto con más detalle en el Capítulo 10).
  • Una organización basada en datos casi seguro que elegirá entre opciones o acciones futuras utilizando un conjunto de variables ponderadas. Los recursos son siempre finitos, y siempre hay pros y contras para distintos cursos de acción razonables. Hay que reunir datos para cada una del conjunto de variables que preocupan o interesan y determinar ponderaciones entre ellas para generar una decisión principal final. Por ejemplo, cuando Warby Parker eligió la ubicación de su primera oficina fuera de Nueva York, tuvo en cuenta un amplio conjunto de variables -índice de Bienestar de Gallup, reserva de talentos, coste de la vida, número y coste de los vuelos a Nueva York, etc.- y las clasificó y ponderó como parte de la decisión final. Marissa Mayer (consejera delegada de Yahoo!) cuenta una historia similar cuando eligió entre ofertas de trabajo competidoras y tomó la decisión de trabajar para Google.4

Una verdadera organización basada en datos hará al menos una de estas cosas, algo con visión de futuro donde los datos sean ciudadanos de primera clase.

Bien, ahora tenemos una organización que dispone de datos de alta calidad y analistas cualificados que se dedican a estas actividades prospectivas. Sin duda, ¡eso la convierte en una organización basada en datos!

Por desgracia, no necesariamente. Como un árbol que cae en un bosque sin que nadie lo oiga, si los analistas emiten análisis pero nadie se da por enterado, si no influyen en las decisiones de los responsables, que siguen basándose en el instinto y la opinión, no está basado en datos. Los análisis tienen que informar e influir en las personas influyentes.

Dykes habla de esto en términos de una "cadena de valor analítica" (ver Figura 1-3). Los datos tienen que impulsar los informes, que deben conducir a inmersiones y análisis más profundos. Esos análisis tienen que llegar al responsable de la toma de decisiones, que los incorpora a su proceso de toma de decisiones. Este paso es clave para basarse en los datos. Una organización necesita esos datos y ese análisis para impulsar una decisión que cambie la estrategia o las tácticas y tenga un impacto final en la organización de alguna manera. La tecnología y la formación pueden hacer la primera parte: permitir a los analistas realizar análisis y redactar sus conclusiones. Sin embargo, es la cultura la que establece la mentalidad y el proceso para tener en cuenta esas conclusiones, confiar en ellas y actuar en consecuencia.

Por último, llegamos al quid de la cuestión de lo que significa basarse en los datos. Una organización basada en datos utilizará los datos como prueba crítica para ayudar a informar e influir en la estrategia. Habrá una cultura basada en pruebas en la que se pueda confiar en los datos y el análisis sea muy relevante, informativo y se utilice para determinar los siguientes pasos.

Ahí radica el reto. Si tu organización toma decisiones viscerales, ¿cómo puedes defender una toma de decisiones más basada en datos? No es fácil ni rápido, así que no esperes cambios radicales de la noche a la mañana, pero todos los miembros de una organización pueden contribuir significativamente a esa mejora. En este libro, examinaremos una serie de formas en que la cultura de una organización debería impulsarse para estar más orientada a los datos.

Alt Text
Figura 1-3. La cadena de valor de la analítica (de Dykes, 2010). En una organización basada en datos, éstos alimentan los informes, que estimulan un análisis más profundo. Éstos llegan a los responsables de la toma de decisiones, que los incorporan a su proceso decisorio, influyendo en la dirección que toma la empresa y aportando valor e impacto. Figura de http://bit.ly/dykes-reporting.

Madurez analítica

En 2009, Jim Davis, vicepresidente senior y director de marketing de SAS Institute, declaró que existen ocho niveles de analítica:5

Informes estándar

¿Qué ocurrió? ¿Cuándo ocurrió? Ejemplo: informes financieros mensuales.

Informes ad hoc

¿Cuántos? ¿Con qué frecuencia? ¿dónde? Ejemplo: informes personalizados.

Desglose de consultas (o procesamiento analítico en línea, OLAP)

¿Dónde está exactamente el problema? ¿Cómo encuentro las respuestas? Ejemplo: descubrimiento de datos sobre tipos de usuarios de teléfonos móviles y su comportamiento en las llamadas.

Alertas

¿Cuándo debo reaccionar? ¿Qué acciones son necesarias ahora? Ejemplo: La utilización de la CPU mencionada anteriormente.

Análisis estadístico

¿Por qué está ocurriendo esto? ¿Qué oportunidades me estoy perdiendo? Ejemplo: ¿por qué hay más clientes bancarios que refinancian sus viviendas?

Previsión

¿Y si estas tendencias continúan? ¿Cuánto se necesita? ¿Cuándo se necesitará? Ejemplo: los minoristas pueden predecir la demanda de productos de una tienda a otra.

Modelización predictiva

¿Qué ocurrirá a continuación? ¿Cómo afectará a mi negocio? Ejemplo: los casinos predicen qué clientes VIP estarán más interesados en determinados paquetes vacacionales.

Optimización

¿Cómo hacemos mejor las cosas? ¿Cuál es la mejor decisión para un problema complejo? Ejemplo: ¿cuál es la mejor manera de optimizar la infraestructura informática dadas las múltiples y conflictivas limitaciones empresariales y de recursos?

Estas ideas parecen constituir la base de una figura del influyente libro de 2007 de Davenport y Harris, Competing on Analytics,6 que aquí se muestra como Figura 1-4.

Alt Text
Figura 1-4. "Inteligencia y analítica empresarial" de Competing on Analytics de Davenport y Harris. HBR Press, anteriormente derivada de los niveles de analítica de Jim Davis.

(Puedes ver que en esto también se basa el marco de Davenport y la Tabla 1-2. Puedes asignar fácilmente los cuatro primeros niveles a la fila superior de información y el segundo grupo de cuatro a la fila inferior de perspicacia de la Tabla 1-2).

Me gusta el concepto general y las etiquetas. Sin embargo, en la forma en que tanto Davis (2009) como Davenport y Harris (2007) presentan sus ideas, especialmente con la gran flecha ascendente, es demasiado fácil interpretarlo como una progresión o una especie de jerarquía, algo así como un videojuego en el que avanzas a cada nivel siguiente sólo después de haber conquistado el nivel anterior.

Esta pseudoprogresión suele denominarse madurez analítica. Si buscas "madurez analítica" en Google, verás a qué me refiero: muchos proveedores y profesionales del BI la presentan como un conjunto de peldaños con flechas unidireccionales que apuntan de un nivel al siguiente. La analítica no es así: atraviesa niveles dentro de un análisis, y distintas partes de la organización pueden estar implicadas en análisis de distintos grados de sofisticación en un momento dado. Ron Shevlin7 señala algunos puntos importantes:

Desde el punto de vista de las capacidades, no hay ninguna razón por la que una empresa no pueda prever algo como las ventas ("nivel" 6) sin saber dónde está exactamente el "problema" con las ventas ("nivel" 3)... ¿Cómo podría yo, como directivo, abordar la cuestión de "qué acciones son necesarias ahora" sin comprender en cierta medida "qué ocurrirá si estas tendencias continúan" y "qué ocurrirá después"? ("niveles" 6 y 7)?

La forma correcta, creo, de interpretar esto es pensar que el nivel máximo en el que está comprometida la organización está correlacionado positivamente con el nivel de compromiso, inversión y utilidad de la analítica y, como sostienen Davenport y Harris, con la competitividad analítica. Por ejemplo, si tienes un equipo de investigación de operaciones formado por doctores dedicados a optimizar tu cadena de suministro global, está claro que inviertes mucho en datos y analítica. Si tu organización sólo llega a las alertas y los desgloses de consultas, tienes una inversión menor y estás menos orientado a los datos .

La implicación subyacente es que los análisis más sofisticados son mejores; hacen que una organización sea más competitiva. ¿Es eso cierto? En un estudio fascinante8 MIT Sloan Management Review colaboró con el IBM Institute for Business Value para encuestar a 3.000 directivos y analistas de 30 sectores acerca de su uso y creencias sobre el valor de la analítica.

Una pregunta de la encuesta se refería a la posición competitiva de la organización, y las respuestas posibles eran:

  1. Superan sustancialmente a sus homólogos del sector
  2. Rendimiento algo superior al de sus homólogos del sector
  3. A la par con los compañeros del sector
  4. Rendimiento algo o sustancialmente inferior al de los homólogos del sector

Las organizaciones que eligieron las respuestas 1 ó 4 fueron consideradas de alto y bajo rendimiento, respectivamente. Curiosamente, en comparación con las de menor rendimiento, las de mayor rendimiento eran:

  • Cinco veces más probabilidades de utilizar la analítica
  • Tres veces más probabilidades de ser usuarios sofisticados de análisis
  • Dos veces más probabilidades de utilizar la analítica para orientar las operaciones cotidianas
  • Dos veces más probabilidades de utilizar la analítica para orientar las estrategias futuras

Sin duda, hay factores que complican la metodología. Puede haber un importante sesgo de supervivencia, y es probable que exista una correlación entre los mejores resultados y el tamaño de la organización (sabemos que los ingresos de estas organizaciones oscilaban entre menos de 500 millones de dólares y más de 10.000 millones de dólares). Por ejemplo, quizá sólo las organizaciones más grandes y con más éxito dispongan del ancho de banda y los recursos necesarios para desarrollar sofisticados departamentos de investigación operativa que puedan desarrollar y ejecutar modelos de simulación de la cadena de suministro. Sin embargo, hubo un amplio acuerdo en que una analítica mejor y más sofisticada impulsaba el valor empresarial.

Los autores identificaron tres niveles de capacidad analítica: aspiracional, experimentado y transformado. Se resumen en la Tabla 1-3.

Tabla 1-3. Niveles de capacidad analítica: aspiracional, experimentado y transformado. Modificado de http://bit.ly/sloan-big-data.
Aspiracional Con experiencia Transformado
Utiliza la analítica para... Justifica las acciones Acciones guía Prescribir acciones
Utilizar enfoques rigurosos para tomar decisiones Raramente A veces Principalmente
Capacidad para captar, agregar y analizar o compartir información y puntos de vista Limitado Moderado Alta
Competencia funcional
  • Finanzas y presupuestos
  • Operaciones y producción
  • Ventas y marketing
  • Todas las funciones aspiracionales
  • Estrategia / biz-dev
  • Atención al cliente
  • I+D de productos
  • Todas las funciones con aspiraciones y experiencia
  • Gestión de riesgos
  • Experiencia del cliente
  • Planificación de la mano de obra
  • Dirección general
  • Gestión de marca y marketing

En comparación con las organizaciones aspiracionales, las organizaciones transformadas fueron:

  • Cuatro veces más probabilidades de captar muy bien la información
  • Nueve veces más probabilidades de agregar muy bien la información
  • Ocho veces más probabilidades de analizar muy bien la información
  • Diez veces más probabilidades de difundir muy bien la información y los conocimientos
  • 63% más de probabilidades de utilizar una unidad de análisis centralizada como fuente principal de análisis (las estructuras organizativas de análisis se tratan en el Capítulo 4)

De nuevo, aquí hay una complicada maraña de causas y efectos y sesgos, pero existe una asociación entre la ventaja competitiva, en relación con los homólogos del sector, y la sofisticación analítica.

Entonces, ¿qué impide a las organizaciones adoptar ampliamente la analítica? Dos de las tres respuestas principales fueron la falta de comprensión sobre cómo utilizar la analítica y la falta de capacidades internas en la línea de negocio (véase la Figura 1-5).

Alt Text
Figura 1-5. Respuesta a la pregunta: "¿Cuáles son los principales obstáculos para la adopción y el uso generalizados de la información y la analítica en tu organización?"

Son algo que todos, incluidos todos los analistas, pueden ayudar a impulsar. Por ejemplo, los analistas pueden ayudar a "subir de nivel" su conjunto de habilidades y pueden ser más proactivos a la hora de hacer un buen trabajo y comunicar su valor a sus jefes y a la empresa. Pueden investigar más para desenterrar estudios de casos sobre cómo otras organizaciones abordaron problemas empresariales similares mediante la analítica. Los jefes de los ingenieros de datos pueden asignar recursos a la integración y calidad de los datos para que se confíe en ellos. Los altos directivos pueden promover o exigir que se compartan más los datos y designar una propiedad y una administración más claras de los datos, como nombrar un director de análisis o un director de datos (tratado en el Capítulo 11). Todo el mundo tiene un papel que desempeñar.

Visión general

Profundizaremos en estas cuestiones en los capítulos siguientes. Más concretamente, examinaré las necesidades en cuanto a la base: los propios datos brutos y agregados y su calidad (Capítulos 2 y 3). A continuación, examinaré la propia organización de los analistas: los tipos de analistas, las competencias que deben poseer y cómo deben estructurarse(Capítulo 4). Trataré aspectos del análisis de datos(Capítulo 5), el diseño de métricas(Capítulo 6) y la narración de historias con datos(Capítulo 7). El Capítulo 8 trata de las pruebas A/B. Y, lo que es más importante, trataremos la cultura y el proceso de toma de decisiones que caracterizan a una gran organización basada en datos (capítulos 9 y 10). Hablaré de lo que se necesita para gestionar la cultura y la gestión del cambio, especialmente en las grandes organizaciones: una dirección ejecutiva impulsada por los datos. En concreto, trataré tres nuevos cargos ejecutivos: director de datos, director digital y director de análisis(Capítulo 11). El Capítulo 12 trata de cuestiones éticas y de privacidad de los datos, y de cómo una organización que respeta los datos de sus usuarios puede, de hecho, limitar lo que sus analistas pueden hacer con los datos. Terminaré con algunas conclusiones generales(Capítulo 13).

1 Dykes, B., "Informe vs. Análisis: ¿Cuál es la diferencia?" Blog de Marketing Digital, 19 de octubre de 2010.

2 Faria, M., "Acting on Analytics: Cómo construir una empresa impulsada por los datos". BrightTALK, 11 de septiembre de 2013.

3 Davenport, T.H., J. G. Harris y R. Morison. Competir con análisis. Boston: Harvard Business Press, 2010.

4 Bosker, B., "Marissa Mayer, ejecutiva de Google, explica por qué no hay más chicas geeks". The Huffington Post, 6 de julio de 2011.

5 SAS, "Ocho niveles de análisis" (Cary, NC: SAS Institute, Inc., 2008), 4.

6 A pesar de haber aparecido dos años antes, la fuente de Davenport y Harris se cita como "adaptación de un gráfico elaborado por SAS".

7 Shevlin, R., "¿Los ocho niveles de la analítica?" La Marca Financiera, 27 de octubre de 2009.

8 LaValle, S., M. S. Hopkins, E. Lesser, R. Shockley, N. Kruschwitz, "Analítica: El nuevo camino hacia el valor". MIT Sloan Management Review, 24 de octubre de 2010.

Get Crear una organización basada en datos now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.