Capítulo 1. Comunicar datos
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
"Como la catedral a sus cimientos , así una presentación eficaz de los hechos a los datos".
Willard Cope Brinton
Hay algo sobrecogedor en presenciar datos bien comunicados; es muy parecido a encontrarse con una maravilla arquitectónica. Piensa en la primera vez que viste el vídeo de Hans Rosling interactuando con datos sobre el desarrollo mundial en el escenario, o cuando viste por primera vez en Internet una visualización bien diseñada del New York Times. Cuando los datos se comunican bien, es fácil apreciar al mismo tiempo los datos en sí y la presentación de esos datos. Estos dos elementos pueden unirse en una experiencia global que te haga sentir que comprendes mejor el mundo y que quieres hacer algo con tus nuevos conocimientos.
Por otra parte, piensa en alguna ocasión en la que hayas sufrido durante una presentación en el trabajo que incluía tablas y gráficos mal diseñados con información superflua, o todas esas infografías que desearías no haber visto nunca y que desviaban horriblemente las cifras y te dejaban con la sensación de ser más tonto. O los cimientos estaban irremediablemente agrietados o el edificio en sí era inexcusablemente cutre, o ambas cosas. No todos los edificios son catedrales.
¿Cuál es la diferencia entre estos dos tipos de experiencias? Es una cuestión de si los que diseñaron y transmitieron el mensaje eran expertos en comunicar datos.
Este libro trata precisamente de eso. Comunicar datos es simplemente un caso especial de la comunicación en general (hablaremos de ello más adelante), que incorpora afirmaciones cuantitativas sobre el universo. En este contexto, no utilizamos la palabra "datos" en el sentido general de información objetiva, sino en el sentido más específico de "información en forma numérica que puede transmitirse o procesarse digitalmente": cerosy unos en bases de datos, hojas de cálculo y tablas.
Éste también es un libro sobre el uso de Tableau. Este libro te mostrará cómo utilizar Tableau para comunicar bien los datos, aunque puedes aplicar los principios y métodos tratados en este libro al uso de otras herramientas. No pretende ser un manual exhaustivo de Tableau, ni guiarte en la adquisición y almacenamiento reales de tus datos. Aunque esos son pasos necesarios, el objetivo de este libro es ayudarte a tomar todos esos datos que tienes y transmitir su mensaje con eficacia e impacto.
Un paso en el proceso
¿En qué se diferencia la "comunicación de datos" de los demás pasos del proceso general que comienza con una pregunta y termina con una visión compartida? La Figura 1-1 presenta el proceso general de descubrimiento de datos, y muestra dónde encaja la comunicación de datos en ese proceso.
El proceso altamente iterativo suele comenzar con una pregunta, que puede ser específica ("¿qué combinación de productos se da con más frecuencia?") o general ("¿qué podemos aprender sobre las ventas históricas de nuestros productos?"). El siguiente paso es recopilar datos, si se dispone de ellos (por ejemplo, ventas históricas). Luego viene el proceso, a menudo arduo, de estructurar los datos, también llamado "data munging" o "data wrangling". En este paso, los datos se formatean, se moldean, se fusionan, se convierten y se manipulan de cualquier otro modo, de forma que sean aptos para el siguiente paso, la exploración de datos. En este paso, los datos se observan y analizan desde diversos ángulos hasta que se obtienen una o varias percepciones. Estas percepciones forman el mensaje que implica la comunicación de los datos, el paso en el que las afirmaciones cuantitativas se comparten con los demás. Aunque este libro se ocupa principalmente de este último paso, también abordará los demás pasos del proceso, ya que contribuyen a la formación del mensaje que debe comunicarse.
Para examinar con más detalle la idea de comunicar datos, volvamos a la cuna de la teoría de la información: los Laboratorios Bell.
Un modelo de comunicación
Corría el año 1949, y dos empleados de los Laboratorios Bell -Claude Elwood Shannon y su coautor Warren Weaver- publicaron un artículo fundamental en la editorial de la Universidad de Illinois titulado La teoría matemática de la comunicación. En él, introdujeron un modelo de sistemas de comunicación en el que una "fuente deinformación" selecciona un mensaje y a continuación un "transmisor cambia este mensaje en la señal que se envía realmente por el canal de comunicación desde el transmisor al receptor " (ver Figura 1-2).
Para ilustrar el modelo, considera el habla oral: la fuente de información es el cerebro de una determinada persona; el transmisor es el sistema vocal de esta persona; el canal son las ondas sonoras que viajan al chocar las partículas del aire; el receptor es el sistema auditivo de una segunda persona; y el destino es el cerebro de esta segunda persona. La fuente de ruido incluye otros sonidos presentes en el momento en que habla la primera persona.
Shannon y Weaver describen cómo este modelo puede aplicarse a una amplia variedad de casos, incluidos aquellos en los que los símbolos son "letras o palabras escritas, o notas musicales, o palabras habladas, o música sinfónica, o imágenes". En pocas palabras, el modelo describe el proceso de una mente que intenta afectar a otra, y es la esencia misma de la experiencia humana.
En este libro, nos ocupamos del caso en que los símbolos comunicados son representaciones gráficas abstractas de datos en forma de cuadros, gráficos y mapas: visualizaciones de datos. Ver la comunicación de datos en este marco conceptual es útil porque nos recuerda lo que debemos tener en cuenta. Saber cómo puede fallar el sistema es un primer paso clave.
Tres tipos de problemas de comunicación
Para empezar a comprender cómo podemos comunicar bien los datos, es útil considerar los tipos de problemas de comunicación que Shannon y Weaver identificaron:
- El problema técnico
¿Con qué precisión pueden transmitirse los símbolos de la comunicación?
- El problema semántico
¿Con qué precisión transmiten los símbolos transmitidos el significado deseado?
- El problema de la eficacia
¿Hasta qué punto el significado recibido afecta a la conducta de la forma deseada?
Por mucho que la tecnología haya avanzado desde que se esbozaron estos problemas, seguimos sufriendo a menudo problemas técnicos -resolución de pantalla inadecuadaen , audio defectuoso, vídeo granulado, mala calidad de impresión-, cualquier cosa que haga que el receptor reciba algo distinto de lo que se había elaborado originalmente. Teniendo en cuenta los distintos dispositivos, sistemas operativos y programas que puede utilizar la persona que recibe el mensaje, puede ser difícil asegurarse de que el mensaje esté intacto.
El problema semántico se produce cuando codificamos el mensaje utilizando tipos de visualización inadecuados, o cuando los símbolos elegidos no serán comprendidos por la persona receptora. Por ejemplo, codificar un valor utilizando el diámetro de un círculo en lugar de su área sesgará las proporciones percibidas (ver Figura 1-3).
Otro ejemplo del problema semántico se produce cuando se utilizan símbolos que sólo entiende un subconjunto de todos los miembros del público, como los iconos del burro y el elefante que representan a los partidos Demócrata y Republicano del sistema político estadounidense.
El problema de la eficacia es el problema del "¿y qué?", y puede que sea el más importante. Si todo encaja, y el mensaje está perfectamente codificado, transmitido, descodificado y comprendido, pero al destinatario no le importa, o no realiza la acción deseada, en última instancia la comunicación fracasó.
Seis principios para comunicar datos
Para que aborde estos tres tipos de problemas de comunicación, me gustaría proponer seis principios a tener en cuenta a la hora de comunicar datos. Están numerados en el orden general en que se producen, aunque se reconoce plenamente que este proceso es altamente iterativo y rara vez procede en línea recta. Comunicar es un proceso creativo -que implica elaborar y refinar un mensaje- y, como tal, implicará necesariamente muchos bucles:
Conoce tu objetivo
Utiliza los datos adecuados
Selecciona visualizaciones adecuadas
Diseño para la estética
Elige un medio y un canal eficaces
Comprueba los resultados
Veamos estos principios en detalle.
Principio nº 1: Conoce tu objetivo
Es importante tener en cuenta que "información" y "mensaje" no son sinónimos. La información es el conjunto de todos los mensajes posibles que puede seleccionar la fuente de información. El mensaje es lo que se ha seleccionado de este conjunto para ser comunicado. ¿Por qué es importante? En un mundo en el que la información aumenta exponencialmente, elegir tu mensaje es un primer paso importante.
Sin embargo, antes de elegir tu mensaje, es fundamental que conozcas tu objetivo, que puedes articular respondiendo por adelantado a unas cuantas preguntas clave (véase la Figura 1-4):
¿Con quién intentas comunicarte? (público objetivo)
¿Qué quieres que sepan? (significado pretendido)
¿Por qué? ¿Qué quieres que hagan al respecto? (efecto deseado)
Las respuestas a estas preguntas pueden ser muy diferentes para las distintas disciplinas. Un periodista de datos que trabaja en una noticia de última hora no tiene el mismo objetivo que un analista de inteligencia empresarial que trabaja en una corporación. Que comuniquen los datos de forma diferente no debería sorprender, y puede ser totalmente apropiado.
Lo importante es articular tu objetivo: escribir realmente las respuestas a las tres preguntas que acabamos de enumerar. Si no estás seguro de la respuesta a alguna de estas preguntas, no sigas adelante hasta que estés seguro. (Y no pasa nada si tu único propósito es hacer reír a alguien. No tienes que intentar conseguir la paz mundial con cada mensaje de ).
Principio nº 2: Utilizar los datos adecuados
Como dice el refrán , a veces menos es más. Uno de los ejemplos más impactantes de comunicación de datos que he visto nunca consistió en la presentación de un único número: 14. Ese fue el único dato que se compartió con un grupo de directivos reunidos para hablar del servicio de atención al cliente dentro de una organización. El grupo de directivos llegó a saber que ese número representaba el número de veces que un cliente concreto había sido transferido entre departamentos durante una sola llamada a una línea de ayuda. Esto motivó a toda una organización a renovar la experiencia del cliente.
Sin embargo, a veces menos es realmente menos. Mientras conducía, oí en la radio un reportaje en el que se comparaban varias ciudades según el porcentaje de envases de pescado mal etiquetados. Ese mismo día, investigando los datos, descubrí que el tamaño de las muestras era demasiado pequeño para inferir nada acerca de los porcentajes relativos de etiquetado incorrecto en las ciudades. La historia engañó a muchos oyentes, al menos tanto como las etiquetas del pescado.
Y a menudo más es menos. Es posible, y de hecho bastante típico, abrumar a la audiencia con datos. Es fácil entender por qué ocurre esto: has trabajado duro para reunir los datos, y parece que esos datos aumentan el peso de tu mensaje y le confieren credibilidad adicional. Pero todos esos datos adicionales sólo sirven para ahogar el mensaje. Shannon y Weaver identificaron este problema: "si abarrotas la capacidad de la audiencia, fuerzas un error y una confusión generales e ineludibles" En otras palabras, si un dato no aporta nada a tu mensaje, lo desvirtúa.
El último y más importante punto sobre la selección de datos es que tu mensaje debe ser ético y basarse en una epistemología sólida. En otras palabras: no mientas con estadísticas; ya tenemos bastante con eso. No caigas presa de las muchas y variadas formas de falacias estadísticas y lógicas, como confundir correlación con causalidad, dar saltos inductivos poco razonables, aplicar la gaussiana cuando no procede, inferir más de lo que permite el tamaño de la muestra, etc. Éstos son sólo algunos de los muchos icebergs que hay que evitar (en este libro, espero mostrarte cómo evitar algunos de ellos cuando utilices Tableau).
Principio nº 3: Seleccionar visualizaciones adecuadas
Una vez que hayas identificado en los datos que necesitarás para exponer tu punto de vista, el siguiente paso es decidir cómo codificar el mensaje. Codificar los datos significa convertir los propios valores de los datos en representaciones gráficas abstractas, como el tamaño, el color o la forma.
Saber cómo utiliza la mente humana las distintas visualizaciones gráficas de la información para realizar tareas específicas es la clave para evitar el problema semántico (en el que los símbolos no transmiten con precisión el significado pretendido). Por suerte para nosotros, el último medio siglo ha producido pioneros en el campo de la visualización de la información que han arrojado una luz considerable sobre este tema.
¿Qué tipo de datos tienes?
El propio de Tableau, Jock Mackinlay, ha elaborado un marco útil para identificar el orden de eficacia de las distintas variables de codificación en función del tipo de datos que se utilicen. En primer lugar, empecemos con una descripción de los distintos tipos de datos: cuantitativos, ordinales y nominales (véase la Figura 1-5).
¿Cuáles son los tipos de visualizaciones más eficaces para tu tipo de datos?
Una vez que hayas identificado qué tipo o tipos de datos necesitarás para conseguir tu objetivo, tienes que decidir qué variables utilizarás para codificar los datos (véase la Figura 1-6).
Algunos puntos son inmediatamente obvios:
La posición es la forma de codificación más eficaz para todos los tipos de datos.
La longitud, el ángulo y el área disminuyen su eficacia de cuantitativa a ordinal y a nominal.
El tono del color aumenta en eficacia de cuantitativo a ordinal y a nominal.
Tener en cuenta esta clasificación al seleccionar tu tipo de visualización te ayudará a asegurarte de que estás elaborando un mensaje que será fácilmente descodificado y comprendido por tu público.
Si la calidad global de la comunicación sólo se viera afectada por la facilidad de descodificación, no necesitaríamos más principios. En realidad, también tenemos que tener en cuenta la estética, el medio y el canal, y el impacto real .
Principio nº 4: Diseñar para la estética
Permíteme hacer de abogado del diablo en : ¿Por qué tener en cuenta la estética? ¿Cualquier intento de hacer que una visualización "parezca mejor" no es más que basura gráfica o palabrería de diseño? ¿Los elementos gráficos que no son datos no se interpondrán en el camino? ¿No deberían ser los datos en sí lo suficientemente bellos para los lectores?
Comprendo este punto de vista, de verdad. He visto muchos intentos de embellecer las visualizaciones de datos que distraen al público o, lo que es peor, distorsionan los datos hasta confundirlo por completo. Todos estamos de acuerdo en que hay que evitar este resultado. Una forma de evitarlo es desterrar para siempre todos los elementos estéticos. Y sin embargo, ése no es un mundo en el que me gustaría vivir, porque hay un claro valor en el diseño elegante y lo que Willard Cope Brinton llamó "embellecimiento juicioso de los gráficos".
¿El valor? Los elementos estéticos pueden despertar el interés y mejorar la memoria. Siempre que lo hagan sin obstaculizar excesivamente la cognición, pueden utilizarse para lograr el objetivo.
Hay una serie de elementos estéticos en toda visualización de datos, y un puñado de errores comunes que la gente comete al crearlas:
Esquemas de color pobres
Fuentes que distraen
Muchos tipos de letra diferentes
Alineación descuidada
Etiquetas verticales o en ángulo
Colores de fondo oscuros
Bordes gruesos o líneas de cuadrícula
Imágenes inútiles e imágenes prediseñadas
Aceptar perezosamente la mayoría de los programas por defecto
Considera la Figura 1-7, que muestra dos gráficos que ilustran el crecimiento del número de jugadas posibles en una partida de ajedrez a medida que avanza la partida. El gráfico por defecto de Excel está a la izquierda y una versión rediseñada está a la derecha.
En ambos casos, no es más que una línea en una escala log-lineal, pero ¿a cuál es más probable que prestes atención? La estética importa.
La Figura 1-8 muestra otro ejemplo de diseño deficiente y diseño mejorado, esta vez mostrando el crecimiento del empleo en Apple tras el regreso de Steve Jobs en 1997.
Un poco de diseño hace mucho . Si conoces a una buena artista gráfica, llévala a tomar un café y pide su opinión. El diseño es toda una disciplina aparte que podrías pasarte toda una vida aprendiendo y perfeccionando, pero prestar aunque sea un poco de atención al aspecto de tus visualizaciones de datos puede significar la diferencia entre ser ignorado y despertar interés, o entre ser olvidado rápidamente y ser recordado durante mucho tiempo.
En este libro, veremos cómo abordar la estética de las visualizaciones creadas en Tableau.
Principio nº 5: Elige un medio y un canal eficaces
La forma que adopte el mensaje (medio) y cómo se haga llegar a la audiencia (canal) son elementos críticos de cualquier esfuerzo de comunicación de datos. Hay que tener cuidado al seleccionar el "cómo", el "cuándo" y el "dónde" para mejorar las posibilidades de llegar a tu público y alcanzar tus objetivos.
Antes me he referido a La famosa presentación de Hans Rosling en TED en febrero de 2006: la animación de el diagrama de dispersión de GapMinder, junto con la narración y el gesto de señalar y agitar los brazos, son características clave del esfuerzo de comunicación. El conjunto de datos que presentaba era complejo, y el esfuerzo de comunicación también lo era. Lo consiguió, y el impacto ha sido increíblemente profundo.
Cuando comunicas datos, tienes que elegir cómo hacerlo:
¿Gráficos independientes o narrados?
¿Gráficos estáticos, interactivos, animados o combinados?
Si es narrado: ¿grabado, en directo, o ambos?
Si es en directo: ¿a distancia, en persona, o ambas?
En todos los casos: ¿difundido, dirigido o ambos?
El marco de la Figura 1-9 muestra cómo se relacionan normalmente estas opciones en términos de esfuerzo, alcance e impacto probable.
Por un lado, obviamente es muy sencillo y fácil crear un gráfico estático y enviarlo por correo electrónico a un grupo de colegas o publicarlo en la Web como un gráfico independiente. Este enfoque de la comunicación de datos podría tener un impacto muy profundo en tu público objetivo, pero lo más probable es que no lo tenga. También es importante tener en cuenta que el coste en tiempo y esfuerzo es muy bajo.
Por otra parte, narrar un conjunto combinado de gráficos estáticos y dinámicos en persona a un público en directo es una empresa muy compleja. Estará presente un número limitado de personas, pero si lo consigues como Hans Rosling, el impacto puede ser enorme. El esfuerzo es grande (y no olvides ensayar).
Ambos son ejemplos extremos de comunicación de datos. El área entre estos dos extremos incluye la publicación de entradas de blog que combinen visualizaciones de datos interactivas y comentarios detallados, algo que Tableau Public hace muy fácil de hacer.
Como en todo, hay un equilibrio entre coste e impacto. Si tu público objetivo es una pequeña empresa de Sudáfrica y lo que está en juego es mucho, por ejemplo, subir a un avión para explicarles los datos puede ser una buena inversión. Por otra parte, si quieres que el mayor número posible de personas del público en general reciba un mensaje de datos, tendrás que encontrar una forma eficaz de difundir el mensaje. Conocer tu objetivo, y saber quién compone tu público objetivo, informa estas decisiones .
Principio nº 6: Comprueba los resultados
Es un buen hábito en general incorporar a tus esfuerzos bucles de retroalimentación y puntos de control que te ayuden a calibrar si has conseguido los resultados previstos o no. Esto permite corregir el rumbo en caso de objetivos lamentablemente incumplidos, o afinar en caso de ligeros errores.
Hay algunas preguntas que debes hacer cuando compruebes los resultados. Lo llamaremos "RUI":
- Llega a
¿El público recibió tu mensaje? ¿Quién lo recibió y quién no?
- Comprender
¿Interpretó el público el mensaje de datos de la forma que pretendías?
- Impacto
¿Reaccionó el público como querías que reaccionara?
Hacer estas preguntas te ayudará a perfeccionar tu mensaje y a comunicar mejor los datos, y también mostrará un grado adecuado de respeto a tu audiencia .
Resumen
En este capítulo, hemos considerado el acto de comunicar datos como un paso integral en un proceso más amplio de descubrimiento de datos, y un tipo importante de comunicación en general. También hemos considerado tres problemas que pueden obstaculizar una buena comunicación de datos: el problema técnico, el problema semántico y el problema de la eficacia. Por último, consideramos seis principios para superar estos problemas y alcanzar nuestros objetivos. Estos seis principios pueden aplicarse independientemente de la herramienta o el programa informático utilizados.
En el próximo capítulo, daremos una visión general de una herramienta de software concreta para comunicar datos: Tableau.
Get Comunicar datos con Tableau now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.