Capítulo 18. Manejo de puntos solapados

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Cuando queremos visualizar conjuntos de datos grandes o muy grandes, a menudo nos encontramos con el problema de que los simples gráficos de dispersión x-y no funcionan muy bien porque muchos puntos se encuentran unos encima de otros y se solapan parcial o totalmente. Y pueden surgir problemas similares incluso en conjuntos de datos pequeños si los valores de los datos se registraron con poca precisión o se redondearon, de forma que varias observaciones tienen exactamente los mismos valores numéricos. El término técnico utilizado habitualmente para describir esta situación essobretrazado, que significa que estamos trazando muchos puntos uno encima del otro. Aquí describo varias estrategias que puedes seguir cuando te encuentres con este problema.

Transparencia Parcial y Jittering

Primero consideramos un escenario con sólo un número moderado de puntos de datos, pero con un amplio redondeo. Nuestro conjunto de datos contiene el consumo de combustible durante la conducción en ciudad y el desplazamiento del motor de 234 modelos de coches populares lanzados al mercado entre 1999 y 2008(Figura 18-1). En este conjunto de datos, el ahorro de combustible se mide en millas por galón (mpg) y se redondea al valor entero más próximo. La cilindrada del motor se mide en litros y se redondea al decilitro más próximo. Debido a este redondeo, ...

Get Fundamentos de la visualización de datos now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.