Capítulo 5. Estadísticas
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Los hechos son obstinados, pero las estadísticas son más flexibles.
Mark Twain
Estadística se refiere a las matemáticas y técnicas con las que comprendemos los datos. Es un campo rico y enorme, más adecuado para una estantería (o sala) de una biblioteca que para un capítulo de un libro, por lo que nuestro debate no será necesariamente profundo. En su lugar, intentaré enseñarte lo justo para que sea peligroso, y despertar tu interés lo suficiente para que vayas a aprender más.
Describir un único conjunto de datos
A través de una combinación de boca a boca y suerte, DataSciencester ha crecido hasta tener docenas de miembros, y el vicepresidente de recaudación de fondos te pide algún tipo de descripción de cuántos amigos tienen tus miembros que pueda incluir en sus elevator pitches.
Utilizando las técnicas del Capítulo 1, puedes producir fácilmente estos datos. Pero ahora te enfrentas al problema de cómo describirlos.
Una descripción obvia de cualquier conjunto de datos son simplemente los propios datos:
num_friends
=
[
100
,
49
,
41
,
40
,
25
,
# ... and lots more
]
Para un conjunto de datos lo suficientemente pequeño, ésta podría ser incluso la mejor descripción. Pero para un conjunto de datos más grande, esto es difícil de manejar y probablemente opaco. (Imagina mirar una lista de 1 millón de números.) Por eso, utilizamos la estadística para ...
Get Ciencia de datos desde cero, 2ª edición now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.