Capítulo 7. Hipótesis e inferencia

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Es propio de una persona verdaderamente inteligente dejarse conmover por las estadísticas.

George Bernard Shaw

¿Qué vamos a hacer con toda esta estadística y teoría de la probabilidad? La parte científica de la ciencia de datos suele implicar la formación y comprobación de hipótesissobre nuestros datos y los procesos que los generan.

Pruebas estadísticas de hipótesis

A menudo, como científicos de datos de, querremos comprobar si es probable que una determinada hipótesis sea cierta. Para nuestros fines, las hipótesis son afirmaciones como "esta moneda es justa" o "los científicos de datos prefieren Python a R" o "es más probable que la gente abandone la página sin llegar a leer el contenido si mostramos un irritante anuncio intersticial con un botón de cierre diminuto y difícil de encontrar", que pueden traducirse en estadísticas sobre los datos. Bajo varios supuestos, esas estadísticas pueden considerarse observaciones de variables aleatorias de distribuciones conocidas, lo que nos permite hacer afirmaciones sobre la probabilidad de que se cumplan esos supuestos.

En la configuración clásica, tenemos una hipótesis nula, H 0 que representa alguna posición por defecto, y una hipótesis alternativa, H 1 con la que queremos compararla. Utilizamos la estadística para decidir si podemos rechazar H 0 como falsa o no. Probablemente ...

Get Ciencia de datos desde cero, 2ª edición now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.