Prefacio

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

El interés por los datos sintéticos ha crecido rápidamente en los últimos años. Este interés se ha visto impulsado por dos tendencias simultáneas. La primera es la demanda de grandes cantidades de datos para entrenar y construir modelos de inteligencia artificial y aprendizaje automático (AIML). La segunda es el trabajo reciente que ha demostrado métodos eficaces para generar datos sintéticos de alta calidad. Ambos han dado lugar al reconocimiento de que los datos sintéticos pueden resolver algunos problemas difíciles con bastante eficacia, especialmente dentro de la comunidad AIML. Empresas como NVIDIA, IBM y Alphabet, así como organismos como la Oficina del Censo de EE.UU., han adoptado distintos tipos demetodologías de síntesis de datos para apoyar la creación de modelos, el desarrollo de aplicaciones y ladifusión de datos.

Este libro te ofrece una suave introducción a los métodos para lo siguiente: generar datos sintéticos, evaluar los datos que se han sintetizado, comprender las implicaciones de los datos sintéticos para la privacidad e implantar los datos sintéticos en tu organización. Mostramos cómo los datos sintéticos pueden acelerar los proyectos AIML. Algunos de los problemas que pueden abordarse disponiendo de datos sintéticos serían demasiado costosos o peligrosos de resolver utilizando métodos más tradicionales (por ejemplo, el entrenamiento de modelos de control de vehículos autónomos), o simplemente no podrían hacerse de otro modo. También explicamos cómo evaluar los riesgos para la privacidad de los datos sintéticos, aunque suelen ser mínimos si la síntesis se hace correctamente.

Aunque queremos que este libro sea una introducción, también queremos que sea aplicado. Por lo tanto, trataremos algunos de los problemas que se encontrarán con datos reales, no con datos curados o depurados. Los datos reales son complejos y desordenados, y la síntesis de datos debe ser capaz de trabajar en ese contexto.

Nuestro público objetivo son los líderes analíticos responsables de permitir el desarrollo y la aplicación de modelos AIML en sus organizaciones, así como los científicos de datos que quieran aprender cómo la síntesis de datos puede ser una herramienta útil para su trabajo. Utilizaremos ejemplos de distintos tipos de síntesis de datos para ilustrar la amplia aplicabilidad de este enfoque. Nos centraremos principalmente en la síntesis de datos estructurados.

Convenciones utilizadas en este libro

En este libro se utilizan las siguientes convenciones tipográficas:

Cursiva

Indica nuevos términos, URL, direcciones de correo electrónico, nombres de archivo y extensiones de archivo.

Aprendizaje en línea O'Reilly

Nota

Durante más de 40 años, O'Reilly Media ha proporcionado formación tecnológica y empresarial, conocimientos y perspectivas para ayudar a las empresas a alcanzar el éxito.

Nuestra red única de expertos e innovadores comparten sus conocimientos y experiencia a través de libros, artículos y nuestra plataforma de aprendizaje online. La plataforma de aprendizaje en línea de O'Reilly te ofrece acceso bajo demanda a cursos de formación en directo, rutas de aprendizaje en profundidad, entornos de codificación interactivos y una amplia colección de textos y vídeos de O'Reilly y de más de 200 editoriales. Para más información, visita http://oreilly.com.

Cómo contactar con nosotros

Dirige tus comentarios y preguntas sobre este libro a la editorial:

  • O'Reilly Media, Inc.
  • 1005 Gravenstein Highway Norte
  • Sebastopol, CA 95472
  • 800-998-9938 (en Estados Unidos o Canadá)
  • 707-829-0515 (internacional o local)
  • 707-829-0104 (fax)

Tenemos una página web para este libro, donde se enumeran erratas, ejemplos y cualquier información adicional. Puedes acceder a esta página en https://oreil.ly/practical-synthetic-data-generation.

Envía un correo electrónico para comentar o hacer preguntas técnicas sobre este libro.

Para noticias e información sobre nuestros libros y cursos, visita http://oreilly.com.

Encuéntranos en Facebook: http://facebook.com/oreilly

Síguenos en Twitter: http://twitter.com/oreillymedia

Míranos en YouTube: http://youtube.com/oreillymedia

Agradecimientos

La preparación de este libro se ha beneficiado de una serie de entrevistas con expertos en la materia. Me gustaría dar las gracias a las siguientes personas por estar disponibles para hablar de sus experiencias y pensamientos sobre el mercado y la tecnología de los datos sintéticos: Fernanda Foertter, Jim Karkanias, Alexei Pozdnoukhov, Rev Lebaradian, John Ashley, Rob Csonger y Simson Garfinkel.

Rob Csonger y su equipo proporcionaron el contenido de la sección sobrevehículos autónomos.

Mike Hintze, de Hintze Law LLC, preparó el análisis jurídico del capítulo sobre revelación de identidad.

Queremos dar las gracias a Janice Branson por revisar versiones anteriores del manuscrito.

Nuestros clientes y colaboradores, que a menudo nos plantean problemas desafiantes, han sido clave para impulsar nuestras innovaciones en los métodos de síntesis de datos y la aplicación de la tecnología en la práctica.

Get Generación Práctica de Datos Sintéticos now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.