Prefacio a la Segunda Edición

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Estoy excepcionalmente orgulloso de la primera edición de Data Science from Scratch. Resultó ser en gran medida el libro que yo quería que fuera. Pero varios años de evolución en la ciencia de datos, de progreso en el ecosistema Python y de crecimiento personal como desarrollador y educador han cambiado el aspecto que creo que debe tener un primer libro de ciencia de datos.

En la vida no hay segundas ediciones. En la escritura, sin embargo, hay segundas ediciones.

En consecuencia, he reescrito todo el código y los ejemplos utilizando Python 3.6 (y muchas de sus nuevas funciones, como las anotaciones de tipo). He incluido en el libro un énfasis en la escritura de código limpio. He sustituido algunos de los ejemplos de juguete de la primera edición por otros más realistas que utilizan conjuntos de datos "reales". He añadido material nuevo sobre temas como el aprendizaje profundo, la estadística y el procesamiento del lenguaje natural, que corresponden a cosas con las que es probable que trabajen los científicos de datos de hoy en día. (Y he revisado el libro con lupa, corrigiendo errores, reescribiendo explicaciones que son menos claras de lo que podrían ser y refrescando algunos chistes.

La primera edición era un gran libro, y esta edición es aún mejor. ¡Que lo disfrutes!

  • Joel Grus
  • Seattle, WA
  • 2019

Convenciones utilizadas en este libro

En este libro se utilizan las siguientes convenciones tipográficas:

Cursiva

Indica nuevos términos, URL, direcciones de correo electrónico, nombres de archivo y extensiones de archivo.

Constant width

Se utiliza en los listados de programas, así como dentro de los párrafos para referirse a elementos del programa como nombres de variables o funciones, bases de datos, tipos de datos, variables de entorno, sentencias y palabras clave.

Constant width bold

Muestra comandos u otros textos que deben ser tecleados literalmente por el usuario.

Constant width italic

Muestra el texto que debe sustituirse por valores proporcionados por el usuario o por valores determinados por el contexto.

Consejo

Este elemento significa un consejo o sugerencia.

Nota

Este elemento significa una nota general.

Advertencia

Este elemento indica una advertencia o precaución.

Utilizar ejemplos de código

Puedes descargarte material complementario de (ejemplos de código, ejercicios, etc.) en https://github.com/joelgrus/data-science-from-scratch.

Este libro está aquí para ayudarte a hacer tu trabajo. En general, si se ofrece código de ejemplo con este libro, puedes utilizarlo en tus programas y documentación. No es necesario que te pongas en contacto con nosotros para pedirnos permiso, a menos que estés reproduciendo una parte importante del código. Por ejemplo, escribir un programa que utilice varios trozos de código de este libro no requiere permiso. Vender o distribuir un CD-ROM de ejemplos de los libros de O'Reilly sí requiere permiso. Responder a una pregunta citando este libro y el código de ejemplo no requiere permiso. Incorporar una cantidad significativa de código de ejemplo de este libro en la documentación de tu producto sí requiere permiso.

Agradecemos, pero no exigimos, la atribución. Una atribución suele incluir el título, el autor, la editorial y el ISBN. Por ejemplo "Ciencia de datos desde cero, segunda edición, por Joel Grus (O'Reilly). Copyright 2019 Joel Grus, 978-1-492-04113-9".

Si crees que el uso que haces de los ejemplos de código no se ajusta al uso legítimo o al permiso concedido anteriormente, no dudes en ponerte en contacto con nosotros en

Aprendizaje en línea O'Reilly

Nota

Durante casi 40 años, O'Reilly Media ha proporcionado formación, conocimientos y perspectivas sobre tecnología y negocios para ayudar a las empresas a alcanzar el éxito.

Nuestra red única de expertos e innovadores comparten sus conocimientos y experiencia a través de libros, artículos, conferencias y nuestra plataforma de aprendizaje online. La plataforma de aprendizaje en línea de O'Reilly te ofrece acceso bajo demanda a cursos de formación en directo, rutas de aprendizaje en profundidad, entornos de codificación interactivos y una amplia colección de textos y vídeos de O'Reilly y de más de 200 editoriales. Para más información, visita http://oreilly.com.

Cómo contactar con nosotros

Dirige tus comentarios y preguntas sobre este libro a la editorial:

  • O'Reilly Media, Inc.
  • 1005 Gravenstein Highway Norte
  • Sebastopol, CA 95472
  • 800-998-9938 (en Estados Unidos o Canadá)
  • 707-829-0515 (internacional o local)
  • 707-829-0104 (fax)

Tenemos una página web para este libro, donde se enumeran erratas, ejemplos y cualquier información adicional. Puedes acceder a esta página en http://bit.ly/data-science-from-scratch-2e.

Para hacer comentarios o preguntas técnicas sobre este libro, envía un correo electrónico a

Para más información sobre nuestros libros, cursos, conferencias y noticias, consulta nuestro sitio web en http://www.oreilly.com.

Encuéntranos en Facebook: http://facebook.com/oreilly

Síguenos en Twitter: http://twitter.com/oreillymedia

Míranos en YouTube: http://www.youtube.com/oreillymedia

Agradecimientos

En primer lugar, quiero dar las gracias a Mike Loukides por aceptar mi propuesta para este libro (y por insistir en que lo redujera a un tamaño razonable). Habría sido muy fácil para él decir: "¿Quién es esta persona que no para de enviarme por correo electrónico capítulos de muestra, y cómo hago para que se vaya?". Le agradezco que no lo hiciera. También me gustaría dar las gracias a mis editoras, Michele Cronin y Marie Beaugureau, por guiarme a lo largo del proceso de publicación y conseguir que el libro quedara en un estado mucho mejor de lo que lo habría conseguido yo sola.

No podría haber escrito este libro si nunca hubiera aprendido ciencia de datos, y probablemente no habría aprendido ciencia de datos si no fuera por la influencia de Dave Hsu, Igor Tatarinov, John Rauser y el resto de la pandilla de Farecast. (¡Hace tanto tiempo que entonces ni siquiera se llamaba ciencia de datos!) La buena gente de Coursera y DataTau también merecen mucho crédito.

También estoy agradecida a mis lectores beta y revisores. Jay Fundling encontró un montón de errores y señaló muchas explicaciones poco claras, y el libro es mucho mejor (y mucho más correcto) gracias a él. Debashis Ghosh es un héroe por revisar con cordura todas mis estadísticas. Andrew Musselman sugirió suavizar el aspecto de "las personas que prefieren R a Python son unos réprobos morales" del libro, lo que creo que acabó siendo un consejo bastante bueno. Trey Causey, Ryan Matthew Balfanz, Loris Mularoni, Núria Pujol, Rob Jefferson, Mary Pat Campbell, Zach Geary, Denise Mauldin, Jimmy O'Donnell y Wendy Grus también aportaron comentarios inestimables. Gracias a todos los que leyeron la primera edición y ayudaron a hacer de éste un libro mejor. Cualquier error que quede es, por supuesto, responsabilidad mía.

Le debo mucho a la comunidad #datascience de Twitter, por exponerme a un montón de conceptos nuevos, presentarme a un montón de gente estupenda y hacerme sentir lo bastante fracasado como para salir y escribir un libro para compensar. Gracias especialmente a Trey Causey (de nuevo), por recordarme (sin querer) que debía incluir un capítulo sobre álgebra lineal, y a Sean J. Taylor, por señalarme (sin querer) un par de enormes lagunas en el capítulo "Trabajar con datos".

Por encima de todo, debo un inmenso agradecimiento a Ganga y Madeline. Lo único más difícil que escribir un libro es vivir con alguien que está escribiendo un libro, y yo no podría haberlo conseguido sin su apoyo.

Get Ciencia de datos desde cero, 2ª edición now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.