Prefacio

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Las empresas están cada vez más orientadas a los datos, y un componente clave de la estrategia de datos de cualquier empresa es un almacén de datos: un repositorio central de datos integrados de toda la empresa. Tradicionalmente, el almacén de datos lo utilizaban los analistas de datos para crear informes analíticos. Pero ahora también se utiliza cada vez más para rellenar cuadros de mando en tiempo real, realizar consultas ad hoc y proporcionar orientación para la toma de decisiones mediante análisis predictivos. Debido a estos requisitos empresariales de analítica avanzada y a la tendencia hacia el control de costes, la agilidad y el acceso autoservicio a los datos, muchas organizaciones se están pasando a almacenes de datos basados en la nube, como Google BigQuery.

En este libro, ofrecemos un recorrido completo por BigQuery, un almacén de datos empresarial sin servidor, altamente escalable y de bajo coste que está disponible en Google Cloud. Como no hay infraestructura que gestionar, las empresas pueden centrarse en analizar los datos para encontrar información significativa utilizando el SQL conocido.

Nuestro objetivo con BigQuery ha sido construir una plataforma de datos que proporcione capacidades de perímetro, aproveche las muchas y excelentes tecnologías que ahora están disponibles en los entornos de nube y sea compatible con tecnologías de datos probadas que siguen siendo relevantes hoy en día. Por ejemplo, en el perímetro de vanguardia, BigQuery de Google es una arquitectura de cálculo sin servidor que desacopla el cálculo y el almacenamiento. Esto permite que las distintas capas de la arquitectura funcionen y escalen de forma independiente, y ofrece a los desarrolladores de datos flexibilidad en el diseño y la implementación. BigQuery admite de forma única el aprendizaje automático nativo y el análisis geoespacial. Con Cloud Pub/Sub, Cloud Dataflow, Cloud Bigtable, Cloud AI Platform y muchas integraciones de terceros, BigQuery interopera con sistemas tradicionales y modernos, en una amplia gama de rendimiento y latencia deseados. Y en el frente de lo probado, BigQuery admite SQL estándar ANSI, optimización columnar y consultas federadas, que son clave para la exploración de datos ad hoc de autoservicio que demandan muchos usuarios.

¿A quién va dirigido este libro?

Este libro está dirigido a analistas de datos, ingenieros de datos y científicos de datos que deseen utilizar BigQuery para obtener información a partir de grandes conjuntos de datos. Los analistas de datos pueden interactuar con BigQuery a través de SQL y mediante herramientas de cuadros de mando como Looker, Data Studio y Tableau. Los ingenieros de datos pueden integrar BigQuery con canalizaciones de datos escritas en Python o Java y utilizando marcos como Apache Spark y Apache Beam. Los científicos de datos pueden crear modelos de aprendizaje automático en BigQuery, ejecutar modelos TensorFlow en datos de BigQuery y delegar operaciones distribuidas a gran escala en BigQuery desde un cuaderno Jupyter.

Convenciones utilizadas en este libro

En este libro se utilizan las siguientes convenciones tipográficas:

Cursiva

Indica nuevos términos, URL, direcciones de correo electrónico, nombres de archivo y extensiones de archivo.

Constant width

Se utiliza en los listados de programas, así como dentro de los párrafos para referirse a elementos del programa como nombres de variables o funciones, bases de datos, tipos de datos, variables de entorno, sentencias y palabras clave.

Constant width bold

Muestra comandos u otros textos que deben ser tecleados literalmente por el usuario.

Constant width italic

Muestra el texto que debe sustituirse por valores proporcionados por el usuario o determinados por el contexto.

Consejo

Este elemento significa un consejo o sugerencia.

Nota

Este elemento significa una nota general.

Advertencia

Este elemento indica una advertencia o precaución.

Utilizar ejemplos de código

El material complementario (ejemplos de código, ejercicios, etc.) se puede descargar en https://github.com/GoogleCloudPlatform/bigquery-oreilly-book.

Si tienes una pregunta técnica o un problema al utilizar los ejemplos de código, envía un correo electrónico a

Este libro está aquí para ayudarte a hacer tu trabajo. En general, si se ofrece código de ejemplo con este libro, puedes utilizarlo en tus programas y documentación. No es necesario que te pongas en contacto con nosotros para pedirnos permiso, a menos que estés reproduciendo una parte importante del código. Por ejemplo, escribir un programa que utilice varios trozos de código de este libro no requiere permiso. Vender o distribuir ejemplos de los libros de O'Reilly sí requiere permiso. Responder a una pregunta citando este libro y el código de ejemplo no requiere permiso. Incorporar una cantidad significativa de código de ejemplo de este libro en la documentación de tu producto sí requiere permiso.

Agradecemos, pero generalmente no exigimos, la atribución. Una atribución suele incluir el título, el autor, la editorial y el ISBN. Por ejemplo "Google BigQuery: La Guía Definitiva" de Valliappa Lakshmanan y Jordan Tigani (O'Reilly). Copyright 2020 Valliappa Lakshmanan y Jordan Tigani, 978-1-492-04446-8".

Si crees que el uso que haces de los ejemplos de código no se ajusta al uso legítimo o al permiso concedido anteriormente, no dudes en ponerte en contacto con nosotros en

Aprendizaje en línea O'Reilly

Nota

Durante más de 40 años, O'Reilly Media ha proporcionado formación tecnológica y empresarial, conocimientos y perspectivas para ayudar a las empresas a alcanzar el éxito.

Nuestra red única de expertos e innovadores comparten sus conocimientos y experiencia a través de libros, artículos y nuestra plataforma de aprendizaje online. La plataforma de aprendizaje en línea de O'Reilly te ofrece acceso bajo demanda a cursos de formación en directo, rutas de aprendizaje en profundidad, entornos de codificación interactivos y una amplia colección de textos y vídeos de O'Reilly y de más de 200 editoriales. Para más información, visita http://oreilly.com.

Cómo contactar con nosotros

Dirige tus comentarios y preguntas sobre este libro a la editorial:

  • O'Reilly Media, Inc.
  • 1005 Gravenstein Highway Norte
  • Sebastopol, CA 95472
  • 800-998-9938 (en Estados Unidos o Canadá)
  • 707-829-0515 (internacional o local)
  • 707-829-0104 (fax)

Tenemos una página web para este libro, donde se enumeran erratas, ejemplos y cualquier información adicional. Puedes acceder a esta página en https://oreil.ly/google_bigquery_tdg.

Para hacer comentarios o preguntas técnicas sobre este libro, envía un correo electrónico a

Para obtener noticias y más información sobre nuestros libros y cursos, consulta nuestro sitio web en http://www.oreilly.com.

Encuéntranos en Facebook: http://facebook.com/oreilly

Síguenos en Twitter: http://twitter.com/oreillymedia

Sigue a los autores en Twitter: https://twitter.com/lak_gcp y https://twitter.com/jrdntgn

Míranos en YouTube: http://www.youtube.com/oreillymedia

Agradecimientos

Nosotros (Lak y Jordan) fuimos muy afortunados con nuestros revisores: Elliott Brossard, Evan Jones, Graham Polley, Rebecca Ward y Tegan Tigani revisaron cada capítulo de este libro e hicieron numerosas sugerencias para mejorarlo. Elliott mantuvo nuestras consultas SQL sencillas y limpias. Nos beneficiamos de la experiencia de Evan en el uso de BigQuery en Google Finance. Graham aportó una valiosa perspectiva de cliente a muchas de nuestras discusiones sobre costes y regionalización. Rebecca nos mantuvo informados y Tegan se aseguró de que nuestro lenguaje fuera sencillo y directo. Además de estos cinco, muchos Googlers (Chad Jennings, Haris Khan, Misha Brukman, Daniel Gundrum, Mosha Pashumansky, Amir Hormati y Mingge Deng) revisaron partes del manuscrito en sus áreas de especialización. Cualquier error que quede es nuestro, por supuesto.

Gracias también a nuestras respectivas familias, compañeros de equipo y directores (Rochana Golani y Sudhir Hasbe) por su apoyo. Ha sido un placer trabajar con Nicole Taché y Kristen Brown, nuestras editoras en O'Reilly. El texto es inconmensurablemente mejor gracias al ávido trabajo de Bob Russell, nuestro corrector. Este libro fue idea de Saptarshi Mukherjee, y fue él quien nos empujó a los dos a colaborar en un nuevo libro sobre BigQuery. Por último, nos gustaría dar las gracias a los usuarios de BigQuery (¡y a la competencia!) por empujarnos a mejorar BigQuery, y al equipo de ingeniería de BigQuery por hacer realidad la magia.

Donamos el 100% de los derechos de autor de este libro a United Way of King County, donde ambos vivimos. Te animamos encarecidamente a que te involucres con una organización benéfica local para dar, ofrecerte como voluntario y pasar a la acción para ayudar a resolver los retos más difíciles de tu comunidad.

Actualizaciones de la primera edición

Se están introduciendo nuevas funciones y mejoras en BigQuery a un ritmo vertiginoso. Publicaremos enlaces a artículos que expliquen las nuevas funciones y actualizaciones de BigQuery en https://github.com/GoogleCloudPlatform/bigquery-oreilly-book. Periódicamente, resumiremos esos artículos en actualizaciones de este libro.

Este libro se publicó en noviembre de 2019, y la primera actualización se aplicó en junio de 2020. En esta actualización se incluyeron secciones nuevas o ampliadas sobre secuencias de comandos, reservas, vistas materializadas, seguridad a nivel de columna, SQL dinámico, aprendizaje automático, controles de acceso a nivel de tabla y consultas federadas.

Get Google BigQuery: La Guía Definitiva now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.