book

R para la Ciencia de Datos, 2ª Edición

Name: R para la Ciencia de Datos, 2ª Edición
ISBN: 9781098186128

by Hadley Wickham, Mine Cetinkaya-Rundel, Garrett Grolemund

September 2024

Intermediate to advanced

578 pages

13h 44m

Spanish

O'Reilly Media, Inc.

Read now

Unlock full access

Introducción
Prefacio a la Segunda EdiciónLo que aprenderásCómo está organizado este libroLo que no aprenderásModeladoGrandes datosPython, Julia y sus amigosRequisitos previosRRStudioEl TidyverseOtros paquetesEjecutar código ROtras convenciones utilizadas en este libroAprendizaje en línea O'ReillyCómo contactar con nosotrosAgradecimientosEdición en línea
I. Juego completo
1. Visualización de datos
IntroducciónRequisitos previosPrimeros pasosLos pingüinos Marco de datosObjetivo finalCrear un ggplotAñadir estética y capasEjerciciosLlamadas ggplot2Visualizar distribucionesUna variable categóricaUna variable numéricaEjerciciosVisualizar las relacionesUna variable numérica y otra categóricaDos variables categóricasDos variables numéricasTres o más variablesEjerciciosGuardar tus parcelasEjerciciosProblemas comunesResumen
2. Flujo de trabajo: Conceptos básicos
Conceptos básicos de codificaciónComentarios¿Qué hay en un nombre?Funciones de llamadaEjerciciosResumen
3. Transformación de datos
IntroducciónRequisitos previosnycflights13dplyr BásicoFilasfiltrar()Errores comunesordenar()distinto()EjerciciosColumnasmutar()seleccionar()renombrar()recolocar()EjerciciosLa pipaGruposagrupar_por()resumir()Las funciones slice_Agrupación por múltiples variablesDesagrupación.porEjerciciosCaso práctico: Agregados y tamaño de la muestraResumen
4. Flujo de trabajo: Estilo de código
NombresEspaciosTuberíasggplot2Seccionamiento ComentariosEjerciciosResumen
5. Ordenación de datos
IntroducciónRequisitos previosDatos ordenadosEjerciciosDatos de alargamientoDatos en los nombres de columna¿Cómo funciona el Pivotaje?Muchas variables en los nombres de columnaDatos y nombres de variables en las cabeceras de columnaAmpliación de datos¿Cómo funciona pivot_wider()?Resumen
6. Flujo de trabajo: Guiones y Proyectos
GuionesCódigo de ejecuciónDiagnóstico de RStudioGuardar y nombrarProyectos¿Cuál es la fuente de la verdad?¿Dónde vive tu análisis?Proyectos RStudioCaminos relativos y absolutosEjerciciosResumen
7. Importación de datos
IntroducciónRequisitos previosLeer datos de un archivoConsejos prácticosOtros argumentosOtros tipos de archivosEjerciciosControlar los tipos de columnasTipos de adivinanzasValores perdidos, tipos de columnas y problemasTipos de columnasLeer datos de varios archivosEscribir en un archivoEntrada de datosResumen
8. Flujo de trabajo: Obtener ayuda
Google es tu amigoHacer un reprexInvertir en ti mismoResumen

II. Visualiza
9. Capas
IntroducciónRequisitos previosAsignaciones estéticasEjerciciosObjetos geométricosEjerciciosFacetasEjerciciosTransformaciones estadísticasEjerciciosAjustes de posiciónEjerciciosSistemas de coordenadasEjerciciosLa gramática estratificada de los gráficosResumen
10. Análisis exploratorio de datos
IntroducciónRequisitos previosPreguntasVariaciónValores típicosValores inusualesEjerciciosValores inusualesEjerciciosCovariaciónUna variable categórica y una numéricaDos variables categóricasDos variables numéricasPatrones y modelosResumen
11. Comunicación
IntroducciónRequisitos previosEtiquetasEjerciciosAnotacionesEjerciciosEscalasEscalas por defectoMarcas de eje y teclas de leyendaDisposición de la leyendaSustitución de una básculaZoomEjerciciosTemasEjerciciosDisposiciónEjerciciosResumen
III. Transforma
12. Vectores lógicos
IntroducciónRequisitos previosComparacionesComparación en coma flotanteValores perdidosis.na()EjerciciosÁlgebra booleanaValores perdidosOrden de operaciones%en%.EjerciciosResúmenesResúmenes lógicosResúmenes numéricos de vectores lógicosSubconjunto lógicoEjerciciosTransformaciones condicionalesif_else()caso_cuando()Tipos compatiblesEjerciciosResumen
13. Números
IntroducciónRequisitos previosHaciendo númerosCuentaEjerciciosTransformaciones numéricasReglas aritméticas y de reciclajeMínimo y máximoAritmética modularLogaritmosRedondeoCortar números en rangosAgregados acumulativos y rodantesEjerciciosTransformaciones generalesRangosDesplazamientosIdentificadores consecutivosEjerciciosResúmenes numéricosCentroMínimo, máximo y cuantilesDifundeDistribucionesPuestosCon mutar()EjerciciosResumen
14. Cuerdas
IntroducciónRequisitos previosCrear una cadenaEscapaCuerdas en brutoOtros caracteres especialesEjerciciosCrear muchas cadenas a partir de datosstr_c()str_glue()str_flatten()EjerciciosExtraer datos de cadenasSeparar en filasSeparar en columnasDiagnosticar problemas de ensanchamientoCartasLongitudSubconjuntoEjerciciosTexto no inglésCodificaciónVariaciones de letrasFunciones dependientes de la ubicaciónResumen
15. Expresiones regulares
IntroducciónRequisitos previosPatrones básicosFunciones claveDetectar coincidenciasContar PartidosSustituir valoresExtraer variablesEjerciciosDetalles del patrónEscapar deAnclasClases de personajesCuantificadoresPrecedencia de operadores y paréntesisAgrupar y capturarEjerciciosControl del patrónBanderas RegexPartidos fijosConsultaComprueba tu trabajoOperaciones booleanasCrear un patrón con códigoEjerciciosExpresiones regulares en otros lugaresTidyverseBase RResumen
16. Factores
IntroducciónRequisitos previosFactor BásicoEncuesta Social GeneralEjercicioModificar el orden de los factoresEjerciciosModificar los niveles de los factoresEjerciciosFactores ordenadosResumen
17. Fechas y horarios
IntroducciónRequisitos previosCrear fecha/horaDurante la importaciónDe CuerdasDe componentes individualesDe otros tiposEjerciciosComponentes Fecha-HoraObtener componentesRedondeoModificar componentesEjerciciosLapso de tiempoDuracionesPeríodosIntervalosEjerciciosHusos horariosResumen
18. Valores perdidos
IntroducciónRequisitos previosValores perdidos explícitosÚltima observación trasladadaValores fijosNaNValores perdidos implícitosPivotanteCompletaÚnete aEjerciciosFactores y grupos vacíosResumen
19. Únete a
IntroducciónRequisitos previosClavesClaves primarias y foráneasComprobación de claves primariasClaves SustitutasEjerciciosUniones básicasUniones mutantesEspecificar claves de uniónFiltrar unionesEjercicios¿Cómo funcionan las uniones?Coincidencia de filasFiltrar unionesUniones no-EquiUniones en cruzLa desigualdad se uneUniones rodantesUniones solapadasEjerciciosResumen
IV. Importación
20. Hojas de cálculo
IntroducciónExcelRequisitos previosCómo empezarLectura de hojas de cálculo ExcelFichas de lecturaLeer parte de una hojaTipos de datosEscribir en ExcelSalida formateadaEjerciciosHojas de cálculo de GoogleRequisitos previosCómo empezarLectura de Hojas de cálculo de GoogleEscribir en Google SheetsAutenticaciónEjerciciosResumen
21. Bases de datos
IntroducciónRequisitos previosBases de datosConectarse a una base de datosEn este libroCargar algunos datosConceptos básicos de DBIdbplyr BásicoSQLConceptos básicos de SQLSELECCIONADESDEGRUPO PORDONDEORDENAR PORSubconsultasÚnete aOtros verbosEjerciciosTraducciones de funcionesResumen
22. Flecha
IntroducciónRequisitos previosObtener los datosAbrir un conjunto de datosEl formato parquetVentajas del parquetParticiónReescribiendo los datos de la Biblioteca de SeattleUtilizar dplyr con ArrowRendimientoUtilizar dbplyr con ArrowResumen
23. Datos jerárquicos
IntroducciónRequisitos previosListasJerarquíaColumnas de la listaNo anidarunnest_wider()unnest_longer()Tipos incoherentesOtras funcionesEjerciciosCasos prácticosDatos muy ampliosDatos relacionalesProfundamente anidadoEjerciciosJSONTipos de datosjsonliteIniciar el proceso de rectangulaciónEjerciciosResumen
24. Raspado web
IntroducciónRequisitos previosÉtica y legalidad del raspadoCondiciones del servicioInformación personal identificableDerechos de autorConceptos básicos de HTMLElementosAtributosExtraer datosEncontrar elementosSelección de nidosTexto y atributosTablasEncontrar los selectores adecuadosPonerlo todo juntoLa Guerra de las GalaxiasLas mejores películas de IMDbSitios dinámicosResumen
V. Programa
25. Funciones
IntroducciónRequisitos previosFunciones vectorialesEscribir una funciónMejorar nuestra funciónMutar funcionesResumen FuncionesEjerciciosFunciones del Marco de DatosIndirección y evaluación ordenada¿Cuándo abrazar?Casos de uso habitualesEnmascaramiento de datos frente a selección ordenadaEjerciciosFunciones de trazadoMás variablesCombinación con otros paquetes TidyverseEtiquetadoEjerciciosEstiloEjerciciosResumen
26. Iteración
IntroducciónRequisitos previosModificar varias columnasSeleccionar columnas con .colsLlamar a una sola funciónLlamar a varias funcionesNombres de columnasFiltradoacross() en FuncionesVersus pivot_longer()EjerciciosLectura de varios archivosListar archivos en un directorioListaspurrr::map() y list_rbind()Datos en el caminoGuarda tu trabajoMuchas iteraciones simplesDatos heterogéneosManejo de fallosGuardar varias salidasEscribir en una base de datosEscribir archivos CSVGuardar parcelasResumen
27. Guía de campo de la Base R
IntroducciónRequisitos previosSeleccionar varios elementos con [Vectores de subconjuntoSubconjunto de marcos de datosEquivalentes de dplyrEjerciciosSeleccionar un solo elemento con $ y [[Marcos de datosTibblesListasEjerciciosAplicar Familiapara BuclesParcelasResumen
VI. Comunícate
28. Cuarto
IntroducciónRequisitos previosCuarto BásicoEjerciciosEditor visualEjerciciosFuente EditorEjerciciosTrozos de códigoEtiqueta de trozosOpciones de trozosOpciones globalesCódigo en líneaEjerciciosCifrasDimensionamiento de figurasOtras opciones importantesEjerciciosTablasEjerciciosAlmacenamiento en cachéEjerciciosSolución de problemasCabecera YAMLAutónomoParámetrosBibliografías y citasFlujo de trabajoResumen
29. Formatos de cuarto
IntroducciónOpciones de salidaDocumentosPresentacionesInteractividadhtmlwidgetsBrillantePáginas web y librosOtros formatosResumen
Índice
Sobre los autores

Content preview from R para la Ciencia de Datos, 2ª Edición

Introducción

La ciencia de datos es una disciplina apasionante que te permite transformar datos brutos en comprensión, perspicacia y conocimiento. Los objetivos de R para la Ciencia de Datos son ayudarte a aprender las herramientas más importantes de R que te permitirán hacer ciencia de datos de forma eficiente y reproducible, ¡y divertirte un poco por el camino! Después de leer este libro, tendrás las herramientas necesarias para enfrentarte a una amplia variedad de retos de la ciencia de datos utilizando las mejores partes de R.

Prefacio a la Segunda Edición

¡Bienvenido a la segunda edición de R para la Ciencia de Datos (R4DS)! Se trata de una importante revisión de la primera edición, eliminando material que ya no consideramos útil, añadiendo material que desearíamos haber incluido en la primera edición y, en general, actualizando el texto y el código para reflejar los cambios en las buenas prácticas. También estamos muy contentos de dar la bienvenida a una nueva coautora: Mine Çetinkaya-Rundel, una destacada educadora en ciencia de datos y una de nuestras colegas de Posit (la empresa antes conocida como RStudio).

A continuación, un breve resumen de los cambios más importantes:

La primera parte del libro ha pasado a llamarse "Juego completo". El objetivo de esta sección es darte los detalles aproximados del "juego completo" de la ciencia de datos antes de sumergirnos en los detalles.
La segunda parte del libro es "Visualizar". Esta parte ofrece una cobertura más exhaustiva ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Álgebra lineal práctica para la ciencia de datos

Publisher Resources

ISBN: 9781098186128

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

R para la Ciencia de Datos, 2ª Edición

by Hadley Wickham, Mine Cetinkaya-Rundel, Garrett Grolemund

Introducción

Prefacio a la Segunda Edición

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.