book

Programación de PyTorch para Aprendizaje Profundo

by Ian Pointer

October 2024

Intermediate to advanced

220 pages

6h 5m

Spanish

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

El aprendizaje profundo en el mundo actualPero, ¿qué es exactamente el aprendizaje profundo y necesito un doctorado para entenderlo?PyTorch¿Qué pasa con TensorFlow?Convenciones utilizadas en este libroUtilizar ejemplos de códigoAprendizaje en línea O'ReillyCómo contactar con nosotrosAgradecimientos
Construir una máquina de aprendizaje profundo personalizadaGPUCPU/Tarjeta madreRAMAlmacenamientoAprendizaje profundo en la nubeColaboratorio GoogleProveedores de la nube¿Qué proveedor de la nube debo utilizar?Utilizar Jupyter NotebookInstalar PyTorch desde ceroDescargar CUDAAnacondaPor fin, ¡PyTorch! (y Jupyter Notebook)TensoresOperaciones tensorialesDifusión tensorialConclusiónOtras lecturas
Nuestro problema de clasificaciónDesafíos tradicionalesPero primero, los datosPyTorch y los cargadores de datosConstruir un conjunto de datos de entrenamientoConstruir conjuntos de datos de validación y pruebaPor fin, ¡una Red Neuronal!Funciones de activaciónCrear una redFunciones de pérdidaOptimizandoFormaciónHacer que funcione en la GPUPonerlo todo juntoHacer prediccionesModelo de ahorroConclusiónOtras lecturas
Nuestro primer modelo convolucionalConvolucionesPuesta en comúnAbandonoHistoria de las arquitecturas CNNAlexNetInception/GoogLeNetVGGResNet¡Hay otras arquitecturas disponibles!Uso de modelos preentrenados en PyTorchExaminar la estructura de un modeloBatchNorm¿Qué modelo debes utilizar?Ventanilla única para modelos: PyTorch HubConclusiónOtras lecturas
Aprendizaje por transferencia con ResNetEncontrar ese ritmo de aprendizajeTasas de aprendizaje diferencialesAumento de datosAntorcha de Visión TransformaEspacios de color y transformadas lambdaClases de transformación personalizadasEmpieza poco a poco y creceConjuntosConclusiónOtras lecturas
Redes neuronales recurrentesRedes de memoria a largo plazoUnidades Recurrentes CerradasbiLSTMIncrustacionesantorchatextoObteniendo nuestros datos: ¡Tweets!Definición de camposConstruir un vocabularioCrear nuestro modeloActualizar el bucle de entrenamientoClasificar los TweetsAumento de datosInserción aleatoriaBorrado aleatorioIntercambio aleatorioVolver TraducciónAumento y torchtext¿Aprendizaje por transferencia?ConclusiónOtras lecturas
SonidoEl conjunto de datos ESC-50Obtención del conjunto de datosReproducir audio en JupyterExplorando la ESC-50SoX y LibROSAtorchaudioConstruir un conjunto de datos ESC-50Un modelo CNN para la ESC-50Esta Frecuencia Es Mi UniversoEspectrogramas MelUn nuevo conjunto de datosAparece una ResNet salvajeEncontrar una tasa de aprendizajeAumento de datos de audioTransformadas de torchaudioCadenas de efectos SoXSpecAugmentOtros experimentosConclusiónOtras lecturas
Son las 3 de la mañana. ¿Qué están haciendo tus datos?TensorBoardInstalación de TensorBoardEnvío de datos a TensorBoardGanchos PyTorchTrazar la media y la desviación típicaMapeo de activación de clasesGráficos de llamaInstalar py-spyLectura de gráficos de llamaArreglar una transformación lentaDepuración de problemas de la GPUComprobación de la GPUPunto de control de gradienteConclusiónOtras lecturas
Modelo de servicioCrear un servicio FlaskConfigurar los parámetros del modeloConstruir el contenedor DockerAlmacenamiento local frente a almacenamiento en la nubeRegistro y telemetríaImplementación en KubernetesConfiguración en Google Kubernetes EngineCrear un clúster k8sServicios de escaladoActualizaciones y limpiezaTorchScriptRastreandoScriptingLimitaciones de TorchScriptTrabajar con libTorchObtención de libTorch y Hello WorldImportar un modelo TorchScriptConclusiónOtras lecturas
Aumento de datos: Mixtos y SuavizadosconfusiónSuavizado de etiquetasOrdenador, ¡mejora!Introducción a la SuperresoluciónIntroducción a las GANEl falsificador y el críticoEntrenar un GANLos peligros del colapso del modoESRGANMás aventuras en la detección de imágenesDetección de objetosR-CNN más rápida y R-CNN de máscaraMuestras AdversarialesAtaques de caja negraDefensa contra ataques adversariosMás de lo que parece: La arquitectura del TransformadorPrestar atenciónAtención es todo lo que necesitasBERTFastBERTGPT-2Generar texto con GPT-2ULMFiT¿Qué utilizar?ConclusiónOtras lecturas

Content preview from Programación de PyTorch para Aprendizaje Profundo

Capítulo 5. Clasificación de textos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Vamos a dejar atrás las imágenes por ahora y centrar nuestra atención en otra área en la que el aprendizaje profundo ha demostrado ser un avance significativo respecto a las técnicas tradicionales: procesamiento del lenguaje natural (PLN). Un buen ejemplo de ello es Google Translate. Originalmente, el código que se encargaba de la traducción tenía unas pesadas 500.000 líneas de código. El nuevo sistema, basado en TensorFlow, tiene aproximadamente 500, y funciona mejor que el método antiguo.

También se han producido avances recientes en la aplicación del aprendizaje por transferencia (del que aprendiste en el Capítulo 4) a los problemas de la PNL. Nuevas arquitecturas, como la arquitectura Transformer, han llevado a la creación de redes como la GPT-2 de OpenAI, cuya variante más grande produce un texto de calidad casi humana (de hecho, OpenAI no ha publicado los pesos de este modelo por miedo a que se utilice maliciosamente).

Este capítulo ofrece un recorrido relámpago por las redes neuronales recurrentes y las incrustaciones. Luego exploramos la biblioteca torchtext y cómo utilizarla para el procesamiento de textos con un modelo basado en LSTM.

Redes neuronales recurrentes

Si echamos la vista atrás para ver cómo hemos estado utilizando hasta ahora nuestras arquitecturas basadas en CNN, veremos que siempre han estado trabajando ...