book

Aprendizaje profundo desde cero

by Seth Weidman

September 2024

Intermediate to advanced

252 pages

6h 43m

Spanish

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

Comprender las Redes Neuronales Requiere Múltiples Modelos MentalesEsquemas de los capítulosConvenciones utilizadas en este libroUtilizar ejemplos de códigoAprendizaje en línea O'ReillyCómo contactar con nosotrosAgradecimientos
FuncionesMatemáticasDiagramasCódigoDerivadosMatemáticasDiagramasCódigoFunciones anidadasDiagramaMatemáticasCódigoOtro esquemaLa regla de la cadenaMatemáticasCódigoUn ejemplo un poco más largoMatemáticasDiagramaCódigoFunciones con múltiples entradasMatemáticasDiagramaCódigoDerivadas de funciones con múltiples entradasDiagramaMatemáticasCódigoFunciones con múltiples entradas vectorialesMatemáticasCrear nuevas funciones a partir de funciones existentesMatemáticasDiagramaCódigoDerivadas de funciones con varias entradas vectorialesDiagramaMatemáticasCódigoFunciones vectoriales y sus derivadas: Un paso más alláDiagramaMatemáticasCódigoFunciones vectoriales y sus derivadas: El paso atrásGráfico computacional con dos entradas de matriz 2DMatemáticasDiagramaCódigoLa parte divertida: El pase hacia atrásDiagramaMatemáticasCódigoConclusión
Visión general del aprendizaje supervisadoModelos de aprendizaje supervisadoRegresión linealRegresión lineal: Un diagramaRegresión lineal: Un diagrama más útil (y las matemáticas)Añadir la interceptaciónRegresión lineal: El CódigoEntrenar el modeloCálculo de los Gradientes: Un esquemaCálculo de los Gradientes: Las matemáticas (y algo de código)Cálculo de los Gradientes: El código (completo)Utilizar estos gradientes para entrenar el modeloEvaluación de nuestro modelo: Conjunto de entrenamiento frente a conjunto de pruebasEvaluar nuestro modelo: El CódigoAnalizar la característica más importanteRedes neuronales desde ceroPaso 1: Un montón de regresiones linealesPaso 2: Una función no linealPaso 3: Otra regresión linealDiagramasCódigoRedes neuronales: El paso atrásEntrenamiento y evaluación de nuestra primera red neuronalDos razones por las que esto está ocurriendoConclusión
Definición de Aprendizaje Profundo: Una primera pasadaLos componentes básicos de las redes neuronales: OperacionesDiagramaCódigoLos componentes básicos de las redes neuronales: CapasDiagramasBloques de construcción en Bloques de construcciónEl plano de capasLa capa densaLa clase NeuralNetwork, y tal vez otrasDiagramaCódigoClase de pérdidaAprendizaje profundo desde ceroImplantar la formación por lotesRedNeural: CódigoFormador y OptimizadorOptimizadorEntrenadorPonerlo todo juntoNuestro primer modelo de aprendizaje profundo (desde cero)Conclusión y próximos pasos
Algunas intuiciones sobre las redes neuronalesLa función de pérdida de entropía cruzada SoftmaxComponente nº 1: La función SoftmaxComponente nº 2: La pérdida de entropía cruzadaNota sobre las funciones de activaciónExperimentosPreprocesamiento de datosModeloExperimento: Pérdida de entropía cruzada SoftmaxImpulsoIntuición para el impulsoImplementación del impulso en la clase OptimizadorExperimento: Descenso Gradiente Estocástico con MomentoDecaimiento de la Tasa de AprendizajeTipos de disminución de la tasa de aprendizajeExperimentos: Decaimiento de la Tasa de AprendizajeInicialización del pesoMatemáticas y códigoExperimentos: Inicialización del pesoAbandonoDefiniciónAplicaciónExperimentos: AbandonoConclusión
Redes neuronales y aprendizaje de representaciónUna arquitectura diferente para los datos de imagenLa operación de convoluciónLa operación de convolución multicanalCapas convolucionalesImplicaciones de la aplicaciónDiferencias entre las capas convolucionales y las capas totalmente conectadasHacer predicciones con capas convolucionales: La capa de aplanamientoAgrupar capasRealización de la operación de convolución multicanalEl pase hacia delanteConvoluciones: El paso atrásLotes, Convoluciones 2D y Canales MúltiplesConvoluciones 2DEl último elemento: Añadir "Canales"Utilizar esta operación para entrenar una CNNLa operación de aplanadoLa capa Conv2D completaExperimentosConclusión
La limitación clave: Manejar la ramificaciónDiferenciación automáticaCodificar la acumulación de gradientesMotivación de las redes neuronales recurrentesIntroducción a las redes neuronales recurrentesLa primera clase para RNNs: Capa RNNLa segunda clase para RNNs: Nodo RNNJuntar estas dos clasesEl paso atrásRNNs: El CódigoLa clase RNNLayerLos elementos esenciales de los RNNNodos"RNNNodos "vainillaLimitaciones de los RNNN "VanillaUna solución: GRUNodesNodos LSTMRepresentación de datos para un modelo lingüístico basado en RNN a nivel de caracteresOtras tareas de modelado lingüísticoCombinar variantes de RNNLayerPoner todo esto juntoConclusión
Tensores PyTorchAprendizaje profundo con PyTorchElementos de PyTorch: Modelo, Capa, Optimizador y PérdidaImplementación de bloques de construcción de redes neuronales con PyTorch: Capa DensaEjemplo: Modelo de precios de la vivienda en Boston en PyTorchElementos PyTorch: Optimizador y PérdidaElementos PyTorch: EntrenadorTrucos para optimizar el aprendizaje en PyTorchRedes neuronales convolucionales en PyTorchCargador de datos y transformacionesLSTMs en PyTorchPosdata: Aprendizaje no supervisado mediante autocodificadoresAprendizaje de la representaciónUn enfoque para situaciones sin etiqueta algunaImplementar un Autoencoder en PyTorchUna prueba más contundente para el aprendizaje no supervisado, y una soluciónConclusión
Regla de la cadena matricialGradiente de la pérdida respecto a los términos de sesgoConvoluciones mediante multiplicación de matrices

Content preview from Aprendizaje profundo desde cero

Capítulo 4. Extensiones

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En el último capítulo, después de haber dedicado dos capítulos a razonar desde los primeros principios sobre qué son los modelos de aprendizaje profundo y cómo deberían funcionar, finalmente construimos nuestro primer modelo de aprendizaje profundo y lo entrenamos para resolver el problema relativamente sencillo de predecir el precio de la vivienda a partir de características numéricas sobre las casas. En la mayoría de los problemas del mundo real, sin embargo, entrenar con éxito modelos de aprendizaje profundo no es tan fácil: aunque estos modelos pueden concebiblemente encontrar una solución óptima a cualquier problema que pueda enmarcarse como un problema de aprendizaje supervisado, en la práctica suelen fallar, y de hecho hay pocas garantías teóricas de que una arquitectura de modelo dada encuentre de hecho una buena solución a un problema dado. Aun así, hay algunas técnicas bien conocidas que hacen que el entrenamiento de redes neuronales tenga más probabilidades de éxito; en ellas se centrará este capítulo.

Empezaremos en repasando lo que "intentan hacer" matemáticamente las redes neuronales: encontrar el mínimo de una función. Luego mostraré una serie de técnicas que pueden ayudar a las redes a conseguirlo, demostrando su eficacia en el clásico conjunto de datos MNIST de dígitos escritos a mano. Empezaremos con una función de pérdida ...