book

Aprendizaje profundo desde cero

by Seth Weidman

September 2024

Intermediate to advanced

252 pages

6h 43m

Spanish

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

Comprender las Redes Neuronales Requiere Múltiples Modelos MentalesEsquemas de los capítulosConvenciones utilizadas en este libroUtilizar ejemplos de códigoAprendizaje en línea O'ReillyCómo contactar con nosotrosAgradecimientos
FuncionesMatemáticasDiagramasCódigoDerivadosMatemáticasDiagramasCódigoFunciones anidadasDiagramaMatemáticasCódigoOtro esquemaLa regla de la cadenaMatemáticasCódigoUn ejemplo un poco más largoMatemáticasDiagramaCódigoFunciones con múltiples entradasMatemáticasDiagramaCódigoDerivadas de funciones con múltiples entradasDiagramaMatemáticasCódigoFunciones con múltiples entradas vectorialesMatemáticasCrear nuevas funciones a partir de funciones existentesMatemáticasDiagramaCódigoDerivadas de funciones con varias entradas vectorialesDiagramaMatemáticasCódigoFunciones vectoriales y sus derivadas: Un paso más alláDiagramaMatemáticasCódigoFunciones vectoriales y sus derivadas: El paso atrásGráfico computacional con dos entradas de matriz 2DMatemáticasDiagramaCódigoLa parte divertida: El pase hacia atrásDiagramaMatemáticasCódigoConclusión
Visión general del aprendizaje supervisadoModelos de aprendizaje supervisadoRegresión linealRegresión lineal: Un diagramaRegresión lineal: Un diagrama más útil (y las matemáticas)Añadir la interceptaciónRegresión lineal: El CódigoEntrenar el modeloCálculo de los Gradientes: Un esquemaCálculo de los Gradientes: Las matemáticas (y algo de código)Cálculo de los Gradientes: El código (completo)Utilizar estos gradientes para entrenar el modeloEvaluación de nuestro modelo: Conjunto de entrenamiento frente a conjunto de pruebasEvaluar nuestro modelo: El CódigoAnalizar la característica más importanteRedes neuronales desde ceroPaso 1: Un montón de regresiones linealesPaso 2: Una función no linealPaso 3: Otra regresión linealDiagramasCódigoRedes neuronales: El paso atrásEntrenamiento y evaluación de nuestra primera red neuronalDos razones por las que esto está ocurriendoConclusión
Definición de Aprendizaje Profundo: Una primera pasadaLos componentes básicos de las redes neuronales: OperacionesDiagramaCódigoLos componentes básicos de las redes neuronales: CapasDiagramasBloques de construcción en Bloques de construcciónEl plano de capasLa capa densaLa clase NeuralNetwork, y tal vez otrasDiagramaCódigoClase de pérdidaAprendizaje profundo desde ceroImplantar la formación por lotesRedNeural: CódigoFormador y OptimizadorOptimizadorEntrenadorPonerlo todo juntoNuestro primer modelo de aprendizaje profundo (desde cero)Conclusión y próximos pasos
Algunas intuiciones sobre las redes neuronalesLa función de pérdida de entropía cruzada SoftmaxComponente nº 1: La función SoftmaxComponente nº 2: La pérdida de entropía cruzadaNota sobre las funciones de activaciónExperimentosPreprocesamiento de datosModeloExperimento: Pérdida de entropía cruzada SoftmaxImpulsoIntuición para el impulsoImplementación del impulso en la clase OptimizadorExperimento: Descenso Gradiente Estocástico con MomentoDecaimiento de la Tasa de AprendizajeTipos de disminución de la tasa de aprendizajeExperimentos: Decaimiento de la Tasa de AprendizajeInicialización del pesoMatemáticas y códigoExperimentos: Inicialización del pesoAbandonoDefiniciónAplicaciónExperimentos: AbandonoConclusión
Redes neuronales y aprendizaje de representaciónUna arquitectura diferente para los datos de imagenLa operación de convoluciónLa operación de convolución multicanalCapas convolucionalesImplicaciones de la aplicaciónDiferencias entre las capas convolucionales y las capas totalmente conectadasHacer predicciones con capas convolucionales: La capa de aplanamientoAgrupar capasRealización de la operación de convolución multicanalEl pase hacia delanteConvoluciones: El paso atrásLotes, Convoluciones 2D y Canales MúltiplesConvoluciones 2DEl último elemento: Añadir "Canales"Utilizar esta operación para entrenar una CNNLa operación de aplanadoLa capa Conv2D completaExperimentosConclusión
La limitación clave: Manejar la ramificaciónDiferenciación automáticaCodificar la acumulación de gradientesMotivación de las redes neuronales recurrentesIntroducción a las redes neuronales recurrentesLa primera clase para RNNs: Capa RNNLa segunda clase para RNNs: Nodo RNNJuntar estas dos clasesEl paso atrásRNNs: El CódigoLa clase RNNLayerLos elementos esenciales de los RNNNodos"RNNNodos "vainillaLimitaciones de los RNNN "VanillaUna solución: GRUNodesNodos LSTMRepresentación de datos para un modelo lingüístico basado en RNN a nivel de caracteresOtras tareas de modelado lingüísticoCombinar variantes de RNNLayerPoner todo esto juntoConclusión
Tensores PyTorchAprendizaje profundo con PyTorchElementos de PyTorch: Modelo, Capa, Optimizador y PérdidaImplementación de bloques de construcción de redes neuronales con PyTorch: Capa DensaEjemplo: Modelo de precios de la vivienda en Boston en PyTorchElementos PyTorch: Optimizador y PérdidaElementos PyTorch: EntrenadorTrucos para optimizar el aprendizaje en PyTorchRedes neuronales convolucionales en PyTorchCargador de datos y transformacionesLSTMs en PyTorchPosdata: Aprendizaje no supervisado mediante autocodificadoresAprendizaje de la representaciónUn enfoque para situaciones sin etiqueta algunaImplementar un Autoencoder en PyTorchUna prueba más contundente para el aprendizaje no supervisado, y una soluciónConclusión
Regla de la cadena matricialGradiente de la pérdida respecto a los términos de sesgoConvoluciones mediante multiplicación de matrices

Content preview from Aprendizaje profundo desde cero

Capítulo 1. Fundamentos Fundamentos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

No memorices estas fórmulas. Si entiendes los conceptos, puedes inventar tu propia notación.

John Cochrane, Notas sobre inversiones 2006

El objetivo de este capítulo en es explicar algunos modelos mentales fundamentales que son esenciales para comprender cómo funcionan las redes neuronales. En concreto, trataremos las funciones matemáticas anidadas y sus derivadas. Partiremos de los bloques de construcción más sencillos posibles para demostrar que podemos construir funciones complicadas formadas por una "cadena" de funciones constituyentes e, incluso cuando una de estas funciones sea una multiplicación de matrices que toma múltiples entradas, calcular la derivada de las salidas de las funciones con respecto a sus entradas. Entender cómo funciona este proceso será esencial para comprender las redes neuronales, que técnicamente no empezaremos a tratar hasta el Capítulo 2.

Mientras nos orientamos en torno a estos elementos fundamentales de las redes neuronales, describiremos sistemáticamente cada concepto que introduzcamos desde tres perspectivas:

Matemáticas, en forma de ecuación o ecuaciones
Código, con la menor sintaxis extra posible (lo que hace de Python una opción ideal)
Un diagrama que explique lo que ocurre, del tipo que dibujarías en una pizarra durante una entrevista de codificación

Como menciona en el prefacio, ...