Capítulo 4. Creación de prototipos
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
A estas alturas, ya deberías tener suficientes conocimientos teóricos para ponerte manos a la obra con algunos casos de uso de IA. En este capítulo, aprenderás a utilizar una técnica de creación de prototipos tomada de la gestión de productos para crear y poner en práctica rápidamente casos de uso de ML y validar tus suposiciones sobre viabilidad e impacto.
Recuerda que nuestro objetivo en es averiguar rápidamente si nuestra idea impulsada por la IA crea valor y si somos capaces de construir una primera versión de la solución sin perder demasiado tiempo ni otros recursos. Este capítulo te introducirá no sólo en los conceptos teóricos sobre la creación de prototipos, sino también en las herramientas concretas que vamos a utilizar en los ejemplos a lo largo de este libro.
¿Qué es un prototipo y por qué es importante?
Afrontemos la dura verdad: la mayoría de los proyectos de ML fracasan. Y eso no se debe a que la mayoría de los proyectos carezcan de financiación o talento (aunque esos también son problemas comunes).
La principal razón por la que fracasan los proyectos de ML es la increíble incertidumbre que los rodea: los requisitos, el alcance de la solución, la aceptación del usuario, la infraestructura, las consideraciones legales y, lo que es más importante, la calidad del resultado, son todos muy difíciles de predecir con antelación a una nueva iniciativa. Especialmente en lo que se refiere al resultado, nunca sabes realmente si tus datos contienen suficientes señales hasta que no pasas por el proceso de recopilación, preparación y limpieza de datos y construyes el modelo real.
Muchas empresas inician sus primeros proyectos de IA/ML con mucho entusiasmo. Luego descubren que los proyectos resultan ser un pozo sin fondo. Se gastan meses de trabajo y miles de dólares sólo para llegar a un simple resultado: no funciona.
La creación de prototipos es una forma de minimizar el riesgo y evaluar el impacto y la viabilidad de tu caso de uso de ML antes de escalarlo. Con la creación de prototipos, tus proyectos de ML serán más rápidos, más baratos y ofrecerán un mayor retorno de la inversión.
Para este libro, un prototipo es un producto inacabado con un propósito sencillo: la validación. Conceptos como una PoC o un producto mínimo viable (MVP) tienen el mismo propósito, pero estos conceptos tienen un trasfondo diferente e implican algo más que la mera validación. La idea de validación es tan importante porque no necesitas construir un prototipo si no tienes nada que validar.
En el contexto de los proyectos de IA o ML, quieres validar tu caso de uso en dos dimensiones: impacto y viabilidad. Por eso es tan esencial que tengas una idea aproximada de estas categorías antes de lanzarte a construir algo.
He aquí algunos ejemplos de cosas que puedes validar en el contexto del ML y la IA:
-
¿Aporta tu solución valor al usuario?
-
¿Se está utilizando tu solución como estaba previsto?
-
¿Tu solución es aceptada por los usuarios?
-
¿Contienen tus datos suficientes señales para construir un modelo útil?
-
¿Un servicio de IA funciona lo suficientemente bien con tus datos como para aportar suficiente valor?
Para que sea una herramienta de validación eficaz, los prototipos de ML deben ser completos. Crear un modelo preciso es bueno. Crear un modelo útil es mejor. Y la única forma de obtener esa información es poner tu solución de ML delante de usuarios reales. Puedes construir el mejor predictor de rotación de clientes del mundo, pero si el personal de marketing y ventas no está preparado para poner en práctica las predicciones, tu proyecto está muerto. Por eso necesitas la opinión rápida de los usuarios.
Cuando crees el prototipo de tu solución potenciada por ML, no te comprometas con los datos. No utilices datos que no estarían disponibles en producción. No hagas limpiezas manuales que no escalan. Puedes arreglar un modelo; puedes arreglar la interfaz de usuario. Pero no puedes arreglar los datos. Trátalos como los tratarías en un escenario de producción.
Por lo general, un prototipo de debe tener un alcance bien definido que incluya lo siguiente:
- Objetivo claro
- Por ejemplo: "¿Podemos construir un modelo que sea mejor que nuestra línea de base B para predecir y, dados unos datos x?".
- Plazos estrictos
- Por ejemplo: "Construiremos el mejor modelo que podamos en un máximo de dos semanas".
- Criterios de aceptación
- Para ejemplo, "Nuestro prototipo superó la prueba de aceptación del usuario si se produjo la respuesta F".
Cuando se trata de tecnología, un prototipo debería dejarte decidir qué pila tecnológica es la mejor para alcanzar los objetivos en el plazo previsto. Los prototipos te dan una valiosa visión de las posibles áreas problemáticas (por ejemplo, los problemas de calidad de los datos), al tiempo que implican a las partes interesadas de la empresa desde el principio y gestionan sus expectativas.
Prototipos en Inteligencia de Negocio
En décadas, el proceso típico de desarrollo de sistemas de BI era el clásico método de cascada: los proyectos se planificaban como un proceso lineal que comenzaba con la recopilación de requisitos, luego pasaba al diseño, seguido de la ingeniería de datos, las pruebas y la implementación de los informes o métricas deseados por la empresa.
Incluso sin IA ni ML, el método de la cascada está llegando a sus límites. Esto se debe a la conjunción de varios factores. Los requisitos empresariales son cada vez más difusos a medida que el propio negocio se hace más complejo. Además, la tecnología también se está volviendo más compleja. Mientras que hace 10 años tenías que integrar un puñado de fuentes de datos, hoy incluso las pequeñas empresas tienen que gestionar docenas de sistemas.
Cuando tu plan de proyecto para una iniciativa de BI a gran escala está listo, a menudo ya está superado por la realidad. Con la IA/ML y sus incertidumbres asociadas, las cosas no van a ser mucho más fáciles.
Para lanzar con éxito una solución basada en IA como parte de un sistema de BI, debes tratar esencialmente tu sistema de BI como un producto de datos. Eso significa reconocer el hecho de que no sabes si tu idea funcionará finalmente según lo previsto, qué aspecto tendrá la solución final y si tus usuarios interactúan con ella como se espera. Las técnicas de gestión de productos, como, como la creación de prototipos, te ayudarán a mitigar estos riesgos y permitirán un desarrollo más flexible. Pero, ¿cómo puedes aplicar exactamente la creación de prototipos en el ámbito del BI?
Se espera por defecto que los informes de los sistemas de producción de BI sean fiables y estén disponibles, y que la información que contengan sea exacta. Así que tu sistema de producción no es la mejor opción para probar algo entre los usuarios. ¿Qué más tenemos?
Las empresas suelen trabajar con sistemas de prueba para probar nuevas funciones antes de ponerlas en producción. Sin embargo, el problema de los sistemas de prueba es que suelen implicar el mismo esfuerzo técnico y los mismos retos que el sistema de producción. Normalmente, se replica todo el entorno de producción con fines de prueba: un almacén de datos de prueba, un frontend BI de prueba y un área de prueba para los procesos ETL, porque quieres asegurarte de que lo que funciona en el sistema de prueba también funciona en producción.
En el sentido de nuestra definición, un prototipo tiene lugar antes de las pruebas, como se muestra en la Figura 4-1. Para el prototipo, necesitas una profunda integración vertical, desde la ingesta de datos, pasando por los servicios analíticos, hasta la interfaz de usuario, al tiempo que mantienes baja la complejidad técnica general.
En la mayoría de los casos, especialmente con sistemas BI monolíticos, tu pila de producción y pruebas no es adecuada para crear prototipos en unos pocos días o semanas. Para nuestros fines, necesitamos algo menos complejo y ligero.
Sea cual sea la pila tecnológica que utilices para ello, debes asegurarte de lo siguiente:
-
La pila tecnológica soporta las tres capas de la arquitectura del caso de uso de la IA (datos, análisis e interfaz de usuario) para garantizar que los datos estén disponibles y sean aptos para su uso, que tus modelos funcionen lo suficientemente bien con tus datos y que los usuarios acepten y vean el valor de tu solución.
-
Tu pila debe ser abierta y ofrecer una gran conectividad para permitir la futura integración en el sistema de pruebas y quizás incluso en el de producción. Este aspecto es esencial porque, si las pruebas tienen éxito, quieres permitir una transición fluida de la fase de prototipado a la de pruebas. Si prototipas en tu máquina local, será complicado transferir el flujo de trabajo de tu ordenador a un servidor remoto y esperar que funcione con la misma fluidez. Herramientas como Docker te ayudarán a facilitar la transición, añadiendo fricciones técnicas que ya no tienen nada que ver con tu hipótesis de validación original.
Por tanto, la plataforma de prototipado perfecta para los casos de uso de BI impulsados por IA ofrece una alta conectividad, muchos servicios de integración disponibles y bajos costes de inversión inicial. Las plataformas en la nube han demostrado cumplir bastante bien estos requisitos.
Además, debes utilizar una plataforma que te permita acceder fácilmente a los distintos servicios de IA/ML tratados en el Capítulo 2. Si tienes los datos disponibles, la creación de prototipos del modelo ML no debería llevarte más de un máximo de dos a cuatro semanas, a veces sólo unos días. Utiliza AutoML para tareas de regresión/clasificación, AIaaS para servicios básicos como el reconocimiento de caracteres, y modelos preentrenados para aplicaciones personalizadas de aprendizaje profundo en lugar de entrenarlos desde cero.
Para evitar perder tiempo y dinero innecesariamente en tu próximo proyecto de ML, construye primero un prototipo antes de lanzarte a por todas.
El kit de herramientas de creación de prototipos de IA para este libro
En este libro utilizaremos Microsoft Azure como plataforma para la creación de prototipos. Puedes utilizar muchas otras herramientas, como AWS o GCP. Estas plataformas son comparables en sus características, y lo que hacemos aquí con Azure, básicamente lo puedes hacer con cualquier otra plataforma.
Yo elegí Azure por las dos razones siguientes:
-
Muchas empresas funcionan con una pila de Microsoft, y Azure será la plataforma en la nube más familiar para ellas.
-
Azure se integra sin problemas con Power BI, una herramienta de BI muy popular en muchas empresas.
Puede que te preguntes cómo una plataforma en la nube tan completa como Azure puede ser lo suficientemente ligera para crear prototipos. La razón principal es que no utilizamos toda la plataforma Azure, sino sólo partes de ella que se proporcionan "como servicio", por lo que no tenemos que preocuparnos de los detalles técnicos bajo el capó. Los principales servicios que utilizaremos son Azure Machine Learning Studio, Azure Blob Storage, un recurso informático de Azure y un conjunto de Azure Cognitive Services, la oferta AIaaS de Microsoft.
Lo bueno es que, aunque aún estamos haciendo prototipos, la infraestructura también resistiría un escenario de producción. Tendríamos que cambiar los procesos, el mantenimiento, las integraciones y la gestión de la solución, pero la base técnica sería la misma. Hablaremos de esto con más detalle en el Capítulo 11.
Intentaré no basarme demasiado en funciones que funcionen exclusivamente con Azure y Power BI, sino mantenerlo lo suficientemente abierto para que puedas conectar tus propios modelos de IA a tu propio BI. Además, la mayoría de las integraciones de Azure en Power BI requieren una licencia Pro, por la que no quiero hacerte pasar. Empecemos con la configuración para Microsoft Azure.
Trabajar con Microsoft Azure
Esta sección te ofrece una rápida introducción a Microsoft Azure y te permite activar todas las herramientas que necesitarás para los casos de uso que comienzan en el Capítulo 7. Aunque es posible que no necesites todos estos servicios de inmediato, te recomiendo que los configures de antemano para que puedas centrarte en los casos de uso reales más adelante, en lugar de ocuparte de la sobrecarga técnica.
Regístrate en Microsoft Azure
Para crear y utilizar los servicios de IA a partir del Capítulo 7, necesitas una cuenta de Microsoft Azure. Si eres nuevo en la plataforma, Azure te da acceso gratuito a todos los servicios que cubrimos en este libro durante los primeros 12 meses (en el momento de escribir esto). También obtienes un crédito gratuito de 200 $ para los servicios que se facturan en función del uso, como los recursos informáticos o las Implementaciones del modelo de IA.
Para explorar el acceso gratuito e inscribirte, visita https://azure.microsoft.com/free e inicia el proceso de inscripción.
Nota
Si ya tienes una cuenta Azure, puedes pasar directamente a "Crear un recurso informático Azure". Ten en cuenta que es posible que se te facturen estos servicios si no estás en periodo de prueba gratuito. Si no estás seguro, ponte en contacto con tu administrador de Azure antes de seguir adelante.
Para registrarte, se te pedirá que crees una cuenta Microsoft. Te recomiendo que crees una cuenta nueva con fines de prueba (¡y que aproveches el bono de crédito gratuito!). Si tienes una cuenta corporativa, puedes intentar continuar con ella, pero tu empresa podría tener restricciones. Por tanto, puede que sea mejor empezar de cero, jugar un poco y, cuando lo tengas todo claro, continuar con la cuenta de tu empresa.
En la página siguiente, haz clic en "¡Crea uno!".(Figura 4-2).
A continuación, introduce tu dirección de correo electrónico y haz clic en Siguiente. Crea una contraseña y continúa. Tras confirmar que no eres un robot, deberías ver la pantalla de la Figura 4-3.
Debes confirmar tu cuenta con un número de teléfono válido. Introduce tus datos y haz clic en "Envíame un mensaje" o "Llámame". Introduce el código de verificación y haz clic en "Verificar código". Una vez realizada la verificación correctamente, comprueba las condiciones y haz clic en "Siguiente".
¡Ya casi has llegado! La última pregunta de te pedirá que facilites los datos de tu tarjeta de crédito. ¿Por qué? Es lo mismo que ocurre con las principales plataformas en la nube. Una vez que se agote tu crédito gratuito o expire el periodo gratuito, se te cobrará por utilizar estos servicios. Sin embargo, lo bueno de Microsoft para principiantes es que no se te cobrará automáticamente. Cuando termine tu periodo gratuito, tendrás que optar por la facturación de pago por uso.
Después de registrarte correctamente en, deberías ver la pantalla del portal Azure que se muestra en la Figura 4-4.
¡Bienvenido a Microsoft Azure! Puedes acceder a esta página de inicio en cualquier momento visitando portal.azure.com. Exploremos rápidamente la página de inicio del portal Azure:
- Barra de navegación (1)
- Puedes abrir el menú del portal a la izquierda o navegar hasta la configuración de tu cuenta en la parte superior derecha.
- Servicios Azure (2)
- Estos son los servicios recomendados para ti. Puede que te parezcan diferentes, sobre todo si te acabas de dar de alta.
- Crear un recurso (3)
- Este será uno de los botones más utilizados. Lo utilizas para crear nuevos recursos como servicios en Azure.
- Navegar (4)
- Esta sección contiene herramientas y todos los demás elementos que te llevan a diversos ajustes. Por ahora no los necesitarás.
Cuando veas esta pantalla, estarás listo para configurar Microsoft Azure. Si tienes problemas para configurar tu cuenta Azure, te recomiendo los siguientes recursos:
Crear un espacio de trabajo Azure Machine Learning Studio
Azure Machine Learning Studio será nuestro banco de trabajo en Microsoft Azure para construir e implementar modelos ML personalizados y gestionar conjuntos de datos. Lo primero que tienes que hacer es crear un espacio de trabajo de Azure Machine Learning. El espacio de trabajo es un recurso básico en tu cuenta de Azure que contiene todos tus experimentos, entrenamiento y modelos ML desplegados.
El recurso del espacio de trabajo está asociado a tu suscripción de Azure. Aunque puedes crear y gestionar estos servicios mediante programación, utilizaremos el portal de Azure para navegar por el proceso. Recuerda que todo lo que hagas aquí con el ratón y el teclado también se puede hacer mediante scripts automatizados si lo deseas más adelante.
Accede a la cuenta Microsoft que utilizaste para la suscripción a Azure y visita portal.azure.com. Haz clic en el botón "Crear un recurso"(Figura 4-5).
Ahora utiliza la barra de búsqueda para encontrar machine
learning
y selecciónalo(Figura 4-6).
En la sección Aprendizaje automático, haz clic en Crear(Figura 4-7).
Tienes que proporcionar alguna información para tu nuevo espacio de trabajo, como se muestra en la Figura 4-8:
- Nombre del espacio de trabajo
- Elige un nombre único para tu espacio de trabajo que lo diferencie de otros espacios de trabajo que crees. Los nombres de proyecto suelen ser buenos candidatos para nombres de espacios de trabajo. En este ejemplo se utiliza
auto-ml
. El nombre debe ser único dentro del grupo de recursos seleccionado. - Suscripción
- Selecciona la suscripción a Azure que quieras utilizar.
- Grupo de recursos
- Un grupo de recursos agrupa recursos en tu suscripción a Azure y podría, por ejemplo, estar vinculado a tu departamento. Te aconsejo encarecidamente que crees un nuevo grupo de recursos en esta fase y asignes a este grupo de recursos cualquier servicio que vayas a configurar para este libro. Esto facilitará mucho la limpieza más adelante. Haz clic en "Crear nuevo" y dale un nombre a tu nuevo grupo de recursos. En este ejemplo se utiliza
ai-powered-bi
. Siempre que veas esta referencia en cualquier sitio, debes sustituirla por el nombre de tu propio grupo de recursos. - Ubicación
- Selecciona la ubicación física más cercana a tus usuarios y a tus recursos de datos. Ten cuidado al transferir datos fuera de zonas geográficas protegidas, como la Unión Europea (UE). La mayoría de los servicios suelen estar disponibles primero en las regiones de EEUU.
Una vez que hayas introducido todo, haz clic en "Revisar + crear". Una vez superada la validación inicial, vuelve a hacer clic en "Crear".
Crear tu espacio de trabajo en la nube de Azure puede llevar varios minutos. Cuando finalice el proceso, verás un mensaje de éxito, como en la Figura 4-9.
Para ver tu nuevo espacio de trabajo, haz clic en "Ir al recurso". Esto te llevará a la página del recurso ML(Figura 4-10).
Ahora has seleccionado el espacio de trabajo creado anteriormente. Verifica aquí tu suscripción y tu grupo de recursos. Si quisieras entrenar e implementar tus modelos ML mediante código programático, ahora también puedes dirigirte a tu editor de código favorito y continuar desde allí.
Pero como queremos continuar nuestro viaje sin código, haz clic en "Iniciar estudio" para entrenar e implementar modelos ML sin escribir una sola línea de código. Esto te llevará a la pantalla de bienvenida del Estudio de Aprendizaje Automático(Figura 4-11). También puedes acceder directamente a través de ml.azure.com.
El Estudio de Aprendizaje Automático es una interfaz web que incluye una variedad de herramientas de ML para realizar escenarios de ciencia de datos para profesionales de la ciencia de datos de todos los niveles de habilidad. El estudio es compatible con todos los navegadores web modernos (no, esto no incluye Internet Explorer).
La pantalla de bienvenida está dividida en tres áreas principales:
-
A la izquierda, encontrarás la barra de menú con acceso a todos los servicios de ML Studio.
-
En la parte superior, encontrarás los servicios sugeridos y podrás crear directamente más servicios haciendo clic en "Crear nuevo".
-
En la parte inferior, verás un resumen de los servicios o recursos lanzados recientemente dentro de ML Studio (que ya debería estar vacío, puesto que acabas de configurar tu cuenta).
Crear un Recurso Informático Azure
Tú has creado una suscripción a Azure y un espacio de trabajo para Machine Learning Studio. Puedes considerar estas cosas todavía como "gastos generales". Hasta ahora, no has lanzado ningún servicio o recurso que realmente haga algo.
Eso está a punto de cambiar ahora. En los pasos siguientes, crearás un recurso informático. Puedes imaginar un recurso informático como una máquina virtual (o un clúster de máquinas virtuales) donde se ejecuta la carga de trabajo real de tus trabajos. En las modernas plataformas en nube, como Microsoft Azure, los recursos informáticos pueden crearse y eliminarse con unos pocos clics (o instrucciones desde la línea de comandos) y se aprovisionarán o cerrarán en cuestión de segundos. Puedes elegir entre una gran variedad de configuraciones de máquinas: desde ordenadores pequeños y baratos hasta máquinas pesadas con soporte para unidades de procesamiento gráfico (GPU).
Advertencia
Una vez que crees un recurso informático y éste esté en línea, se te cobrará según el precio mencionado en la lista de recursos informáticos (por ejemplo, 0,6 $/hora). Si aún estás utilizando créditos Azure gratuitos, se te descontarán de ellos. Si no, se cargará en tu tarjeta de crédito según corresponda. Para evitar cargos innecesarios, asegúrate de detener o eliminar cualquier recurso informático que ya no necesites.
Crearás un recurso informático que podrás utilizar para todos los ejemplos de este libro. En la práctica, puede que quieras configurar diferentes recursos de cálculo para diferentes proyectos, así como tener más transparencia sobre qué proyecto incurre en qué costes. Sin embargo, en nuestro ejemplo de creación de prototipos, un recurso es suficiente, y puedes controlar fácilmente si el recurso está en funcionamiento para que no se coma tu presupuesto de pruebas gratuitas.
Puedes crear un recurso informático directamente en Azure ML Studio. Haz clic en la opción Computación de la barra de navegación izquierda.
A continuación, haz clic en "Crear nuevo cálculo", y aparecerá una pantalla como la de la Figura 4-12. Para seleccionar el tipo de máquina, selecciona el botón de opción "Seleccionar entre todas las opciones".
Aquí puedes ver todos los tipos de máquinas disponibles(Figura 4-13). Cuanto más rendimiento asignes, más rápido será normalmente un entrenamiento ML. El recurso más barato disponible es una máquina Standard_DS1_v2 con un núcleo, 3,5 GB de RAM y 7 GB de almacenamiento, que cuesta unos 0,06 $ por hora en la región Este de EEUU.
Escribe Standard_DS1
en la opción "Buscar por nombre de máquina virtual" y selecciona la máquina con el precio más bajo, como se muestra en la Figura 4-13. Aquí puedes elegir realmente cualquier tipo de máquina; sólo asegúrate de que el precio sea razonable, porque de momento no necesitamos un alto rendimiento.
Haz clic en el botón Crear. Esto debería devolverte a la página de resumen de tus recursos informáticos. Espera a que se cree el recurso, lo que suele tardar entre dos y cinco minutos. El recurso informático se iniciará automáticamente una vez aprovisionado (ver Figura 4-14).
Puesto que no necesitarás este recurso hasta el Capítulo 7, selecciona el recurso y haz clic en Detener para evitar que sea gravado. Al final, tu página de resumen de recursos informáticos debe tener un aspecto similar al de la Figura 4-15. Tu recurso informático debe aparecer en la lista, pero su estado debe ser Detenido.
Crear Azure Blob Storage
El último bloque de construcción que necesitas para nuestra configuración de prototipos es un lugar para almacenar y cargar archivos como tablas CSV o imágenes. El lugar típico para estos archivos binarios es Azure Blob Storage; blob significa objeto binario grande -básicamente, almacenamiento de archivos para casi todo con escala casi ilimitada-. Utilizaremos este almacenamiento principalmente para escribir los resultados de nuestros modelos de IA o para almacenar archivos de imágenes para los casos de uso del Capítulo 7 en adelante.
Para crear almacenamiento blob en Azure, visita portal.azure.com y busca storage accounts
. Haz clic en Crear y crea una nueva cuenta de almacenamiento en la misma región en la que se encuentra tu recurso ML Studio. Dale a esta cuenta un nombre único y, a continuación, selecciona rendimiento estándar y almacenamiento redundante local, como se muestra en la Figura 4-16. Como sólo se trata de datos de prueba, no necesitas pagar más por estándares de disponibilidad de datos más elevados. De nuevo, aquí guardarás los datos sólo temporalmente, y los gastos estarán más que cubiertos por tu presupuesto de prueba gratuito.
Una vez completada la implementación, haz clic en "Ir al recurso". Verás la interfaz que se muestra en la Figura 4-17.
Haz clic en "Claves de acceso" a la izquierda para abrir la pantalla que se muestra en la Figura 4-18. Necesitarás estas claves de acceso cuando quieras acceder programáticamente a los objetos de ese almacén.
Ahora que tienes una cuenta de almacenamiento y claves para manipular datos aquí, tienes que crear un contenedor, que es algo así como una carpeta de archivos que ayuda a organizarlos. Haz clic en la opción Contenedores del menú de la izquierda y luego en "+ Contenedor" en la parte superior de la pantalla, como se muestra en la Figura 4-19.
Crea un contenedor llamado tables
. Establece el nivel de acceso en Contenedor, lo que facilitará el acceso posterior a los archivos a través de herramientas externas como Power BI. Crea otro Contenedor llamado simulation
con la misma configuración.
Si tratas con datos sensibles o de producción, aquí elegirías, por supuesto, Privado para asegurarte de que se necesita autorización antes de poder acceder a los datos. Voilá, el nuevo contenedor debería aparecer en la lista y ya está listo para alojar algunos archivos.
Trabajar con Microsoft Power BI
Para la capa de usuario, nos basaremos en Microsoft Power BI como herramienta para mostrar informes, cuadros de mando y los resultados de nuestros modelos de IA. Power BI está disponible en dos versiones: Power BI Desktop y Power BI Service.
Power BI Desktop actualmente sólo está disponible para Windows. Esta aplicación offline se instala en tu ordenador y tiene todas las funciones que puedes esperar de Power BI. Si tienes una suscripción a Microsoft Office, lo más probable es que Power BI forme parte de ella. Puedes descargar Power BI desde la página de descargas de Microsoft Power BI.
Power BI Service es una versión en línea de Power BI que funciona en todas las plataformas, incluidos los Mac. Actualmente no tiene todas las funciones de la versión de escritorio, pero se añaden nuevas funciones con regularidad. No puedo garantizarte que todo lo que cubrimos en este libro funcione en el servicio Power BI, pero merece la pena intentarlo si no puedes o no quieres instalar Power BI en tu ordenador. Puedes empezar a utilizar el servicio Power BI en su página de Introducción.
Si nunca has trabajado con Power BI, puede que te resulte útil ver el curso introductorio de 45 minutos de Microsoft, que te ofrece una introducción de alto nivel sobre el funcionamiento de la herramienta.
Advertencia
Por desgracia, Power BI no siempre ofrece resultados exactamente reproducibles. A medida que sigas los casos de uso de este libro, puede que notes que algunas de sus visualizaciones y sugerencias automatizadas no coinciden con las capturas de pantalla de este libro. No te confundas demasiado por ello, ya que la imagen general debería seguir siendo la misma, aunque aparezcan pequeñas variaciones aquí y allá.
En en caso de que no te guste utilizar Power BI o quieras utilizar tu propia herramienta de BI, deberías poder recrear todo lo que aparece en los casos prácticos (excepto los Capítulos 5 y 6) también en cualquier otra herramienta de BI, siempre que admita la ejecución de código de scripts Python o R.
Para ejecutar los scripts de Python o R dentro de Power BI, necesitas tener uno de estos lenguajes instalados en tu ordenador y Power BI apuntado al núcleo respectivo. Comprueba los siguientes recursos para asegurarte de que Power BI y R, o Power BI y Python, están configurados correctamente:
Además de los motores limpios de Python o R, necesitas unos cuantos paquetes para trabajar posteriormente en los casos de uso. Para R, estos paquetes son los siguientes
-
httr (para hacer solicitudes HTTP)
-
rjson (para manejar la respuesta de la API)
-
dplyr (para la preparación de datos)
Para los scripts de Python, los equivalentes son los siguientes:
-
solicita
-
json
-
pandas
Asegúrate de que estos paquetes están instalados para el motor R o Python que Power BI esté utilizando en tu caso. Si no sabes cómo instalar paquetes en R o Python, consulta estos vídeos de YouTube:
Resumen
Espero que este capítulo te haya proporcionado una sólida comprensión de lo que es un prototipo en el contexto del desarrollo de productos de datos, y por qué es muy recomendable comenzar cualquier proyecto de IA/ML con un prototipo en primer lugar. A estas alturas, también deberías tener listo tu kit personal de herramientas de prototipado para poder abordar los casos prácticos de uso de los próximos capítulos. ¡Vamos allá!
Get Inteligencia empresarial basada en IA now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.