El manual del desarrollador para la seguridad de los modelos de lenguaje de gran tamaño
by Steve Wilson
Capítulo 7. No confíes en nadie
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Antes de la reciente obsesión por la serie de Netflix Stranger Things, en los años 90 estaba Expediente X, unade mis series favoritas de todos los tiempos. Trataba de dos agentes del FBI que investigaban fenómenos extraños como monstruos, alienígenas y conspiraciones gubernamentales. El protagonista de la serie, Fox Mulder, tenía dos eslóganes. Una de esas frases era esperanzadora La verdad está ahí fuera. La otra era profundamente paranoica No confíes en nadie.
En este capítulo, nos centraremos en la segunda frase. Repasaremos brevemente los innumerables riesgos inherentes a las arquitecturas típicas de LLM y señalaremos que, aunque merece la pena aplicar las mitigaciones comentadas anteriormente, no hay forma de asumir que la salida de tu modelo sea siempre digna de confianza. Adoptaremos el mantra de Mulder "No confíes en nadie" y exploraremos cómo puedes aplicar un enfoque de confianza cero a tu aplicación LLM. ¡La paranoia no es locura cuando la amenaza es real!
Confianza cero no es sólo una palabra de moda; es un marco riguroso diseñado para asumir que las amenazas pueden venir de cualquier parte, incluso dentro de tus sistemas de confianza. Este modelo es beneficioso para los LLMs, que a menudo ingieren una variedad de entradas de fuentes poco fiables. Examinaremos cómo puedes gestionar la "agencia" que tiene tu LLM, limitando ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access