Podcast DevExpert

Feb 11 2025 56 mins

Other Episodes

⚠️ ¿Quieres que ninguna IA te quite el trabajo? Entonces necesitas ir más allá con tus conocimientos sobre desarrollo de software.

🎁 Te regalo esta masterclass de 15 minutos donde te cuento todos los detalles 👉 https://devexpert.io/masterclass-15?utm_source=yt&utm_medium=social&utm_campaign=103

---

En este episodio detallado y exhaustivo, profundizamos en la atmósfera actual que rodea a los modelos de lenguaje, centrándonos en el desarrollo chino Deepseek.

Exploramos qué es un modelo de lenguaje, cómo estos modelos integran la censura, la arquitectura y el funcionamiento detrás de las redes neuronales, el concepto de modelos open-source y el proceso de fine-tuning.

Además, discutimos las diferencias entre los modelos razonadores y los modelos de lenguaje tradicionales, la técnica de destilación de modelos, la ejecución de modelos de lenguaje de forma local y las complejidades del entrenamiento y la cuantización.

Este episodio tiene como objetivo proporcionar a los oyentes una comprensión profunda y una perspectiva clara de los aspectos fundamentales y los avances recientes en el mundo de la IA y los modelos de lenguaje.

00:00 Introducción y Contexto del Debate

00:37 Modelos de Lenguaje y Censura

04:18 Funcionamiento Interno de los Modelos de Lenguaje

08:21 Entrenamiento y Parámetros de los Modelos

29:32 Fine-Tuning en Modelos de Lenguaje

40:19 Modelos Razonadores y su Evolución

44:50 Ejecución Local y Modelos Destilados

51:51 Conclusiones y Reflexiones Finales

Download episode Share

Copy URL

Subscribe on Podcast Addict

¿Cómo funciona Deepseek? Las bases de la IA explicadas | DevExpert 1x03

Feb 11 2025 56 mins