Artwork

Вміст надано Kubernetes Bytes, Ryan Wallner, and Bhavin Shah. Весь вміст подкастів, включаючи епізоди, графіку та описи подкастів, завантажується та надається безпосередньо компанією Kubernetes Bytes, Ryan Wallner, and Bhavin Shah або його партнером по платформі подкастів. Якщо ви вважаєте, що хтось використовує ваш захищений авторським правом твір без вашого дозволу, ви можете виконати процедуру, описану тут https://uk.player.fm/legal.
Player FM - додаток Podcast
Переходьте в офлайн за допомогою програми Player FM !

Deploy and fine-tune LLM models on Kubernetes using KAITO

44:17
 
Поширити
 

Manage episode 433011321 series 3332465
Вміст надано Kubernetes Bytes, Ryan Wallner, and Bhavin Shah. Весь вміст подкастів, включаючи епізоди, графіку та описи подкастів, завантажується та надається безпосередньо компанією Kubernetes Bytes, Ryan Wallner, and Bhavin Shah або його партнером по платформі подкастів. Якщо ви вважаєте, що хтось використовує ваш захищений авторським правом твір без вашого дозволу, ви можете виконати процедуру, описану тут https://uk.player.fm/legal.

In this episode of the Kubernetes Bytes podcast, Bhavin sits down with Sachi Desai, Product Manager and Paul Yu, Sr. Cloud Advocate at Microsoft to talk about the open source KAITO project. KAITO is the Kubernetes AI Toolchain Operator that enables AKS users to deploy open source LLM models on their Kubernetes clusters. They discuss how KAITO helps with running AI-enabled applications alongside the LLM models, how it helps users bring their own LLM models and run them as containers, and how KAITO helps them fine-tune open source LLMs on their Kubernetes clusters.

Check out our website at https://kubernetesbytes.com/

Cloud Native News:

  • https://azure.github.io/AKS/2024/07/30/azure-container-storage-ga
  • https://github.blog/news-insights/product-news/introducing-github-models/

Show links:

  1. Fei Guo - https://www.linkedin.com/in/fei-guo-a48319a/
  2. Ishaan Sehgal - https://www.linkedin.com/in/ishaan-sehgal/

Timestamps:

  • 00:02:15 Cloud Native News
  • 00:05:34 Interview with Sachi and Paul
  • 00:42:08 Key takeaways
  continue reading

88 епізодів

Artwork
iconПоширити
 
Manage episode 433011321 series 3332465
Вміст надано Kubernetes Bytes, Ryan Wallner, and Bhavin Shah. Весь вміст подкастів, включаючи епізоди, графіку та описи подкастів, завантажується та надається безпосередньо компанією Kubernetes Bytes, Ryan Wallner, and Bhavin Shah або його партнером по платформі подкастів. Якщо ви вважаєте, що хтось використовує ваш захищений авторським правом твір без вашого дозволу, ви можете виконати процедуру, описану тут https://uk.player.fm/legal.

In this episode of the Kubernetes Bytes podcast, Bhavin sits down with Sachi Desai, Product Manager and Paul Yu, Sr. Cloud Advocate at Microsoft to talk about the open source KAITO project. KAITO is the Kubernetes AI Toolchain Operator that enables AKS users to deploy open source LLM models on their Kubernetes clusters. They discuss how KAITO helps with running AI-enabled applications alongside the LLM models, how it helps users bring their own LLM models and run them as containers, and how KAITO helps them fine-tune open source LLMs on their Kubernetes clusters.

Check out our website at https://kubernetesbytes.com/

Cloud Native News:

  • https://azure.github.io/AKS/2024/07/30/azure-container-storage-ga
  • https://github.blog/news-insights/product-news/introducing-github-models/

Show links:

  1. Fei Guo - https://www.linkedin.com/in/fei-guo-a48319a/
  2. Ishaan Sehgal - https://www.linkedin.com/in/ishaan-sehgal/

Timestamps:

  • 00:02:15 Cloud Native News
  • 00:05:34 Interview with Sachi and Paul
  • 00:42:08 Key takeaways
  continue reading

88 епізодів

Усі епізоди

×
 
Loading …

Ласкаво просимо до Player FM!

Player FM сканує Інтернет для отримання високоякісних подкастів, щоб ви могли насолоджуватися ними зараз. Це найкращий додаток для подкастів, який працює на Android, iPhone і веб-сторінці. Реєстрація для синхронізації підписок між пристроями.

 

Короткий довідник

Слухайте це шоу, досліджуючи
Відтворити