Artwork

Вміст надано IVANCAST PODCAST. Весь вміст подкастів, включаючи епізоди, графіку та описи подкастів, завантажується та надається безпосередньо компанією IVANCAST PODCAST або його партнером по платформі подкастів. Якщо ви вважаєте, що хтось використовує ваш захищений авторським правом твір без вашого дозволу, ви можете виконати процедуру, описану тут https://uk.player.fm/legal.
Player FM - додаток Podcast
Переходьте в офлайн за допомогою програми Player FM !

Peering Into the Black Box: The Rise of Representation Engineering

37:27
 
Поширити
 

Manage episode 448992995 series 3351512
Вміст надано IVANCAST PODCAST. Весь вміст подкастів, включаючи епізоди, графіку та описи подкастів, завантажується та надається безпосередньо компанією IVANCAST PODCAST або його партнером по платформі подкастів. Якщо ви вважаєте, що хтось використовує ваш захищений авторським правом твір без вашого дозволу, ви можете виконати процедуру, описану тут https://uk.player.fm/legal.

Join us in SHIFTERLABS’ latest experimental podcast series powered by Notebook LM, where we bridge research and conversation to illuminate groundbreaking ideas in AI. In this episode, we dive into “Representation Engineering: A Top-Down Approach to AI Transparency,” an insightful paper from the Center for AI Safety, Carnegie Mellon University, Stanford, and other leading institutions. This research redefines how we view transparency in deep learning by shifting the focus from neurons and circuits to high-level representations.

Discover how Representation Engineering (RepE) introduces new methods for reading and controlling cognitive processes in AI models, offering innovative solutions to challenges like honesty, hallucination detection, and fairness. We explore its applications across essential safety domains, including model control and ethical behavior. Tune in to learn how these advances could shape a future of AI that is more transparent, accountable, and aligned with human values.

This series is part of SHIFTERLABS’ ongoing commitment to pushing the boundaries of educational technology and fostering discussions at the intersection of research, technology, and responsible innovation.

  continue reading

100 епізодів

Artwork
iconПоширити
 
Manage episode 448992995 series 3351512
Вміст надано IVANCAST PODCAST. Весь вміст подкастів, включаючи епізоди, графіку та описи подкастів, завантажується та надається безпосередньо компанією IVANCAST PODCAST або його партнером по платформі подкастів. Якщо ви вважаєте, що хтось використовує ваш захищений авторським правом твір без вашого дозволу, ви можете виконати процедуру, описану тут https://uk.player.fm/legal.

Join us in SHIFTERLABS’ latest experimental podcast series powered by Notebook LM, where we bridge research and conversation to illuminate groundbreaking ideas in AI. In this episode, we dive into “Representation Engineering: A Top-Down Approach to AI Transparency,” an insightful paper from the Center for AI Safety, Carnegie Mellon University, Stanford, and other leading institutions. This research redefines how we view transparency in deep learning by shifting the focus from neurons and circuits to high-level representations.

Discover how Representation Engineering (RepE) introduces new methods for reading and controlling cognitive processes in AI models, offering innovative solutions to challenges like honesty, hallucination detection, and fairness. We explore its applications across essential safety domains, including model control and ethical behavior. Tune in to learn how these advances could shape a future of AI that is more transparent, accountable, and aligned with human values.

This series is part of SHIFTERLABS’ ongoing commitment to pushing the boundaries of educational technology and fostering discussions at the intersection of research, technology, and responsible innovation.

  continue reading

100 епізодів

Усі епізоди

×
 
Loading …

Ласкаво просимо до Player FM!

Player FM сканує Інтернет для отримання високоякісних подкастів, щоб ви могли насолоджуватися ними зараз. Це найкращий додаток для подкастів, який працює на Android, iPhone і веб-сторінці. Реєстрація для синхронізації підписок між пристроями.

 

Короткий довідник

Слухайте це шоу, досліджуючи
Відтворити