Artwork

Вміст надано BlueDot Impact. Весь вміст подкастів, включаючи епізоди, графіку та описи подкастів, завантажується та надається безпосередньо компанією BlueDot Impact або його партнером по платформі подкастів. Якщо ви вважаєте, що хтось використовує ваш захищений авторським правом твір без вашого дозволу, ви можете виконати процедуру, описану тут https://uk.player.fm/legal.
Player FM - додаток Podcast
Переходьте в офлайн за допомогою програми Player FM !

Introduction to Mechanistic Interpretability

11:45
 
Поширити
 

Manage episode 458945499 series 3498845
Вміст надано BlueDot Impact. Весь вміст подкастів, включаючи епізоди, графіку та описи подкастів, завантажується та надається безпосередньо компанією BlueDot Impact або його партнером по платформі подкастів. Якщо ви вважаєте, що хтось використовує ваш захищений авторським правом твір без вашого дозволу, ви можете виконати процедуру, описану тут https://uk.player.fm/legal.

Our introduction introduces common mech interp concepts, to prepare you for the rest of this session's resources.

Original text: https://aisafetyfundamentals.com/blog/introduction-to-mechanistic-interpretability/
Author(s): Sarah Hastings-Woodhouse

A podcast by BlueDot Impact.
Learn more on the AI Safety Fundamentals website.

  continue reading

Розділи

1. Introduction to Mechanistic Interpretability (00:00:00)

2. Why might mechanistic interpretability be useful? (00:01:16)

3. Looking inside neural networks (00:03:34)

4. What makes mechanistic interpretability hard? (00:06:33)

5. Addressing polysemanticity (00:08:34)

85 епізодів

Artwork
iconПоширити
 
Manage episode 458945499 series 3498845
Вміст надано BlueDot Impact. Весь вміст подкастів, включаючи епізоди, графіку та описи подкастів, завантажується та надається безпосередньо компанією BlueDot Impact або його партнером по платформі подкастів. Якщо ви вважаєте, що хтось використовує ваш захищений авторським правом твір без вашого дозволу, ви можете виконати процедуру, описану тут https://uk.player.fm/legal.

Our introduction introduces common mech interp concepts, to prepare you for the rest of this session's resources.

Original text: https://aisafetyfundamentals.com/blog/introduction-to-mechanistic-interpretability/
Author(s): Sarah Hastings-Woodhouse

A podcast by BlueDot Impact.
Learn more on the AI Safety Fundamentals website.

  continue reading

Розділи

1. Introduction to Mechanistic Interpretability (00:00:00)

2. Why might mechanistic interpretability be useful? (00:01:16)

3. Looking inside neural networks (00:03:34)

4. What makes mechanistic interpretability hard? (00:06:33)

5. Addressing polysemanticity (00:08:34)

85 епізодів

ทุกตอน

×
 
Loading …

Ласкаво просимо до Player FM!

Player FM сканує Інтернет для отримання високоякісних подкастів, щоб ви могли насолоджуватися ними зараз. Це найкращий додаток для подкастів, який працює на Android, iPhone і веб-сторінці. Реєстрація для синхронізації підписок між пристроями.

 

Короткий довідник

Слухайте це шоу, досліджуючи
Відтворити