Adapting Diverse Controls: Ctrl-Adapter, HQ-Edit, Tango 2
MP3•Головна епізоду
Manage episode 413674097 series 3568650
Вміст надано PocketPod. Весь вміст подкастів, включаючи епізоди, графіку та описи подкастів, завантажується та надається безпосередньо компанією PocketPod або його партнером по платформі подкастів. Якщо ви вважаєте, що хтось використовує ваш захищений авторським правом твір без вашого дозволу, ви можете виконати процедуру, описану тут https://uk.player.fm/legal.
AI Papers Podcast for 04/21/2024 Ctrl-Adapter: An Efficient and Versatile Framework for Adapting Diverse Controls to Any Diffusion Model HQ-Edit: A High-Quality Dataset for Instruction-based Image Editing Tango 2: Aligning Diffusion-based Text-to-Audio Generations through Direct Preference Optimization TextHawk: Exploring Efficient Fine-Grained Perception of Multimodal Large Language Models On Speculative Decoding for Multimodal Large Language Models
…
continue reading
26 епізодів