Artwork

Вміст надано Brian Olsen and Trino Community. Весь вміст подкастів, включаючи епізоди, графіку та описи подкастів, завантажується та надається безпосередньо компанією Brian Olsen and Trino Community або його партнером по платформі подкастів. Якщо ви вважаєте, що хтось використовує ваш захищений авторським правом твір без вашого дозволу, ви можете виконати процедуру, описану тут https://uk.player.fm/legal.
Player FM - додаток Podcast
Переходьте в офлайн за допомогою програми Player FM !

45: Trino swimming with the DolphinScheduler

1:54:46
 
Поширити
 

Manage episode 358485307 series 2796878
Вміст надано Brian Olsen and Trino Community. Весь вміст подкастів, включаючи епізоди, графіку та описи подкастів, завантажується та надається безпосередньо компанією Brian Olsen and Trino Community або його партнером по платформі подкастів. Якщо ви вважаєте, що хтось використовує ваш захищений авторським правом твір без вашого дозволу, ви можете виконати процедуру, описану тут https://uk.player.fm/legal.

DolphinScheduler is a popular Apache data workflow orchestrator that enables running complex data pipelines. They recently added a Trino integration and will be demonstrating how to use DolphinScheduler to enable a series of transformations on the data lakehouse with Trino.

- Intro Music: 0:00

- Intro: 0:31

- Trino release 407: 13:22

- What is workflow orchestration?: 21:12

- Why do we need a workflow orchestration tool for building a data lake?: 31:07

- What is Apache DolphinScheduler?: 37:35

- Does DolphinScheduler have any computing engine or storage layer?: 53:11

- What are the differences with other workflow orchestration, such as Apache Airflow?: 58:46

- Demo: Creating a simple Trino workflow in DolphinScheduler: 1:26:44

- PR: Improve performance of Parquet files: 1:47:04

Show Notes: https://trino.io/episodes/45

Show Page: https://trino.io/broadcast/

  continue reading

61 епізодів

Artwork
iconПоширити
 
Manage episode 358485307 series 2796878
Вміст надано Brian Olsen and Trino Community. Весь вміст подкастів, включаючи епізоди, графіку та описи подкастів, завантажується та надається безпосередньо компанією Brian Olsen and Trino Community або його партнером по платформі подкастів. Якщо ви вважаєте, що хтось використовує ваш захищений авторським правом твір без вашого дозволу, ви можете виконати процедуру, описану тут https://uk.player.fm/legal.

DolphinScheduler is a popular Apache data workflow orchestrator that enables running complex data pipelines. They recently added a Trino integration and will be demonstrating how to use DolphinScheduler to enable a series of transformations on the data lakehouse with Trino.

- Intro Music: 0:00

- Intro: 0:31

- Trino release 407: 13:22

- What is workflow orchestration?: 21:12

- Why do we need a workflow orchestration tool for building a data lake?: 31:07

- What is Apache DolphinScheduler?: 37:35

- Does DolphinScheduler have any computing engine or storage layer?: 53:11

- What are the differences with other workflow orchestration, such as Apache Airflow?: 58:46

- Demo: Creating a simple Trino workflow in DolphinScheduler: 1:26:44

- PR: Improve performance of Parquet files: 1:47:04

Show Notes: https://trino.io/episodes/45

Show Page: https://trino.io/broadcast/

  continue reading

61 епізодів

Alle episoder

×
 
Loading …

Ласкаво просимо до Player FM!

Player FM сканує Інтернет для отримання високоякісних подкастів, щоб ви могли насолоджуватися ними зараз. Це найкращий додаток для подкастів, який працює на Android, iPhone і веб-сторінці. Реєстрація для синхронізації підписок між пристроями.

 

Короткий довідник

Слухайте це шоу, досліджуючи
Відтворити