Kurzusleírás

Bevezetés a Stratio Platformba

  • Áttekintés a Stratio architektúrájáról és alapvető modulairól
  • A Rocket és Intelligence szerepe az adatok életciklusában
  • Bejelentkezés és a Stratio UI navigálása

Munka a Rocket Modullal

  • Adatbefogadás és pipeline létrehozása
  • Adatforrások kapcsolódtatása és transzformációk konfigurálása
  • PySpark használata előfeldolgozási feladatokhoz a Rocketben

PySpark alapjai a Stratio felhasználóknak

  • PySpark adatszerkezetek és műveletek
  • Ciklusok: for, while, if/else használata
  • Def használata és saját függvények írása

Rocket előrehaladott használata PySpark-kal

  • Streaming adatbefogadás és transzformációk
  • Ciklusok és függvények használata batch és real-time scenariókban
  • Legjobb gyakorlatok a PySpark teljesítményéért pipeline-okban

A Intelligence Modul felfedezése

  • Áttekintés az adatmodellezési és analitikai funkciókról
  • Jellemzők kiválasztása, transzformálása és felfedezése
  • PySpark szerepe az egyedi analitika és insightokban

Összetett analitikai folyamatok létrehozása

  • Egyedi felhasználói függvények (UDFs) létrehozása Intelligence-ben
  • Feltételek és ciklusok alkalmazása az adatlogikához
  • Használati esetek: szegmentáció, aggregáció és előrejelzés

Telepítés és Collaboration

  • Munkafolyamatok mentése, exportálása és újrahasználata
  • Együttműködés a csapat többi tagjával a Stratio-ban
  • Kimenet vizsgálata és integrálása a lefolyó eszközökkel

Összefoglalás és Következő lépések

Követelmények

  • Python programozási tapasztalat
  • Adat-analitika vagy nagyadatok feldolgozása fogalmaival való ismeret
  • Alapvető ismeret az Apache Spark és elosztott számítástechnika terén

Audience

  • Stratio alapú platformokon dolgozó adatmérnökök
  • Analitikusok vagy fejlesztők, akik Rocket és Intelligence modulokat használnak
  • Technikai csapatok, amelyek átállnak a PySpark folyamatokra a Stratión belül
 14 Órák

Résztvevők száma


Ár résztvevőnként

Vélemények (5)

Közelgő kurzusok

Rokon kategóriák