látogató számláló

Program | Workshopok

Nagy teljesítményű adatfeldolgozás Pythonban

ÁTTEKINTÉS

Az üzleti életnek nincs olyan területe, ahol valamilyen táblázatkezelőt ne használnának a szakemberek, és nincs ez másként az üzleti elemzések és a data science világában sem. A Python-t használó adatelemzők, data scientist-ek többségének a Pandas csomag DataFrame-e az adatelemzés és adatmanipuláció alfája és ómegája, legyen a feladat éppen aggregálás, pivotálás, hiányzó vagy kiugró értékek kezelése, vagy éppen komplex feature engineering. Mint minden más területe is a data science-nek, az adatok elemzése és manipulálása is gyors fejlődésen ment keresztül az elmúlt években, ami olyan hatékonyabb eszközök és könyvtárak megjelenéséhez vezetett, melyek a pandas csomag hiányosságait (lassú implementáció, tékozló memória kezelés, egy single-core/single-thread működés) próbálják pótolni.

A workshopon

  • az egyik legnépszerűbb, nagy teljesítményű adatfeldolgozást ígérő Polars csomaggal
    ismerkedünk meg gyakorlati példákon keresztül, de
  • szó lesz még a Pandas 2.0 csomag nagy teljesítményű adatfeldolgozással kapcsolatos
    újdonságairól, illetve
  • más DataFrame alapú adatmanipulációs alternatívákról is (Modin, Daft).

ELŐFELTÉTELEK

A workshop gyakorlati jellegű, ezért aki nemcsak hallgatni szeretné a workshopot, hanem a gyakorlatokat is együtt szeretné végrehajtani az előadóval, annak saját laptopra is szüksége lesz előre telepített Python környezettel, illetve szüksége lesz olyan jogosultságokra a számítógépén, melyekkel szükség szerint új csomagokat is telepíthet. Ennek megfelelően a résztvevők számára erősen ajánlott legalább alapszintű Python és elemzői tudás, de a pandas data science csomag alapszintű ismerete sem hátrány.

ELŐADÓ

Oltyán Gábor

Chief Data Scientist, Tech Senior Manager, PwC Hungary
LinkedIn

Oltyán Gábor, a PwC Magyarország Chief Data Scientist-je, aki az üzleti intelligencia területén 2000-ben kezdett dolgozni fejlesztőként és data mining elemzőként. Közel 200 sikeres adatbányászati és data science projektben vett részt, illetve később irányított három földrészen Seattle-től Kuala Lumpurig. A prediktív analitika, adatbányászat, big data analitika területén szerzett mély tapasztalatra építve készít átfogó megoldásokat, melyek a legújabb eszközöket és módszertanokat felhasználva segítenek a cégeknek a rendelkezésre álló adatvagyonuk minél teljesebb üzleti kiaknázásában.

LEBONYOLÍTÁSI TUDNIVALÓK

Dátum: 2023. november 20, hétfő
Formátum: Személyes előadás
Helyszín: Hotel Mercure Buda Castle Hill