Nagy teljesítményű adatfeldolgozás Pythonban
ÁTTEKINTÉS
Az üzleti életnek nincs olyan területe, ahol valamilyen táblázatkezelőt ne használnának a szakemberek, és nincs ez másként az üzleti elemzések és a data science világában sem. A Python-t használó adatelemzők, data scientist-ek többségének a Pandas csomag DataFrame-e az adatelemzés és adatmanipuláció alfája és ómegája, legyen a feladat éppen aggregálás, pivotálás, hiányzó vagy kiugró értékek kezelése, vagy éppen komplex feature engineering. Mint minden más területe is a data science-nek, az adatok elemzése és manipulálása is gyors fejlődésen ment keresztül az elmúlt években, ami olyan hatékonyabb eszközök és könyvtárak megjelenéséhez vezetett, melyek a pandas csomag hiányosságait (lassú implementáció, tékozló memória kezelés, egy single-core/single-thread működés) próbálják pótolni.
A workshopon
- az egyik legnépszerűbb, nagy teljesítményű adatfeldolgozást ígérő Polars csomaggal
ismerkedünk meg gyakorlati példákon keresztül, de - szó lesz még a Pandas 2.0 csomag nagy teljesítményű adatfeldolgozással kapcsolatos
újdonságairól, illetve - más DataFrame alapú adatmanipulációs alternatívákról is (Modin, Daft).
ELŐFELTÉTELEK
A workshop gyakorlati jellegű, ezért aki nemcsak hallgatni szeretné a workshopot, hanem a gyakorlatokat is együtt szeretné végrehajtani az előadóval, annak saját laptopra is szüksége lesz előre telepített Python környezettel, illetve szüksége lesz olyan jogosultságokra a számítógépén, melyekkel szükség szerint új csomagokat is telepíthet. Ennek megfelelően a résztvevők számára erősen ajánlott legalább alapszintű Python és elemzői tudás, de a pandas data science csomag alapszintű ismerete sem hátrány.
ELŐADÓ
Oltyán GáborChief Data Scientist, Tech Senior Manager, PwC Hungary |
Oltyán Gábor, a PwC Magyarország Chief Data Scientist-je, aki az üzleti intelligencia területén 2000-ben kezdett dolgozni fejlesztőként és data mining elemzőként. Közel 200 sikeres adatbányászati és data science projektben vett részt, illetve később irányított három földrészen Seattle-től Kuala Lumpurig. A prediktív analitika, adatbányászat, big data analitika területén szerzett mély tapasztalatra építve készít átfogó megoldásokat, melyek a legújabb eszközöket és módszertanokat felhasználva segítenek a cégeknek a rendelkezésre álló adatvagyonuk minél teljesebb üzleti kiaknázásában.
LEBONYOLÍTÁSI TUDNIVALÓK
Dátum: 2023. november 20, hétfő
Formátum: Személyes előadás
Helyszín: Hotel Mercure Buda Castle Hill