Python fogások adatelemzőknek
ÁTTEKINTÉS
Az adatelemzői munka alfája és ómegája az adatelőkészítés: az itt elvégzett munka alapvetően befolyásolja az eredményeket, a végső modellek teljesítményét és szerencsétlen esetben akár a teljes projekt 70-90%-át is elviheti! Az inkább alapozó jellegű tutorial célja bemutatni az adatelőkészítés legfontosabb lépéseit, és azt, hogy Python nyelven milyen technikákkal és hogyan lehet ezt hatékonyan végrehajtani.
ELŐFELTÉTELEK
A részvételhez saját számítógépre és a számítógépen előre telepített Anaconda környezetre (www.anaconda.com) vagy Kaggle (www.kaggle.com) regisztrációra lesz szükség. Az előzőeken túl alapvető Python ismeretek és némi kódolási tapasztalat előfeltétele az anyag gyakorlati követésének. Elemzői alapismeretek, illetve a legfontosabb elemzői Python csomag (pandas) ismerete pedig előny.
TEMATIKA
- Adat előkészítés, adat tisztítás
- Duplikáció vizsgálat
- Üres értékek kezelése
- Kiugró értékek (outlier-ek) kezelése
- Feature Engineering – új, hasznosabb változók előállítása
- Folytonos változók átalakítása
- Kategória változók transzformációja
- Új változók létrehozása más változók elemekre bontásával vagy kombinálásával
ELŐADÓ
Oltyán GáborChief Data Scientist, Tech Senior Manager
|
Oltyán Gábor, a PwC Magyarország Chief Data Scientist-je, aki az üzleti intelligencia területén 2000-ben kezdett dolgozni fejlesztőként és data mining elemzőként. Közel 200 sikeres adatbányászati és data science projektben vett részt, illetve később irányított három földrészen Seattle-től Kuala Lumpurig. A prediktív analitika, adatbányászat, big data analitika területén szerzett mély tapasztalatra építve készít átfogó megoldásokat, melyek a legújabb eszközöket és módszertanokat felhasználva segítenek a cégeknek a rendelkezésre álló adatvagyonuk minél teljesebb üzleti kiaknázásában.
LEBONYOLÍTÁSI TUDNIVALÓK
Dátum: 2022. november 15, kedd
Hossz: 90 perc
Formátum: Személyes előadás
Nyelv: Magyar
Helyszín: Hotel Mercure Buda Castle Hill