Áttekintés
Az adatok elemzése során sok esetben találkozunk olyan feladatokkal, amelyek sok kézi munkát igényelnek, gyakran ismétlődnek vagy éppen nehezen oldhatóak meg a szokásos eszközökkel. A workshop bemutatja, hogy lehet ezeket az adatelemzési feladatokat egyszerű, Pythonban írt miniprogramok segítségével hatékonyan elvégezni.
A Python méltán az egyik legnépszerűbb eszköz az adatelemzés területén. Elsősorban könnyen olvasható és tanulható, letisztult nyelvezete, valamint a hozzá tartozó gazdag elemzési, adatfeldolgozási és vizualizációs funkciókat támogató eszköztár teszi értékessé.
A kurzus során röviden áttekintjük a nyelv alapjait, és könnyed gyakorlatok segítségével megismerkedünk a működésével, lehetőségeivel. A gyors ismerkedés után a Python legfontosabb adatelemzési könyvtárának, a Pandas segítségével fogjuk feldolgozni és transzformálni a beolvasott adatokat.
Az adatfeldolgozás mellett érinteni fogjuk a vizuális adatfeltárást és -elemzést is és a workshop végére megtanuljuk, hogyan tudunk felépíteni és automatizálni egy teljes elemzési folyamatot a nyersadatok beolvasásától kezdve egészen eredmények elmentéséig.
Kinek szól?
Azoknak javasoljuk, akik munkájuk során gyakran találkoznak adatelemzési és feldolgozási feladatokkal és szeretnék megismerni a Python nyelv ezt támogató eszközeit.
Előfeltételek
Előzetes programozási tudásra nincs szükség, némi Excel tapasztalat és érdeklődés az adatelemzés iránt hasznos.
A részvételhez saját laptop szükséges.
Oktató
A képzés oktatója Oltyán Gábor, a PwC Magyarország Chief Data Scientist-je, aki az üzleti intelligencia területén 2000-ben kezdett dolgozni fejlesztőként és data mining elemzőként. Közel 200 sikeres adatbányászati és data science projektben vett részt, illetve később irányított három földrészen Seattle-től Kuala Lumpurig. A prediktív analitika, adatbányászat, big data analitika területén szerzett mély tapasztalatra építve készít átfogó megoldásokat, melyek a legújabb eszközöket és módszertanokat felhasználva segítenek a cégeknek a rendelkezésre álló adatvagyonuk minél teljesebb üzleti kiaknázásában.
Tematika
Bevezetés a Pythonba
Adatelemzés egyszerűen
Az adatok tisztítása és gazdagítása
|
Több adattábla kezelése
Eredmények elmentése
Kitekintés, további lehetőségek
|