látogató számláló

Adatelemzés és adatvizualizáció Pythonban

Áttekintés

Az adatok elemzése során sok esetben találkozunk olyan feladatokkal, amelyek sok kézi munkát igényelnek, gyakran ismétlődnek vagy éppen nehezen oldhatóak meg a szokásos eszközökkel. A workshop bemutatja, hogy lehet ezeket az adatelemzési feladatokat egyszerű, Pythonban írt miniprogramok segítségével hatékonyan elvégezni.

A Python méltán az egyik legnépszerűbb eszköz az adatelemzés területén. Elsősorban könnyen olvasható és tanulható, letisztult nyelvezete, valamint a hozzá tartozó gazdag elemzési, adatfeldolgozási és vizualizációs funkciókat támogató eszköztár teszi értékessé.

A kurzus során röviden áttekintjük a nyelv alapjait, és könnyed gyakorlatok segítségével megismerkedünk a működésével, lehetőségeivel. A gyors ismerkedés után a Python legfontosabb adatelemzési könyvtárának, a Pandas segítségével fogjuk feldolgozni és transzformálni a beolvasott adatokat.

Az adatfeldolgozás mellett érinteni fogjuk a vizuális adatfeltárást és -elemzést is és a workshop végére megtanuljuk, hogyan tudunk felépíteni és automatizálni egy teljes elemzési folyamatot a nyersadatok beolvasásától kezdve egészen eredmények elmentéséig.

Kinek szól?

Azoknak javasoljuk, akik munkájuk során gyakran találkoznak adatelemzési és feldolgozási feladatokkal és szeretnék megismerni a Python nyelv ezt támogató eszközeit.

Előfeltételek

Előzetes programozási tudásra nincs szükség, némi Excel tapasztalat és érdeklődés az adatelemzés iránt hasznos.
A részvételhez saját laptop szükséges.

Oktató

A képzés oktatója Oltyán Gábor, a PwC Magyarország Chief Data Scientist-je, aki az üzleti intelligencia területén 2000-ben kezdett dolgozni fejlesztőként és data mining elemzőként. Közel 200 sikeres adatbányászati és data science projektben vett részt, illetve később irányított három földrészen Seattle-től Kuala Lumpurig. A prediktív analitika, adatbányászat, big data analitika területén szerzett mély tapasztalatra építve készít átfogó megoldásokat, melyek a legújabb eszközöket és módszertanokat felhasználva segítenek a cégeknek a rendelkezésre álló adatvagyonuk minél teljesebb üzleti kiaknázásában.

Tematika

Bevezetés a Pythonba

  • Mi is az a Python? Mire használható az adatelemzésben?
  • Python alapok és adatelemzési könyvtárak: Pandas és barátai

Adatelemzés egyszerűen

  • Adatok betöltése forrásállományokból (XLS, CSV)
  • Az adatok feltérképezése, adatok lekérdezése
  • Aggregációk számítása, egyszerű grafikonok készítése

Az adatok tisztítása és gazdagítása

  • Számított mezők készítése
  • Feltételes kifejezések használata
  • Szöveges és dátum mezők kezelése
  • Adatok csoportosítása és rendezése
Több adattábla kezelése

  • Két tábla összekapcsolása
  • Kódszótárak (Lookup) használata

Eredmények elmentése

  • Adatok mentése  XLS állományokba
  • Szöveges állományok készítése
  • Grafikonok mentése képállományként

Kitekintés, további lehetőségek

  • Amit a Python környezetekről tudni kell
  • Adatbázisok kezelése
  • Webes adatok feldolgozása
  • Haladó adatvizualizációs lehetőségek

További workshopjaink: