látogató számláló

Adatelemzés és adatvizualizáció R használatával

Áttekintés

Az R olyan ingyenes, nyílt forráskódú programnyelv, amelyet kifejezetten statisztikai, adatfeldolgozási, -elemzési és -vizualizációs célra alkottak meg, és ezen a területen napjainkban is a legszélesebb eszköztárat kínálja valamennyi programnyelv és kereskedelmi statisztikai szoftver közül. A workshop során az R környezet általános ismertetésén túl, rövid gyakorlati példákon keresztül és egy esettanulmány segítségével bemutatjuk, hogy a programnyelv hogyan használható a mindennapi munka során.
A képzés segédanyagát képezi egy részletes e-book, amelyhez a résztvevők hozzáférést kapnak, illetve a könyvet generáló forráskódot is szabadon letölthetik.

Kinek szól?

Elsősorban azoknak ajánljuk, akik érdeklődnek az adatfeldolgozás, -elemzés és -vizualizáció iránt, és szeretnének kilépni a “dobozos” szoftverek korlátai közül. A teljesen kezdő R felhasználók mellett azok számára is hasznos lehet, akik már rendelkeznek R-es tapasztalattal, de szeretnék stabilabb alapismeretekkel és gyakorlati tanácsokkal felvértezve folytatni az R tanulását.

Előfeltételek

Általános informatikai ismeretek szükségesek, érdeklődés az adatelemzés iránt hasznos.
A részvételhez saját laptop szükséges.

Oktató

A workshop oktatója dr. Tóth Dénes a Kogentum Kft. alapítója, aki több mint 10 évig dolgozott az MTA kutatójaként kognitív pszichológiai és idegtudományi területen. A kommerciális statisztikai szoftverek után hamar rátalált az R-re, amelyet napi szinten használt mindenféle adatelemzési feladatra, illetve idővel rendszeresen oktatott is egyetemi és akadémiai környezetben.

2013-ban saját céget alapított egy számítógépes diszlexiateszt forgalmazására, majd néhány évvel később a cég profilja kibővült adatelemzési és alkalmazásfejlesztési szolgáltatással üzleti megbízók számára.

Társszervezője és alkalmankénti előadója a hazai R meetup-nak, illetve közreműködik több nyilvános R csomag fejlesztésében is.

Tematika

Az R ökoszisztéma

  • R, CRAN, RStudio IDE bemutatása
  • Csomagok telepítése és betöltése
  • Projektek készítése, strukturálása
  • Hogyan segítsünk magunkon?

R alapok

  • Alapobjektumok (vektor, lista, data.frame)
  • Műveletek objektumokkal
  • Egyszerű transzformációk
  • Szintaktikai jellegzetességek

Adatok beolvasása és mentése

  • Munkakönyvtár, fájlműveletek
  • Szöveg- és Excel- fájlok beolvasása
  • Adatbázis-kapcsolatok és adatok kiírása
Adatfeldolgozás

  • Leíró statisztikák
  • data.table csomag főbb jellegzetességei
  • Adatok szűrése, összegzése, csoportonkénti elemzése
  • Változók képzése, módosítása és táblák összekapcsolása

Adatvizualizáció

  • Egyszerű grafikonok készítése
    beépített R-függvényekkel
  • ggplot csomag főbb jellegzetességei
  • Példák ggplot-ábrák készítésére

Modellezés

  • Prediktív modellezés lépései
  • Példa: modellezés logisztikus
    regresszióval

További workshopjaink: