Skip to content
Kezdőlap » Olimpiák 1896-2016

Olimpiák 1896-2016

A projekt célkitűzése, hogy átfogó képet kapjunk az olimpiai eredményekről. Az adatok a Kaggle-ről származnak, és az 1896 és 2016 közötti nyári és téli olimpiák adatait tartalmazzák.

Az elemzés előtt kialakítottuk a megfelelő adatmodellt (mivel az adatok egyetlen táblában voltak), ill. magyar sportolók esetében javítottuk a neveket, ugyanis azok ékezetek nélkül szerepeltek (minden név az ékezetes betűk kihagyásával szerepelt, ezt csak a magyar színekben versenyzők esetén korrigáltuk). Ezt Levenshtein-távolság segítségével tettük meg: egy külön listába rendeztük az ékezetes neveket, majd az ékezet nélküli neveken végighaladva kiválasztottuk azt a nevet, amellyel a távolság a legkisebb, így a megfelelő ékezettel rendelkező nevet kapva (hiszen a metrika szövegek hasonlóságán alapul – hány műveletet (karakter elhagyása, beszúrása, módosítása) kell elvégezni, hogy egyikből a másikat kapjuk).

A jelentéskészítésnél a fő szempont az volt, hogy egy böngészhető összefoglalót készítsünk, mely segítségével bárki könnyen és egyszerűen felfedezheti az olimpikonok és a résztvevő nemzetek teljesítményét. Az általános áttekintő információk mellett képet kaphatunk sportáganként, nemzetenként vagy résztvevőnkként az elért eredményekről, de akár egy ország adott olimpián elért eredményei közt is böngészhetünk, valamint az egyes olimpiákon elért eredményeket is áttekinthetjük. Az utolsó lapon néhány „leget” gyűjtöttünk össze, melyek érdekességként szolgálnak.