Prvý krok „dolovania údajov" bol trochu zdĺhavejší ako naposledy. Ručne som musel skopírovať jednotlivé zoznamy zo stránky MVSR. Následne som musel tieto údaje upraviť do vhodnej tabuľkovej podoby, pretože všetko som mal v jednom stĺpci. Použil som rozdelenie textu na stĺpce. Toto spôsobilo rozdelenie do jednotlivých stĺpcov. Akurát nie do rovnakých a preto som si označil údaje veku podmieneným formátom, aby som ľahšie tabuľku upravil do vhodného databázového tvaru.

Mohol som síce spraviť makro, ale rýchlejšie sa mi zdalo použiť štandardné postupy. Tak som údaje filtroval, zoraďoval a hromadne posúval. Celkovo prvá fáza od kopírovania z webu po úpravu štruktúry tabuľky trvala približne hodinu. Čo sa mi nezdá veľa, lebo makro aj s vyskúšaním a ladením by netrvalo menej času.

No a ďalej to už bolo jednoduché, stačilo si dať vhodnú otázku a kontingenčná tabuľka mi zobrazila odpoveď. Niektoré výsledky však nie sú celkom presné, nakoľko nie je štandardizované napr. povolanie kandidátov a niektoré povolania sa v zozname vyskytujú v rôznych obmenách, s použitím skratky, tituly sú u niektorých zmiešané z viacerých a pod.
Výsledky
Prvú otázku som si položil o tom koľko je kandidátov z akého mesta rozdelených podľa strán.

Ďalej ma zaujímalo vzdelanie podľa titulov a strán. Profesorov je 19 a docentov 26. Najviac ich je v strane č. 5 - spolu 10. V strane č.2 je ich spolu 9.

Pomer kandidátov, ktorí majú titul a ktorí nemajú je podľa jednotlivých strán uvedený v grafe.

Povolania sú kvôli rôznym pomenovaniam rovnakých pozícii nepresné, tj. SZČO, živnostník a živnostníčka sú tri rôzne údaje aj keď reálne to je jedno povolanie. Podobne to platí aj pre študent, študent VŠ, študentka. Nemal som veľmi čas ani chuť to upravovať. Snáď pri ďalších voľbách zavedú pri registrácii kandidátov zoznam najčastejších 200 povolaní a bude to presnejšie. Teraz ich je 869 pri 2967 kandidátoch.

Poslancov, resp. kandidátov čo majú niečo spoločné s poslancami je 147.

Nezamestnaných je spolu 54. Viac je mužov - 32. Graf znázorňuje rozdelenie podľa strán, ktoré majú na kandidátke nezamestnaných.

Čo sa týka veku, tak všetci spolu majú 131905. Najmladší majú 21 a najstarší 85 rokov. Podľa intervalu 10 rokov je percentuálne zastúpenie vekových štruktúr zobrazené v koláčovom grafe.

Podľa jednotlivých strán je to s vekom kandidátov nasledovne.

Na odľahčenie uvádzam ešte prvých 25 najpočetnejších krstných mien medzi kandidátmi.

Z databázovej tabuľky, ktorá je vhodne formátovaná, sa „dolujú údaje" pomerne jednoducho. Dôležité je správne sa pýtať aké údaje chcem vidieť v prehľadnej tabuľkovej forme alebo v grafoch. Excel disponuje silnými nástrojmi na prezentáciu údajov (reportov), ktoré chcú (potrebujú) vedúci pracovníci vidieť. V tomto článku je len zopár možností na ukážku. Ďalšie by som vytvoril keby som mal čas, chuť, väčšiu motiváciu a správne otázky čo chcem vo výsledkoch vidieť. Z týchto údajov ich skôr môžu chcieť vidieť volebné tímy a následne voliči.
Pozn.: údaje sú z kandidátky, ktorú som stiahol v nedeľu 5.2.2012. Kvôli nejednotnej terminológii môžu byť vo výsledkoch drobné nepresnosti.