
Na Sme.sk pre vás každý deň pridávame stovky článkov z tých najrôznejších oblastí života. My však vieme, že vás konkrétne bavia len niektoré: Niekoho tie o počítačoch, iného o kultúre.
Chceme, aby vám neušli aj keď sa neobjavia na našej hlavnej stránke, alebo ak ste u nás náhodou neboli viac dní a oni už u nás zapadli.
Pomocou matematických algoritmov sa vám odteraz budeme snažiť odporúčať články, ktoré ste ešte nečítali a pritom by vás mohli zaujímať.
Nová služba sa volá Čo čítať - okrem samostatnej stránky ju nájdete aj pri každom článku.
Ako vieme, čo chcem čítať?
Samotný princíp odporúčania je založený na hypotéze, že podobným ľudom sa páčia alebo nepáčia podobné veci.
Zo všetkých návštevníkov Sme.sk sa snažíme nájsť zopár takých, ktorí sú práve vám najpodobnejší, zistíme aké články čítali oni a vy ešte nie, tieto zoradíme podľa toho koľkým z vašich najpodobnejších "susedov" sa páčia a zobrazíme prvé 3 alebo prvých 20.
Samozrejme, v skutočnosti je to trochu komplikovanejšie a články napríklad majú rôznu váhu podľa toho koľko a akých ľudí ich čítalo alebo či ste článok už videli na titulnej stránke a ignorovali ho - tým vás však zaťažovať nebudeme.
Ako služba vznikala? (Ján Suchal, Slovenská technická univerzita)
Na Fakulte informatiky a informačných technológií Slovenskej technickej univerzity v Bratislave (FIIT STU) už niekoľko rokov existuje neformálna výskumná skupina PeWe (Personalized Web) zahŕňajúca študentov zo všetkých troch stupňov štúdia (bakalárske, inžinierske a doktorandské), ktorí sa pod vedením prof. Márie Bielikovej vo svojich projektoch venujú prispôsobovaniu obsahu webu a to najmä v kontexte personalizovaného a sociálneho webu.
Čo čítať alebo personalizované kolaboratívne odporúčanie, ako takúto službu volajú v akademických kruhoch, bol jeden z viacerých nápadov, ktoré vznikli pri brainstormingu tejto skupiny zameranom práve na vylepšenie sme.sk.
Nápad bol a začali sme rozmýšľať akým spôsobom je najlepšie vytvárať odporúčania tak, aby táto služba tvorila vhodný doplnok internetových novín, kde v súčasnosti vidíme články, ktoré prečítalo veľa ľudí, ale nijako sa nezohľadňuje to, aké záujmy má každý z nás.
Pomerne rýchlo sme zistili, že rozumne spracúvať sústavne prúdiace a pomerne veľké množstvo dát o tom, čo kto na sme.sk prečítal, nie je vôbec také jednoduché, ako by sa mohlo zdať. Navyše človek na odporúčanie po kliknutí určite nechce čakať dlhšie ako sekundu.
Tieto podmienky naše prvotné veľkolepé návrhy veľmi rýchlo uzemnili, začalo zdĺhavé skúšanie, obdobie pokusov a omylov, návrhov a programovania základu pre spracovanie záznamov o aktivite čitateľov.
Tu je výsledok - čo naň hovoríte? Napíšte nám do diskusie.