Kitalálják a gondolatod a netes keresők!

Kitalálják a gondolatod a netes keresők!
A prediktív keresés során a keresési szándékot az emberek kollektív és egyéni keresései, kontextuális jellemzők és egyéb adatforrások alapján próbálják prediktálni – mondja Jóföldi Endre. A Precognox Kft. alapító ügyvezetője szerint néha szürreális kiegészítésekkel is találkozhatunk a keresők önkitöltő funkciójában.

 

(Az interjú a 2016 őszi Internet Hungary konferencia előtt készült.)


– Több mint 20 éve netezek, részben a munkám is ehhez köt, online szerkesztő is vagyok, mégis belefutottam egy netes fél-információba. Hitelesnek tűnő oldal ijesztgetett azzal, hogy a barackmag belső részét elfogyasztva cián-mérgezést kaphatok. Már néhány szemtől! Hogy mi a pontos igazság e téren, azt máig sem tudom, de nem is ezt kérdezném. Inkább azt, hogy van valamilyen módszer mondjuk a megalapozott orvosi (vagy például pénzügyi) tanácsokkal sáfárkodó, sokszor pedig vissza is élő honlapok ezreinek kiválogatására egy-egy keresés alkalmával?
– Ilyen esetekre, egészségügyi területen, van egy svájci alapítvány, amely weboldalak tartalmának megbízhatóságát hivatott validálni. Ez a Health On the Net Foundation (hon.ch). A több mint 20 éves cég egyfajta minősítést ad arról, hogy az oldal tartalma tudományosan igazolt, megbízható állításokat tartalmaz-e. Mondhatnám emellett, hogy legyünk óvatosak és körültekintőek, de sajnos a különböző csodálatos gyógyulást ígérő termékek és jó üzletet jelentő szolgáltatások (például hitelek, tőzsdei kereskedési rendszerek és hasonlók) ügyes marketing akciói sokszor pár lépéssel előttünk járnak. A lehető legkülönfélébb eszközökkel igyekeznek elaltatni gyanakvásunkat. A konkrét barackmagos történetet nem értem, bár a direkt üzleti érdek nélküli fél-információk egyre több és több problémás tartalmat generálnak, nem is szólva a nézetekről, ideológiákról és politikai indíttatású bejegyzések, oldalak tömegeiről.

– Mit lehet ezzel az információs hiperinflációval kezdeni? El kell fogadni, mint a nagyszerű internet kellemetlen mellékhatását?
– Amellett, hogy a keresők elég jól rangsorolják a releváns találatokat, nekünk is kritikusnak kell lennünk, mikor valamit olvasunk. Itt felvetődik a perszonalizáció kérdése is, például hogy ugyanarra a keresőszóra mennyire más találatokat kapnak az emberek az eltérő keresési előzményeik miatt, vagy hogy ki milyen információkkal találkozik egy közösségi oldalon az általa követett ismerősei révén. A sok információ valahol tartalmazza mindenki igazságát, legyen az tudományosan elfogadott vagy teljesen ál-tudományos. A keresési technológiák pedig segítenek is valamilyen mértékben a saját igazságburkunkon belül maradni, de nem szabad teljesen elengednünk a gyeplőt.

– Mi a helyzet a kereséseinkkel? Az igen intenzív SEO miatt rengeteg keresés visz félre mindannyiunkat. Különösen például, ha nyaralni mennénk vagy mondjuk hitelt keresünk vagy autót szeretnénk venni. Milyenek lesznek a jövő keresői?
– A jelen keresői már nem szimplán a keresőszavak alapján keresnek, hanem arra törekednek, hogy minél jobban beazonosítsák a felhasználók szándékait a keresés kontextusával együtt. Figyelembe veszik a keresés helyét, a kifejezés szinonimáit, az aktuális keresési trendeket, a szemantikailag kapcsolódó fogalmakat és további természetes nyelvi elemeket. Manapság is meglepődhetünk egy-egy ijesztően pontos keresési javaslaton vagy találaton, ám a jövő keresőinek van még lehetőségük a fejlődésre, illetve a változásra, hiszen olyan technológiai kihívásokkal is számolniuk kell, mint például a mobilos vagy a hangalapú keresés.

– Az emberek mégis lassabban változnak. A keresési adatok elemzéséből derült ki például, hogy a britek többsége a Brexit másnapján keresett csak rá arra, mi is történt, nem?
– Én óvatosabb lennék ezekkel a statisztikákkal. A Google Trends adatokból nem tudjuk meg, hogy pontosan hányan kerestek arra, hogy „Mi az az EU?” vagy „Mi történik, ha kilépünk az EU-ból?”. Csupán a trendet látjuk 1 és 100 közé átskálázva. Abban a pillanatban, amint ezek mellé tesszük a „Brexit” keresőszót, az 1-től 100-ig tartó skála egyből más képet mutat, és az derül ki, hogy elenyésző ezeknek a kérdéseknek a volumene. Emellett persze arról sincs információnk, hogy pontosan kik kerestek rá ezekre a kérdésekre, hogy szavaztak-e vagy sem, így nem vonhatunk le messzemenő következtetéseket. A jelenségről úgy kaphatnánk tisztább képet, ha a jelentősebb kereséseket mind számításba tudnánk venni.

– Visszatérve eredeti témánkra: hogyan működnek az „okosabb” keresők?
– A prediktív keresés során a keresési szándékot az emberek kollektív és egyéni keresései, kontextuális jellemzők és egyéb adatforrások (például email, social media) alapján próbálják előre jelezni, prediktálni. Mikor elkezdünk gépelni valamit a Google-ben, rögtön felugrik pár javaslat, amik nagyon hasznosnak tudnak bizonyulni, de néha szürreális kiegészítésekkel is találkozhatunk. Ezek mind lenyomatai annak, ahogyan az emberek keresnek és gondolkodnak. Így nem csoda, ha például bizonyos társadalmi csoportok megkülönböztetése tükröződik vissza egy-egy javaslatból vagy ha kiderül, hogy az internet népét az a gondolat foglalkoztatja manapság leginkább, hogy mi történt Hodorral.

– Lehet, hogy nem mindenki tud róla mégsem? Mi történt Hodorral?
– Nem szeretnék nagyon spoilerezni, de van benne egy időhurok. Akinek ez nem elég, először is nézze meg a sorozat ezen részét, majd keressen rá. Vagy kérdezze magát George R. R. Martint.

– Értem, de az üzletben hogyan használhatjuk fel ezt?
– A prediktív analitikai módszerekkel megbecsülhetjük ügyfeleink, felhasználóink viselkedését, felismerhetjük a trendeket, mintázatokat vagy az adatainkban rejlő összefüggéseket. Keresési adatokkal például becsléseket tehetünk a közeljövőre, hogy mely termékek iránt látszik emelkedni a piaci kereslet; vagy épp hatékonyabbá tehetjük egy oldal keresőjét szemantikus logelemzés segítségével.

– Hogyan néz ki ez a gyakorlatban?
– Itt a Precognox Kft. – egyébként mára harminc fősre bővült – csapatával nemrég készítettünk egy adatbányászati, Big Data projektet. A Jobmonitor állásportálon feladott hirdetések és álláskeresések számának változásait figyeltük. Ebből mondjuk július végén már meg tudtuk tippelni, hogyan alakul a KSH két héttel később érkező előzetes munkanélküliségi adata.

– Ennek milyen gyakorlati haszna lehet?
– Egy nagyobb webáruházban történt vásárlásokból például a kiskereskedelmi forgalom, vagy akár a GDP várható alakulását is kellő bizonyossággal előre lehet jelezni, hiszen évekre visszamenőleg is megvizsgálhatjuk az adatokat. Persze ehhez nem napi pár tucat, vagy pár száz vásárlás kell, hanem több tízezer.

BEMUTATKOZÁS 

Jóföldi Endre

– A Precognox Kft. alapító ügyvezetője, mely intelligens kereséssel, szövegbányászattal, illetve agilis Java szoftverfejlesztéssel foglalkozik.
– Ügyfeleik között megtalálható a Kilgray, a Profession vagy éppen a CEU is.
– Ők az elindítói a Natural Language Processing Meetup (http://www.meetup.com/Hungarian-nlp/) közösségnek.
– Endre a Kereső Világ szakmai blog elindítója és egyik szerzője.

Jóföldi Endre, Precognox

Kövesd az oldalunkat a Facebook-on és a Twitteren is!


Halaska Gábor

Dr. Halaska Gábor Figyelő hetilap rovatszerkesztője, startup szakértő diplomáit az Államigazgatási Főiskolán és az ELTE Jogi Karán szerezte. A kilencvenes évek eleje óta dolgozik újságíróként. …