Gagyi mami és a drogosok – avagy mit tudnak meg 100 lájkból?

Gagyi mami és a drogosok – avagy mit tudnak meg 100 lájkból?
Egy okos, adatokat elemezni-, értelmezni képes gép már 60-100 lájkból olyan személyiség-profilt készít, ami pontosabb lehet annál is, mint amennyire, kollégáink, barátaink, sőt, házastársunk ismer minket.

 

A címben feltett kérdésre van egy meglehetősen megdöbbentő válasz: mindent! Pontosabban 60-100, jellemzően nyilvános Facebook lájkunk automatikus kielemzésével „szinte mindent”. De legalábbis sokkal többet, mint akár a kollégák, akár a kollégák, akár a rokonok vagy a házastársak.

De kezdjük egy kicsit messzebbről, ahogyan a CEU Business School egyetemi tanára, Bőgel György is tette ezt az Evolution konferencián. Előadását Thomas Peterffy-vel, amerikai 77-ik leggazdagabb, magyar származású üzletemberének bemutatásával kezdte. Bár kevesen ismerik őt, 14,7 milliárd dollárra (mintegy 4300 milliárd forintra!) rúgó vagyonának nagy részét úgy szerezte, hogy évtizedekkel ezelőtt összerakott egy olyan számítógépes adatelemző rendszert, amelynek segítségével pillanatok alatt hatalmas tőzsdei sikereket ért el – akár a filmekben...

De mit tanulhatnak a marketingesek, a vásárlók viselkedését kutatók a tőzsdemozgásokat elemző Thomas Peterffy-től? Azt, hogy az adatok elemzése során még fontosabb az a régi alapigazság, hogy „csak egy jó kérdést kell feltenni”. És persze a következő lépcső talán még nehezebb: a kérdést a lehető legpontosabban, tudományos alapossággal kell lefordítani az adattudós nyelvére ezt a kérdést.

Bőgel György remek példákat is hozott: egy értékesítő legfontosabb kérdése, hogy mondjuk az összegyűjtött 100 lead-ből – amelyet nem tud egyesével végiglátogatni – melyik az a kettő, amelyikhez ma vagy holnap érdemes „becsengetni”. Az adóhatóság „big data” kérdése lehet: ki fog a jövőben(!) nagy valószínűséggel adót csalni. A rendőség megkérdezheti: ki fog a jövőben bűntényt elkövetni (lásd a Különvélemény című filmet).

A marketinges fő kérdése a big data adatelemző rendszerekhez, csapatokhoz pedig valahogy így hangzana: kik a bizonytalanok? Egyfelől aki bizonyosan vesz terméket/szolgáltatást másfelől aki 1000%, hogy nem vesz semmit, ezt a két tábort minek is megcélozni.
A lényeg tehát a személyiségek profilozása, a lehető legtöbb (persze az adott üzlet számára releváns) aspektusának feltérképezése. De, hogy ne legyünk túl elméletiek, nézzünk néhány példát: a stanfordi kutatók kimutatták például, hogy a „remek” Gagyi mami című film lájkolói közt jóval magasabb a kábítószer-fogyasztók aránya, vagy, aki szereti a különleges alakú, csavart sült krumplit, az az átlagnál jóval intelligensebb, vagy, a Honda autók vásárlói jellemzően nem dohányoznak. Az ilyen, és ehhez hasonló adatpontok ezreit beazonosítva készülnek az egyre pontosabb személyiségprofilok.

Az IBM még remek infografikát is közölt, Marriages with Data címmel, amely megmutatta többek közt: a big data egy házasság sikerességét is képes előre jelezni, megdöbbentően nagy valószínűséggel, mégpedig a hasonló adatbányászati módszerek és személyiségtípusok használatával. (Az indiai Matrimony.com esettanulmány alapján.)

Persze tévedhet az adatelemző is, és vannak nagyon szoros összefüggések, amelyek nyilván (99 százalékos valószínűséggel) teljesen véletlenszerűek: így például a Maine állambeli válások arányának változása nagyon szorosan korrelál a fejenkénti margarinfogyasztás alakulásával...
De vissza a like-elemzésre: akármennyire is hihetetlen, de akár a zenei ízlés megadásával az ember nemi és politikai identitására is igen pontos becslést tudnak adni az adattudósok. Ha ezek az adatok egyszer a bankkártyás, vagy akár csak az online vásárlásainkkal, kereséseinkkel is össze lesznek kötve, akkor aztután már tényleg nyitott könyv leszünk bárki számára, aki az adatainkat birtokolja. Az adatvédelemtől sem várhatunk csodákat. Mert ha használni akarjuk Androidos vagy akár Apple telefonunkat, Windows-os számítógépünket, netről ingyen elérhető levelezésünket, akkor bizony a telepítéskor elfogadjuk azt, hogy az adatainkkal fizetünk – hangzott el az Evolution konferencia egy másik előadásán.


Az Evolution-ön ezt megelőzően számos előadásban került szó a big data legújabb trendjeiről, alkalmazási lehetőségeiről. E területről és sok más, hasonló témában számos értékes tudásanyagot lehet majd felcsipegetni május 9-10-én a siófoki Media Hungary konferencián is.



Halaska Gábor

Dr. Halaska Gábor Figyelő hetilap rovatszerkesztője, startup szakértő diplomáit az Államigazgatási Főiskolán és az ELTE Jogi Karán szerezte. A kilencvenes évek eleje óta dolgozik újságíróként. ...