„Az algoritmusok területének lapvetően két fontos ága van: egyrészt létezik a Natural-language generation megközelítése, azaz amikor a gépi algoritmus gyönyörű szép folyószöveget generál és emberi értékű szöveget állít elő a semmiből, a kontextusból vagy a válaszból. Ez nagyon érdekes terület, hiszen soknyelvűséggel megoldani és algoritmusból előállítani az értelmes szöveget nagyon nehéz. Persze vannak nyelvek, melyekből egyszerűbb a dolog, ilyen például az angol, ahol kevés a toldalék és az üzleti nyelv egy nagyon szűk halmazzal is jól beszélhető. Ezzel szemben a magyar nyelv dúskál a toldalékokban és a speciális nyelvtani szabályokban” – közölte a 25. Media Hungary konferencián Szekeres Péter.
A Neticle alapítója a szakterülete másik nagy ágának annak megismerését tartja, hogy miként lehet adatvezérelve jobbá tenni a címeket, tartalmakat, posztokat vagy éppen email tárgyakat. Végével is erre a hullámra ültek fel, a mindennapokban ezt kutatják. „Ezt úgy kell elképzelni, hogy ha valakinek van már egy szövege és elképzelése, megcsinálta a cikk vázlatát is, akkor megnézi, hogy mik azok a trükkök, apró módosítások, ahol hatékonyabbá tehető a tartalma” – magyarázta, majd hozzátette: ez a közösségi médiában rendkívül izgalmasnak bizonyul, hiszen ott lényeges, hogy milyen egy jó poszt hosszúsága, mekkora az elérés, milyen a hastagek használata, illetve mi a téma.
Szekeres Péter szerint a címadás komplex dolog: az újságírónak vagy bloggernek mindig van egy célja a címmel, annak mindig illeszkednie kell a fő tartalomhoz, a médium szellemiségéhez. „Emellett azt szeretnék elérni, hogy a lehető legtöbben elolvassák a tartalmukat, azaz minél többen kattintsanak a cikkre. Ez azért is különösen fontos, mert hazai média kultúra nagyon címlap központú, az olvasó csak ritkán kattint a rovatokba” – mondta a szakember. Véleménye szerint emiatt a szokás miatt fontos, hogy mi jelenik meg a nagy portálok főoldalán, hiszen minden esetben a cikkek címe, a lead és a kapcsolódó audiovizuális tartalmak alapján dönti el egy olvasó azt, hogy rákattint-e az adott tartalomra. „Utána persze még vannak fontos mutatók, többek között hogy végig olvastuk-e az adott cikket, továbbolvastunk-e a témában, esetleg történik-e valamilyen vásárlás vagy explicit tranzakció az oldalon” – sorolta Szekeres Péter. Hozzátette, erre fejlesztették ki szolgáltatásukat, mellyel elérhetővé vált, hogy sokan megnyissanak egy adott tartalmat és ne térjenek el az eredeti cikktől. A cég a szolgáltatás létrehozáskor több száz változót definiált, és ezen változók négy nagy csoportját határozták meg: munkák és személyek, speciális témák, szemantikai elemek, szintaktikai elemek. „Az engineünk felismeri a cikkben szereplő személyeket, megmondja, hogy milyen fontosabb témák vannak az adott szövegben, hogy számszerűen mennyire pozitív vagy negatív egy tartalom” – vázolta Szekeres Péter. Elmondta, ezeket kombinálták össze a rengeteg változóval, megvizsgálják az autkorrelációs értékeket is. Ezekből első körben 34 darab fontos változót hoztak létre, s ebből kezdték el modelljüket építeni. Olyan szabályokat generáltak, olyan rejtett mintákat fedeztek fel, amik betartásával egészen biztosan többen kattintanak az adott címre. „A modellünknél fontos volt az is, hogy ne csak bonyolult dolgokat ismerjen fel, hanem akármilyen összefüggésre teszünk szert, az nagyon könnyedén megérthető legyen a user oldalról.
Ami az eddigi munka során tisztán látszik, hogy a modellek működnek, így jobbak az elérések. Azt azonban tiszteletben tartjuk, hogy van egy alkotói kreativitás, vagy a média esetében egy tartalomgyártási folyamat, amit követni kell. Mi ebben hiszünk, mi ezekben az algoritmusokon dolgozunk, s ez az ami ma hitelesen vállalható és elérhető.
Kövesd az oldalunkat a Facebook-on és a Twitteren is!