Konkrét kérdésre konkrét válasz

Internetes keresők új nemzedékeit fejlesztik a kutatók, részben olyanokat, amelyek konkrét kérdésekre konkrét számokkal, kifejezésekkel felelnek, részben olyanokat, amelyek hosszabb válaszok megadására is képesek. Mindez a termék piacára belépni szándékozó Microsoft esélyeit is javíthatja.

Mi a következő állomás a keresők fejlődésében? Az AltaVista, a keresőmotorok első generációjának legnépszerűbb tagja megmutatta, hogy mivel az interneten indexált rendben találhatók az információk, ezek között elvileg bármit meg lehet találni. A Google, a jelenlegi sztár már valamelyest rendet vágott az adatok irdatlan tömegében, ám még mindig nem képes arra, hogy konkrét kérdésekre konkrét válaszokat adjon. Ebből fakad, hogy ez lehet a következő generációs keresők újdonsága – írja a The Economist.

Eric Brill, a Microsoft egyik kutatója állítja, hogy cége lehet az első, amely – prototípusként Ask MSR (az MSR azt jelenti: Microsoft Research) néven – előáll egy ilyen eszközzel. Ez a motor arra vállalkozik, hogy egy meghatározott kérdésre egy szimpla számmal vagy kifejezéssel feleljen. Ha valaki mondjuk arra kíváncsi, hogy mikor született Marilyn Monroe, akkor az Ask MSR a következőket teszi. Először is egy szófaji elemzést követően megkeveri a mondat szavait (Például: Monroe mikor Marilyn született?), majd az így kapott "mondatokat" betölti egy keresőbe, amely előássa a szókapcsolatokat tartalmazó dokumentumokat. (Erre a körmönfontnak látszó eljárásra azért van szükség, mert a kérdezők egyéni stílusa zagyva mondatokat eredményezhet a gép számára, amelyekre nem találna választ, azaz a dolgok elbonyolításának elkerülése "olcsó" lenne, de rossz megoldásokhoz vezetne.) Miután megvan a dokumentumok gyűjteménye, a program elkezdi keresni a konkrét választ, majd az eredményt gyakoriság szerinti sorrendben felsorolja. A tapasztalatok szerint az esetek 75 százalékában az első három helyen megtalálható a jó felelet. Ez talán nem hangzik túl meggyőzően, de ha hozzávesszük az emberi értelem szűrőjét, akkor már jobb eredményt kapunk. Ha például arra a kérdésre, hogy „Hányszor nyert Björn Borg Wimbledonban?”, kapunk néhány számot, mondjuk 1980, 5 stb., akkor tudjuk, hogy az utóbbira voltunk kíváncsiak. Ha mindez nem elég, akkor egy kattintással eljuthatunk a forrásul szolgáló dokumentumokhoz, amelyekből magunk kereshetjük ki a megfelelő feleletet. A motor még javításra szorul, de nem kétséges, hogy a Microsoft piacra dobja, várhatóan AnswerBot néven.

A Microsoft és a Dél-kaliforniai Egyetem kutatói nem a bonyolult mesterséges intelligenciák kifejlesztésének útját járják, hanem egyszerűbb – adatbázisokban őrzött ismeretek statisztikai valószínűség szerinti előfordulását kihasználó – módszerekkel igyekeznek kifejleszteni az okosabb internetes keresőket. Nem arra akarják rábírni a számítógépet, hogy felfogja az emberek kérdéseinek értelmét, hanem csak arra, hogy kitalálja, mit is akarhat megtudni – az emberek viselkedését, kérdéseik gyakoriságát feldolgozó statisztikai adatok alapján valószínűsíthetően – a keresőt használó internetező.

Eközben Eric Brill már egy további, még fogósabb problémán dolgozik. Radu Soricuttal, a Dél-kaliforniai Egyetem munkatársával együtt nemrég publikálta első kutatási eredményeit egy olyan kereső megalkotásával kapcsolatban, amely ötvenszavas válaszokat tudna adni viszonylag gyakran felmerülő kérdésekre (például: Milyen szabályok alapján ítélik oda az Oscar-díjakat?) A megoldást a zajszűrés elvének megfelelően képzelik el. Az analógia alapja az elektronikus zavarszűrés, amelyet a rossz minőségű rádióforgalmazások vagy telefonbeszélgetések esetén használnak abból a célból, hogy a háttérzajból kiszűrjék a valójában elhangzott – a zavarás miatt eltorzult – beszédet. Ezt a szisztémát alkalmazzák például manapság a helyesírás-ellenőrző programoknál. Ezek olyan szoftverek, amelyek statisztikai valószínűség, gyakoriság alapján mintegy kitalálják, hogy bizonyos elütések mely helyes szó elrontását jelentik, és ennek alapján adják fel a szerintük megfelelő szót. Ez a módszer a kereső esetén a "gyakran feltett kérdések" (Frequently Asked Questions, FAQ) mintájára működik, azaz ilyen kérdéseket raktároz a program, ezekhez hasonlítja a hozzá fordulók felvetéseit, igyekezve megtalálni, hogy a rögzített kérdések melyikét is tette fel neki valójában a felhasználó a saját szavaival, stílusában leírva. E művelet elvégzése után aztán feldobja a kérdésre felelő webes dokumentumokat. A jelenleg használt keresőprototípus 40 százalékos hatékonysággal működik, ami nem briliáns, de nem is rossz, tekintve a probléma bonyolultságát a gépi agy "nyelvérzékéhez" képest.

Azóta történt

Előzmények