„Ez túl hosszú, nem olvasom el.”– ismerős? Van egy jó hírem: megjelent az interneten egy új keresőmotor, amely automatikusan egy-mondatos összefoglalót generál a tudományos közleményekből. A kereső fejlesztői hisznek abban, hogy szoftverük a tudósok segítségére válik a kutatási cikkek gyors feldolgozásában.
A fejlesztő csapat a kereső által generált egymondatos összefoglalót „TLDR”-nek nevezi, amely az internet közismert rövidítése az angol „too-long-didn’t-read” jelenségnek.
A TLDR jelenleg a Semantic Scholarban található meg. A kezdeményezés viszonylag friss, múlt hónapban élesítették a Semantic Scholar keresőjében – amelyet a non-profit Allen Institute for Artificial Intelligence (AI2) szervezet üzemeltet.
A szoftver egyelőre csak 10 millió informatikai témájú cikket rövidít egymondatossá, de több diszciplína kutatási cikkeit is tervezik becsatornázni a projektbe. Jelenleg a finomhangolás fázisában tartanak.
Az embereknek, úgy tűnik, bejön
Az előzetes tesztelés eredményei szerint a szoftver nagyban megkönnyíti a böngészést a tudományos cikkek között. Az egymondatos összefoglalók hatékonyabbnak bizonyulnak, mint az absztraktok és címek áttekintésével történő keresés – főleg, ha az mobileszközről történik.
Akik tesztelték a TLDR-t a Semantic Scholaron belül, úgy gondolják, óriási sikere lesz a szoftvernek. Nem kizárt, hogy az egymondatos összefoglalók standarddá fognak válni a tudományos keresőkben. Tulajdonképpen annyira gördülékennyé teszi a keresést és a tudományos cikkek közötti böngészést, hogy már az is meglepő, nem jelent meg korábban. Az igény határozottan megvan rá. – nyilatkozta Jevin West – informatikus, University of Washington – a Nature-nek.
Így működik
Természetesen a szoftver kezdetleges, így nem tökéletes, viszont akik már próbálták, előszeretettel használják a TLDR-t a Twitteren. A közösségi oldal nem mellesleg az egyik legszámottevőbb inspiráció volt az egymondatos összefoglalók megalkotásában.
A TLDR neurális hálózatokat használ a nagymennyiségű szöveg feldolgozására. A szoftverfejlesztők több tízezer kutatási cikket tápláltak be az adatbázisba, összekapcsolták a címükkel, ennek segítségével pedig a program képes rövid mondatok megalkotására. Ennek részleteiről tovább olvashatsz a Nature bejegyzésében.
Távolabbi kilátások
Az egymondatos összefoglalókkal azok számára is értelmezhetővé és gyorsan feldolgozhatóvá válnak a tudományos cikkek, akik nem a téma szakértői. Más hasonló elven működő keresők (pl. Paper Digest) célközönsége sokkal inkább a szakmai zsargont értők és használók közössége, a tudósok.
A fejlesztők terve, hogy a szoftverüket tudományos kiadók számára is értékesítsék, valamint a szolgáltatás kiszélesítésén is gondolkodnak. Egy személyre szabott, tématerületre szűkített lista ötlete is felmerült, melynek segítségével a kutató az őt érdeklő terület(ek) kutatási cikkeit tekintheti meg egymondatos összefoglalókban.
Próbáld ki te is! –> Semantic Scholar