FindZebra: új keresőmotor a ritka betegségek megtalálására
Egy dániai kutatócsoport hatékony keresőmotort fejlesztett ki, melynek segítségével az eddiginél könnyebben megtalálhatók a világhálón a ritka betegségekkel kapcsolatos, szakmailag megbízható információk.
A dániai Radu Dragusin az International Journal of Medical Informatics című lap februári számában hozta nyilvánosságra az újdonságot.
Az egészségügyi szakemberek egyre szélesebb körben alkalmazzák diagnosztikai munkájukban az internetet, ezen belül is a Google és a PubMed használata a legnépszerűbb. Problémát jelent ugyanakkor, hogy míg a gyakoribb kórképek esetében ez célravezető stratégia, a ritka betegségekkel kapcsolatban nem könnyű megbízható forrásokat találni.
Ritka betegségeknek azokat a kórképeket nevezzük, melyek előfordulási aránya ritkább, mint 1:2000. A National Institutes of Health (NIH) alternatív definíciója szerint: „Ritka betegségnek tekintjük azokat, melyek bármely tetszőleges időpontot kiválasztva 200 ezernél kevesebb beteget érintenek az Egyesült Államokban.” Összesen körülbelül 6800 ritka kórképet tartanak számon. A ritka betegségek jellegzetessége, hogy diagnosztikájuk nehéz: a Ritka Betegségek Európai Szervezetének adatai szerint a betegség felismerése minden negyedik beteg esetében 5−30 évet késik. Sok ritka betegség esetében a pontos ok nem ismert, és a kóreredet jelentős hányadban egyetlen gén mutációjáig követhető vissza – ezeket ritka genetikai betegségeknek nevezzük. Az etiológiában ugyanakkor olyan környezeti faktorok is szerepet játszanak, mint például a táplálkozás, a dohányzás vagy a vegyszerhatás – ezek vagy direkt módon hatnak közre a betegség kialakulásában, vagy géninterakciók révén elősegítik azok kialakulását vagy súlyosbíthatják a kórlefolyást.
A „zebra” kifejezést először egy amerikai orvos használta a ritka betegségekre az 1940-es évek végén: „Ha patadobogást hall az ember a háta mögül, akkor nem zebrára számít.”
Nem lehetetlen persze speciális információkra lelni a ritka betegségekről a Google segítségével sem. Ehhez azonban végig kell menni egy meglehetősen idő- és munkaigényes folyamaton, melynek során a nagy halom adatból kiszűrjük a megbízható forrásból származókat. Ennek az az oka, hogy a Google nem a megbízhatóság és a tartalom értéke alapján rangsorol, hanem azokat az oldalakat sorolja előbbre, melyekben több link szerepel külső hivatkozásokra. Ha például egy tünetegyüttes egyes elemeit írjuk be a keresőbe kulcsszavakként, a ritka betegségek jó eséllyel nem szerepelnek majd a találati lista elején. Ehhez járul még az is, hogy a Google nincs speciális keresésekre optimalizálva, ami megint csak ahhoz vezet, hogy a keresés túlnyomórészt irreleváns találatokat ad. Mindezek fényében nem meglepő, hogy az egészségügyben hatalmas az igény egy hatékonyabb keresési módszerre.
Dragusin és munkatársai mindenekelőtt azt határozták meg, hogy a Google-hoz és PubMedhez hasonló eszközök mennyiben alkalmasak a diagnosztikai munkára. Ennek ismeretében egy célirányos, könnyen kezelhető keresőmotort alkottak, melyet FindZebrának neveztek el. A FindZebra oldalán ezt írják: „Összesen több mint 31 ezer olyan cikket indexáltunk, melyek a ritka és ritka genetikai betegségekkel foglalkoznak. Ehhez kizárólag szakmailag megbízható internetes forrásokat használtunk fel.”
Az új keresőmotor teljesítményét értékelő vizsgálatokban megállapították, hogy a ritka betegségekkel kapcsolatos keresésekben a FindZebra felülmúlja a Google-t. Ha például az alábbiak szerint végeztek keresést: „fiú, normál szülés, mindkét nagy lábujj deformitása (ízületi hiány), gyorsan növekvő csonttumor a gerinc közelében, a biopsziás mintában osteogenesis”, akkor a FindZebra pontosan azonosította a betegséget fibrodysplasia ossificans progressivaként. Ugyanezekkel a kifejezésekkel Google-keresést végezve a találati lista egyetlen tagja sem tett említést erről a kórképről. A kutatók ezek alapján megállapították, hogy a Google nem optimális az ilyen típusú keresésekre.
Az értékelés második részében úgy ismételték meg az összehasonlítást, hogy a Google-keresést is azokra a forrásokra korlátozták, melyeket a FindZebra is használ. A Google ebben az esetben is lényegesen rosszabbul teljesített, mint a FindZebra.
A ritka betegségekre kifejlesztett keresőmotor a findzebra.compute.dtu.dk internetes címen érhető el, ahol jelenleg az alábbi figyelmeztetés olvasható: „Ez egy kutatási projekt, melynek használata csak egészségügyi szakemberek számára ajánlott.” Majd valamivel később: „Bár a cikkek indexálását egészségügyi szakemberek végezték és felügyelték, a betegeknek nyomatékosan azt tanácsoljuk, hogy konzultáljanak orvosukkal.”
Meg kell jegyezni azt is, hogy bár a Google nem feltétlenül alkalmas a ritka kórképekkel kapcsolatos keresésekre, az orvostudomány más területein igen hasznosnak bizonyulhat. Egy 2012-es vizsgálatban például azt találták, hogy az influenzával, illetve időjárás-előrejelzéssel kapcsolatos Google-keresés alapján több mint 7 héttel korábban előre jelezhető volt az influenzajárvány tetőzésének időpontja.