Kis AI-modellek is hasznosak lehetnek a kórházakban
Egy kutatás szerint bizonyos célokra nem szükséges nagy, drága és fejlett AI-eszközöket alkalmazni, jó eredményeket adnak a kisebb, szabad forráskódú modellek is.
Az npj Digital Medicine folyóiratban július 23-án jelent meg a CU Anschutz Medical Campus kutatóinak tanulmánya, amelynek fő megállapítása, hogy az ingyenes, nyílt forráskódú mesterséges intelligencia (AI) eszközök ugyanolyan hatékonyan segíthetik az orvosokat a vizsgálati eredmények rögzítésében, mint a drágább kereskedelmi rendszerek, anélkül, hogy veszélyeztetnék a betegek adatainak biztonságát. A kutatás egy ígéretes és költséghatékony alternatívát mutat be a széles körben ismert eszközökhöz, mint például a ChatGPT, amelyek gyakran drágák, és érzékeny adatok külső szerverekre történő elküldését igényelhetik.
“Ez egy nagy győzelem az egészségügyi szolgáltatók és a betegek számára egyaránt” -nyilatkozta Aakriti Pandita, a tanulmány első szerzője. “Bebizonyítottuk, hogy a kórházaknak nincs szükségük drága vagy a magánéletet veszélyeztető AI-rendszerekre a pontos eredmények eléréséhez.”
Az orvosok gyakran készítenek (írnak vagy diktálnak) jegyzeteket vagy szabad szöveges jelentéseket, amikor különféle orvosi vizsgálatokat, például egy ultrahangot végeznek. Ezek a jegyzetek értékesek, de nem mindig vannak olyan formátumban, amely felhasználásra alkalmassá tenné őket. Ezen információk strukturálása segít a kórházaknak nyomon követni a betegek eredményeit, felismerni a trendeket és hatékonyabban végezni a kutatásokat. Az AI eszközöket egyre gyakrabban használják ennek a folyamatnak a gyorsabbá és pontosabbá tételére.
De a legfejlettebb AI rendszerek közül sok, például az OpenAI GPT-4 rendszere, megköveteli a betegadatok interneten keresztül külső szerverekre történő elküldését. Ez problémát jelent az egészségügyben, ahol az adatvédelmi törvények a betegadatok védelmét elsődleges prioritássá teszik. A mostani tanulmány azt állapította meg, hogy az ingyenes AI-modellek, amelyek kórházi rendszereken belül használhatók anélkül, hogy adatokat kellene máshova küldeni, ugyanolyan jól, sőt néha jobban teljesítenek, mint a kereskedelmi forgalomban megvásárolható változatok.
A kutatócsoport egy konkrét orvosi problémára összpontosított: a pajzsmirigy csomókra, azokra a nyakon található dudorokra, amelyeket gyakran ultrahangvizsgálat során fedeznek fel. Az orvosok az ACR TI-RADS nevű pontozási rendszert használják annak értékelésére, hogy ezek a csomók milyen valószínűséggel rákosak. Az AI-eszközök valódi betegadatok használata nélküli betanításához a kutatók 3000 hamis, vagy „szintetikus” radiológiai jelentést hoztak létre. Ezek a jelentések utánozták az orvosok által használt nyelvet, de nem tartalmaztak semmilyen személyes információt. A csapat ezután hat különböző ingyenes AI-modellt tanított meg ezeknek a jelentéseknek az olvasására és pontozására.
A modelleket 50 valódi betegjelentésen tesztelték egy nyilvános adatbázisból, és az eredményeket összehasonlították olyan kereskedelmi AI-eszközökkel, mint a GPT-3.5 és a GPT-4. Az egyik nyílt forráskódú modell, az úgynevezett Yi-34B, néhány példa alapján ugyanolyan jól teljesített, mint a GPT-4. Még a kisebb modellek is, amelyek normál számítógépeken futtathatók, egyes tesztekben jobban teljesítettek, mint a GPT-3.5.
“A kereskedelmi forgalomban beszerezhető AI eszközök hatékonyak, de az egészségügyi ellátásban nem mindig praktikusak” – fejtette ki Nikhil Madhuripan, a tanulmány társszerzője. “Drága eszközök, és használatuk általában azt jelenti, hogy a beteg adatait egy vállalat szervereire kell elküldeni, ami komoly adatvédelmi aggályokat vethet fel. Ezzel szemben a nyílt forráskódú AI-eszközök a kórház saját, biztonságos rendszerén belül futtathatók. Ez azt jelenti, hogy az érzékeny információknak nem kell elhagyniuk az épületet, és nincs szükség nagy és drága GPU-klaszterek vásárlására.”
A tanulmány azt is kimutatta, hogy a szintetikus adatok biztonságos és hatékony módszert jelenthetnek az AI-eszközök betanítására, különösen akkor, ha a valódi betegadatokhoz való hozzáférés korlátozott. Ez lehetőséget teremt személyre szabott, megfizethető AI-rendszerek létrehozására az egészségügyi ellátás számos területén.
A csapat reméli, hogy megközelítésük a radiológián túl más területeken is alkalmazható lesz, például a betegségek időbeli alakulásának nyomon követésében.
“Ez nem csak időmegtakarításról szól” – összegzett Pandita. „Hanem arról, hogy olyan AI-eszközöket hozzunk létre, amelyek valóban használhatók a mindennapi orvosi gyakorlatban anélkül, hogy óriási költségekbe vernénk a kórházakat, vagy veszélyeztetnénk a betegadatok biztonságát.”
Írásunk az alábbi közlemények alapján készült:
Free AI tools match commercial systems in reading medical scans safely and affordably
Irodalmi hivatkozás:
Aakriti Pandita et al, Synthetic data trained open-source language models are feasible alternatives to proprietary models for radiology reporting, npj Digital Medicine (2025). DOI: 10.1038/s41746-025-01658-3