AI a mammográfiás elemzésben
Egy tanulmány szerint a mammográfiában alkalmazott mesterséges intelligencia (AI) eszköz magas érzékenységet és specifitást mutatott és teljesítményében felülmúlta az emberi olvasókat. Az AI eszköz teljesítménye azonban a léziók szintjén kissé alacsonyabb volt, mint a mellszintjén.
Adnan Gani Taib és George John William Partridge (Nottingham-i Egyetem, Nottingham, Anglia) munkatársaikkal a European Radiology-ban júniusban online cikkükben azt írták, hogy a mammográfiában alkalmazott mesterséges intelligencia (AI) eszköz magas érzékenységet és specifitást mutatott, teljesítményében felülmúlta az emberi értékelőket. Az AI eszköz teljesítménye azonban a léziók szintjén kissé alacsonyabb volt, mint az egész mell értékelésének szintjén.
A kutatók retrospektív módon elemezték az Egyesült Királyság NHS mellszűrési programjának mammográfiáit egy kereskedelmi AI eszköz (Lunit Insight MMG) és emberi értékelők segítségével, hogy értékeljék 882 nem rosszindulatú és 318 rosszindulatú emlődaganat és 328 lézió képét.
Az emberi olvasók (n = 1258), köztük radiológusok, radiográfusok és emlőgyógyászok, 1200 mammográfiát vizsgáltak meg. Ugyanezeket az eseteket az AI eszköz is tőlük függetlenül elemezte.
Az emberi és az AI döntéseket a patológia vagy a 3 éves utánkövetés alapján összehasonlították a valós eredményekkel.
Az érzékenységet, a specifitást és a görbe alatti területet (AUC) mind a mell, mind a lézió (megjelölt érdeklődési területek) szintjén kiszámították. Az AI eszköz az AUC alapján mind a mell (0,942 vs. 0,878), mind a lézió (0,929 vs. 0,851; P < 0,01 mindkettő esetében) szintjén felülmúlta az emberi oértékelőket.
A fejlesztő által ajánlott visszahívási küszöbértéknél az AI eszköz szignifikánsan magasabb specifitást ért el, mint az emberi értékelők a teljes mell értékelésének szintjén (87,4% vs. 79,2%; P < 0,01).
Az emberi specifitáshoz kalibrálva az AI eszköz magasabb érzékenységet mutatott, mint az emberi értékelők mind a teljes mell értékelésének szintjén (92,1% vs 87,5%; P = 0,051), mind a lézió értékelésének szintjén (90,9% vs 83,2%; P < 0,01). Az AI eszköz a teljes rákos léziók 4%-át nem tudta lokalizálni, míg az emberi hibaarány mediánja 62,6% volt.
„Eredményeink alátámasztják azt az elképzelést, hogy az AI-t be kell vezetni a prospektív szűrési munkafolyamatba, ahol a rosszindulatú daganatok lokalizálása előnyös a betegek és a szűrési folyamat számára” – írták a szerzők. „Az ember és az AI közötti együttműködés javítása érdekében az AI-t a léziók szintjén kell értékelni; a pontosság hiánya itt automatizálási torzításhoz és felesleges betegellátási eljárásokhoz vezethet” – tették hozzá.
A tanulmány retrospektív jellege miatt nem tudta értékelni az AI valós idejű hatását az emberi döntéshozatalra. Mivel a vizsgált esetekben túlsúlyban voltak a rákos esetek ez a tesztkészlet az emberi teljesítmény túlbecsléséhez vezethetett. Ezenkívül nem álltak rendelkezésre korábbi mammográfiás felvételek az összehasonlítás céljára, amelyeket a rutin klinikai gyakorlatban gyakran használnak a felismerés segítésére.
A tanulmányt a Lunit finanszírozta.
Forrás:
Taib, AG., Partridge, GJW., Yao, L et al. The evaluation of artificial intelligence in mammography-based breast cancer screening: Is breast-level analysis enough? Eur Radiol (2025) https://doi.org/10.1007/s00330-025-11733-8https://link.springer.com/article/10.1007/s00330-025-11733-8