Emlőrák kimutatása mesterséges intelligenciával
Az új képelemző rendszer 99,72%-os pontossággal mutatta ki az emlőrákot a tesztelés során.
- Új kezelési módszer terápiarezisztens emlőrák kezelésében
- A BRCA2 mutációt hordozó emlőrák kialakulása
- Új terápiás megközelítés HER2-pozitív emlőrákban
- Emlőrák kimutatása anyatejből
- AI használata a mellrák kimutatására
- Hosszabb emlőrák túlélés olaparibbal
- Lendületes fejlődés az emlőrák gyógyszeres kezelésében
- Kinél nagyobb a mellrák kiújulásának kockázata?
- Sacituzumab govitecan a HR+ áttétes emlőrák kezelésére
- A szervezett lakossági mammográfiás emlőszűrés részvételi mutatói 2012–2021 között Magyarországon
- A rosszindulatú daganatok hazai epidemiológiai helyzete a XXI. század második évtizedében
- Premenopauzális nők hormonreceptor-pozitív korai emlőrákjának ovariumszuppressziós ellátása mellé adott aromatázgátló- vagy tamoxifenadagolás összehasonlítása
- Emlőrák elleni kísérleti vakcina
- Az előrehaladott tripla negatív emlőrák kezelése
- Az emlőrákos betegek és a betegség kiújulásának kockázatai
- A petefészekműködés szuppressziójának előnyei emlőrákban
- Az emlőrák posztoperatív sugárterápiájának mellékhatásai
A Cancers folyóiratban május 9-én jelent meg a Northeastern University kutatóinak cikke, amelyben egy olyan új, az emlőrák felismerésére tervezett mesterséges intelligencia-architektúra kifejlesztéséről adtak hírt, amely a tesztelés során 99,72%-os pontosságot ért el. Az emlőrák az új női rákos esetek 30%-át teszi ki évente, és az American Cancer Society becslései szerint 2024-ben csak az Egyesült Államokban több mint 42 ezer nő fog belehalni.
“Az AI megnézi a nagy felbontású képeket, és a korábbi adatokból megtanulja, hogyan ismerje fel a rákra utaló mintázatokat, valamint, hogy hogyan végezze el a további diagnózist, ami elsősorban az altípus és az invazivitás meghatározását foglalja magában” - nyilatkozta Saeed Amal, a cikk első szerzője, aki kutatócsoportjával januárban már publikált hasonló eredményeket egy prosztatarákot felismerő AI modellről. “Az AI alkalmazásának lényege, hogy nem hagy ki egy daganatot sem, és nem fog kimerülni 10 vagy 20 ember diagnosztizálását követően.”
Ideális esetben ez a keretrendszer lehetővé teszi majd az orvosok számára, hogy ne csak gyorsabban és pontosabban kezeljék a betegeket, hanem segít az új AI-modellek kifejlesztésében is, amelyekkel olyan ritka és nem gyakori rákos megbetegedéseket is lehet diagnosztizálni, amelyekről nem áll rendelkezésre nagy elemszámú betegadat. A mostani vizsgálathoz az emlőrákos minták felvételeit a kutatók a Breast Cancer Histopathological Database-ben található rosszindulatú és jóindulatú emlőszövetek képeit tartalmazó, nyilvánosan elérhető adatkészletből szerezték meg. Ezen adatok birtokában a csapat egy olyan mélytanulásos (deep learning) algoritmust hozott létre, amely különböző modelleket használt a pontosság növelése és a hiba csökkentése érdekében.
“Ez a folyamat olyan, mintha egyszerre több orvos diagnózisát vennénk, és szavazással választanánk ki a legjobb döntést” - fejtette ki Amal.
Hogyan működik egy képfelismerő rendszer?
A mostani kutatás során kifejlesztett emlőrák-felismerő rendszer egy úgynevezett konvolúciós neurális hálózat (CNN; convolutional neural network). Ehhez hasonló algoritmust használ például a Facebook vagy az Instagram az arcok felismerésére. A neurális hálózat úgy működik, hogy adatokat vesz fel, és az adatokat „súlyok” beállításával manipulálja, amelyek a bemeneti jellemzők egymáshoz és az objektum osztályához való viszonyára vonatkozó feltételezések. A hálózat betanításával a súlyok értékeit módosítják, és végül remélhetőleg olyan súlyokhoz fog konvergálni a modell, amely pontosan rögzítik a jellemzők közötti kapcsolatokat. Így működik egy úgynevezett előrecsatolt neurális hálózat, és a CNN-ek két részből állnak: egy ilyen előrecsatolt neurális hálózatból és konvolúciós rétegek csoportjából. A konvolúció egy matematikai művelet, amely súlykészletet hoz létre, lényegében a kép egyes részeinek reprezentációját hozva létre. Ez a súlykészletet az ún. kernel vagy szűrő. A létrehozott szűrő kisebb, mint a teljes bemeneti kép, és csak a kép egy részét fedi le. A szűrőben lévő értékek összeszorzódnak a képen látható értékekkel, vagyis egyes lényeges részletek nagyobb súlyt kapnak. Ezután a szűrőt áthelyezik, hogy a kép egy új részét reprezentálják, és a folyamatot addig ismétlik, míg a teljes képet le nem fedi.
Képzeljünk el például egy téglafalat, ahol a téglák a bemeneti kép képpontjait képviselik. Egy „ablakot” oda-vissza csúsztatnak a fal mentén, ez a szűrő. Az ablakon keresztül látható téglák azok a pixelek, amelyek értéke összeszorzódik a szűrőn belüli értékekkel. Emiatt a súlyok szűrővel történő létrehozásának ezt a módszerét gyakran „csúsztatható ablakok” technikának nevezik, és a kutatás során pontosan ezt a módszert alkalmazták a fejlesztők a nagy méretű képek elemzésére.
A teljes bemeneti kép körül mozgatott szűrők kimenete egy kétdimenziós adattömb, amely a teljes képet reprezentálja. Konvolúciókra azért van szükség, mert egy neurális hálózatnak képesnek kell lennie a kép pixeleinek számértékként értelmezésére. A konvolúciós rétegek feladata, hogy a képet számértékekké alakítsák, amelyeket a neurális hálózat értelmezni tud, majd képes lesz releváns mintázatokat kinyerni belőle. A konvolúciós hálózat szűrőinek feladata ezért egy kétdimenziós értéktömb létrehozása, amely átvihető a neurális hálózat későbbi rétegeibe, azokba, amelyek megtanulják a képen látható mintákat. A CNN-k nem csak egy szűrőt használnak a minták megtanulására a bemeneti képekből. Több szűrőt használnak, mivel a különböző szűrők által létrehozott különböző tömbök a bemeneti kép összetettebb, gazdagabb megjelenítéséhez vezetnek. A CNN-ek szűrőinek általános száma 32, 64, 128 és 512. Minél több szűrő van, annál több lehetősége van a CNN-nek megvizsgálni a bemeneti adatokat, és tanulni belőlük.
A CNN elemzi a pixelértékek különbségeit, hogy meghatározza az objektumok határait. Szürkeárnyalatos képen a CNN csak a fekete-fehér eltérést, azaz világostól a sötétig terjedő különbségeket vizsgálná. Ha a képek színesek, akkor a CNN nem csak a sötétséget és a világosságot veszi figyelembe, hanem a három különböző színcsatornát – pirosat, zöldet és kéket – is látnia kell. Ebben az esetben a szűrők 3 csatornával rendelkeznek, akárcsak maga a kép.
Miután az adatok áthaladtak az összes konvolúciós rétegen, tovább haladnak a CNN sűrűn összefüggő részébe. A sűrűn összekapcsolt rétegek úgy néznek ki, mint egy hagyományos előrecsatolt neurális hálózat, csomópontok sorozata, amelyek egymáshoz kapcsolódó rétegekbe vannak rendezve. Az adatok ezeken a sűrűn összefüggő rétegeken haladnak keresztül, amelyek megtanulják a konvolúciós rétegek által kinyert mintákat, és ezáltal a hálózat képessé válik az objektumok felismerésére.
Ebben a rendszerben a kutatók több adatbázisból származó képek felhasználásával tanították be a rendszert a képek felismerésére. A betanítást úgynevezett “epoch”-okban (“korszak”-okban) végezték, ebből összesen 20-at alkalmaztak. Minden epoch 48 lépésből állt, és minden egyes lépés körülbelül 16 másodpercet vett igénybe a betanítás során.
A szövettani célú AI képelemzés egyik fő kihívása a nagyméretű, nagy felbontású képeket tartalmazó adathalmazok kezelése, ami gyakran olyan számítási kapacitást igényel, hogy az egyelőre korlátokba ütközik. Ennek a problémának a megoldására azonban vannak már olyan módszerek, innovatív technikák, amelyek képesek ezt az igényt csökkenteni. Ilyen technikák az “image patching”, a “downsampling” és az “ensemble learning”, vagyis képfoltok alkalmazása, a mintavételezés csökkentése és az együttes tanulás. Ezekben általában az a közös vonás, hogy a képek teljesen jelentéktelen részeit nem dolgozzák fel, és az egyes fontos részeket is több részletben, több lépésre bontva számszerűsítik. A mostani fejlesztés során a nagy felbontású képek kisebb foltokra történő szegmentálása lehetővé tette a lokalizált régiók fókuszált elemzését, csökkentve a számítási igényeket, miközben sikerült megőrizni a diagnosztikai pontosságot. Emellett a kutatók a megtanult jellemzők hasznosítására előre betanított konvolúciós neurális hálózati (CNN) modelleket, például a VGG16 és a ResNet50 modelleket használták, ezáltal optimalizálva a számítási hatékonyságot. Továbbá az együttes tanulási stratégia (ensemble learning) amely több modellből származó előrejelzéseket kombinált, nemcsak az osztályozási pontosságot növelte, hanem a meglévő modellarchitektúrák kihasználásával a számítási kapacitásigényeket, költségeket is mérsékelte.
Írásunk az alábbi közlemények alapján készült:
AI system diagnoses breast cancer with near 100% accuracy
Mik azok a CNN-ek (konvolúciós neurális hálózatok)?
Irodalmi hivatkozás:
Aadhi Aadhavan Balasubramanian et al, Ensemble Deep Learning-Based Image Classification for Breast Cancer Subtype and Invasiveness Diagnosis from Whole Slide Image Histopathology, Cancers (2024). DOI: 10.3390/cancers16122222