R Diener1, M Treder2, N Eter2. 1. Klinik für Augenheilkunde, Universitätsklinikum Münster, Domagkstr. 15, 48149, Münster, Deutschland. raphael.diener@ukmuenster.de. 2. Klinik für Augenheilkunde, Universitätsklinikum Münster, Domagkstr. 15, 48149, Münster, Deutschland.
Abstract
BACKGROUND: The use of artificial intelligence (AI) interesting for automated image segmentation, analysis and classification, among others and has already been described for various fields of ophthalmology. OBJECTIVE: This manuscript provides an overview of current approaches and advances in the application of big data and AI in various diseases of the optic nerve head. MATERIAL AND METHODS: A PubMed search was performed. Studies were searched for that answered clinical questions using big data approaches or classical machine learning methods in the analysis of multimodal imaging of the optic nerve head. RESULTS: Big data can help to answer clinical questions in common diseases such as glaucoma. The AI is applied for the segmentation of multimodal imaging of the optic nerve head as well as for the classification of diseases, such as glaucoma or optic disc edema on this imaging data. CONCLUSION: With the help of big data and AI, relationships can be recognized more easily and the diagnostics and course assessment of diseases of the optic nerve head can be facilitated or automated. A prerequisite for clinical application is a CE marking as a medical device in Europe and approval by the Food and Drug Administration in the USA.
BACKGROUND: The use of artificial intelligence (AI) interesting for automated image segmentation, analysis and classification, among others and has already been described for various fields of ophthalmology. OBJECTIVE: This manuscript provides an overview of current approaches and advances in the application of big data and AI in various diseases of the optic nerve head. MATERIAL AND METHODS: A PubMed search was performed. Studies were searched for that answered clinical questions using big data approaches or classical machine learning methods in the analysis of multimodal imaging of the optic nerve head. RESULTS: Big data can help to answer clinical questions in common diseases such as glaucoma. The AI is applied for the segmentation of multimodal imaging of the optic nerve head as well as for the classification of diseases, such as glaucoma or optic disc edema on this imaging data. CONCLUSION: With the help of big data and AI, relationships can be recognized more easily and the diagnostics and course assessment of diseases of the optic nerve head can be facilitated or automated. A prerequisite for clinical application is a CE marking as a medical device in Europe and approval by the Food and Drug Administration in the USA.
Im Rahmen verschiedener Erkrankungen des Sehnervenkopfes hilft die multimodale Bildgebung, verschiedene Pathologien exakt darzustellen. Dies ermöglicht sowohl eine genaue Diagnostik als auch eine Verlaufsbeurteilung. Die Auswertung dieser Daten mithilfe von künstlicher Intelligenz (KI) eröffnet neue Möglichkeiten in der Augenheilkunde. Zusätzlich kann Big Data helfen, immer mehr anfallende Daten strukturiert auszuwerten.
Big Data
„Big Data“ beschreibt die Analyse von großen Datenmengen. Diese ermöglicht die kostengünstige und ressourcensparende Beantwortung verschiedener klinischer Fragestellungen, um so auch übergeordnete Zusammenhänge aufzeigen zu können [1]. So konnten beispielsweise eine Assoziation zwischen minimierter Sonnenstrahlenexposition und erhöhter Inzidenz eines primären Offenwinkelglaukoms, sowie ein erhöhtes Risiko einer Glaukomerkrankung bei Patienten mit Diabetes mellitus oder vorbestehender arterieller Hypertonie identifiziert werden [2-4]. Basis für diese Auswertungen sind große, strukturierte und digitale Datensammlungen. Dies hat im Bereich der Augenheilkunde dazu geführt, dass verschiedene Register gegründet wurden. Besonders nennenswert sind in diesem Zusammenhang das „Save-Sight“-Register in Australien, das „IRIS“-Register in den USA und das „OREGIS“-Register unter Schirmherrschaft der Deutschen Ophthalmologischen Gesellschaft (DOG) in Deutschland [5-7].„Big Data“ beschreibt die Analyse von großen DatenmengenUnterstützt wird diese Entwicklung durch eine zunehmende elektronische Dokumentation der Patientenvisiten [8-12]. Gerade in Zeiten einer Pandemie kann sich dies als hilfreich erweisen. Bommakanti et al. entwickelten und implementierten beispielsweise ein Tool, welches das individuelle Risiko eines Fortschreitens einer Augenerkrankung – wie einem Glaukom – durch eine verzögerte Inanspruchnahme der Versorgung und das Morbiditätsrisiko durch eine COVID-19-Exposition berücksichtigt und die Triage anstehender Augenarzttermine erleichtert [13]. Weitere Möglichkeiten von strukturierten großen Datensätzen sind die Anwendung von KI für eine Segmentierung und Klassifikation oder Prädiktion des Krankheitsverlaufs.
Künstliche Intelligenz
KI ist ein Teilbereich der Informatik und beschreibt Algorithmen, die in der Lage sind, „intelligente“ Entscheidungen zu treffen.Maschinelles Lernen (ML) und Deep Learning (DL) sind Unterbegriffe der KI und beschreiben Algorithmen, welche die Fähigkeiten besitzen, bestimmte Lösungsansätze selbstständig zu „erlernen“ (Abb. 1). ML kann als eine Erweiterung der klassischen Statistik bezeichnet werden. Statistische Modelle sind darauf ausgelegt, Varianzen zu erklären und herauszuarbeiten, mit welcher Wahrscheinlichkeit es sich dabei um Zufall handelt. ML-Modelle haben genauso wie die klassischen statistischen Modelle das Ziel, durch „Training“ anhand von Musterdaten exakte Vorhersagen zu treffen. Im Vergleich zu den klassischen statistischen Modellen ist hier das Ergebnis in der Regel allerdings weniger gut nachvollziehbar.
Machine Learning ist eine Unterform der künstlichen Intelligenz, welche Deep Learning beinhaltetBeim DL werden sog. tiefe neuronale Netzwerke verwendet, bei dem Algorithmen orientiert an der Struktur des menschlichen Gehirns aufgebaut sind. In der einfachsten Form hat ein neuronales Netzwerk 3 Elemente: den Input Layer, in dem die Daten dem System zugeführt werden, die Hidden Layers, in denen die Daten weiterverarbeitet werden, und den Output Layer, in dem eine Information (statistische Entscheidung) ausgegeben wird. Diese Algorithmen sind insbesondere für die automatische Bildanalyse geeignet, jedoch sind für den Anwender die Entscheidungsprozesse nicht immer nachvollziehbar und führen somit häufig zu einer sog. „Black Box“ ([14-16]; Abb. 2).
Bildsegmentierung
Die Bildsegmentierung ist der Vorgang des Überprüfens eines jeden einzelnen Bildpunktes, ob dieser einem uns interessierenden Objekt, wie z. B. einer anatomischen Struktur, angehört.Die Untersuchung des Sehnervenkopfes kann neben der stereoskopischen Fundoskopie mithilfe unterschiedlicher Bildgebungsmodalitäten wie der Farbfundusfotografie oder der optischen Kohärenztomographie (OCT) erfolgen. Für eine korrekte Zuordnung von strukturellen Veränderungen zu verschiedenen Sehnervenerkrankungen ist eine genaue Segmentierung der anatomischen Strukturen erforderlich.Eine große Exkavation im Verhältnis zu der Sehnervenscheibe (Cup-Disc-Ratio) kann beispielsweise ein Hinweis für eine glaukomatöse Optikusschädigung sein.Zwar ist eine große Exkavation nicht direkt pathognomonisch für ein Glaukom, jedoch minimiert eine automatisierte robuste Berechnung der Cup-Disc-Ratio (CDR) die hohe Inter- und Intraobservervariabilität der Beurteilung von Papillen auf Fundusfotos [17].Mehrere Arbeitsgruppen entwickelten deshalb Modelle, mit denen eine automatische Segmentierung des Sehnervenkopfes in Cup und Disc und somit eine leichte Berechnung der CDR auf Fundusfotos möglich ist ([18]; Abb. 3) Trotzdem ist diese aufgrund des Mangels an scharfen Konturen und fehlender Tiefeninformationen innerhalb eines 2‑dimensionalen Bildes fehleranfällig. Zhao et al. konnten dieses Problem mit einem 2‑stufigen halb-überwachten Ansatz lösen. Mithilfe eines tiefen neuronalen Netzes wurden in einem ersten Schritt auf Fundusfotos vorher nicht definierte Merkmale des Sehnervenkopfes extrahiert (Output). Somit wird eine aufwendige und fehleranfällige manuelle Markierung umgangen, da das System selbstständig nach Merkmalen (engl. „features“) suchte. In einem zweiten Schritt wurden diese Merkmale wiederum als Input für ein weiteres Regressionsmodell zur Vorhersage der vertikalen CDR verwendet. Das Modell konnte die CDR mit einem mittleren absoluten Fehler von 0,0563 sehr genau vorhersagen und übertraf klassische Modelle, die auf einer manuellen Segmentierung basierten [19].
Im Gegensatz zu Fundusfotos ermöglich ein OCT-Scan eine 3‑dimensionale Darstellung des Sehnervenkopfes und des peripapillären Gewebes. Diese hat zu einem tieferen Verständnis von strukturellen Veränderungen im Bereich des Sehnerven bei verschiedenen Optikuserkrankungen geführt.Im Rahmen einer glaukomatösen Optikusneuropathie kommt es beispielsweise zu typischen Veränderungen im Bereich der Papille und der peripapillären retinalen Nervenfaserschicht (RNFL). Bislang segmentieren kommerziell erhältliche Geräte v. a. die RNFL und die auf der Bruch-Membran basierende minimale Randsaumweite (BMO-MRW). Diese Parameter haben sich v. a. bei der Detektion und Verlaufsbeurteilung von Glaukompatienten als sinnvoll erwiesen. Jedoch können bei bis zu 40 % der RNFL-Scans Segmentierungsfehler aufgrund einer schlechten Aufnahmequalität auftreten [20]. Eine manuelle Korrektur dieser Fehler ist zeitaufwendig und behindert den Arbeitsfluss im klinischen Alltag.Mit dem DL-Modell, das von Mariottoni et al. vorgeschlagen wurde, ließ sich die RNFL in OCT-Bildern mit schlechter Aufnahmequalität besser messen, als mit der Software des Herstellers [21]. Neben der RNFL und BMO-MRW zeigen sich bei Fortschreiten eines Glaukoms jedoch auch Änderungen anderer anatomischer Strukturen, die auf dem OCT-Scan der Papille sichtbar sind. Zwar konnten Thompson et al. auf OCT-Scans mithilfe eines DL-Modells ohne Segmentierung der RNFL besser ein Glaukom diagnostizieren als mit der Nervenfaserschichtdickenmessung [22], welche eine segmentierungsunabhängige Klassifikation von gesunden Patienten und Patienten mit einem Glaukom ermöglicht. Dies limitiert im Umkehrschluss jedoch auch die klinische Anwendung des Algorithmus allein auf die genannten Patientengruppen.Im Gegensatz dazu sind Bildsegmentierungsalgorithmen wie der von Devalla et al. universell bei allen Erkrankungen des Sehnervenkopfes anwendbar, da sie nicht speziell auf die automatische Identifikation einer bestimmten Erkrankung, sondern allein auf eine optimierte Segmentierung einer Bildgebungsmodalität trainiert sind. Die genannte Arbeitsgruppe konnte mithilfe eines mehrschichtigen neuronalen Netzwerkes die RNFL, das prälaminare Gewebe, das retinale Pigmentepithel, die Aderhaut, die Lamina cribrosa und die peripapilläre Sklera automatisiert zuordnen und markieren [23]. Die automatische Segmentierung konnte robust sowohl in gesunden als auch in für Segmentierungsfehler anfälligen glaukomatös veränderten Sehnervenköpfen durchgeführt werden [24]. In einem weiteren Ansatz konnte die gleiche Arbeitsgruppe einen DL-Algorithmus entwickeln, der die Qualität von OCT-B-Scans unterschiedlicher Geräte so harmonisierte, dass in einem weiteren Schritt eine geräteunspezifische Segmentierung der Strukturen möglich war [25]. Dies macht eine einfache Implementierung der Segmentierung von OCT-Scans im klinischen Alltag auf unterschiedlichen Geräten möglich und erleichtert die Diagnostik und Verlaufsbeurteilung von Erkrankungen des Sehnervenkopfes wie dem Glaukom.
Glaukomatöse Optikusneuropathie
Da eine glaukomatöse Optikusneuropathie im Frühstadium asymptomatisch verläuft, ist das Glaukom für ein Screening von großen Patientenkohorten geeignet.Jedoch liefert aktuell noch kein einzelnes Untersuchungsverfahren allein ausreichend valide Daten, um ein Glaukom sicher zu diagnostizieren. Für ein kosteneffektives Glaukomscreening wäre ein einzelner Test mit gleichzeitig hoher Sensitivität und Spezifität wünschenswert [26]. Da die digitale Farbfundusfotografie weit verbreitet und kostengünstig ist, scheint eine automatisierte, KI-gestützte Bilddatenanalyse zur Detektion von glaukomatösen Optikusschädigungen auf dieser Bildgebungsmodalität sehr attraktiv [27].Für ein kosteneffektives Glaukomscreening wäre ein einzelner Test wünschenswertDie Klassifikation von glaukomatösen Optikusneuropathien auf Farbfundusfotos ist schon mit einer hohen Genauigkeit möglich. Li et al. konnten mithilfe von 48.116 Fundusfotos einen DL-Algorithmus mit einer Fläche unter der Kurve (AUC) von 0,986 zur Detektion von glaukomatösen Optikusneuropathien generieren [28]. Phene et al. konnten mit ihrem DL-Algorithmus, trainiert auf 86.618 Fundusfotos, sogar 2 Glaukomspezialisten bei der Klassifikation einer glaukomatösen Optikusatrophie übertreffen [29]. Für den Augenarzt ist die Logik hinter der Entscheidung des Algorithmus aufgrund der „Black Box“ von Algorithmen v. a. bei tiefen neuronalen Netzwerken jedoch nicht nachvollziehbar.Dies konnte die Arbeitsgruppe um Phene et al. mithilfe einer logistischen Regression jedoch umgehen und zeigen, dass sowohl für den Glaukomspezialisten als auch für den Algorithmus die gleichen Merkmale (CDR > 0,7, Papillenrandkerbe, Nervenfaserdefekt, Gefäßverlauf) am ausschlaggebendsten für die Klassifikation waren [29].Obwohl die Fundusfotografie der optimale Kandidat für ein Glaukomscreening zu sein scheint, können mit OCT-Scans zusätzliche Informationen wie die peripapilläre RNFL oder BMO-MRW über den Sehnervenkopf gewonnen werden.Medeiros et al. konnten zeigen, dass es möglich ist, einen Algorithmus darauf zu trainieren, automatisiert die Dicke der RNFL allein auf Fundusfotos zu quantifizieren [30]. Sie trainierten ein tiefes neuronales Netzwerk mit Fundusfotos und den korrespondierenden SD(„spectral domain“)-OCT-Scans von 2312 Sehnerven. Das DL-System konnte auf einem Testdatensatz, bestehend aus 6292 Papillenfotos, die mittlere Dicke der RNFL mit einer absoluten Abweichung von 82,5 ± 16,8 µm vorhersagen. Dieses Modell übertraf sogar Augenärzte in der Klassifikation von Bildern von Sehnervenköpfen mit und ohne einen Gesichtsfelddefekt [31]. Die gleiche Arbeitsgruppe konnte ähnlich vielversprechende Ergebnisse mit der Vorhersage der mittleren BMO-MRW allein auf Fundusfotos erzielen [32].Neben der Quantifizierung von RNFL und BMO-MRW auf Farbfundusfotos könnten andere KI-Ansätze zu einem tieferen Verständnis der Auswirkung von strukturellen Veränderungen des Sehnerven auf seine Funktion führen. Christopher et al. konnten mithilfe eines DL-Modells Gesichtsfelddefekte nur anhand von OCT-Scans des Sehnervenkopfes vorhersagen [33]. Dieser Ansatz könnte im klinischen Alltag helfen, die Häufigkeit der zeitaufwendigen Gesichtsfelduntersuchung bei Glaukompatienten effektiver zu gestalten und gezielter anzuwenden. Mariottoni et al. konnten eine KI-basierte Zuordnung von strukturellen OCT-RNFL-Schäden zu Gesichtsfelddefekten bei einem Glaukom entwickeln. Dies ermöglicht ein tieferes Verständnis des Zusammenhanges von Struktur und Funktion und kann im klinischen Alltag bei der Beurteilung von RNFL-Defekten helfen [34].
Stauungspapille
Eine der größten Herausforderungen bei der Anwendung von KI ist es, robuste Ansätze auch für Erkrankungen mit geringer Inzidenz zu entwickeln. Teilweise ist bei diesen eine ausreichend große Anzahl an Patienten nur mit Datenbanken oder großen multizentrischen Studien zu erzielen. Trotzdem kann gerade die Abgrenzung einer Erkrankung mit hoher Inzidenz wie dem Glaukom zu anderen selteneren Sehnervenerkrankungen schwierig und zugleich klinisch hochrelevant sein. Dieser Fragestellung widmeten sich Yang et al. und konnten mit einem DL-Modell zwischen glaukomatöser und nichtglaukomatöser Optikusneuropathie auf 3815 Farbfundusfotos mit einer Sensitivität von 93 % und einer Spezifität von 81 % unterscheiden [35].Große Datensätze bei Erkrankungen mit niedriger Inzidenz zu generieren ist eine HerausforderungVergleichsweise einfach ist für einen erfahrenen Augenarzt die Detektion einer Stauungspapille. Die direkte Ophthalmoskopie wird aber nur noch vereinzelt von Internisten oder Neurologen beherrscht. Jedoch zeigt sich bei 2,6 % aller Patienten mit neurologischen Symptomen eine Stauungspapille (STP), die Hinweis auf einen erhöhten Hirndruck sein kann [36]. Wird diese übersehen und bleibt eine intrakranielle Hypertension unbehandelt, kann dies zu einem irreversiblen Nervenfaserdefekt mit konsekutiver Funktionsminderung führen. Aus diesem Grund wird in verschiedenen Kliniken und Notaufnahmen mithilfe der digitalen Fundusfotografie ein Bild des Sehnervenkopfes erstellt [37]. Dieses Bild wiederum muss durch einen Augenarzt vor Ort oder per Telemedizin in einem anderen Zentrum beurteilt werden [37]. Hier wäre ein robuster KI-Ansatz zur automatischen Detektion von Papillenödemen sehr hilfreich, jedoch sind große Datensätze bei Erkrankungen mit niedriger Inzidenz ein limitierender Faktor. Echegaray et al. konnten mithilfe eines ML-Algorithmus automatisiert auf Farbfundusfotos den Grad des Papillenödems nach Frisén [38] mit einer gleichen Genauigkeit wie ein erfahrener Neuroophthalmologe klassifizieren [39]. Akbar et al. konnten automatisiert mit einer Genauigkeit von 92,9 % eine Stauungspapille von gesunden Sehnervenköpfen auf Farbfundusfotos abgrenzen [40], ähnliche Ergebnisse wurde von Fatima et al. erzielt [41]. Die verwendeten Datensätze waren mit einer Anzahl von jeweils unter 300 Fundusfotos in beiden Fällen nur gering. Auch ist die Unterscheidung zwischen gesund und krank zwar vielversprechend, entspricht jedoch nicht der Realität, in der mehr als 2 Alternativen vorhanden sind. So ist es klinisch teilweise schwierig, zwischen Papillenödemen und Pseudopapillenödemen – beispielsweise bei hyperopen Augen – zu unterscheiden. Mit einem ML-Modell konnten Ahn et al. zwischen geschwollenen Sehnervenköpfen aufgrund unterschiedlicher Optikusneuropathien, Pseudopapillenödemen und gesunden Sehnervenköpfen unterscheiden [42]. Zusätzlich umgingen die genannten Autoren das Problem eines kleinen Datensatzes. Zum einen konnte mithilfe von Augmentierung der vorhandenen Daten die Diversität des Datensatzes erhöht werden, ohne tatsächlich neue Daten zu generieren. Dies minimiert das Risiko einer Überanpassung (engl. „overfitting“), was bedeutet, dass der Algorithmus nicht auf externe Daten anwendbar ist, da er zwischen gesund und krank anhand von Merkmalen unterscheidet, die nur in dem vorhandenen Datensatz, aber nicht auf einem weiteren externen Datensatz vorhanden sind. Zum anderen wurde ein vortrainiertes tiefes neuronales Netzwerk verwendet. Dadurch wurden trotz der geringeren Datenmengen gute Ergebnisse erzielt.Einen deutlich größeren Datensatz konnten Milea et al. [43] in einer multizentrischen Studie generieren. Die Arbeitsgruppe trainierte einen DL-Algorithmus auf 14.341 Fundusfotos, von denen 2148 Papillen ein Papillenödem aufgrund einer intrakraniellen Hypertension hatten. Der Algorithmus konnte auf einem externen Datensatz von 1505 Farbfundusfotos mit einer AUC von jeweils 0,99 zwischen gesunden Sehnervenköpfen und Stauungspapillen sowie zwischen Stauungspapillen und anderen Pathologien des Sehnervenkopfes unterscheiden. Die Studie aus dem New England Journal of Medicine zeigt, dass auch bei Erkrankungen mit geringer Inzidenz mithilfe von multizentrischen Datensätzen robuste Algorithmen generiert werden können. Der Algorithmus der BONSAI-Arbeitsgruppe könnte bei Implementierung einen großen Einfluss auf die tägliche Routine in Notaufnahmen haben und maßgeblich die Versorgung von Patienten mit intrakranieller Hypertension durch eine schnellere Diagnostik und Therapie verbessern.
Schlussfolgerung und Ausblick
Die strukturierte Sammlung und Auswertung von Daten mithilfe von Big-Data-Analysen sowie die Verwendung maschinellen Lernens auf digitalisierten Daten hat zu einer Vielzahl an interessanten Anwendungen geführt. Mit diesen können Zusammenhänge besser erkannt und die Diagnostik und Verlaufsbeurteilung von Erkrankungen des Sehnervenkopfes erleichtert oder automatisiert werden. Eine Voraussetzung für die klinische Anwendung ist in Europa die CE-Kennzeichnung als ein Medizinprodukt und in den USA die Zulassung durch die Food and Drug Administration (FDA). In den nächsten Jahren wird sich zeigen, ob eine Implementierung dieser Algorithmen in den Alltag umgesetzt werden kann.Die Anwendung von künstlicher Intelligenz in der Augenheilkunde ist jedoch längst keine Zukunftsmusik mehr. Zuletzt konnte ein auf KI basierender Algorithmus zur Früherkennung einer diabetischen Retinopathie auf Fundusfotos eine Zulassung in Europa (2019) und in den USA (2018) erhalten [44].
Fazit für die Praxis
Um eine automatisierte Klassifikation von Erkrankungen mit hoher und mit geringer Inzidenz zu ermöglichen, ist die strukturelle Erfassung von Bilddaten in Registern oder in multizentrischen Studien notwendig.KI(künstliche Intelligenz)-basierte Algorithmen können durch eine verbesserte Segmentierung von Fundusfotos und OCT(optische Kohärenztomographie)-Scans des Sehnervenkopfes die Diagnostik und Verlaufsbeurteilung von Sehnervenerkrankungen optimieren.KI-basierte Algorithmen können auf Farbfundusfotos besser ein Glaukom erkennen als ein Augenarzt und bieten deshalb einen interessanten Ansatz für ein Glaukomscreening von großen Datenmengen.KI-basierte Algorithmen könnten den Ablauf in Notaufnahmen durch eine automatisierte Diagnostik von Papillenödemen auf Farbfundusfotos optimieren.
Authors: Steven L Mansberger; Shivali A Menda; Brad A Fortune; Stuart K Gardiner; Shaban Demirel Journal: Am J Ophthalmol Date: 2016-11-04 Impact factor: 5.258
Authors: Nikhil K Bommakanti; Yunshu Zhou; Joshua R Ehrlich; Angela R Elam; Denise John; Shivani S Kamat; Jared Kelstrom; Paula Anne Newman-Casey; Manjool M Shah; Jennifer S Weizer; Sarah D Wood; Amy D Zhang; Jason Zhang; Paul P Lee; Joshua D Stein Journal: JAMA Ophthalmol Date: 2020-09-01 Impact factor: 7.389
Authors: Mark Christopher; Christopher Bowd; Akram Belghith; Michael H Goldbaum; Robert N Weinreb; Massimo A Fazio; Christopher A Girkin; Jeffrey M Liebmann; Linda M Zangwill Journal: Ophthalmology Date: 2019-09-30 Impact factor: 12.079