Gut- oder bösartige Hautläsion? Künstliche Intelligenz differenziert besser als Dermatologen, übersieht weniger Melanome

Pam Harrison

Interessenkonflikte

20. Juni 2018

Das sogenannte Deep Learning Convolutional Neural Network (CNN) als Form künstlicher Intelligenz erstellt bei gut- und bösartigen Hautläsionen genauere Diagnosen als dermatologische Experten. In einer früheren Studie schnitt die künstliche Intelligenz (KI) bereits bei der Vorhersage des Gesamtüberlebens von Gliom-Patienten besser als Pathologen ab. Die aktuelle Studie, die in den Annals of Oncology veröffentlicht worden ist, hat jetzt festgestellt, dass sie bei der Beurteilung dermatoskopischer Aufnahmen auch gut- und bösartige Hautläsionen besser differenzieren konnte als selbst erfahrene Dermatologen [1].

„Das CNN funktioniert wie das Gehirn eines Kindes“, erklärt Dr. Holger Haenßle, Oberarzt der Hautklinik der Universität Heidelberg, in einer Stellungnahme. „Um es zu trainieren, zeigten wir dem CNN über 100.000 Bilder von gut- und bösartigen Hautkrebsarten und Muttermalen und gaben die Diagnose für jedes Bild an“, fügte er hinzu. „Das CNN übersah weniger Melanome, d.h. es hatte eine höhere Sensitivität als die Dermatologen, und es stufte weniger gutartige Muttermale als malignes Melanom ein, was bedeutet, dass es eine höhere Spezifität besitzt. Diese Ergebnisse zeigen, dass CNN in der Lage sind, auch umfassend ausgebildete dermatologische Experten in der Erkennung von Melanomen zu übertreffen“, schliesst er.

Die Untersucher erstellten ein Bilder-Test-Set mit 300 Aufnahmen, wovon 20% Melanome waren (sowohl in situ als auch invasiv). Die restlichen 80% zeigten gutartige melanozytäre Nävi verschiedener Subtypen, wie sie in der klinischen Praxis üblich sind. Die Untersucher hatten nur dermatoskopische Aufnahmen für die Bildsätze verwendet. Die Läsionen wurden bei 10-facher Vergrößerung aufgenommen.

2 Dermatologen wählten dann 100 Bilder aus dem 300-Bilder-Test-Set aus, um die diagnostische Schwierigkeit zu erhöhen. Dieses 100-Bilder-Set (Set-100) wurde für CNN-Tests verwendet, deren Ergebnisse mit den Ergebnissen von Dermatologen einer internationalen Fachgesellschaft verglichen wurden.

Letztlich nahmen 58 Dermatologen an der Studie teil: Die Hälfte von ihnen (52%) bezeichnete sich als Experte für Dermatoskopie mit über 5-jähriger Berufserfahrung, 19% gaben an, über eine 2- bis 5-jährige Erfahrung in Dermatoskopie zu verfügen und 29% waren Dermatoskopie-Anfänger mit weniger als 2 Jahren Erfahrung.

In einem Level-1-Test wurden die Dermatologen gebeten, die Diagnose „gutartiger Nävus“ oder „malignes Melanom“ allein anhand der dermatoskopischen Bildern zu stellen. Bei der Auswertung hatte die Dermatologen-Gruppe durchschnittlich 86,6% der malignen Melanome richtig diagnostiziert. Dies entspricht einer mittleren Sensitivität für die dichotome Klassifikation von Set-100-Läsionen von 86,9%.

 
Das CNN übersah weniger Melanome, d.h. es hatte eine höhere Sensitivität als die Dermatologen, und es stufte weniger gutartige Muttermale als malignes Melanom ein, was bedeutet, dass es eine höhere Spezifität besitzt. Dr. Holger Haenßle
 

Gutartige Nävi wurden in 71,3% der Fälle korrekt identifiziert, was eine mittlere Spezifität von 71,3% korrekt bedeutet. Dies entspricht einer durchschnittlichen ROC-AUC (Receiver-Operating-Characteristic Area Under Curve; Fläche unter einer Grenzwertoptimierungskurve) von 0,79, so die Untersucher.

„Dermatoskopie-Experten zeigten eine signifikant höhere mittlere Sensitivität, Spezifität und einen größeren ROC-Bereich als Anfänger“, so die Autoren.Im gleichen Level-1-Test vermochte der CNN 95% der malignen Melanome (Sensitivität) und 63,8% der gutartigen Muttermale (Spezifität) genau zu identifizieren. Dies führte wiederum zu einer ROC-AUC von 0,86 für das CNN, so die Untersucher.

Level-2-Test

Nach 4 Wochen durchliefen die Dermatologen einen Level-2-Test, bei dem sie neben den Dermatoskopie-Aufnahmen zusätzliche klinische Informationen erhielten. Dann wurden ihnen dieselben Nahaufnahmen von 100 Fällen präsentiert, welche auch die Experten beim Level-1-Test zu sehen bekommen hatten.

Durch die zusätzlichen Informationen verbesserten sich die Leistungen der Dermatologen bei einer mittleren Sensitivität von 88,9%, einer mittleren Spezifität 75,7% und einer mittleren ROC-AUC von 0,82 (p < 0,01).

„Diese Veränderungen beruhen ausschließlich auf signifikanten Verbesserungen bei ‚Anfängern‘ und ‚erfahrenen Dermatologen‘“, betonten die Untersucher. Dermatoskopie-Experten profitierten hingegen nicht von den zusätzlichen klinischen Informationen, stellten sie fest. Auf der anderen Seite hatte die CNN-Leistung beim gleichen Level-2-Test eine Sensitivität von 95%, eine Spezifität von 90% und eine ROC-AUC von 0,95.

CNN versus Dermatologen

Die Prüfer verwendeten dann die Ergebnisse der Level-1-Tests als Vergleichswert für das CNN, wo die mittlere Sensitivität der Dermatologen 86,6% betragen hatte.

„Bei dieser Sensitivität war die Spezifität des CNN höher (92,5%) als die mittlere Spezifität der Dermatologen (71,3%)“, berichteten die Untersucher und stellen fest, dass der Unterschied statistisch signifikant war (p < 0,01). Außerdem war die ROC-AUC des CNN mit 0,86 auch größer als die mittlere ROC AUC der Dermatologen mit 0,79 im gleichen Level-1-Test (p < 0,01), fügten sie hinzu.

Unter realistischeren Bedingungen, bei denen den Dermatologen sowohl die Bilder als auch klinische Informationen vorlagen, verbesserten sich ihre Ergebnisse zwar, doch lag das CNN immer noch vorn.

 
Unsere Daten zeigen deutlich, dass ein CNN-Algorithmus unabhängig vom individuellen Erfahrungs- und Ausbildungsstand ein geeignetes Tool zur Unterstützung der Ärzte in der Melanom-Diagnostik sein kann. Dr. Holger Haenßle und Kollegen
 

Unter Verwendung der mittleren Level-2-Test-Sensitivität der Dermatologen von 88,9% betrug „die CNN-Spezifität 82,5% und lag damit signifikant höher als die mittlere Spezifität der Dermatologen von 75,7%“, berichteten sie weiter (p < 0,01). Dies galt auch für die ROC-AUC des CNN bei 0,86, das über der mittleren ROC-AUC der Dermatologen von 0,82 (p < 0,01) lag.

„Die Ergebnisse unserer Studie zeigen, dass ein adäquat trainiertes Deep Learning CNN in der Lage ist, dermoskopische Aufnahmen melanozytischer Läsionen hochpräzise zu klassifizieren“, schreiben die Autoren. „Unsere Daten zeigen deutlich, dass ein CNN-Algorithmus unabhängig vom individuellen Erfahrungs- und Ausbildungsstand ein geeignetes Tool zur Unterstützung der Ärzte in der Melanom-Diagnostik sein kann.“

Dieser Artikel wurde von Markus Vieten aus www.medscape.com übersetzt und adaptiert.

 

Kommentar

3090D553-9492-4563-8681-AD288FA52ACE
Wir bitten darum, Diskussionen höflich und sachlich zu halten. Beiträge werden vor der Veröffentlichung nicht überprüft, jedoch werden Kommentare, die unsere Community-Regeln verletzen, gelöscht.

wird bearbeitet....