Institute for Digital Business

Machine Learning identifiziert 301 Exoplaneten

August 19, 2022

Zu allen Artikeln

Von Michael Mueck.

Exoplaneten sind Planeten ausserhalb unseres Sonnensystems, welche einen anderen Stern umkreisen. Dieser Forschungszweig ist für die Astronomie deshalb so wichtig, weil dadurch Rückschlüsse auf die Entwicklung von Sonnensystemen gewonnen werden können. Doch die Suche hat ihre Tücken, denn False Positives schleichen sich in die Ergebnisse ein. Dagegen helfen jetzt Neuronale Netzwerke.

In meiner Freizeit begeisterter Amateur-Astronom, belege ich den CAS Artificial Intelligence Management von Afke Schouten an der HWZ. Was liegt also näher als Hobby und Weiterbildung mit spannender Forschung zu vereinen? Im Prinzip ist die Identifizierung von Exoplaneten relativ einfach. Ein Planet schiebt sich auf seiner Laufbahn vor die Sonne. Ihre Lichtkurve sinkt ab und steigt nach dem Transit wieder an. Satelliten übermitteln diese Beobachtungsdaten.

Trotzdem braucht es viel Wissen, um zuverlässige Modelle entwickeln zu können. Die NASA hat Ende 2021 aus Archivdaten des Weltraumteleskops Kepler 301 neue Planeten bestätigt. Dies ist einem neuronalen Netzwerk zu verdanken, welches Forscher darauf trainiert haben, positive von negativen Signalen zu unterscheiden. Ihnen ist es gelungen, ein hochpräzises Deep Learning Modell zu entwickeln, welches Exoplaneten zuverlässig klassifiziert.

ExoMiner Modell

Die Forschungsmission beobachtete erst hunderttausende von Sternen, woraus sich über 100’000 potenzielle Transitbewegungen ergaben. Ihr ExoMiner genanntes Modell identifiziert daraus Exoplaneten mit einer statistischen Wahrscheinlichkeit von 99%. Dies ist für die Wissenschaftler im Vergleich zu anderen Modellen (76%) eine Revolution.

Die Forscher berichten, dass der vollständige Machine Learning (ML) Prozess das Modell in die Lage versetzt, Trainingsdaten korrekt zu klassifizieren und auf künftige neue Transitsignale zu übertragen. Sieht man sich den Forschungsbericht im Astrophysical Journal (Valizadegan et al., 2021) genauer an, fällt auf, welche Schwierigkeiten es zu bewältigen und welche Feinheiten es zu berücksichtigen gab.

Erst mussten die Rohdaten mit mathematischen Filtern aufbereitet werden, damit sie genügend sauber waren für ihre weitere Verarbeitung. Das Bild (unten) zeigt Datenrauschen während eines Transits. Im Studium wurde mehrfach betont, wie wichtig es ist mit sauberen Daten zu arbeiten. Jetzt erkenne ich auch aus meiner eigenen Perspektive die Tragweite von sauberen Daten. Gut aufbereitet lassen sich später noch weitere Informationen aus den Daten gewinnen, wie die Planetengrösse oder die Umlaufzeit um ihre Sonne.

Datenrauschen

Quelle: iopscience.iop.org

Zuvor durchlaufen die Daten ein Deep Neural Network (DNN). Dies sind nichtlineare Rechensysteme, welche beliebige Funktionen annähern können. Ein DNN besteht aus nichtlinearen Verarbeitungseinheiten, sog. Neuronen (unten, a). Diese verarbeiten eine gewichtete Summe Σ an Eingaben und leitet sie durch eine nichtlineare Aktivierungsfunktion 𝑓 in die Ausgabe. In einem DNN sind die Neuronen in Schichten organisiert. Die Ausgaben der Neuronen vom ähnlichen Typ fliessen in die Neuronen der nächsten Schicht. Im ExoMiner Modell wurden 5 vollständig verknüpfte Schichten verwendet (unten, b und c).

Deep Neural Network (DNN)

Quelle: iopscience.iop.org

Die Modellarchitektur dieses DNN arbeitet mit Klassifizierungsprozessen in der Form von Wenn-dann-Regeln. Dabei unterscheidet es die beobachteten Daten nach Entscheidungsgrenzen in Positiv oder Negativ, in Planeten oder Nicht-Planeten.

Üblicherweise wird Deep Learning Modellierung als Black-Box durchgeführt. Die Verarbeitung ist weitgehend selbständig und das Resultat eher schwer interpretierbar. Das besondere an ExoMiner ist, dass durch die hohe Klassifizierungsrate von 99% sein Algorithmus erklärbar wird. Das Geheimnis liegt darin, dass überprüft wird ob ein möglicher Transit zur Form passt, welche die Planetengrösse als Lichtkurve entwickeln müsste.

ExoMiner

iopscience.iop.org

Das Modell lernt, indem die positiv validierten Transits den Trainingsdaten hinzugefügt werden, um seine Vorhersagen zu verfeinern. Seine Konkurrenten lässt ExoMiner weit hinter sich. Basierend auf den Trainingsdaten im direkten Vergleich schneidet er signifikant besser ab (unten). Die 301 neu validierten Exoplaneten erhöhen die Anzahl bekannter Exoplaneten auf über 5’200. Dank diesem Modell sind die Fachleute zuversichtlich, die Daten der am Start stehenden Weltraummissionen zuverlässig analysieren zu können auf ihrer Suche nach bewohnbaren Planeten.

Diese neuen Forschungsmethoden öffnen auch für Amateur-Astronomen wie mich ein interessantes Fenster im Himmel und bereits werden erste Citizen Science Programme angeboten wie bspw. vom EU-Projekt ESCAPE. Dank dem Studium von AI-Management an der HWZ kann ich AI im Job und in meinem Hobby nutzen. Einmal mehr eine bereichernde Bestätigung für «Careerlong Learning».

Quelle: https://doi.org/10.3847/1538-4357/ac4399
EU Project ESCAPE: https://projectescape.eu

 

Dieser Fachbeitrag wurde im Rahmen eines Leistungsnachweises für das CAS AI Management verfasst und wurde redaktionell aufgearbeitet.

Dein Persönliches Digital Update

Bleibe auf dem Laufenden über die neuesten Entwicklungen der digitalen Welt und informiere dich über aktuelle Neuigkeiten zu Studiengängen und Projekten.