Bereiche | Tage | Auswahl | Suche | Aktualisierungen | Downloads | Hilfe
T: Fachverband Teilchenphysik
T 109: Experimentelle Techniken der Astroteilchenphysik I
T 109.2: Vortrag
Montag, 28. März 2011, 17:05–17:20, 30.95: 001
Signal-Hintergrund-Separation für große Datenmengen durch Sampling-basiertes Boosting — •Marius Helf und Michael Backes — Technische Universität Dortmund, 44221 Dortmund, Deutschland
Die Basis einer effizienten Datenanalyse in der Astroteilchenphysik ist ein gutes Verfahren zur Hintergrundunterdrückung. Boosting ist ein sowohl beliebter als auch effizienter Ansatz, um zwei Klassen in einem Datensatz zu separieren. In aktuellen Experimenten der Astroteilchenphysik liegt die zum Training verfügbare Datenmenge bei mehreren Millionen Beispielen, und in der Regel verbessert sich die Performance eines Modells umso mehr, je größer die Trainingsmenge ist. Klassische Lernverfahren sind jedoch nicht in der Lage, solch große Datenmengen zu verarbeiten. Das auf dem weit verbreiteten AdaBoost basierende Verfahren Ada2Boost wurde erweitert, um potentiell große Datensätze durch geschickte Sampling-Techniken direkt aus einer Datenbank nutzbar zu machen. Hier wird die modifizierte Version von Ada2Boost vorgestellt und an Hand von Simulationen des MAGIC-Experiments seine Performance mit der des Random Forest-Ansatzes und des unmodifizierten AdaBoost-Algorithmus’ verglichen.