Tōkei-Sūri-Kenkyūsho (Tokio) Annals of the Institute of Statistical Mathematics Dordrecht [u.a.] : Springer Science + Business Media B.V, 1949 75(2023), Seite 335-368 Online-Ressource
Tōkei-Sūri-Kenkyūsho (Tokio) Annals of the Institute of Statistical Mathematics Dordrecht [u.a.] : Springer Science + Business Media B.V, 1949 74(2022), Seite 167-194 Online-Ressource
Motiviert durch Anwendungen in der Betrugsdetektion beschäftigt sich die Dissertation mit der Modellwahl in prädiktiven Modellen, in denen das korrekte Ranking von Beobachtungen vorhergesagt werden soll. Hierzu beweist die Arbeit zunächst die asymptotische Linearität einer ganzen Familie regularisierter M-Schätzer, die u.A. das Lasso abdeckt. Mit dem in der Dissertation entwickelten Verfahren ,,SingBoost'' gelingt es, trotz unstetiger Verlustfunktion auch im Rankingproblem ein Gradienten-Boosting in Erweiterung des L2-Boostings bereitzustellen. Wir beweisen: Dieser Algorithmus besitzt entsprechende Konsistenz-Eigenschaften wie das L2-Boosting. Für eine stabile Modellwahl wird eine verlustbasierte Stabilitätsselektion entwickelt. Auf simulierten Daten verbessert SingBoost verbunden mit dieser Stabilitätsselektion die Performance für das harte stetige Rankingproblem strikt. Die hierzu entwickelte Stabilitätsselektion ist dabei universell, für beliebige Verlustfunktionen, einsetzbar.
Motivated by applications in fraud detection, this dissertation is concerned about model selection in predictive models where the correct ranking of observations has to be predicted. For this, the thesis starts by proving the asymptotic linearity of a whole family of regularized M-estimators which covers for example the Lasso. With the algorithm ''SingBoost'' developed in this dissertation, we succeed in providing a Gradient Boosting algorithm as an extension of L2-Boosting, even though the loss function is non-continuous. We prove: This algorithm has analogous consistency properties as L2-Boosting. As to stable model selection, we develop a loss-based Stability Selection. In combination with this Stability Selection, SingBoost strictly improves the performance for the hard ranking problem on simulated data. The loss-based Stability Selection that we provide is universally applicable, i.e., for arbitrary loss functions.