Ein verteiltes System ist ein Paradigma, welches für die moderne, technologische Welt unverzichtbar ist, in der jede Sekunde unzählige Anfragen verarbeitet werden. Dafür braucht es in verteilten Systemen eine hohe Verfügbarkeit. In einer sich verändernden Umgebung sind durch die Komplexität und Skalierbarkeit der Ressourcen und Komponenten die Systeme häufig Fehlern ausgesetzt. Replikation spielt eine Rolle bei der Milderung solcher Fehler. Sie maskiert diese, um eine fehlertolerante Umgebung zu schaffen. In dieser Hinsicht fokussiert sich diese Forschung auf zielgerichtete Modellierung, maschinelles Lernen und insbesondere genetische Programmierung, um automatisch neue Datenreplikationsstrategien zu identifizieren und entwerfen. Diese Dissertation stellt einen Ansatz zur Abwägung und Optimierung der Ziele vor, welcher auf genetischer Programmierung basiert. Er bestimmt neue, auf das Problem zugeschnittene Replikationsstrategien, die mit etablierten Strategien konkurrieren.
A distributed system is a paradigm, which is indispensable to the current world due to countless requests with every passing second. Therefore, in distributed computing, high availability is very important. Since failures are often inevitable in a distributed paradigm, it greatly affects the availability of services. Replication plays a role in mitigating such failures by masking them to achieve a fault-tolerant distributed environment, thereby eliminating the hindrances in the availability of the data. In this regard, this research focuses on sophisticated modeling, analysis, and machine learning approaches, particularly, genetic programming to automatically identify and design new data replication strategies that are innovative. This dissertation proposes a genetic programming-based multi-objective optimization approach that offers competitive results w.r.t. the contemporary strategies as well as generating novel strategies even with a slight use of relevant genetic operators.
Hochverfügbare Dienste können mit Hilfe von sogenannten Quorum Protokollen realisiert werden. Leider gestaltet sich die Anwendung von Quorum-Protokollen in realen Netzwerken als schwierig, da effiziente Quorum-Protokolle oft von einer bestimmten Graphenstruktur abhängen, die den von ihnen verwalteten Replikaten auferlegt sind. In dieser Arbeit zeigen wir, dass die Kosten- und Verfügbarkeits\-vorhersagen von Quorum-Protokollen oft ungenau sind, wenn sie in einem realen Netzwerk eingesetzt werden. Wir stellen den Mapping-Ansatz vor. Der Mapping-Ansatz erhöht die Genauigkeit der der Kosten- und Verfügbarkeits\-vorhersagen der meisten Quorum-Protokolle in realen Netzwerken. Da der Mapping-Ansatz sehr rechenintensiv ist, wird das k-nearest neighbors Verfahren benutzt, um die Verfügbarkeit der durch die Quoren Protokolle erbrachten Dienste vorherzusagen. Da selbst diese Technik bei bestimmten Netzwerkgrößen nicht praktikabel ist, werden zwei neue Quorum-Protokoll, namentlich das Circle-Protokoll und das Crossing-Protokoll, vorgestellt. Diese beiden Protokolle arbeiten direkt auf einem realen Netzwerk. Alle diese verschiedenen Techniken werden ausführlich analysiert und verglichen. Abschließend wird ein Algorithmus vorgestellt, der alle diese Techniken verwendet um das beste Quorum-Protokoll für ein gegebenes reales Netzwerk zu finden.
Highly available services can be implemented by means of so-called quorum protocols. Unfortunately, applying quorum protocols in real-world physical networks turns out to be difficult since efficient quorum protocols often depend on a particular graph structure imposed on the replicas managed by it. In this work, we show that the cost and availability predictions of the operations provided by quorum protocols are often not accurate when they are executed in a real-world physical network. We present the mapping approach, the mapping approach increases the accuracy of the cost and availability predictions of most quorum protocols on real-world networks. The mapping approach is used to analyze multiple existing quorum protocols when applied on real-world networks. As the mapping approach is computational expensive, the k-nearest neighbors algorithm is novelly employed to predict availability of the services facilitated by the quorum protocols when used on a real-world network. As even this technique is infeasible at certain network sizes two new quorum protocol, namely the Circle Protocol and the Crossing Protocol, are presented that directly work on the real-world network of arbitrary size. All these different techniques are extensively analyzed and compared. Concluding, an algorithm is presented that uses all these techniques to find the best quorum protocol for a given real-world network.
Advances in Self-Organizing Maps, Learning Vector Quantization, Clustering and Data Visualization Cham : Springer, 2020 (2020), Seite 23-32 1 Online-Ressource (XII, 342 p. 161 illus., 113 illus. in color)
Das Erstellen von Lernmaterialien und die Planung von Unterricht ist eine alltägliche Aufgabe von LehrerInnen. In den letzten Jahren hat das Interesse an der Entwicklung von kompetenzorientierten Unterricht immer weiter zugenommen. Keine Ausnahme ist dabei der Informatikunterricht. Von Bedeutung war in der bisherigen Forschung die Definition von Informatik-Kompetenzen, die in dieser Arbeit die Grundlage für die automatisierte Untersuchung von Unterrichtsmaterialien sind. Bislang wurde in keiner Studie spezifisch untersucht, wie die Verwendung von Information Retrieval und Text Mining genutzt werden kann, um die Entwicklung kompetenzorientierter Inhalte zu unterstützen. Die Strukturierung von Lernmaterialen und deren kompetenzorientierte Klassifizierung sind Kern dieser Arbeit. Basierend auf Curricula gewährt die Klassifikation von 5100 Materialien Einblicke in die inhaltliche und prozessorientierte Ausrichtung von Unterricht und deckt dabei die gängigsten Schulinformatik-Begriffe auf.
The development and preparation of teaching and learning materials are the daily chores of Computer Science (CS) teachers. The last few years have seen an increased interest in the development of valuable and competence oriented teaching. Possible Computer Science lesson contents and educational concepts have been widely studied. Towards a CS teaching culture, students’ competences are of particular importance. Therefore, this work uses competence descriptions to highlight the direct impact on everyday school life and implements a framework to apply a competence-oriented Text Mining (TM) and Information Retrieval (IR) process. To date, no study has explicitly looked at how IR and TM can be used to classify competence-oriented lesson content. Based on German Curricula, 5.100 CS materials are classified into the content- and process-orientation to generate automated competence estimations. Furthermore, a Difference Analysis compares CS materials with everyday language content.
KI 2020: Advances in Artificial Intelligence 1st ed. 2020. Cham : Springer International Publishing, 2020 (2020), Seite 267-274 1 Online-Ressource(XIII, 360 p. 33 illus.)