From 2d9f1e1c0ee642b63fb0243d5062e1aeed4c098c Mon Sep 17 00:00:00 2001 From: Emile Date: Fri, 22 Feb 2019 15:33:29 +0100 Subject: started describing the process of sharindg the trees --- .main.tex.swp | Bin 12288 -> 12288 bytes docs/.container.tex.swp | Bin 16384 -> 24576 bytes docs/.ergebnisse.tex.swp | Bin 0 -> 12288 bytes docs/.simulieren.tex.swp | Bin 0 -> 16384 bytes docs/container.tex | 150 +++++++++++++++++++++++++++++++++++++++++++++-- docs/ergebnisse.tex | 1 - main.pdf | Bin 228426 -> 262205 bytes main.tex | 2 + 8 files changed, 146 insertions(+), 7 deletions(-) create mode 100644 docs/.ergebnisse.tex.swp create mode 100644 docs/.simulieren.tex.swp diff --git a/.main.tex.swp b/.main.tex.swp index 0f7da08..235bcf1 100644 Binary files a/.main.tex.swp and b/.main.tex.swp differ diff --git a/docs/.container.tex.swp b/docs/.container.tex.swp index b208ccf..3c8fe29 100644 Binary files a/docs/.container.tex.swp and b/docs/.container.tex.swp differ diff --git a/docs/.ergebnisse.tex.swp b/docs/.ergebnisse.tex.swp new file mode 100644 index 0000000..766897d Binary files /dev/null and b/docs/.ergebnisse.tex.swp differ diff --git a/docs/.simulieren.tex.swp b/docs/.simulieren.tex.swp new file mode 100644 index 0000000..000780c Binary files /dev/null and b/docs/.simulieren.tex.swp differ diff --git a/docs/container.tex b/docs/container.tex index c16f69f..788b19d 100644 --- a/docs/container.tex +++ b/docs/container.tex @@ -102,14 +102,152 @@ berechnen. \subsection{Datenbank Skalierung} -Ein Bottleneck das bei der Skallierung enersteht ist die Anbinding and die Datenbank: Desto mehr Simulations-Container mit der Datenbank interagieren, desto höher wird die Auslastung der Datenbank. +\begin{figure*}[ht] +\centering +\begin{forest} + [, s sep+=5mm, draw, circle + [A,tikz={\node[draw,fit=()(!1)(!l), label=below:Server 1] {};}, draw, circle + [\(\dots\)] + [\(\dots\)] + [\(\dots\)] + [\(\dots\)] + ] + [B,tikz={\node[draw,fit=()(!1)(!l), label=below:Server 2] {};}, draw, circle + [\(\dots\)] + [\(\dots\)] + [\(\dots\)] + [\(\dots\)] + ] + [C,tikz={\node[draw,fit=()(!1)(!l), label=below:Server 3] {};}, draw, circle + [\(\dots\)] + [\(\dots\)] + [\(\dots\)] + [\(\dots\)] + ] + [D,tikz={\node[draw,fit=()(!1)(!l), label=below:Server 4] {};}, draw, circle + [\(\dots\)] + [\(\dots\)] + [\(\dots\)] + [\(\dots\)] + ] + ] +\end{forest} +\caption{Die Teilbäume \(A, B, C\) und \(D\) werden auf vershiedenen Systemen betrieben und entsprechend angesprochen.} +\label{fig:tree_sharding} +\end{figure*} + +Ein Bottleneck das bei der Skallierung enersteht ist die Anbinding and die +Datenbank: Desto mehr Simulations-Container mit der Datenbank interagieren, +desto höher wird die Auslastung der Datenbank. Um dieses Problem zu lösen +bietet es sich an die Datenbank in mehrere teile aufzuspalten. Ein weiters +essenzielles Problem das bei der Verteilung der Simulations rechen Knoten in +verschiedene rechenzentren entsteht ist, dass die Bandbreite zur Datenbank +sinkt und die Latenz steigt. \subsubsection{Sharding} -Problem: viele simulations container wollen mit einer Datenbank reden - -Lösung: Datenbank sharding +Ab einer gewissen Größe kann eine Galaxie nicht mehr in einer Datenbank +gespeichert werden. Diese muss demnach auf mehrere Rechner aufgeteilt werden. +Da die Datenbank einerseits die einzelnen Sterne Speicher und Bäume welche die +Sterne referenziert bietet es sich hier an diese beiden Bestandsteile der +Datenbank in einzelne Datenbanken auszulagern. + +\paragraph{Sterne} ~\\ +Möchte man eine Liste an Stenen auf mehrere Datenbanken aufspalten wird die +Liste entsprechend aufgeteilt und auf die Datenbanken verteilt. Wird nun ein +bestimmter Stern gesucht wird die Anfrage über einen reverse-proxy geleitet +welcher die Anfrage and die entsprechende Datenbank weiterleitet. + +\par Es ist somit möglich die Liste an sternen auf mehrere Datenbanken +aufzuteilen und somit die Last von einem System auf mehrere zu verteilen. + +\paragraph{Bäume} ~\\ +Die Aufteilung der Datenbank in der die Bäume gespeichert werden gestaltet sich +ähnlich. Statt alle Bäume in einer Datenbank zu speichern, werden die +entsprechenden Teilbäume ab einer bestimmten Tiefe in verschiedene Datenbanken +verteilt. Die Interaktion mit der Datenbank verändert sich nur minimal. Statt +bei einer Anfrage an die Wurzel eines Baumes die entsprechenden node\_ids der +Kinder zu bekommen, erhält man die Adresse der Datenbank in der der Teilbaum +gespeichert wird. Dies ist in Abbildung \ref{fig:tree_sharding} visuell dargestellt. \subsubsection{Caching} -Problem: Bandbreite zu niedrig +Ein weiters Problem das mit der Nutzung eines verteilten Systems entsteht ist +die Bandbreite zwischen den Simulatoren und der Datenbank und die entsprechene +Latenz. Mehrere Messungen zwischen verschiedenen Stervern sind in Abbildung +\ref{fig:bandwidth_latency} dargestellt. + +\begin{figure} +\centering +\begin{tabular} {l | l | l | l} +Server 1 & Server 1 & Bandbreite & Latenz \\ +(Standort) & (Standort) & (Mb/s) & (ms) \\ \hline\hline +Nuremberg & Helsinki & 450 & 23 \\ \hline +Nuremberg & Nuremberg & 2000 & \\ \hline +localhost & localhost & 55000 & 0.07 \\ \hline +\end{tabular} +\caption{Messungen der Anbindungen zwischen verschiedenen Servern. Die Messung +Nuremberg \( \leftrightarrow \) Nuremberg bezieht sich auf zwei Server im +gleichen Rechenzentrum und die Messung localhost \( \leftrightarrow \) +localhost auf die selbe Maschine} +\label{fig:bandwidth_latency} +\end{figure} -Lösung: Local Caching (Geoabhängig) +\par Es wird deutlich, dass falls der Server auf der die Datenbank läuft sich +physisch sehr weit von den Servern auf denen sich die Simulation-container +befinden steht, die Bandbreite zu problemen führt. Es bietet sich also an die +Daten die viel von den simulations-containern genutzt werden physisch näher an +die simulations-container zu bringen um so Proleme die durch die niedrige +Bandbreite und hohe Latenz entstehen zu minimieren. Dies ist in Abbildung +\ref{fig:local_caching} zu sehen: Es existiert eine Haupt-Datenbank welche alle +Zeitschritte speichert und mit den lokalen Datenbanken kommuniziert. Diese +Speichern den jeweilichen Zeitschritt, den die Simulations-Container benötigen +um die kraftberechnnung durchzuführen. Sobald der Lokale Cache leer ist wird +der Nächste Zeitschritt von der Datenbank in den cache kopiert und die +Simulations-Container können mit der Arbeit fortfahren. + +\begin{figure} +\begin{adjustbox}{width=\textwidth/2} +\tikzset{concept/.append style={fill={none}}} +\begin{tikzpicture} + \path[mindmap,concept color=black,text=black] + node[concept] {Haupt Datenbank} + [clockwise from=0] + child[draw, concept color=black] { + node[concept] {Nuremberg \\ Cache} + [clockwise from=67.5] + child { node[concept] {Simulator 1} } + child { node[concept] {Simulator 2} } + child { node[concept] {Simulator 3} } + } + child[draw, concept color=black] { + node[concept] {Helsinki \\ Cache} + [clockwise from=0] + child { node[concept] {Simulator 1} } + child { node[concept] {Simulator 2} } + child { node[concept] {Simulator 3} } + } + child[draw, concept color=black] { + node[concept] {Falkenstein \\ Cache} + [clockwise from=-60.5] + child { node[concept] {Simulator 1} } + child { node[concept] {Simulator 2} } + child { node[concept] {Simulator 3} } + } + child[draw, concept color=black] { + node[concept] {Amsterdam \\ Cache} + [clockwise from=240] + child { node[concept] {Simulator 1} } + child { node[concept] {Simulator 2} } + child { node[concept] {Simulator 3} } + } + child[draw, concept color=black] { + node[concept] {\( \dots \) \\ Cache} + [clockwise from=-180] + child { node[concept] {Simulator 1} } + child { node[concept] {Simulator 2} } + child { node[concept] {Simulator 3} } + }; +\end{tikzpicture} +\end{adjustbox} +\caption{Aufspaltung der Datenbank und Nutzung von localen Caches} +\label{fig:local_caching} +\end{figure} diff --git a/docs/ergebnisse.tex b/docs/ergebnisse.tex index db02904..e69de29 100644 --- a/docs/ergebnisse.tex +++ b/docs/ergebnisse.tex @@ -1 +0,0 @@ -\section{Ergebnisse} diff --git a/main.pdf b/main.pdf index c3f80d6..f4b13aa 100644 Binary files a/main.pdf and b/main.pdf differ diff --git a/main.tex b/main.tex index 1407efd..bf3c682 100644 --- a/main.tex +++ b/main.tex @@ -16,6 +16,7 @@ \usepackage[stable]{footmisc} % footnotes \usepackage{svg} \usepackage{subfig} +\usepackage{adjustbox} % code listings \usepackage{listings} @@ -28,6 +29,7 @@ % tikz for drawing stuff and forest for nice graphs \usepackage{tikz} +\usetikzlibrary{mindmap,trees} \usepackage{forest} \linespread{1} -- cgit 1.4.1