Title

layout: true
<slide-template title="Vorlesung Cloud- und Web-Technologien (CS3140)" subtitle="Knotenzentrische Algorithmen"></slide-template>

---

<title-slide title="Cloud- und Web-Technologien" modulenumber="(CS3140)" subtitle="Knotenzentrische Algorithmen mit Flink"></title-slide>

---

# Chronologische Übersicht über die Themen
<webinfo-overview-new current="11"></webinfo-overview-new>

---

# Graphberechnungen

- in vielen Frameworks langwierig
  - geringe Lokalität von Speicherzugriffen
  - sehr wenige Arbeitsschritte pro Knoten
  - sich verändernder Parallelitätsgrad
  - .bold[verteilte Berechnungen über mehrere Rechner verschlimmert das Problem!]

---

# Alternative Möglichkeiten zur Graphberechnung

- Single-Computer-Graphbibliothek
  - nicht skalierbar
- MapReduce
  - ineffizient: Speicherung des Graphzustandes in jedem Verarbeitungsschritt<br/>$\rightarrow$ zu viel Kommunikation notwendig
- .bold[besser:] speziell für Graphen entwickeltes verteiltes Programmiermodell und verteilte Graphverarbeitungsengine

---

# .darkblue[„Think like a vertex!“] .small-font34.darkgray[(Pregel<sup>1</sup>-ähnliche Systeme)]

.reference[
<sup>1</sup> G. Malewicz et al.: .bold[Pregel: a system for large-scale graph processing]. In SIGMOD, 2010.
]

<table>
<tr>
<td>
.condensed.no-margin[
- Algorithmus<br/>.darkblue[„aus Sicht eines Knotens“]
  - Eigener .darkblue[Knotenwert] kann verändert werden
  - .darkblue[Nachrichten] können an andere (beliebige) Knoten (mit bekannter ID) versendet und empfangen werden
]
</td>
<td>
<object data="../../img/cloud/BSP.svg" type="image/svg+xml" style="width:400px">
    
    <img src="../../img/cloud/BSP.svg" type="image/svg+xml" style="width:400px"/>
</object>
</td>
</tr>
</table>
.condensed.no-margin[
- .darkblue[Wiederholung bis keine Änderungen/Nachrichten oder maximale Iterationsanzahl] erreicht
- Motivation
  - Alle Programme dieses Programmiermodells sind<br/>.darkblue[hoch parallelisierbar] .darkgray[(⇝ Verteilung der Knotenberechnungen)]
]

---

# .darkgreen[Apache Flink/Gelly]

- Unterstützung .darkblue[mehrere]r .darkblue[Programmiermodelle für Graphberechnungen]
  - Am Allgemeinsten: .darkblue.bold[Knotenzentrisch (Pregel)] 
  - aber Ausführung .darkblue[andere]r (eingeschränkter) .darkblue[Programmiermodelle] .darkgray[(Scatter-Gather/Gather-Sum-Apply)] evtl. .darkblue[performanter]
       + Einschränkungen z.B.
            + <span class="darkblue">Nachrichten</span> können <span class="darkblue">nur zu Nachbarn</span> versendet werden
            + <span class="darkblue">Trennung der Knotenwertaktualisierung vom Nachrichtenversand</span>

---

<board-exercise></board-exercise>

# .darkblue[Single-Source-Shortest-Path]<br/>als Pregel-Programm

.padding-top[
<object data="../../img/cloud/SSSP1.svg" type="image/svg+xml" class="fullwidth">
    
    <img src="../../img/cloud/SSSP1.svg" type="image/svg+xml" class="fullwidth"/>
</object>
]

---

<board-exercise></board-exercise>

# .darkblue[Single-Source-Shortest-Path]<br/>als Pregel-Programm

.padding-top[
<object data="../../img/cloud/SSSP2.svg" type="image/svg+xml" class="fullwidth">
    
    <img src="../../img/cloud/SSSP2.svg" type="image/svg+xml" class="fullwidth"/>
</object>
]

---

<board-exercise></board-exercise>

# .darkblue[Single-Source-Shortest-Path]<br/>als Pregel-Programm

.padding-top[
<object data="../../img/cloud/SSSP3.svg" type="image/svg+xml" class="fullwidth">
    
    <img src="../../img/cloud/SSSP3.svg" type="image/svg+xml" class="fullwidth"/>
</object>
]

---

<board-exercise></board-exercise>

# .darkblue[Single-Source-Shortest-Path]<br/>als Pregel-Programm

.padding-top[
<object data="../../img/cloud/SSSP4.svg" type="image/svg+xml" class="fullwidth">
    
    <img src="../../img/cloud/SSSP4.svg" type="image/svg+xml" class="fullwidth"/>
</object>
]

---

# Verteilte Graphverarbeitungsframeworks

.condensed[
- Pregel (C++)
  - Ursprung der Idee der knotenzentrischen Algorithmen
- GraphLab (C++)
- PowerGraph (C++)
- PowerLyra (C++)
  - basiert auf PowerGraph (mit weiteren hybriden Partitionierungsstrategien)
- GraphX (Scala/Java JVM)
  - verwendet Spark zur verteilten Verarbeitung von Graphen
- Gelly (Java JVM)
  - verwendet Apache Flink zur verteilten Verarbeitung von Graphen
]

---

# Kantenschnitt für das Partitionieren von Graphen - Pregel

.padding-top.textcenter[
<object data="../../img/cloud/PregelKantenschnitt.svg" type="image/svg+xml" class="halfwidth">
    
    <img src="../../img/cloud/PregelKantenschnitt.svg" type="image/svg+xml" class="halfwidth"/>
</object>
]
.condensed[
- Kantenschnitt mit Verteilung der Knoten auf die Rechner
- Kommunikation per Nachrichten entlang der Kanten
]

---

# Kantenschnitt für das Partitionieren von Graphen - GraphLab

.padding-top.textcenter[
<object data="../../img/cloud/GraphLabKantenschnitt.svg" type="image/svg+xml" class="halfwidth">
    
    <img src="../../img/cloud/GraphLabKantenschnitt.svg" type="image/svg+xml" class="halfwidth"/>
</object>
]
.condensed[
- Kantenschnitt mit Verteilung der Knoten auf die Rechner, aber Replikate der Knoten und Kanten in beiden Rechnern (Kantenstart-/ende)
- Kommunikation zwischen  Replikate und Master für Updates
]

---

# Knotenschnitt für das Partitionieren von Graphen - Powergraph/PowerLyra

.padding-top.textcenter[
<object data="../../img/cloud/PowergraphKnotenschnitt.svg" type="image/svg+xml" class="threequarterwidth">
    
    <img src="../../img/cloud/PowergraphKnotenschnitt.svg" type="image/svg+xml" class="threequarterwidth"/>
</object>
]
.condensed[
- Knotenschnitt: Zusätzliche Knotenreplikate für die Kanten für parallele Knotenverarbeitung
]

---

# Knotenschnitt für das Partitionieren von Graphen - GraphX/Gelly

.condensed[
- Erweiterung des allgemeinen Datenflussframeworks in Spark
  - Umwandlung von graph-spezifischen Operationen zu Operationen der Basis-Engine wie etwa Join, Map und Group-By
  - Knotenreplikation und Partitionierung basierend auf Knotenschnitt zum Balanzieren des Workloads
- Gelly basierend auf Flink
  - Umwandlung von graph-spezifischen Operationen zu Operationen der Basis-Engine wie etwa Join, Reduce, Map und coGroup
]

---

# Partitionierungsstrategien

- Zuordnung der Knoten und/oder Kanten des zu verarbeitenden Graphen zu Rechner
- Ziele:
  - Gleichmäßige Verteilung
  - Effiziente Verarbeitung mit geringen Kommunikationskosten

---

# Partitionierungsstrategie "Random"

.condensed[
- Hashwert der Kante bestimmt Rechner
  - 2 Varianten
      - Richtung der Kante spielt Rolle bei der Zuordnung  
      - kanonisch: Richtung der Kante spielt keine Rolle, d.h. Zuordnung von $(u,v)$ und $(v,u)$ zum selben Rechner
- Vorteile
  - schnelle Berechnung des zugeordneten Rechners
  - gleichmäßige Verteilung der Kanten
  - hoch parallelisierbar
- Unterstützung von folgenden Graphdatenbanken
  - Powergraph (kanonische Variante)
  - GraphX (beide Varianten)
]

---

# Part.-strategie "Random" - Beispiel

.more-more-condensed[
<table>
<tr>
<td>
<span class="bold">Beispiel-<br/>graph:</span>
<object data="../../img/cloud/ExampleGraph.svg" type="image/svg+xml" style="width:130px">
    
    <img src="../../img/cloud/ExampleGraph.svg" type="image/svg+xml" style="width:130px"/>
</object>
</td>
<td>

<table class="result tablepadding textcenter">
<tr>
<th>Kante<br/>$(u,v)$</th>
<th>Rechner<br/>kanonisch $h(u,v)=$<br/>$(u+v)\ mod\ 3$</th>
<th>Rechner<br/>nicht kanonisch $h(u,v)=$<br/>$(u+5\times v)\ mod\ 3$</th>
</tr>
<tr>
<td>$(1,0)$</td>
<td>1</td>
<td>1</td>
</tr>
<tr>
<td>$(0,2)$</td>
<td>2</td>
<td>1</td>
</tr>
<tr>
<td>$(2,0)$</td>
<td>2</td>
<td>2</td>
</tr>
<tr>
<td>$(2,1)$</td>
<td>0</td>
<td>1</td>
</tr>
<tr>
<td>$(3,0)$</td>
<td>0</td>
<td>0</td>
</tr>
<tr>
<td>$(0,3)$</td>
<td>0</td>
<td>0</td>
</tr>
<tr>
<td>$(3,2)$</td>
<td>2</td>
<td>1</td>
</tr>
</table>

</td>
</tr>
</table>
]

---

# Part.-strategie "Oblivious" (Powergraph) 1/3

.condensed[
- "Greedy" Heuristik, um Kanten zu platzieren
  - aber den Replikationsfaktor (d.h. Anzahl Rechner auf denen Kanten eines bestimmten Knotens gespeichert sind) zu minimieren
- Nächste Platzierung einer Kante basiert auf vorherigen Platzierungen (vorgenommen durch denselben Rechner)
  - keine Kommunikation zwischen Rechnern über vorherige Platzierungen notwendig (daher "oblivious"/nichtsahnend)
  - Verteilung nicht so schnell berechenbar wie bei Random
]

---
  
# Part.-strategie "Oblivious" (Powergraph) 2/3

.more-more-condensed[
- Sei $A(u)$ die Menge an Rechnern, auf denen $u$ repliziert ist
  - durch Platzierungen des betrachteten Rechners unabhängig von anderen verteilenden Rechnern
- Platzierung einer Kante $(u,v)$ .darkgray.small-font[(nach $i$ Schritten zufälliger Verteilung)]
  - mit dem Ziel der Minimierung von $|A(u)|+|A(v)|$
     - Fall 1: $A(u) \cap A(v) \neq \phi$, d.h. auf einen Rechner sind bereits Replikate von $u$ und $v$<br/>$\rightarrow$ Platzierung von $(u,v)$ auf wenigsten ausgelasteten Rechner aus $A(u) \cap A(v)$
     - Fall 2: Nur ein Knoten wurde bereits platziert. O.B.d.A.: $A(u) = \phi \wedge A(v) \neq \phi$. Platzierung auf wenigsten ausgelasteten Rechner aus $A(v)$
     - Fall 3: $A(u) = A(v) = \phi$: Platzierung der Kante auf den am wenigsten ausgelasteten Rechner
     - Fall 4: $A(u) \neq \phi$, $A(v) \neq \phi$, aber $A(u) \cap A(v) = \phi$: Platzierung auf wenigsten ausgelasteten Rechner aus $A(u) \cup A(v)$
]

---

# Part.-strategie "Oblivious" - Beispiel 3/3

.more-more-condensed.no-margin[
- Zufällige Verteilung nach $i$ Schritten
<table class="tablepadding">
<tr>
<td>
<object data="../../img/cloud/ExampleGraph.svg" type="image/svg+xml" style="width:85px">
    
    <img src="../../img/cloud/ExampleGraph.svg" type="image/svg+xml" style="width:85px"/>
</object>
</td>
<td>

<table class="result tablepadding textcenter">
<tr>
<th>Knoten</th>
<td>0</td>
<td>1</td>
<td>2</td>
<td>3</td>
</tr>
<tr>
<th>Rechner</th>
<td>{0, 1}</td>
<td>{1, 2}</td>
<td>$\emptyset$</td>
<td>{1}</td>
</tr>
</table>

</td>
</tr>
</table>
]
.more-more-condensed.no-margin[
- Nachfolgende Partitionierung
<table class="result tablepadding textcenter">
<tr>
<th>Kante $(u,v)$</th>
<th>$A(u)$</th>
<th>$A(v)$</th>
<th>$A(u) \cap A(v)$</th>
<th>Rechner</th>
</tr>
<tr>
<td>$(1,0)$</td>
<td>{$1,2$}</td>
<td>{$0,1$}</td>
<td>{$1$}</td>
<td>$1$</td>
</tr>
<tr>
<td>$(0,2)$</td>
<td>{$0,1$}</td>
<td>$\emptyset$</td>
<td>$\emptyset$</td>
<td>$0$</td>
</tr>
<tr>
<td>$(2,0)$</td>
<td>{$0$}</td>
<td>{$0,1$}</td>
<td>{$0$}</td>
<td>$0$</td>
</tr>
<tr>
<td>$(2,1)$</td>
<td>{$0$}</td>
<td>{$1,2$}</td>
<td>$\emptyset$</td>
<td>$2$</td>
</tr>
<tr>
<td>$(3,0)$</td>
<td>{$1$}</td>
<td>{$0,1$}</td>
<td>{$1$}</td>
<td>$1$</td>
</tr>
<tr>
<td>$(0,3)$</td>
<td>{$0,1$}</td>
<td>{$1$}</td>
<td>{$1$}</td>
<td>$1$</td>
</tr>
<tr>
<td>$(3,2)$</td>
<td>{$1$}</td>
<td>{$0,2$}</td>
<td>$\emptyset$</td>
<td>$2$</td>
</tr>
</table>
]

---

# Eingeschränkte Partitionierungsstrategien

- Klasse von Partitionierungsstrategien
- Hash-Wert der Kanten bestimmt Platzierung
  - Einschränkungen zur Reduzierung des Replikationsfaktors
     - Zuordnung des Knotens $v$ zu einer eingeschränkten Menge $S(v)$
	 - Kante $(u, v)$ ist platziert in eine Partition aus $S(u) \cap S(v)$
- Beispielstrategien:
  - .darkblue[Grid]/2D Edge .darkgray[(in dieser Vorlesung...)]
  - Perfect Difference Set (PDS)

---

# Grid (Powergraph)/2D Edge (GraphX)

.more-more-condensed[
- Rechner organisiert in quadratischer Matrix
- Eingeschränkte Menge $S(v)$ enthält alle Rechner der gesamten Zeile und Spalte der Position $h(v)$
  - Kante $(u,v)$ wird auf einen aus der Schnittmenge dieser Rechner platziert
     - Bsp. unten: $h(u)=1$, $h(v)=9$<br/>$\Rightarrow$ Kante $(u,v)$ kann auf Rechner $3$ oder $7$ platziert werden
     - Jede Kante kann auf mind. 2 Rechnern platziert werden
  - obere Schranke $2\times\sqrt{N}-1$ des Replikationsfaktors ($N$ Anzahl Rechner)

<table class="result tablepadding textcenter">
<tr>
<th colspan="3">Zuordung Kanten zu Rechner</th>
</tr>
<tr>
<td class="lila" style="background-color: #f9e6ff">$h(u)=1$</td>
<td class="lila" style="background-color: #f9e6ff">$2$</td>
<td class="darkred bold" style="background-image: linear-gradient(135deg, #f9e6ff 50%, #e6ffe6 50%)">$3$</td>
</tr>
<tr>
<td class="lila" style="background-color: #f9e6ff">$4$</td>
<td>$5$</td>
<td class="darkgreen" style="background-color: #e6ffe6">$6$</td>
</tr>
<tr>
<td class="darkred bold" style="background-image: linear-gradient(135deg, #f9e6ff 50%, #e6ffe6 50%)">$7$</td>
<td class="darkgreen" style="background-color: #e6ffe6">$8$</td>
<td class="darkgreen" style="background-color: #e6ffe6">$h(v)=9$</td>
</tr>
</table>
]

---

# Partitionierungsstrategie:<br/>High-Degree Replicated First (HDRF) (Powergraph) 1/3

.more-condensed[
- HDRF berücksichtigt bei Kantenzuordnung zu Rechner
  - bestehende Zuordnungen
      - Bevorzugung der Rechner, die bereits einen Knoten der Kante repliziert haben<br/>$\rightarrow$ geringerer Replikationsfaktor
  - Kantengrade
      - Zuordnung zu Rechner mit Replikaten des Knotens mit geringerem Kantengrad<br/>$\rightarrow$ geringerer Replikationsfaktor für den Knoten mit geringerem Grad & Bevorzugung von Knoten mit hohen Grad
  - Auslastung des Rechners
      - Bevorzugung der Rechner mit geringerer Auslastung
]

---

# Partitionierungsstrategie:<br/>High-Degree Replicated First (HDRF) (Powergraph) 2/3

.more-more-condensed[
- Jede Maschine $M$ erhält für eine Kante $(u,v)$ einen Score $C(u,v,M) = C$<span class="subscript small-font18">$REP$</span>$(u,v,M) + \lambda \times C_{BAL}(M)$
  - Score $C_{BAL} \in$ &#91;0,1) repräsentiert Ladefaktor<br/>(mehr Kanten bereits auf Rechner gespeichert $\rightarrow$ kleinerer Wert)
  - .darkblue.bold[Auswahl des Rechners mit höchsten $C$ Score] 
  - $C_{REP}(u,v,M) = g(u,M) + g(v,M)$ 
  - $g(v,M) = 1+(1-\theta(v))$ if $M\in A(v)$, else $0$
  - Inkrementierung der partiellen Gradzähler $\delta(u)$ und $\delta(v)$ für Kante $(u,v)$
      - Normalisierter Gradzähler: $\theta(v) = \frac{\delta(v)}{\delta(u)+\delta(v)}$
]

---

# .darkblue[HDRF] (Powergraph) - .darkgray[Beispiel] 3/3

.more-condensed[
- Verteilung der Kante $(1,0)$
.small-font24[
<table class="result tablepadding">
<tr>
<th>Rechner $M$ oder Knoten $n$</th>
<th>0</th>
<th>1</th>
</tr>
<tr>
<th>$C_{BAL}(M)$ .small-font[(höhere Auslastung $\rightarrow$ kleinerer Wert)]</th>
<td>$\frac{1}{100}$</td>
<td>$\frac{3}{4}$</td>
</tr>
<tr>
<th>$\delta(n)$ .small-font[nach Update für Kante $(1,0)$]</th>
<td>$1$</td>
<td>$3$</td>
</tr>
<tr>
<th>$\theta(n) = \frac{\delta(v)}{\delta(u)+\delta(v)}$</th>
<td>$\frac{1}{4}$</td>
<td>$\frac{3}{4}$</td>
</tr>
<tr>
<th>$A(n)$ .small-font[(aufgrund vorheriger Verteilung)]</th>
<td>$\emptyset$</td>
<td>{$0,1$}</td>
</tr>
<tr>
<th>$g(1,M)$.small-font[$= 1+(1-\theta(1))$ if $M\in A(1)$, else $0$]</th>
<td>$1\frac{3}{4}$</td>
<td>$1\frac{1}{4}$</td>
</tr>
<tr>
<th>$g(0,M)$.small-font[$= 1+(1-\theta(0))$ if $M\in A(0)$, else $0$]</th>
<td>0</td>
<td>0</td>
</tr>
<tr>
<th>$C_{REP}(1,0,M) = g(1,M) + g(0,M)$</th>
<td>$1\frac{3}{4}$</td>
<td>$1\frac{1}{4}$</td>
</tr>
<tr>
<th>$C(1,0,M)= C$<span class="subscript small-font18">$REP$</span>$(1,0,M) +$<br/>$\lambda \times C_{BAL}(M)$ mit $\lambda=\frac{3}{4}$</th>
<td>$1\frac{303}{400}$<br/>$= 1,7575$</td>
<td class="bold darkred">$1\frac{13}{16}$<br/>$= 1,8125$</td>
</tr>
</table>
]]

---

# Part.-strategie: Hybrid (PowerLyra)

.more-condensed[
- Hybride Strategie
  - Knotenschnitt für Knoten mit hohem Grad
     - Hashwert des Startknotens bestimmt Knoten
	 - Hohe Replikationsfaktoren (& damit bessere Auslastung)
  - Ansonsten Kantenschnitt
     - Kantenschnitt für Kanten mit hohem Grad des Zielknotens
          - Hashwert des Startknotens bestimmt Knoten
     - Kantenschnitt für Kanten mit geringem Grad des Zielknotens
          - Hashwert des Zielknotens bestimmt Knoten
	      - Dadurch Minimierung des Replikationsfaktors
- Berücksichtigung der tatsächlichen Knotengrade:<br/>Dadurch Part. in mehreren Phasen:
  1. Kantenschnitt aller Kanten und Aktualisierung der Gradzähler
  2. Wiederzuordnungsphase für Knotenschnitt der Knoten mit Grad über einen Threshold (Default: 100)
]

---

# Zum .darkblue[Weiterlesen]…

.condensed[
- Shiv Verma, Luke M. Leslie, Yosub Shin, Indranil Gupta:<br/><span class="em darkblue">An Experimental Comparison of Partitioning Strategies in Distributed Graph Processing</span>,<br/>VLDB 2017<br/>
  <a href="http://www.vldb.org/pvldb/vol10/p493-verma.pdf" target="_blank">http://www.vldb.org/pvldb/vol10/p493-verma.pdf</a>
]

---

# .darkblue[Zusammenfassung]

.condensed[
- Knotenzentrische Algorithmen als Programmierparadigma zum verteilten Berechnen von Graphalgorithmen
  - unterstützt den Entwickler gut zu parallelisierende Graphalgorithmen zu entwickeln
- Verteilung des Graphen
  - Kanten-/Knotenschnitt
  - Partitionierungsstrategien für Kanten/Knoten
      - Random
	  - Oblivious
	  - Grid/2D Edge
	  - High-Degree Replicated First (HDRF)
	  - Hybrid
]