Dynamisch Programmeren III
Vandaag Dynamisch programmeren met wat lastiger voorbeelden: Handelsreiziger Longest common subsequence Optimale zoekbomen Knapsack 2 - DP2
Handelsreiziger Een handelsreiziger moet een aantal steden bezoeken: Elke stad 1 keer Elk paar steden v, w heeft een afstand d(v,w) Beginstad = eindstad Wat is de kortste route? 3 - DP2
a 2 c 5 3 4 4 b 4 d Optimaal: totale lengte 13 a 2 c 5 3 4 4 b 4 d Niet optimaal: Totale lengte 16 4 - DP2
Toepassingen Logistiek (belangrijk!!) Robot (printplaten, productie, ) Data van een disk halen Verfmachine Sommige toepassingen zijn asymmetrisch: d(v,w) hoeft niet hetzelfde te zijn als d(w,v) 5 - DP2
Held-Karp Held-Karp algoritme voor Handelsreiziger: Lost het probleem in O(2 n n 2 ) tijd op Werkt ook voor sommige generalisaties Ook als probleem asymetrisch is Langzaam (exponentieel) dus alleen handig als n klein is, maar wel sneller dan naief O(n!) Vandaag: algoritme voor: foto s in de dierentuin 6 - DP2
n! en 2 n n 2 n n! 2 n n 2 5 120 800 10 3628800 102400 15 1.31 10^12 7372800 20 2,43 10^18 4,19 10^8 7 - DP2
Foto s in de dierentuin n dieren Afstandentabel: tussen elk paar dieren de tijd in minuten om van het ene dier naar het andere te lopen omdat de dierentuin heuvelachtig is, hoeft deze niet symmetrisch te zijn Ik wil van elk dier een foto maken: hoe doe ik dat zo snel mogelijk? 8 - DP2
Oplossen met dynamisch Wat is de rij keuzes? programmeren Welk dier bezoeken we eerst? Welk dier als 2e? Welk dier als 3e Etc. Top choice: laatste bezochte dier Deelstuk van keuzes: een rijtje van de eerste i bezochte dieren? 9 - DP2
Wat is een deelprobleem - I Dit lukt niet: Hoeveel tijd kost het om i dieren te bezoeken? Ik mis belangrijke informatie over de deeloplossing Snelste route voor drie dieren hoeft geen deel te zijn van een snelste route voor vier dieren 10 - DP2
Wat is een deelprobleem - II Dit lukt ook niet: Welke verzameling van i dieren bezoek ik? 1 11 - DP2
Aanpak Deelprobleem: Gegeven een verzameling dieren S en een dier k, wat is de minimum tijd om alle dieren in S te bezoeken (begin bij dier 1) en te eindigen bij dier k? Handige notatie: S is alle dieren tussen 1 en k, dus we bezoeken S U {1,k } A(S,k) = minimum tijd als we beginnen in 1, dan alle dieren in S bezoeken (met de beste volgorde) en dan naar k gaan 12 - DP2
Recurrente betrekking A(,g) = d(1,g) Als S >0, dan ( beste geval over alle mogelijkheden voor top-choice) A(S,k) = min { A(S {g}, g) + d(g,k) g in S} 13 - DP2
Uiteindelijk antwoord min { A(V-{1,k},k) k V-{1} } Als we niet naar het begin terug moeten Beste over alle mogelijkheden voor laatst bezochte dier Variant waar we een rondje lopen (terug naar het begin): min { A(V-{1,k},k) + d(k,1) k V-{1} } 14 - DP2
Algoritme 1: memorisatie Maak een hashtabel Q, initieel leeg Best = maxint For all g {2,, n} do Best = min (Best, Compute(V {1,g},g)) Output Best Met Compute een recursief algoritme met memorisatie (next) 15 - DP2
Compute Compute (S, g) {volgt recurrente betrekking} If (S,g) in Q, then return Q(S,g) Else: If S= then return d(1,g) Else antw = maxint; For k S do antw = min {antw, Compute(S {g}, g) + d(g,k)) Zet Q(S,g) op antw Return antw 16 - DP2
Andere aanpak Reken alle A(S,g) uit: Eerst alleen S = Dan alle S met een dier Dan alle S met twee dieren Dan alle S met drie dieren Etc Of representeer S als integer Ook practisch: reken bij elke verzameling de opvolgende oplossingen uit (met heuristieken om stukken die nooit optimaal kunnen zijn weg te laten) 17 - DP2
Over dit algoritme Tijd: we kijken naar alle deelverzamelingen: 2 n Per verzameling n keuzes voor laatste dier Per combinatie n tijd, want kijken naar elk een-nalaatste dier: O(2 n n 2 ) Generalisatie: bijvoorbeeld: hoeveel dieren kan je binnen k tijd bezoeken? (Tussen openingstijd en sluitingstijd?) 18 - DP2
Longest common subsequence Toepassing: DNA vergelijking Sequence: rij elementen <x(1),, x(m)> Deelsequence: voor 1 i 1 < i 2 < i 3 < < i k m de rij elementen <x(i 1 ), x(i 2 ), x(i 3 ), x(i k ) > Deelsequences van <7, 2, 4, 3, 7> zijn bijv: <7,2> of <7,4,7> of <3> of <> of <7,2,4,3,7> of <2,3> Probleem: gegeven twee sequences, vind een sequence die een deelsequence van beide sequences is en zo lang mogelijk is. Bijv.: <3,6,7,1,8,2,8> en <3,4,8,6,7,3,8> geeft <3,6,7,8> als antwoord 19
Wat notatie Subsequence Gemeenschappelijke (common) subsequence Prefix (beginstuk) X i =<x(1),, x(i)> is een prefix van X=<x(1),, x(m)> (0 i m) Z 3 =<7,2,4> is prefix van Z=<7,2,4,5,6,7,8> LCS van X en Y: longest common subsequence 20
Optimaliteitsprincipe Als Z=<z(1),, z(k)> is een LCS van X=<x(1),, x(m)> en Y=<y(1),, y(n)>, dan: Als x(m)=y(n) dan: z(k)=x(m)=y(n) en Z k 1 is een LCS van X m-1 en Y n-1 Als x(m) y(n) dan: Als z(k) x(m) dan Z is een LCS van X m-1 en Y Als z(k) y(n) dan Z is een LCS van X en Y n-1 21
Deelproblemen Voor elke prefix van X en elke prefix van Y, kijk naar de lengte van de LCS c[i,j] = lengte van LCS van X i en Y j. Voor elke i, 0 i m en elke j, 0 j n. Topkeuze: laatste letter van LCS 22
Recurrente betrekking Als i = 0 of j = 0, dan c[i,j] = 0. Als i>0 en j>0 en x(i) = y(j) dan c[i,j] = c[i-1,j-1] +1. Als i>0 en j>0 en x(i) y(j) dan c[i,j] = max( c[i,j-1], c[i-1,j] ). 23
Berekeningsvolgorde c[i,j] heeft nodig evt c[i-1,j], c[i,j-1], c[i-1,j-1]. Dus, bijv. For i = 0 to m Do for j = 0 to n Bereken c[i,j] 24
Code om lengte LCS te berekenen m = lengte (X) n = lengte Y Maak array c[0 m, 0 n] For i = 1 to m do c[i,0] = 0 For j = 0 to n do c[0,j] = 0 For i = 1 to m do For j = 1 to n do If x(i) == y(j) then c[i,j] = c[i-1,j-1] +1 Else c[i,j] = max( c[i,j-1], c[i-1,j] ) Return c[m,n] 25
Tijd O(mn) m = lengte (X) n = lengte Y Maak array c[0 m, 0 n] For i = 1 to m do c[i,0] = 0 For j = 0 to n do c[0,j] = 0 For i = 1 to m do For j = 1 to n do If x(i) == y(j) then c[i,j] = c[i-1,j-1] +1 Else c[i,j] = max( c[i,j-1], c[i-1,j] ) Return c[m,n] 26
27 Constructieve versie: Houd bij waar je vandaankwam m = lengte (X); n = lengte Y Maak array c[0 m, 0 n] For i = 1 to m do c[i,0] = 0 For j = 0 to n do c[0,j] = 0 For i = 1 to m do For j = 1 to n do If x(i) == y(j) then c[i,j] = c[i-1,j-1] +1; b[i,j]= LO Else if c[i-1,j] c[i,j-1] Then c[i,j] = c[i,j-1] ; b[i,j] = O Else c[i,j] = c[i-1,j]; b[i,j] = L Print-LCS(b,X,m,n) Print-LCS(b,X,i,j) If i==0 or j==0 then return If b[i,j] = LO then Print- LCS(b,X,i-1,j-1); print x(i) Elseif b[i,j] = O then Print- LCS(b,X,i,j-1) Else {b[i,j] = L} Print-LCS(b,X,i-1,j)
Opmerkingen Tabel b is handig voor constructie, maar constructie kan ook zonder tabel b. Als we alleen de lengte willen weten, kunnen we met twee rijen van de tabel volstaan 28
Zoekbomen Zoekboom voor het vinden van keys Keys zijn (bijv. lexicographisch) geordend. Keys hebben verschillende frequenties Welke zoekboom kost kleinste gemiddelde aantal stappen? Diepte: aantal kanten tot wortel. (Je bekijkt dus diepte+1 knopen in boom.) 29
Twee zoekbomen appel een is appel gezond is gezond wel een wel 30
Input van probleem Gegeven: Keys k(1),, k(n), (geordend) Frequenties p(1),, p(n), p(i) geeft de frequentie waarmee key k(i) gezocht wordt Frequenties q(0), q(1),, q(n) q(i) geeft de frequentie aan waarmee we een key zoeken die ligt tussen k(i-1) en k(i). q(0) voor keys kleiner dan k(1), q(n) voor keys groter dan k(n) Som van alle p(i) s en q(i) s is precies 1. 31
Voorbeeld van zoekboom k(3) k(1) k(4) d(0) k(2) d(1) d(2) d(3) d(4) k(5) d(5) 32
Zoekboom en gemiddelde tijd Geordende binare boom met keys als interne knopen, en knopen d(i) als bladeren (geven aan als gezochte key niet in boom zit) Verwachtte tijd van een zoekactie bij boom T: n ( depth ( k( i)) 1)* p( i) T i 1 i 0 1 n depth ( k( i))* = p( i) n T i 1 i 0 n ( depth depth T T ( d( i)) 1)* q( i) ( d( i))* q( i) 33
Probleem Gegeven keys, en frequenties p(i) en q(i), vind een zoekboom voor de keys met minimum verwachtte tijd van een zoekactie Nagaan van alle mogelijke zoekbomen is veel te duur (er zijn W(4 n /n 3/2 ) mogelijke bomen als we n keys hebben). DP algoritme kan dit probleem in O(n 3 ) tijd oplossen 34
Subproblemen: structuur k(b) k(l) k(r) k(?) Bevat dummy keys d(b+1) d(r-1) : gebruik een optimale boom voor de keys k(b+1) k(r-1) 35
Deelproblemen e(i,j): minimum gemiddelde zoektijd voor een zoekboom met keys k(i) k(j) en dummy keys d(i-1) d(j) (en bijbehorende frequenties p(i) p(j) en q(i-1) q(j).) 1 j l i depth T ( k( l))* p( l) l i 1 Speciaal geval: e(i,i-1): zoekboom bevat alleen dummy key d(i-1) j depth T ( d( l))* q( l) 36
Recurrente betrekking e(i,i-1) = q(i-1) Als i j, dan: neem minimum over alle keuzes van key als wortel: j j e( i, j) min e( i, r 1) e( r 1, j) p( l) q( l) i r j l i l i 1 Werk in linkerboom Werk in rechterboom Tijd voor bekijken van de wortel 37
Rekenvolgorde Weer rij-gewijs, maar van elke rij alleen maar een stukje: Eerst alle e(i,i-1) uitrekenen For l = 1 to n do For i = 1 to n l + 1 do j = i + l 1; Bereken e(i,j) 38
Preprocessing Steeds direct berekenen van termen: w( i, j) kan lang duren. Dus tabelleren we die. Neem matrix w[1 n,0 n]. For i=1 to n+1 do w[i,i-1] = q(i-1) For i=1 to n+1 do For j = 0 to n do w[i,j] = w[i,j-1] + p(j)+q(j) j l i p( l) O(n 2 ) j l i 1 q( l) 39
DP algoritme voor optimale zoekbomen probleem Tabelleer w. For i = 1 to n+1 do e[i,i+1] = q(i-1) For l = 1 to n do For i = 1 to n l + 1 do j = i + l 1; e[i,j] = maxint; For r = i to j do t = e[i,r-1]+ e[r+1,j] + w[i,j] If t < e[i,j] Then e[i,j] = t; root[i,j] = r De tabel root staat ons in staat de gezochte boom te construeren Uitrekenen van minimum uit recurrente betrekking 40
Slotopmerkingen Maken van boom zelf kan met behulp van terugredeneren met tabel root Tijd van algoritme is O(n 3 ) Er bestaat een versie van het algoritme dat O(n 2 ) tijd gebruikt (Knuth, 1971). 41
Knapsack probleem Voorwerpen met Waardes v 1, v n Gewichten w 1,, w n Maximum gewicht W Zoek verzameling voorwerpen met totaalgewicht hooguit W en maximum waarde 42 - DP2
Deelproblemen en recurrente betrekking K[i,b] = maximum waarde van deelverzameling van de eerste i voorwerpen met totaalgewicht hooguit b. K[0,b] = 0 (voor elke niet negatieve b) K[i, b] = max (K[i-1,b], K[i-1,b-W[i]] + V[i]) 43 - DP2
En dan Berekeningsvolgorde: matrix bijv. rij-gewijs vullen. Dubbele loop Constructie-versie 44 - DP2
Conclusies Soms meer inzicht nodig voor ontwerp van DP algoritme. Steeds het stappenplan volgen; bij de eerste stap kijken naar deelbeslissingen en wat voor soort deelproblemen je dan overhoudt. 45