Rencontre #8: Programmation dynamique (revue)

par Mattéo Delabre

Nous passerons en revue ensemble les problèmes de programmation dynamique et leurs solutions, et nous discuterons du concours d’entraînement à venir la semaine prochaine.

Solutions aux problèmes de programmation dynamique

Radio Commercials

Dans le problème “Radio Commercials”, une série \(L\) de \(N\) nombres nous était donnée. Le score d’une sous-séquence (intervalle) de nombres est défini comme leur somme à laquelle on retranche la quantité de valeurs sommée, multipliée par une certaine constante \(P\). L’objectif était de trouver le meilleur score d’intervalle possible.

Une approche naïve consiste à énumérer tous les \(n^2-n\) intervalles possibles, puis à calculer le score de chacun, et à conserver le maximum. Cette approche fonctionne en \(O(n^3)\), ce qui n’est pas assez efficace pour valider le problème.

Une optimisation possible se trouve dans le calcul du score de chaque intervalle. Précalculons les sommes partielles \(S(i)\) des \(i\) premières valeurs de la liste, en temps \(O(n)\). On peut alors obtenir la somme de n’importe quel intervalle entre \(i\) et \(j\) en \(O(1)\) en calculant \(S(j) - S(i - 1)\). L’approche initiale munie de cette optimisation fonctionne en \(O(n^2)\). Ce n’est pas encore assez rapide pour valider le problème.

Une seconde optimisation repose sur la relation de récurrence suivante. Si \(c(i)\) désigne le meilleur score de n’importe quel intervalle qui se termine en \(i\), \[c(i) = \max\begin{cases} c(i-1) + L[i] - P & \text{si } i \geq 1, \\ 0. \end{cases}\]

Le meilleur score global est obtenu en calculant \(\max_{i \in \{1, \ldots, N\}}{c(i)}\). Cette optimisation, appelée algorithme de Kadane, donne une solution qui fonctionne en \(O(n)\). Cette complexité permet de résoudre le problème.

Lattice Paths

Dans “Lattice Paths”, l’objectif était de calculer le nombre de chemins possibles entre le coin supérieur gauche et le coin inférieur droit dans une grille, si les seuls déplacements permis sont d’aller une case vers le bas ou une case vers la droite.

En notant \((i,j)\) la \(j\)-ème case de la \(i\)-ème rangée de la grille, on peut observer que le nombre de chemins de \((1,1)\) jusqu’à \((i, j)\) est égal au nombre de chemins jusqu’à \((i - 1, j)\) plus le nombre de chemins jusqu’à \((i, j - 1)\). Ainsi, si \(c(i, j)\) désigne le nombre de chemins possibles de \((1,1)\) jusqu’à \((i, j)\), \[c(i, j) = \begin{cases} c(i - 1, j) + c(i, j - 1) & \text{si } i \geq 1 \text{ et } j \geq 1,\\ 1 & \text{sinon.} \end{cases}\]

En observant cette récurrence, on voit qu’elle calcule le triangle de Pascal. Le nombre de chemins jusqu’à \((i, j)\) correspond aux entrées \((i+j, i)\) et \((i+j, j)\) du triangle.

Les 6 premières rangées du triangle de Pascal, arrangées de sorte que chaque entrée est située en dessous des deux termes de la rangée précédente qui servent à son calcul

Triangle de Pascal (par Conrad.Irwin et Drini, sous licence GFDL)

Ce lien indique une interprétation combinatoire du problème. Tous les chemins qui se rendent jusqu’à la case \((i, j)\) de la grille le font en exactement \(i+j\) déplacements, dont \(i\) déplacements vers le bas et \(j\) déplacements vers la droite. Le nombre de chemins possibles correspond donc au nombre de façons de choisir lesquels \(i\) des \(i+j\) déplacements se feront vers le bas, c’est-à-dire \[c(i, j) = {i + j \choose i} = {i + j \choose j}.\]

Tri Tiling

“Tri Tiling” est un autre problème de combinatoire, qui demandait de calculer le nombre de façons de remplir un rectangle de taille \(3 \times n\) avec des dominos, jusqu’à \(n = 30\). Une première observation est qu’il n’y a aucune façon de remplir le rectangle si \(n\) est impair, puisqu’il faudrait alors remplir un nombre impair de cases.

Sans réfléchir davantage à la structure du problème, nous pouvons mettre au point une solution en programmation dynamique. Dans un rectangle rempli, chaque case contient une moitié de domino. Notons \(X = \{\sqsubset, \sqcup, \sqsupset, \sqcap\}\) le contenu possible de chaque case. Nous dirons que deux triplets \(S = (s_1, s_2, s_3) \in X^3\) et \(T = (t_1, t_2, t_3) \in X^3\) sont compatibles si deux colonnes adjacentes peuvent légitimement contenir \(S\) suivi de \(T\). Par exemple \((\sqsubset, \sqcap, \sqcup)\) et \((\sqsupset, \sqcap, \sqcup)\) sont compatibles, ainsi que \((\sqsubset, \sqsupset, \sqsubset)\) et \((\sqsupset, \sqsubset, \sqsupset)\). Au contraire, \((\sqcap, \sqcup, \sqsubset)\) et \((\sqcap, \sqcup, \sqsubset)\) ne sont pas compatibles. On peut ainsi établir la liste des triplets compatibles.

Dénotons par \(c(i, S = (s_1, s_2, s_3))\) le nombre de façons valides de remplir un rectangle de taille \(3 \times i\) de sorte que les trois cases de la dernière colonne contiennent \(s_1\), \(s_2\) et \(s_3\) respectivement. Alors \[c(i + 1, T) = \sum_{\substack{ S \in X^3\\[.33em] S \text{ et } T \text{ compatibles} }}{c(i, S)}\] avec pour cas de base \(c(0, (\sqsupset, \sqsupset, \sqsupset)) = 1.\) En construisant un programme à partir de cette relation de récurrence, on obtient une solution valide pour le problème.

Remarquez l’astuce utilisée ici, qui consiste à placer une partie de l’« état » du calcul dans le paramètre de la récurrence, pour s’assurer qu’on ne dénombre que des solutions valides. Ce procédé fonctionne pour les problèmes dont on peut déterminer localement la validité des solutions. Ici un remplissage du rectangle est valide si et seulement si toutes les colonnes adjacentes sont compatibles. Sans cette propriété, nous aurions dû placer tout l’état des colonnes précédentes dans le paramètre de la récurrence, ce qui aurait annihilé toute l’efficacité de la solution.

Si on veut pousser l’analyse un peu plus loin, il existe une récurrence paramétrée sur \(i\) uniquement, référencée sous A001835 à l’OEIS. En implémentant cette récurrence, on obtient un programme plus succinct que le précédent.

Narrow Art Gallery

Dans “Narrow Art Gallery”, nous devions trouver comment fermer \(k\) pièces d’un musée de sorte que la valeur des pièces restantes soit maximale et qu’il soit toujours possible de cheminer d’un bout à l’autre du musée. Les pièces sont disposées en \(N\) rangées de 2 colonnes, les visiteurs peuvent s’y déplacer horizontalement ou verticalement, et l’entrée et la sortie du musée sont en haut et en bas des \(N\) rangées.

Il est important de ne pas fermer deux pièces sur la même rangée, ni deux pièces en diagonale, afin d’éviter de bloquer le passage. Remarquons que, comme dans le problème précédent, cette condition de validité est locale. Il suffit donc de consacrer un paramètre dans notre relation de récurrence pour mémoriser laquelle des deux pièces a été fermée dans la rangée précédente, et ainsi éviter de fermer la pièce située en diagonale.

Notons \(v_{i,j}\) la valeur de la pièce à la \(i\)-ème rangée et la \(j\)-ème colonne. Dénotons \(c(i, j, s)\) la meilleure solution possible pour fermer \(j\) pièces dans les \(i\) premières rangées, de sorte que seule la première pièce de la \(i\)-ème rangée reste ouverte si \(s = 0\), la seconde pièce si \(s = 1\), ou les deux si \(s = -1\). Alors \[c(0, j, s) = 0 \text{ si } j = 0 \text{, sinon } -\infty,\] \[c(i + 1, j, -1) = \max_{t \in \{-1, 0, 1\}}\{c(i, j, t) + v_{i,0} + v_{i,1}\},\] \[c(i + 1, j + 1, s) = \max_{t \in \{-1, s\}}\{c(i, j, t) + v_{i,s}\}.\] Finalement, la meilleure solution est obtenue en calculant \(\max_{s \in \{-1, 0, 1\}}c(N, k, s)\).

Good Coalition

Dans “Good Coalition”, l’objectif était de trouver la coalition majoritaire de partis ayant la plus grande probabilité de se rendre au terme de son mandat. Chacun des \(N\) partis a une probabilité \(p_i\) de terminer son mandat et a obtenu un nombre \(s_i\) de sièges aux dernières élections. Une coalition majoritaire est un sous-ensemble de partis dont le nombre total de sièges atteint ou dépasse 76 sur 150.

Nous pouvons aborder ce problème comme une variante du problème du sac à dos. Au lieu de choisir des objets en maximisant leur utilité sans dépasser une limite de poids, nous choisissons ici des partis en maximisant la probabilité qu’ils terminent son mandat et sans être en dessous de 76 sièges.

Notons \(c(i, j)\) la meilleure probabilité de toute coalition formée d’un sous-ensemble des partis \(\{1, \ldots, i\}\) et atteignant exactement \(j\) sièges. On a alors la relation de récurrence suivante, adaptée de la formulation habituelle en programmation dynamique pour le problème du sac à dos, \[c(i, j) = \max\begin{cases} 1 & \text{si } j = 0, \\ 0 & \text{si } i = 0 \text{ et } j \geq 1, \\ c(i - 1, j) & \text{si } i \geq 1, \\ c(i - 1, j - s_i) \times p_i & \text{si } i \geq 1 \text{ et } j \geq s_i. \\ \end{cases}\] Finalement, la probabilité de la meilleure coalition est obtenue en calculant \(\max_{j \in \{76, \ldots, 150\}}{c(N, j)}\).