Ne doit pas être confondu avec unproblème NP-difficile.
Enthéorie de la complexité, unproblème NP-complet ouproblème NPC (c'est-à-dire un problèmecomplet pour la classeNP) est unproblème de décision vérifiant les propriétés suivantes :
Un problèmeNP-difficile est un problème qui remplit la seconde condition, et donc peut être dans une classe de problème plus large et donc plus difficile que la classe NP.
Bien qu'on puissevérifier rapidement toute solution proposée d'un problème NP-complet, on ne sait pas entrouver efficacement. C'est le cas, par exemple, duproblème du voyageur de commerce ou de celui duproblème du sac à dos.
La plupart des algorithmes connus pour résoudre des problèmes NP-complets ont un temps d'exécution exponentiel en fonction de la taille des données d'entrée dans le pire des cas, et sont donc inexploitables en pratique même pour des instances de taille modérée.
La seconde propriété de la définition implique que s'il existe un algorithme polynomial pour résoudre un quelconque des problèmes NP-complets, alors tous les problèmes de la classe NP peuvent être résolus en temps polynomial. Trouver un algorithme polynomial pour un problème NP-complet ou prouver qu'il n'en existe pas permettrait de savoir si P = NP ou P ≠ NP, une question ouverte qui fait partie desproblèmes non résolus en mathématiques les plus importants à ce jour.
En pratique, lesinformaticiens et lesdéveloppeurs sont souvent confrontés à des problèmes NP-complets. Dans ce cas, savoir que le problème sur lequel on travaille est NP-complet est une indication du fait que le problème est difficile à résoudre, donc qu'il vaut mieux chercher des solutions approchées en utilisant desalgorithmes d'approximation ou utiliser desheuristiques pour trouver des solutions exactes.
Unproblème de décision peut être décrit mathématiquement par unlangage formel, dont les mots correspondent aux instances du problème pour lesquelles la réponse estoui.Sans perte de généralité, on peut supposer que tous les langages qu'on considère sont définis sur le même alphabet.
Deux classes de complexité, présentées de manière plus détaillée dansThéorie de la complexité, interviennent dans la définition de la NP-complétude :
Unlangage estNP-difficile s’il existe uneréduction polynomiale de tout langage à, c’est-à-dire une fonction (où est l’alphabet de ces langages), calculable en temps polynomial sur une machine de Turing déterministe, telle que :
Si de plus, alors lelangage estNP-complet.
La classe des langages NP-complets est notée.
On dit qu’unproblème de décision est « NP-complet » lorsque le langage correspondant est NP-complet. C’est une notion informelle car il existe plusieurs moyens de coder les instances d’un problème, mais cela ne pose pas de difficultés dans la mesure où on emploie un codageraisonnable du problème vers le langage considéré (voir la sectionNP-complétude faible).
Parabus de langage, on qualifie souvent de « NP-complets » desproblèmes d'optimisation et non des problèmes de décision. Ainsi, on dira que leproblème du voyageur de commerce, qui consiste à trouver un plus courtcircuit passant une seule fois par chacun des sommets d'ungraphe connexe fini, est-complet. Cela se justifie par le fait qu'on peut transformer tout problème d’optimisation en problème de décision et réciproquement (voir la section « De la recherche à la décision » de l’article sur la théorie de la complexité).
Le concept de NP-complétude a été introduit en 1971 parStephen Cook dans une communication intituléeThe complexity of theorem-proving procedures[1] (La complexité des procédures de démonstration de problèmes), bien que le mot « NP-complet » n'apparaisse pas explicitement dans l'article.Lors de la conférence à laquelle il a été présenté, une discussion acharnée a eu lieu entre les chercheurs présents pour savoir si les problèmes NP-complets pouvaient être résolus en temps polynomial surmachine de Turing déterministe.John Hopcroft a finalement convaincu les participants que la question devait être remise à plus tard, personne n'ayant réussi à démontrer ou infirmer le résultat.[réf. souhaitée]
Laquestion de savoir si P = NP n'est toujours pas résolue. Elle fait partie desproblèmes du prix du millénaire, un ensemble de sept problèmes pour lesquels l'Institut de mathématiques Clay offre un prix d'un million dedollars. Il « suffirait » de trouver un seul problème NP qui soit à la fois NP-complet et P pour démontrer cette hypothèse, ou d'exhiber un seul problème NP qui ne soit pas dans P pour démontrer sa négation.
Le résultat de l'article de Cook, démontré de manière indépendante parLeonid Levin en URSS[2], est maintenant connu sous le nom dethéorème de Cook-Levin. Ce théorème affirme qu'il existe un problème NP-complet. Cook a choisi leproblème SAT et Levin un problème de pavage. En 1972,Richard Karp a prouvé la NP-complétude de plusieurs autres problèmes fondamentaux en informatique et très disparates, connus comme la liste des21 problèmes NP-complets de Karp. Depuis, on a démontré la NP-complétude de milliers d'autres problèmes.
Pour démontrer la NP-complétude d'un nouveau problème, la méthode usuelle consiste à trouver un problème NP-complet déjà connu qui se réduit à. Cela suffit à démontrer que est NP-complet. En effet, pour tout, on a Π ≤P Π2 ≤P Π1 (la relation de réduction polynomiale ≤P est transitive).
Pour illustrer cette méthode, voici une démonstration de la NP-complétude de l'optimisation linéaire en nombres entiers (OLNE) par une réduction à partir deSAT, qui est NP-complet comme expliqué plus haut.
L'OLNE consiste à déterminer si un système d'inéquations linéaires a au moins une solution entière.
SAT consiste à déterminer si une formule logique sousforme normale conjonctive est satisfiable.
Le problème de l'OLNE est bien un problème NP : vérifier qu'une assignation des variables est solution est réalisable efficacement[3].On définit la fonction de réductionf de la façon suivante. Soit une formule sous forme normale conjonctive.On définit comme étant le problème d'OLNE suivant :
On constate alors que si est satisfiable, alors en posant :
on obtient une solution du problème d'OLNE. Réciproquement, si le problème d'OLNE a une solution, alors la formule peut être satisfaite en mettant à vrai les variablesvi telles quexi = 1. Ainsi, la fonctionf est bien une réduction de SAT à l'OLNE. De plus,f est calculable en temps polynomial donc l'OLNE est un problème NP-complet.
Parmi les problèmes NP-complets notables, on peut citer :
Il est à noter qu'il s'agit alors d'un abus de langage de parler de problème NP pour certains de ces problèmes, car ils ne sont pas desproblèmes de décision. Cependant, les problèmes de décision associés à un problème d'optimisation, typiquement de la forme : « existe-t-il une solution de coût inférieur à... ? », sont eux bien NP-complets.
Le schéma de droite indique, pour une partie de ces problèmes, dans quel ordre on prouve en général la NP-complétude. On notera que cet ordre de réduction n'est pas le seul possible, puisque par définition, il existe toujours une réduction entre deux problèmes NP-complets quelconques. Son intérêt est de simplifier les démonstrations.
Parfois, une modification apparemment mineure transforme un problème NP-complet en problème de la classe P. Quelques exemples :
Certains problèmes dans NP, par exemple ceux exploités encryptographie à clé publique, sont supposés être strictement entre P et NPC. En particulier, la méthodeRSA repose sur la difficulté de lafactorisation des entiers. Aucun algorithme polynomial n'est connu pour le résoudre, mais le problème appartient à NPco-NP et n'est donc vraisemblablement pas NP-complet.
À l'opposé, il existe des problèmes de décision plus difficiles que les problèmes NP-complets. Certains problèmes sontindécidables, par exemple leproblème de l'arrêt. Certains problèmes décidables nécessitent unespace exponentiel et ne sont donc pas dans NP, par exemple la comparaison des langages dénotés par deuxexpressions rationnelles dans lesquelles on autorise, en plus des opérations usuelles, l'opérationcarré[4] (c'est un problème complet dansEXPSPACE).
La NP-complétude ne donne une idée de la difficulté d'un problème que dans le pire cas. Autrement dit, même si on ne sait pas résoudre rapidement toutes les instances d'un problème NP-complet, c'est parfois possible pour une partie d'entre elles.
Ainsi, des algorithmes parséparation et évaluation, non polynomiaux, peuvent avoir un temps d'exécution raisonnable pour des instances relativement grandes.
Si on a besoin de résoudre seulement une sous-classe des instances possibles, alors le problème peut devenir facile. Par exemple, la recherche de l'indépendant maximum (NP-complet) est possible en temps polynomial sur lesgraphes bipartis ou d'autres familles de graphes.
Dans certains cas, on sait démontrer que les instancesaléatoires d'un problèmes NP-complets sont faciles. À titre d'exemple :
Enfin, l'approche de lacomplexité paramétrée consiste à identifier un paramètre qui, dans le cas où il reste petit, permet de résoudre rapidement le problème. En particulier lesalgorithmes FPT en un paramètrek permettent de résoudre un problème en temps proportionnel au produit d'une fonction quelconque dek et d'un polynôme en la taille de l'instance, ce qui fournit un algorithme polynomial quandk est fixé.
Lorsque les méthodes de résolution exactes ne sont pas applicables, desalgorithmes d'approximations (ou à défaut desheuristiques) permettent de trouver des solutions approchées de l'optimum en un temps raisonnable pour un certain nombre de problèmes NP-complets.
Comme mentionné plus haut, il existe plusieurs manières de coder les instances d'un problème sous forme de mots (faits d’une suite finie de symboles d’un alphabet déterminé et fini). Choisir un encodage particulièrement long diminue artificiellement la complexité du problème, puisque celle-ci est exprimée en fonction de la taille de l'entrée.
En particulier, un nombre entiern peut être encodé sur log2n symboles s’il est écrit enbase 2 (ou une base supérieure) mais occupen symboles s’il est écrit enunaire, ce qui est exponentiellement plus grand.
Les problèmes qu’on peut résoudre en temps polynomial lorsque leurs entrées sont codées en unaire sont appelés problèmes « NP-complets faibles ». Leproblème du sac à dos et ses variantes appartiennent à cette catégorie. En effet, ils peuvent être résolus parprogrammation dynamique en temps polynomial en le nombre d'objets et la plus grande quantité intervenant dans l'entrée.
Par opposition, les problèmes qui restent NP-complets dans ce cas sont ditsforts. C'est le cas de la plupart des autres problèmes cités dans cet article, comme SAT, CLIQUE, la coloration de graphe, etc.
Classes de complexité (liste) |
| ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Théorèmes et outils |
| ||||||||||||
Approches non-standard |