Cet article concerne l'œuvre d'Alfred North Whitehead et Bertrand Russell. Pour l'œuvre d'Isaac Newton, voirPhilosophiæ naturalis principia mathematica.
Ne doit pas être confondu avecThe Principles of Mathematics.
| Principia Mathematica | |
| Auteur | Bertrand Russell etAlfred North Whitehead |
|---|---|
| Pays | |
| Version originale | |
| Langue | Anglais |
| Titre | Principia Mathematica |
| Éditeur | Cambridge University Press |
| Date de parution | 1910 |
| modifier | |
LesPrincipia Mathematica sont uneœuvre en trois volumes d'Alfred North Whitehead etBertrand Russell, publiés en1910-1913. Cette œuvre a pour sujet les fondements desmathématiques. Avec en particulier l'idéographie deGottlob Frege, c'est un ouvrage fondamental, dans la mesure où il participe de façon décisive à la naissance de lalogique moderne.
Entre 1898 et 1903, Whitehead travaille à l'édition d'un deuxième volume de sonTreatise on Universal Algebra (de)[1]. Il se rend compte que son approche est similaire à celle que choisit Russell dans le deuxième volume desPrinciples of Mathematics[1], ouvrage lui aussi en projet[n 1]. Ils décident donc de ne pas publier leurs travaux personnels et de travailler ensemble[1].
Après près de dix ans, ils soumettent leurs travaux pour publication à laCambridge University Press. Cette dernière estimant perdre 600£[n 2], dont 300 qu'elle accepte de prendre en charge, et laRoyal Society accordant 200 £, Russell et Whitehead doivent apporter chacun une contribution personnelle de 50 £[3],[n 3].
LesPrincipia englobent lathéorie des ensembles, avec lesnombres cardinaux etordinaux, ainsi que lesnombres réels. Desthéorèmes plus avancés de l'analyse réelle n'ont pas été inclus. Un quatrième volume était initialement prévu, mais n'a jamais été réalisé[4].
Ils utilisent une notation logique développée parPeano, bien qu’elle ait été réadaptée, dans l'optique de rendre le contenu du livre plus clair, et plus concis[5].

Plusieurs centaines de pages précèdent la preuve de cette proposition très célèbre de mathématiques, qui peut être trouvée à la page 379 du Volume I de la1re édition[6].
Dans son langage mathématique, la section en question se propose de démontrer que « si deux ensembles α et β n'ont qu'un seul élément (respectivementx ety), alors dire qu'ils n'ont pas d'élément en commun (x est différent dey) est équivalent à dire que leur réunion contient deux éléments (x ety). »
La preuve que 1 + 1 = 2 est véritablement complétée dans le Volume II (1re édition), à la page 86[7], accompagné du commentaire« The above proposition is occasionally useful » (« la proposition ci-dessus peut parfois être utile »). Ils poursuivent en disant« Elle est utilisée au moins trois fois, en ✸113.66 et ✸120.123.472 ».
Une édition résumée a paru[8] à mi-chemin entre l'œuvre complète et le livre moins technique de 1919 de Russell[9],[10],[11],Introduction à la philosophie mathématique. En 1925, les auteurs ont ajouté uneIntroduction à la Deuxième édition[n 4], unAppendice A (qui s'est substitué au✸9) et un nouvelAppendice C.
LesPrincipia sont considérés comme un des livres les plus influents de l'histoire de lalogique, comparable en cela à l'Organon d'Aristote[13]. Il a joué un rôle moteur dans la recherche sur lesfondements des mathématiques. Dans sa critique du livre,Godfrey Harold Hardy reconnaît l'importance du contenu et même le style d'écriture, tout en admettant que c'est un livre que bien peu de personnes liront intégralement et que les notations utilisées sont de nature à rebuter la majorité des lecteurs, y compris les mathématiciens eux-mêmes[14].
LaModern Library l'a classé23e sur une liste comprenant les cent livres non fictionnels anglais les plus importants duvingtième siècle[15].
Le traité essaye de déduire tous les théorèmes mathématiques à partir d'une liste bien définie d'axiomes et derègles de déduction, en utilisant un langagelogique-symbolique particulier.
Un des buts desPrincipia est de résoudre les paradoxes qui apparaissaient dansLes Fondements de l'arithmétique de 1884 deGottlob Frege, et qui ont été mis en évidence par leparadoxe de Russell de 1901. La « théorie des types logiques » résout ce paradoxe de la façon suivante : un ensemble est différent, ontologiquement, de ses éléments, donc un ensemble ne peut appartenir à lui-même.
Contrairement à unethéorie formaliste, la théorie « logiciste » desPrincipia Mathematica n'a pas« précisé la syntaxe du formalisme ». Lesinterprétations de cette théorie (au sens de lathéorie des modèles) sont présentées en termes devaleurs de vérité, notamment avec les symboles « ⊢ » (affirmation de la vérité), « ~ » (non logique), et « V » (OU inclusif).
La théorie formaliste suivante est présentée en contraste de la théorie logiciste desPrincipia Mathematica. Un système formel contemporain serait construit comme suit:
Les théories contemporaines spécifient souvent leur premier axiome, lemodus ponens ou la«règle de détachement» :
A,A ⊃B │B
Le symbole «│» est habituellement représenté par une ligne horizontale, ici «⊃» signifie «implique». Les symbolesA etB sont des variables ; cette forme de notation est appelée un «schéma d'axiome». Ceci peut être lu ainsi : SIA etA impliqueB ALORSB pour ainsi retenirB pour une utilisation ultérieure. Mais les symboles n'ont pas d'«interprétation» (c.-à.-d., pas de «table de vérité», de «valeur de vérité» ou de «fonction de vérité») et le modus ponens procède mécaniquement, par grammaire seulement.
La théorie desPrincipia Mathematica possède de nombreuses similitudes avec les théories formelles modernes.Kleene a déclaré que «cette déduction des mathématiques de la logique a été présenté comme une axiomatique intuitive. Les axiomes étaient destinés à être acceptés comme des hypothèses plausibles décrivant le monde»[20]. En effet, contrairement à une théorie formaliste qui manipule les symboles selon des règles de syntaxe, LesPrincipia Mathematica ont introduit la notion de «valeurs de vérité», c.-à.-d., la vérité et la fausseté dans leur sensréel, et l'«affirmation de la vérité» prend place dans les cinquième et sixième éléments de la structure de la théorie. (PM 1962:4–36):
Cf.PM 1962:90–94, première édition:
Lapremière édition débute avec la définition du symbole «⊃».
✸1.01.p ⊃q.=. ~p ∨q.Df.
✸1.1. Tout ce qui est impliqué par une proposition élémentaire vraie est vrai.Ppmodus ponens
(✸1.11 a été abandonné dans la deuxième édition.)
✸1.2. ⊦:p ∨p.⊃.p.Pp principe de la tautologie
✸1.3. ⊦:q.⊃.p ∨q.Pp principe d'addition
✸1.4. ⊦:p ∨q.⊃.q ∨p.Pp principe de permutation
✸1.5. ⊦:p ∨ (q ∨r ).⊃.q ∨ (p ∨r ).Pp principe associatif
✸1.6. ⊦:.q ⊃r.⊃:p ∨q.⊃.p ∨r.Pp principe de sommation
✸1.7. Sip est une proposition élémentaire, alors ~p est une proposition élémentaire.Pp
✸1.71. Sip etq sont des propositions élémentaires, alorsp ∨q est une proposition élémentaire.Pp
✸1.72. Si φp et ψp sont des fonctions élémentaires qui prennent des propositions élémentaires comme arguments, alors φp ∨ ψp est une proposition élémentaire.Pp
Avec l'«Introduction à la Seconde Édition», l'annexe A de la seconde édition a abandonné la section entière✸9. Cela comprend six propositions primitives de✸9 à✸9.15 avec les axiomes de réductibilité.
La théorie révisée est rendue difficile par l'introduction de labarre de Sheffer («|») qui symbolise l'«incompatibilité» (c.-à-d., si les deux propositions élémentairesp etq sont vraies, leur «barre»p |q est fausse), leNON-ET logique contemporain. Dans la théorie révisée, l'introduction présente la notion de la «proposition atomique», une «donnée» qui «appartient à la partie philosophique de la logique». Celles-ci n'ont pas de composant, et ne contiennent pas les notions «tout» ou «certains». Par exemple: «c'est rouge», ou «celui-là est plus récent que celui-ci». LesPrincipia Mathematica ont alors «évolué vers les propositions moléculaires» qui sont toutes liées par la «barre». Les définitions donnent des équivalences pour «~», «∨», «⊃», et «.».
La nouvelle introduction définit les «propositions élémentaires» comme des positions atomiques et moléculaires rassemblées. Il remplace alors toutes les propositions primitives de ✸1.2 à ✸1.72 avec une seule proposition en termes de barre:
«Sip,q,r sont des propositions élémentaires, soitp etp|(q|r), nous pouvons en déduirer. C'est une proposition primitive.»
La nouvelle introduction maintient la notation «il existe» (maintenant écrite «parfois vrai») et «pour tout» (écrite «toujours vrai»)[21]. L'Annexe A a renforcé la notion de «matrice» et de «fonction prédicative» (une «idée primitive»,PM 1962: 164).
« La notation de ce travail a été remplacée par le développement ultérieur de la logique au cours duXXe siècle, dans la mesure où un néophyte aurait du mal à lire lesPrincipia Mathematica[13] » ; tandis qu'une grande partie du contenu symbolique peut être converti en notation moderne, la notation originale est elle-même« un sujet de litige scientifique[22]. »
Kurt Gödel a durement critiqué cette notation :
Ceci se reflète dans l'exemple ci-dessous des symboles «p», «q», «r» et «⊃» qui peuvent être formés dans la chaîne «p ⊃ q ⊃ r». LesPM exigent une définition de ce que signifie cette chaîne de symboles par d'autres symboles; en logique moderne, les «règles de formation» (règles syntaxiques conduisant à des «formules bien formées») auraient empêché la formation de cette chaîne.
Source de la notation : Chapitre I «Explications préliminaires des idées et Notations» commence par la source des parties élémentaires de la notation (les symboles =, ⊃, ≡, −, Λ, V, ε, et le système de points) :
LesPrincipia mathematica ont changé le signe de Peano Ɔ en ⊃, et ont également adopté plus tardivement quelques-uns des symboles de Peano, comme ℩ et ι, avec l'habitude de Peano de retourner les lettres à l'envers.
LesPM adoptent le signe d'assertion «⊦» duBegriffsschrift de 1879 deFrege:
Ainsi, pour affirmer une propositionp, on écrit:
(Remarquez que, comme dans l'original, le point gauche est carré et d'une plus grande taille que le point droit.)
La majeure partie du reste de la notation desPM a été inventée parWhitehead.
L'utilisation des points duPM est similaire à celle des parenthèses. Chaque point (ou un point multiple) représente une parenthèse soit à gauche, soit à droite, soit le symbole logique ∧. Les points multiples représentent la «profondeur» des parenthèses, par exemple, «.» «:» ou «:.», «::». Cependant, la position de la correspondance entre la parenthèse droite ou gauche n'est pas indiquée explicitement avec cette notation, mais doit être déduite de certaines règles qui sont confuses, et parfois ambiguës. En outre, lorsque les points représentent le symbole logique ∧, ses opérandes gauche et droite doivent être déduits en utilisant des règles similaires. Tout d'abord, on doit décider en fonction du contexte si les points représentent une parenthèse, ou un symbole logique. Ensuite, il faut décider jusqu'où l'autre parenthèse correspondante se situe : il faut poursuivre cette recherche jusqu'à ce que l'on rencontre, soit un plus grand nombre de points, soit le même nombre de points suivants qui ont une «force» égale ou supérieure, ou qui se situent à la fin de la ligne. Les points situés à côté des signes ⊃, ≡, ∨, = Df ont plus de force que les points à côté de (x), (∃x) et qui ont eux-mêmes plus de force que les points indiquant un produit logique ∧.
Exemple 1. La ligne
correspond à
où letaquet représente les parenthèses extérieures, les deux points suivants représentent les parenthèses autour de ~p et ~q, le troisième point représente les parenthèses autour de p ∧ q, le quatrième point représente le symbole logique ∧ plutôt qu'une paire de parenthèses.
Exemple 2, avec des doubles, triples, et quadruples points :
signifie
Exemple 3, avec un double point indiquant un symbole logique (volume 1, page 10) :
signifie
où le double point représente le symbole logique ∧, et son opérande droite se compose de tout ce qui suit, car il possède une force supérieure à celles des points seuls. Plus loin dans la section ✸14, les crochets «[]» apparaissent, et dans les sections ✸20 et plus, les accolades «{ }» apparaissent. Malheureusement, le point seul (mais aussi «:», «:.», «::», Etc.) sont également utilisés pour symboliser un «produit logique» (leET logique moderne, souvent symbolisé par «&» ou par «∧»).
L'implication logique est représentée par «Ɔ» (par Peano) simplifié en «⊃», la négation logique est symbolisée par un tilde allongé, à savoir, «~» (le «¬» contemporain), leOU logique par «v». Le symbole «=», conjointement avec «Df» est utilisé pour indiquer «est défini comme», alors que dans les sections ✸13 et plus, «=» est défini comme étant (mathématiquement) «identique», à savoir, l'«égalité» mathématique contemporaine. l'équivalence logique est représentée par «≡» (le «si et seulement si» contemporain); les fonctions propositionnelles «élémentaires» sont écrites de manière contemporaine, par exemple,«f(p)», mais plus tard, les parenthèses seront supprimées, par exemple, «φx», «χx», etc.
Exemple, lesPM ont introduit la définition du terme «produit logique» comme suit :
Traduction des formules en symboles contemporains : Divers auteurs utilisent des symboles atlernatifs, donc aucune traduction définitive ne peut être donnée. Toutefois, en raison des critiques comme celle deKurt Gödel ci-dessus, les meilleures traductions contemporaines seront très précises en ce qui concerne les «règles de formation» (syntaxe) des formules. La première formule pourrait être convertie en symboles modernes comme suit[25] :
ou encore
ou encore
etc.
La seconde formule peut être convertie comme suit :
Ce n'est pas (logiquement) équivalent à (p → (q → r)), ni à ((p → q) → r), ces deux formules ne sont pas logiquement équivalentes entre elles non plus.
Ces sections concernent ce qui est maintenant connu comme lecalcul des prédicats et la logique des prédicats avec l'identité (égalité).
Section✸10 : Les «opérateurs» universels et existentiels : LesPM ajoutent «(x)» pour représenter le symbole contemporain universel «pour tous x» ou «∀x», et il utilise un E renversé pour représenter «il existe un x tel que», ou «(Ǝx)». La notation typique serait similaire à ce qui suit :
Sections✸10, ✸11, ✸12 : Propriétés d'une variable étendue à tous les individus : la section✸10 introduit la notion de «propriété» d'une «variable». LesPM donnent cet exemple: φ est une fonction qui indique «est un grec», et ψ indique «est un homme», et χ indique «est un mortel», ces fonctions s'appliquent ensuite à une variablex. LesPM peuvent maintenant écrire, et évaluer :
parce que Zeus n'est pas mortel.
Équipé de cette notation, les PM peuvent créer des formules pour exprimer ce qui suit: «Si tous les Grecs sont des hommes, et si tous les hommes sont mortels, alors tous les Grecs sont mortels». (PM 1962: 138)
Les symboles ⊃x et «≡x» apparaissent dans✸10.02 et✸10.03. Les deux sont des abréviations pour l'universalité (pour tout). La notation contemporaine aurait simplement utilisé les parenthèses en dehors du signe d'égalité («=»):
LesPM attribue le premier symbole à Peano.
La section✸11 applique ce symbole à deux variables. Ainsi, les notations suivantes : ⊃x, ⊃y, ⊃x, pourraient tous apparaître dans une formule unique.
La section✸12 réintroduit la notion de «matrice» (table de vérité), de types logiques, et en particulier les notions de fonctions et propositions dupremier etsecond ordre.
Le nouveau symbolisme «φ!x» représente une valeur d'une fonction de premier ordre. Si un accent circonflexe «^» est placé sur une variable, alors celle-ci est une valeur «individuelle» dey.
Maintenant équipé de la notion de matrice, lesPM peuvent affirmer leuraxiome de réductibilité controversé : une fonction d'une ou deux variables où toutes ses valeurs sont données (ie, dans sa matrice) est (logiquement) équivalent («≡») à une fonction «prédicative» des mêmes variables. La définition d'une variable est donnée ci-dessous à titre d'illustration de la notation (PM 1962: 166-167):
✸12.1 ⊢: (Ǝf): φx.≡x.f!xPp;
Cela signifie que : «Nous affirmons la vérité de ce qui suit : Il existe une fonctionf avec la propriété que : étant donné toutes les valeurs dex, leurs évaluations dans la fonction φ (c'est-à-dire, résultant de leur matrice) est logiquement équivalente à une certaine valeur def (et vice-versa, donc l'équivalence logique).». Autrement dit, étant donné une matrice déterminée par la propriété φ appliquée à la variablex, il existe une fonctionf qui, lorsqu'elle est appliquée àx est logiquement équivalente à sa matrice. Ou encore : chaque matrice φx peut être représentée par une fonctionf appliquée àx, etvice versa.
✸13: L'opérateur d'identité «=» : Celui-ci est une définition qui utilise le signe de deux manières différentes, comme indiqué par la citation desPM :
signifie:
Le signe d'inégalité «≠» fait son apparition en tant que définition dans✸13.02.
✸14: Descriptions :
Le texte saute de la section ✸14 directement aux sections fondamentales ✸20 THÉORIE GÉNÉRALE DES CLASSES et ✸21 THÉORIE GÉNÉRALE DES RELATIONS. Les «relations» sont ce qui est connu dans lathéorie des ensembles contemporaine comme des ensembles depaires ordonnées. Les sections ✸20 et ✸22 introduisent un grand nombre de symboles encore utilisés aujourd'hui. Ceux-ci comprennent les symboles «ε», «⊂», «∩», «∪», «-», «Λ», et «V»: où «ε» signifie «est un élément de» (PM 1962: 188); «⊂» (✸22.01) signifie «est contenue dans», «est un sous-ensemble de»; «∩» (✸22.02) représente le produit logique de classes (ensembles); «∪» (✸22.03) représente la somme logique de classes (ensembles); «-» (✸22.03) signifie la négation d'une classe (ensemble); «Λ» signifie la classe nulle; et «V» signifie la classe ou l'univers du discours universel.
Les petites lettres grecques (autre que «ε», «ι», «π», «φ», «ψ», «χ», et «θ») représentent les classes (par exemple, «α», «β», «γ», «δ», etc.) (PM 1962:188)
Appliquée aux relations dans la section ✸23 CALCUL DES RELATIONS, les symboles «⊂», «∩», «∪» et «-» acquièrent un point : par exemple: «⊍», «∸».
La notion et la notation d'une «classe» (ensemble) : La première édition desPM affirme qu'il n'y a pas de nouvelles idées primitives nécessaires pour définir ce qu'on entend par «une classe», et seulement deux nouvelles «propositions primitives» appelées lesaxiomes de réductibilité (en) pour les classes et les relations respectivement (PM 1962: 25)[27]. Mais avant que cette notion soit définie, lesPM affirment qu'il est nécessaire de créer une notation particulière «ẑ(φz)» qu'il appelle un «objet fictif». (PM 1962: 188)
LesPM peuvent exposer au lecteur comment ces objets fictifs se comportent, parce que «Une classe est entièrement déterminée lorsque sa composition est connue, à savoir qu'il ne peut y avoir deux classes différentes ayant la même composition» (PM 1962: 26). Ceci est symbolisé par l'égalité suivante (similaire au ✸13.01 ci-dessus) :