mercredi 27 mars 2013

Un virus informatique


Un virus informatique est un automate auto réplicatif à la base non malveillant, mais aujourd'hui trop souvent additionné de code malveillant (donc classifié comme logiciel malveillant), conçu pour se propager à d'autres ordinateurs en s'insérant dans des logiciels légitimes, appelés « hôtes ». Il peut perturber plus ou moins gravement le fonctionnement de l'ordinateur infecté. Il peut se répandre à travers tout moyen d'échange de données numériques comme les réseaux informatiques et les cédéroms, les clefs USB, etc.
Son appellation provient d'une analogie avec le virus biologique puisqu'il présente des similitudes dans sa manière de se propager en utilisant les facultés de reproduction de la cellule hôte. On attribue le terme de « virus informatique » à l'informaticien et spécialiste en biologie moléculaire Leonard Adleman (Fred Cohen, Experiments with Computer Viruses, 1984).
Les virus informatiques ne doivent pas être confondus avec les vers informatiques, qui sont des programmes capables de se propager et de se dupliquer par leurs propres moyens sans contaminer de programme hôte. Au sens large, on utilise souvent et abusivement le mot virus pour désigner toute forme de logiciel malveillant.
Le nombre total de programmes malveillants connus serait de l'ordre de 95 000 (2011) selon Sophos (tous types de malwares confondus)1. Cependant, le nombre de virus réellement en circulation ne serait pas supérieur à quelques milliers selon la Wildlist Organisation2, chaque éditeur d'antivirus ayant intérêt à « gonfler » (surestimer) le nombre de virus qu'il détecte. La très grande majorité touche la plate-forme Windows. Bien qu'ils soient extrêmement peu nombreux, il existe aussi des virus sur les systèmes d'exploitation de type Unix/Linux3, mais aucune épidémie comparable à celle des virus Windows n'a encore été constatée à cette date (2011). Le reste est essentiellement destiné à des systèmes d'exploitation qui ne sont plus distribués depuis quelques années, comme les 27 virus — aucun n'étant dangereux — frappant Mac OS 9 et ses prédécesseurs (recensés par John Norstad, auteur de l'antivirus Disinfectant). Les systèmes les moins touchés sont FreeBSD qui axe son développement sur la sécurité, ainsi que Novell NetWareet OS/2 trop rares pour apporter une notoriété à un développeur de virus.
Les virus font souvent l'objet de fausses alertes que la rumeur propage, encombrant les messageries. Certaines d'entre elles, jouant sur l'ignorance en informatique des utilisateurs, leur font parfois détruire des éléments totalement sains du système d'exploitation.

Sommaire

  [masquer

Historique[modifier]

Les premiers logiciels autonomes n'avaient pas le but qu'ils ont aujourd'hui. Les tout premiers logiciels de ce type étaient de simples divertissements, un jeu entre trois informaticiens de la sociétéBellCore War, créé en 1970 dans les laboratoires de la société. Pour ce jeu, chaque joueur écrit un programme, ensuite chargé en mémoire vive. Le système d'exploitation, qui se doit juste d'être multitâche, exécute tour à tour une instruction de chacun des logiciels. L'objectif du jeu est de détruire les programmes adverses tout en assurant sa propre prolifération. Les joueurs ne connaissent évidemment pas l'emplacement du programme adverse. Les logiciels sont capables de se recopier, de se réparer, de se déplacer eux-mêmes en différentes zones de la mémoire et « d'attaquer » le logiciel adverse en écrivant aléatoirement dans d'autres zones mémoire. La partie se termine au bout d'un temps défini ou lorsque l'un des joueurs voit tous ses programmes inactifs ou détruits. Le vainqueur est celui qui possède le plus grand nombre de copies actives. C'est exactement un des principes de programmation des virus.
En 1984, le magazine Scientific American a présenté un jeu informatique consistant à concevoir de petits programmes entrant en lutte et s'autoreproduisant en essayant d'infliger des dégâts aux adversaires, fondant ainsi les bases des futurs virus.
En 1986, l'ARPANET fut infecté par Brain, virus renommant toutes les disquettes de démarrage de système en (C)Brain. Les créateurs de ce virus y donnaient leur nom, adresse et numéro de téléphone car c'était une publicité pour eux.

Différents types de virus[modifier]

  • Le virus classique est un morceau de programme, souvent écrit en assembleur, qui s'intègre dans un programme normal, le plus souvent à la fin, mais cela peut varier. Chaque fois que l'utilisateur exécute ce programme « infecté », il active le virus qui en profite pour aller s'intégrer dans d'autres programmes exécutables. De plus, lorsqu'il contient une charge utile, il peut, après un certain temps (qui peut être très long) ou un évènement particulier, exécuter une action prédéterminée. Cette action peut aller d'un simple message anodin à la détérioration de certaines fonctions du système d'exploitation ou la détérioration de certains fichiers ou même la destruction complète de toutes les données de l'ordinateur. On parle dans ce cas de « bombe logique » et de « charge utile ».
  • Un virus de boot s'installe dans un des secteurs de boot d'un périphérique de démarrage, disque dur (le secteur de boot principal, le « Master boot record », ou celui d'une partition), disquette, ou autre. Il remplace un chargeur d'amorçage (ou programme de démarrage ou « bootloader ») existant (en copiant l'original ailleurs) ou en créé un (sur un disque ou il n'y en avait pas) mais ne modifie pas un programme comme un virus normal ; quand il remplace un programme de démarrage existant, il agit un peu comme un virus « prepender » (qui s'insère au début), mais le fait d'infecter aussi un périphérique vierge de tout logiciel de démarrage le distingue du virus classique, qui ne s'attaque jamais à « rien ».
  • Les macrovirus qui s'attaquent aux macros de logiciels de la suite Microsoft Office (WordExcel, etc.) grâce au VBA de Microsoft. Par exemple, en s'intégrant dans le modèle normal.dot de Word, un virus peut être activé à chaque fois que l'utilisateur lance ce programme.
  • Les virus-vers, apparus aux environs de l'année 2003, ayant connu un développement fulgurant dans les années qui suivirent, sont des virus classiques car ils ont un programme hôte. Mais s'apparentent aux vers (en anglais « worm ») car :
    • Leur mode de propagation est lié au réseau, comme des vers, en général via l'exploitation de failles de sécurité.
    • Comme des vers, leur action se veut discrète, et non-destructrice pour les utilisateurs de la machine infectée.
    • Comme des vers, ils poursuivent des buts à visée large, tels que l'attaque par saturation des ressources ou attaque DoS (Denial of Service) d'un serveur par des milliers de machines infectées se connectant simultanément[réf. nécessaire].
  • Les virus de type batch, apparu à l'époque où MS-DOS était le système d'exploitation en vogue, sont des virus « primitifs ». Bien que capables de se reproduire et d'infecter d'autres fichiers batch, ils sont lents et ont un pouvoir infectant très faible. Certains programmeurs ont été jusqu'à créer des virus batch cryptés et polymorphes, ce qui peut être qualifié de « prouesse technique » tant le langage batch est simple et primitif.
D'autres menaces existent en informatique, s'en distinguant souvent par l'absence de système de reproduction qui caractérise les virus et les vers ; le terme de « logiciel malveillant » (« malware » en anglais) est dans ce cas plus approprié.

Caractéristiques[modifier]

  • le chiffrement : à chaque réplication, le virus est chiffré (afin de dissimuler les instructions qui, si elles s'y trouvaient en clair, révéleraient la présence de ce virus ou pourraient indiquer la présence de code suspect).
  • le polymorphisme : le virus est chiffré et la routine de déchiffrement est capable de changer certaines de ses instructions au fil des réplications afin de rendre plus difficile la détection par l'antivirus.
  • le métamorphisme : contrairement au chiffrement simple et au polymorphisme, où le corps du virus ne change pas et est simplement chiffré, le métamorphisme permet au virus de modifier sa structure même et les instructions qui le composent.
  • la furtivité : le virus « trompe » le système d'exploitation (et par conséquent les logiciels antivirus) sur l'état des fichiers infectés. Des rootkits permettent de créer de tels virus. Par exemple, l'exploitation d'une faille de sécurité au niveau des répertoires permet de masquer l'existence de certains fichiers exécutables ainsi que les processus qui leur sont associés.

Logiciels antivirus[modifier]

Les logiciels antivirus sont des logiciels capables de détecter des virus, détruire, mettre en quarantaine et parfois de réparer les fichiers infectés sans les endommager. Ils utilisent pour cela de nombreuses techniques, parmi lesquelles :
  • la reconnaissance de séquences d'octets caractéristiques (signatures) d'un virus particulier ;
  • la détection d'instructions suspectes dans le code d'un programme (analyse heuristique);
  • la création de listes de renseignements sur tous les fichiers du système, en vue de détecter d'éventuelles modifications ultérieures de ces fichiers par un virus ;
  • la détection d'ordres suspects ;
  • la surveillance des lecteurs de support amovible : disquettesZipCD-ROM, DVD-ROM, Clé USB

Virologie[modifier]

Le terme virus informatique a été créé par analogie avec le virus en biologie : un virus informatique utilise son hôte (l'ordinateur qu'il infecte) pour se reproduire et se transmettre à d'autres ordinateurs.
Comme pour les virus biologiques, pour lesquels ce sont les hôtes les plus en contact avec d'autres hôtes qui augmentent les chances de développement d'un virus, en informatique ce sont les systèmes et logiciels les plus répandus qui sont les plus atteints par les virus : Microsoft WindowsMicrosoft OfficeMicrosoft OutlookMicrosoft Internet ExplorerMicrosoft Internet Information Server... Les versions professionnelles de Windows (NT/2000/XP pro) permettant de gérer les droits de manière professionnelle ne sont pas immunisées contre ces envahisseurs furtifs.
La banalisation de l'accès à Internet a été un facteur majeur dans la rapidité de propagation à grande échelle des virus les plus récents. Ceci est notamment dû à la faculté des virus de s'approprier des adresses de courriel présentes sur la machine infectée (dans le carnet d'adresses mais aussi dans les messages reçus ou dans les archives de pages web visitées ou de messages de groupes de discussions).
De même, l'interconnexion des ordinateurs en réseaux locaux a amplifié la faculté de propagation des virus qui trouvent de cette manière plus de cibles potentielles.
Cependant, des systèmes à diffusion plus restreinte ne sont pas touchés proportionnellement. La majorité de ces systèmes, en tant que variantes de l'architecture UNIX (BSDMac OS X ouLinux), utilisent en standard une gestion des droits de chaque utilisateur leur permettant d'éviter les attaques les plus simples, les dégâts sont donc normalement circonscrits à des zones accessibles au seul utilisateur, épargnant la base du système d'exploitation.

Dénomination des virus[modifier]

Lors de leur découverte, les virus se voient attribuer un nom. Celui-ci est en théorie conforme à la convention signée en 1991 par les membres de CARO (en:Computer Antivirus Research Organization).
Ce nom se détermine ainsi :
  • en préfixe, le mode d'infection (ex: macro virus, cheval de Troie, ver...) ou le système d'exploitation concerné (ex: Win32) ;
  • un mot exprimant une de ses particularités ou la faille qu'il exploite (Swen est l'anagramme de News, Nimda l'anagramme de AdminSasser exploite une faille LSASS, ...) ;
  • en suffixe un numéro de version (les virus sont souvent déclinés sous forme de variantes comportant des similitudes avec la version d'origine).

Exceptions[modifier]

Malheureusement, les laboratoires d'analyse des différents éditeurs antiviraux affectent parfois leur propre appellation aux virus sur lesquels ils travaillent, ce qui rend difficile la recherche d'informations.
C'est ainsi que, par exemple, le virus NetSky dans sa variante Q est appelé W32.Netsky.Q@mm chez Symantec, WORM_NETSKY.Q chez Trend Micro, W32/Netsky.Q.worm chez Panda Security et I-Worm.NetSky.r chez Kaspersky.
Il est cependant possible d'effectuer des recherches génériques pour un nom donné grâce à des moteurs de recherche spécialisés, comme celui de en:Virus Bulletin ou de Kevin Spicer.

vendredi 8 mars 2013

Le projet de mathématique fait par Jeunebook


Portail des
Mathématiques

Présentation

Les mathématiques, du grec máthēma (μάθημα) signifiant « connaissance, science », constituent un domaine de savoir, de recherche et d'enseignement, fondé sur le raisonnement logique. Elles portent sur les nombres, les formes, les opérations et d'autres notions qui permettent entre autres de modéliser l'évolution dans le temps, les procédures, notamment en informatique, et même le hasard.
L'histoire des mathématiques s'appuie sur une pratique du calcul probablement plus ancienne que l'écriture, mais ne commence en tant que telle qu'avec l'établissement des premiersthéorèmes numériques ou géométriques.
Les mathématiques irriguent toutes les disciplines scientifiques et sont utilisées en économie ou dans les innovations technologiques, mais elles ont aussi des relations avec la philosophie, les arts plastiques, la musique et même les jeux et la littérature.

Lumière sur…

Triangle with notations.svg
Le théorème d'Al-Kashi est un théorème de géométrie du trianglecouramment utilisé en trigonométrie. Il généralise le théorème de Pythagore aux triangles non rectangles : il relie le troisième côté d'un triangle aux deux premiers ainsi qu'au cosinus de l'angle formé par ces deux côtés.
Soit un triangle ABC, dans lequel on utilise les notations usuelles exposées sur la Fig. 1 : d'une part α, β et γ pour les angles et, d'autre part, ab et c pour les côtés respectivement opposés à ces angles. Alors, le théorème d'al-Kashi stipule que :
\,c^2=a^2+b^2-2ab\cos\gamma.
Dans la plupart des autres langues, ce théorème est connu sous le nom de loi des cosinus, appellation toutefois relativement tardive. En français, cependant, il porte le nom du mathématicien perse Ghiyath al-Kashiqui unifia les résultats de ses prédécesseurs.
Lire l’article

Articles distingués

Probabilités et statistique : Analyse des données • Écart type •Exploration de données • Loi de probabilité • Loi normale

Image du jour


Évènements

Avril 2011 
Mort de Daniel Quillen, récipiendaire de la médaille Fields en 1978.
Mars 2011 
Le prix Abel est décerné à John Milnor.
Octobre 2010 
Centenaire de l'APMEP.
Mort de Benoît Mandelbrot.
Aout 2010 
Congrès international des mathématiciens à Hyderâbâd : la médaille Fields est attribuée à Elon LindenstraussStanislav SmirnovNgô Bao Châu et Cédric Villani.
Branches des mathématiques
Arithmétique
Généralités
Géométrie
Géométrie et topologie
Analyse
Analyse
Algèbre
Algèbre
Statistiques
Probabilités et Statistique
Théorie des nombres
Théorie des nombres
Trigonométrie
Le nombre d'or est une proportion, définie initialement en géométrie comme l'unique rapport a/b entre deux longueurs a et b telles que le rapport de la somme des deux longueurs (a+b) sur la plus grande (a) soit égal à celui de la plus grande (a) sur la plus petite (b) c'est-à-dire lorsque (a+b)/a = a/b. Le découpage d'un segment en deux longueurs vérifiant cette propriété est appelé par Euclide découpage en « extrême et moyenne raison ». Le nombre d'or est maintenant souvent désigné par la lettre φ (phi).
Ce nombre irrationnel est l'unique solution positive de l'équation x^2 = x + 1. Il vaut exactement :
\frac{1+\sqrt5}2
soit approximativement1 1,618 033 988 7.
Il intervient dans la construction du pentagone régulier et du rectangle d'or. Ses propriétés algébriques le lient à la suite de Fibonacci et permettent de définir une « arithmétique du nombre d'or », cadre de nombreuses démonstrations.
L'histoire de cette proportion commence à une période imprécise de l'antiquité. À la RenaissanceLuca Pacioli, un moine franciscain italien, la met à l'honneur dans un manuel de mathématiques et la surnomme divine proportion en l'associant à un idéal envoyé du ciel. Cette vision se développe et s'enrichit d'une dimension esthétique, principalement au cours des xixe et xxe siècles où naissent les termes de section dorée et de nombre d'or.
Le nombre d'or se trouve parfois dans la nature ou des œuvres humaines, comme dans les capitules du tournesol ou dans certains monuments à l'exemple de ceux conçus par Le Corbusier. Il est aussi étudié comme une clé explicative du monde, particulièrement pour la « beauté ». Il est érigé en théorie esthétique et justifié par des arguments d'ordre scientifique ou mystique : omniprésence dans les sciences de la nature et de la vie, proportions du corps humain ou dans les arts comme la peinture, l'architecture ou la musique.
Certains artistes, tels le compositeur Xenakis ou le poète Paul Valéry ont adhéré à une partie plus ou moins vaste de cette vision, soutenue par des livres populaires. À travers la médecine, l'archéologie ou les sciences de la nature et de la vie, la science infirme les théories de cette nature [réf. nécessaire] car elles sont fondées sur des généralisations abusives et des hypothèses inexactes.

Sommaire

  [masquer

Géométrie[modifier]


Les triangles OAB et OCA sont semblables si et seulement si les longueurs a et b respectent la proportion d'or.

Proportion[modifier]

Le nombre d'or possède une première définition d'origine géométrique, fondée sur la notion de proportion :
Définition de la proportion d'or — Deux longueurs strictement positives a et b respectent la « proportion d'or » si et seulement si, le rapport de a sur b est égal au rapport de a + b sur a :
 \frac{a}{b} = \frac{a+b}{a} \quad (1)
Il existe une interprétation graphique de cette définition, conséquence des propriétés des triangles semblables illustrée par la figure 1. Les segments bleus sont de longueur a et le rouge de longueur b. Dire que la proportion définie par a et b est d'or revient à dire que les triangles OAB et OCA sont semblables. Euclide exprime la « proportion d'or », qu'il appelle « extrême et moyenne raison », de la manière suivante : « Une droite est dite coupée en extrême et moyenne raison lorsque la droite entière est au plus grand segment comme le plus grand segment est au plus petit. »
Le rapport a / b ne dépend pas des deux valeurs a et b, dès lors que ces deux nombres sont en proportion d'extrême et de moyenne raison. Ceci donne une nouvelle définition du nombre d'or :
Définition du nombre d'or — Le nombre d'or est le nombre réel positif, noté φ, égal à la fraction a / b si a et b sont deux nombres en proportion d'extrême et de moyenne raison. Il est donné par la formule :
\varphi = \frac{1+\sqrt5}2.
Sa valeur approximative est donc1 1,618 033 988 7.
La proportion (1), définissant la proportion d'or, peut être écrite de la manière suivante, obtenue en multipliant l'égalité par a/b :
 \frac {a+b}a =\frac ab \Leftrightarrow 1 + \frac ba = \frac ab \Leftrightarrow \frac ab + 1 = \left(\frac ab\right)^2 \Leftrightarrow  \left(\frac ab\right)^2 - \frac ab - 1 =  0
Ce qui revient à dire que φ est solution d'une équation du second degré. Cette propriété donne lieu à une troisième définition :
Définition alternative du nombre d'or — Le nombre d'or est l'unique solution positive de l'équation du second degré suivante :
x^2 - x - 1 = 0 \;
Cette équation est équivalente à celle indiquant que l'inverse de l'inconnue x est égal à x - 1, ce qui implique que le développement décimal de 1/x est le même que celui de x, auquel on a retranché sa partie entière.
Il existe deux modes de définition du nombre d'or, celle géométrique qui s'exprime en termes de proportion et celle algébrique qui définit le nombre comme l'unique racine positive d'une équation. Cette double approche permet de résoudre un problème d'algèbre, en l'occurrence une équation du second degré, à l'aide de méthode géométrique, on parle d'algèbre géométrique.

Rectangle et spirale d'or[modifier]


Construction, à la règle et au compasd'un segment de longueur égale au nombre d'or.
Les calculs précédents permettent, à l'aide d'une règle et d'un compas de dessiner une proportion d'extrême et de moyenne raison. La méthode est illustrée sur la figure de gauche. On dessine un cercle de centre C et de rayon 1 (en orange). Puis, de l'extrémité du rayon, on élève un segment (en vert) perpendiculaire au rayon, de longueur 1/2, et on trace le cercle de centre C' et de rayon 1/2. Le segment bleu qui a pour extrémités C et le point du cercle C' dans le prolongement de C C' est de longueur φ.

Rectangles d'or et divine proportion
Cette méthode permet aussi de construire un « rectangle d'or », c'est-à-dire un rectangle de longueur a et de largeur b tel que a et b soient en proportion d'extrême et de moyenne raison. En d'autres termes, un rectangle est dit d'or si le rapport entre la longueur et la largeur est égal au nombre d'or.
Pour tracer un rectangle d'or de longueur a et de largeur b, le plus simple est de dessiner un carré de côté b. En prenant le milieu de la base comme centre, on trace un cercle passant par les deux sommets opposés. L'intersection de la droite prolongeant la base du carré et du cercle détermine l'extrémité de la base du rectangle d'or. Il apparait comme construit par l'adjonction à un carré de côté de longueur b, d'un rectangle de côtés de longueur b et a - b, comme le montre la figure de droite. Un rapide calcul montre que ce rectangle est encore d'or :
 \frac {a-b}b = \frac ab - 1 = \frac {a+b}a - 1 = \frac ba = \frac 1{\varphi} \quad\text{donc}\quad \frac b{a-b} = \varphi \;
Fibonacci spiral 34.svg
Il est possible de réitérer le processus précédent et d'intégrer un carré de côté a - b dans le rectangle d'or de côté ba - b, comme indiqué sur la figure de gauche. Cette méthode peut être prolongée indéfiniment. Si, dans chaque carré est dessiné un quart de cercle d'extrémités deux côtés du carré, comme sur la figure, on obtient une spirale. Ce graphique est une bonne approximation d'une spirale d'or, d'équation polaire :
 r (\theta) = r \cdot \varphi^{-\frac{\theta}{\pi/2}}
Cette spirale est un cas particulier de spirale logarithmique. Comme toute spirale de cette famille, elle possède une propriété caractéristique, si A est un point de la spirale, alors la droite passant par le centre de la spirale et A fait un angle constant avec la tangente à la spirale en A. Une telle spirale est dite équiangle.
D'autres figures se dessinent à l'aide du nombre d'or à l'instar de l'« œuf d'or »2.

Pentagone et pentagramme[modifier]


Une fois la proportion d'extrême et de moyenne raison construite, il est simple de dessiner un pentagone.
Un pentagone régulier se construit à l'aide de la proportion d'extrême et moyenne raison. Soit un cercle de diamètre OP1 et de rayon a, illustré sur la figure de gauche. Si b est le nombre réel plus petit que a tel que a et b soient en proportion d'or, et P2P3P4 et P5 les intersections du cercle de diamètre OP1 avec les deux cercles de centre O et de rayon a + b et b, alors les cinq points Pi définissent un pentagone.
Nombre d'or Pentagramme.svg
Le pentagramme associé, c'est-à-dire la figure composée des cinq diagonales du pentagone (Cf. figure de droite), contient aussi de multiples proportions d'extrêmes et moyennes raisons. Elles s'expriment simplement à l'aide de triangles isocèles dont les longueurs des côtés sont en proportion d'or. De tels triangles sont appelés « triangles d'or ». Il en existe de deux types différents, les jaunes ayant une base proportionnelle à a et deux côtés à b et les orange ayant une base proportionnelle à b et deux côtés à a. Les triangles foncés sont semblables aux plus clairs de même couleur, la proportion entre clair et foncé est encore d'or.
Les triangles jaunes possèdent deux angles de 36°, soit le cinquième d'un angle plat et un de 108°, soit les trois cinquièmes d'un angle plat. Un tel triangle est parfois appelé « triangle d'argent ». Les triangles orange possèdent deux angles de 72°, soit les deux cinquièmes d'un angle plat et un angle de 36°. Avec des triangles d'or et d'argent dont les côtés sont toujours a et b, il est possible de paver intégralement un plan euclidien de manière non périodique. Un tel pavage est dit de Penrose.

Trigonométrie[modifier]

Article détaillé : Trigonométrie.
Nombre d'or trigonométrie.svg
L'analyse des mesures des triangles d'argent et d'or permettent de déterminer les valeurs trigonométriques associées au pentagone. Considérons un triangle d'argent de base φ et donc de côtés adjacents de longueur 1. Ce triangle, coupé en son milieu, comme sur la figure de droite, est un triangle rectangle d'hypoténuse de longueur 1. Sa base est de longueur φ/2 car elle correspond à la demi-base du rectangle d'argent. On en déduit :
\varphi=2\cos(36^\circ).
Un raisonnement analogue s'applique au triangle d'or. Les côtés ont toujours une longueur 1, la base est en proportion d'or donc de longueur φ - 1. On en déduit que le cosinus de 72° est égal à (φ - 1)/2. À partir de ces valeurs et de différentes formules, il est possible de calculer les images par les fonctions trigonométriques des multiples ainsi que les moitiés de l'angle 36°.
Une autre manière de déterminer les différentes valeurs caractéristiques d'un pentagone consiste à utiliser le plan complexe. Les affixes des sommets sont les racines cinquièmes de l'unité. Comme 5 est un nombre de Fermat, le théorème de Gauss-Wantzel a pour conséquence que le pentagone régulier est constructible à la règle et au compas : les racines s'obtiennent par résolutions successives d'équations du second degré. Dans le plan complexe, les affixes des sommets du pentagone sont 1 et les racines du cinquièmepolynôme cyclotomique X4+X3+X2+X+1.

Arithmétique[modifier]

Un autre chemin que celui de la géométrie permet de mieux comprendre les propriétés du nombre d'or, l'arithmétique. Elle met en évidence ses propriétés algébriques ainsi que les profondes relations entre des sujets apparemment aussi différents que la suite de Fibonacci ou sa relation avec de difficiles équations diophantiennes. Une équation diophantienne est une équation dont les coefficients sont entiers et dont les solutions recherchées sont entières. Pour citer un exemple célèbre, celui-ci correspond à un cas particulier du dernier théorème de Fermat :
x^5 + y^5 = z^5\;
Il fut résolu3 par Dirichlet en 1825, ce qui lui valut une célébrité immédiate. Carl Friedrich Gauss, un mathématicien du xixe siècle, disait des problèmes de cette nature : « Leurs charmes particuliers viennent de la simplicité des énoncés jointe à la difficulté des preuves. »4
À l'aide de notions mathématiques comme les fractions continues ou les entiers algébriques, une « arithmétique du nombre d'or » se dessine. Les repères sont modifiés par rapport à ceux desentiers relatifs, mais le mot « entier » est encore utilisé, par analogie : le nombre d'or est un entier algébrique et même un entier quadratique. Le mot accolé à « entier » marque la différence. Par exemple 19, qui est un nombre premier dans les entiers usuels, n'est pas un élément premier dans ce nouvel univers de nombres.

Fraction continue[modifier]

La fraction continue est une manière d'approcher un nombre réel, dans le cas du nombre d'or, elle est simple. On peut l'approcher par les valeurs 1 ou 1 + 1/1. La fraction suivante est plus précise :
1 + \cfrac 1{1 + \cfrac 11}
Le prolongement à l'infini de cette méthode donne exactement le nombre d'or :
\varphi = 1+ \cfrac 1{1 + \cfrac 1{1 + \cfrac 1 {1 + \cfrac 1{1 + \cdots}}}}
Le fait que la fraction ne s'arrête jamais montre que le nombre d'or n'est pas un nombre rationnel. Une démonstration est proposée dans l'article détaillé. On reconnaît, sous la première barre de fraction l'expression du nombre d'or. On en déduit plusieurs expressions algébriques de φ :
\varphi = 1 + \frac{1}{\varphi} \quad\text{ou}\quad \varphi^2 = \varphi + 1
La dernière formule donne une nouvelle expression du nombre d'or :
\varphi = \sqrt {1 + \varphi} = \sqrt {1 + \sqrt {1 + \varphi}}\quad\text{et}\quad \varphi = \sqrt{1+\sqrt{1+\sqrt{1+\sqrt{1+\cdots}}}}
Cette propriété possède des conséquences remarquables si φ est utilisé comme base d'un système de nombre (voir base d'or).
La fraction continue approximant le nombre d'or possède systématiquement la plus petite valeur possible pour chacun de ses coefficients, à savoir 1. En conséquence, il est le nombre irrationnel qui s'approxime le plus mal par des rationnels. On dit de lui qu'il est le plus irrationnel des nombres réels5 (cf. Théorème de Hurwitz sur les approximations diophantiennes).

Suite de Fibonacci[modifier]

Article détaillé : Suite de Fibonacci.
Le calcul des couples de numérateurs et dénominateurs obtenus par la fraction continue donne les valeurs suivantes (1,1), (2,1), (3,2), (5,3)… le dénominateur correspond au numérateur de la fraction précédente. Il est aussi égal au nième terme de la suite de Fibonacci (un). Elle est définie par récurrence :
u_1 = u_2 = 1\quad \text{et}\quad u_{n+2} = u_{n+1} + u_n \;
Les deux premiers termes sont égaux à 1 et les autres à la somme des deux précédents. Pour obtenir une bonne approximation du nombre d'or, il suffit de choisir une valeur de n suffisamment élevée et considérer la fraction un+1/un. En termes mathématiques, cela s'exprime sous la forme suivante :
\lim_{n \to \infty} \frac {u_{n+1}}{u_n} = \varphi\;
La vitesse de convergence est linéaire, la différence entre un+1/un et φ est, en valeur absolue, inférieure au carré de l'inverse de un.
Si la suite de Fibonacci permet de déterminer une approximation du nombre d'or, la réciproque est vraie. Plus exactement, on dispose de la formule suivante :
u_n= \frac1{\sqrt 5}\left(\varphi^n -(1- \varphi)^n \right)
La valeur |1-φ|n ne fait que diminuer lorsque n s'accroît, elle est toujours suffisamment petite pour pouvoir être négligée, il suffit de prendre l'entier le plus proche de l'expression précédente en négligeant le terme en (1 - φ)n, on obtient :
\frac{\varphi^1}{\sqrt 5} \simeq 0,72\;\text{et} \;u_1 =1,\quad \frac{\varphi^5}{\sqrt 5} \simeq 4,96\;\text{et} \;u_5 =5,\quad  \frac{\varphi^{10}}{\sqrt 5} \simeq 55,004\;\text{et} \;u_{10} = 55
Cette propriété est vérifiée pour toute suite définie par la relation de récurrence un+2 = un+1 + un, indépendamment des valeurs prises par u1 et u2.

Équation diophantienne[modifier]

Article détaillé : Équation diophantienne.
La fraction continue offre des rationnels b/a offrant presque des solutions à l'équation qui s'écrit sous les formes suivantes :
\frac ba \simeq 1 + \frac 1{\frac ba} \;\Leftrightarrow\; \frac {b^2}a \simeq b + a \;\Leftrightarrow\; a^2 + a\cdot b -b^2 \simeq 0
L'égalité stricte à zéro est impossible, elle n'autorise que les solutions triviales. En effet, aucun nombre rationnel ne vérifie la proportion d'or, ce qui justifie l'équation diophantienne suivante :
(1)\quad x^2 + x\cdot y - y^2 = \pm 1\;
L'école mathématique indienne s'intéresse aux équations de cette nature. Brahmagupta développe une méthode, dite chakravala qui permet l'étude de telles équations. Il utilise une identité, qui dans le cas présent prend la forme suivante :
(a^2 + ab - b^2)(c^2 + cd - d^2) = (ac + bd)^2 + (ac + bd)(ad + bc + bd) - (ad + bc + bd)^2\;
Cette identité est liée à l'équation (1) précédente et donc au nombre d'or. Si (ab) et (cd) forment deux couples, solutions de l'équation (1), la partie de gauche de l'identité est égale à plus ou moins un. La partie de droite de l'identité décrit donc une solution (ef) si e = ac + bd et f = ad + bc + bd. La découverte d'une multiplication particulière *, permet de construire autant de solutions que désiré, à partir d'une unique si elle n'est pas triviale :
(a,b)*(c,d) = (ac + bd, ad + bc + bd)\;
En combinant une solution (ab) avec elle-même on en obtient une nouvelle (a2 + b2, 2a.b + b2). Le couple (1, 1) est solution de l'équation (1), donc le couple (2, 3) l'est aussi. Elle est d'ailleurs déjà obtenue avec la méthode précédente. Avec la solution (2, 3) on obtient (13, 21) et avec la solution (13, 21) on obtient (610, 987). On vérifie que le couple (610, 987) est bien une solution de l'équation :
610^2 + 610\times 987 - 987^2 = 372\;100 + 602\; 070 - 974\;169 = 1
On en déduit que la fraction 987/610 est une excellente approximation du nombre d'or. En effet, 987/610 = 1,618 032 7… une précision proche du millionième.

Entiers de Q(5)[modifier]

Article détaillé : entier de Q(5).
Les nombres de la forme a+b\sqrt5 (avec a et b entiers relatifs) forment un ensemble stable par addition et multiplication, qu'on peut d'ailleurs définir de manière plus abstraite par les formules suivantes, sur les couples (ab) :
\forall a,b,c,d \in \mathbb Z\quad (a,b) + (c,d) = (a+c, b+d)\;
et
\forall a,b,c,d \in \mathbb Z\quad (a,b) * (c,d) = (ac+5bd, ad+bc) ;
on obtient ainsi une structure équipée d'une addition et d'une multiplication, qu'on appelle un anneau commutatif.
Cet anneau peut aussi être construit à partir d'une équation diophantienne liée au nombre d'or, sa relation avec φ peut ainsi être vue plus directement. Il se conçoit simplement en considérant les nombres réels de la forme a + φ.b, où a et b désignent deux nombres entiers. L'identité de Brahmagupta, définissant la multiplication se lit :
(a + \varphi b)(c + \varphi d) = ac + (ad + bc)\varphi +bd\varphi^2 = (ac + bd) + \varphi(ad + bc + bd)\;
Ainsi les puissances de φ sont tous de la forme a + φ.b, plus précisément φn = un-1 + un.φ, où (un) désigne la suite de Fibonacci.
Ces deux anneaux possèdent des structures identiques ; le terme consacré pour décrire cette situation est celui d'isomorphisme. Ce sont deux sous-anneaux du corps des nombres réels, ou du corps Q(5), ensemble des nombres de la forme a + b5, avec a et b rationnels. On montre que les nombres de la forme a + φ.b, avec a et b entiers relatifs, sont les entiers de Q(5), c'est-à-dire ceux qui sont racines d'un polynôme de la forme X2+cX+d, avec c et d entiers relatifs. L'anneau des entiers de Q(5) est le cadre naturel sous-jacent à toute l'« arithmétique du nombre d'or ». À certains égards, il est analogue à Z, l'ensemble des entiers naturels. Il est commutatif, et intègre. Le terme intègre signifie que le produit de deux éléments non nuls est non nul. La ressemblance est plus profonde : cet anneau est euclidien, c'est-à-dire qu'il dispose d'une division euclidienne semblable à celle de l'arithmétique des entiers classiques. Les outils de l'arithmétique usuelle sur Z, comme le théorème de Bachet-Bézout, le lemme d'Euclide, le théorème fondamental de l'arithmétique ou en plus sophistiqué le petit théorème de Fermat sont tous des conséquences de la division euclidienne. Elle offre des propriétés analogues pour « l'arithmétique du nombre d'or ». Cette analogie profonde pousse les arithméticiens à parler d'entiers pour décrire les éléments de cet ensemble. La compréhension de l'arithmétique de Z passe souvent par celles des nombres premiers. Les entiers de Q(5) ont aussi leurs propres éléments premiers. Un nombre premier de Z n'est pas toujours premier parmi les entiers de Q(5), comme le montre le contre-exemple 19 :
(4 + 3\varphi)(7-3\varphi) = 28 - 9 + (-12 + 21 -9)\varphi = 19\;
Cette différence engendre des modifications dans l'application des théorèmes classiques. Par exemple si p est un nombre premier différent de 5 tel que le reste de sa division euclidienne par 5 soit un carré parfait, donc égal à 1 ou à 4, le petit théorème de Fermat indique que φp-1 - 1 est un multiple de p. Ceci montre que up-1 est un multiple de p ainsi que up-2 - 1, en effet, φp-1 - 1 = up-2 - 1 + up-1.φ. Les démonstrations sont proposées dans l'article détaillé.

Fragments d'histoire[modifier]

Antiquité[modifier]


Pour Thomas L. Heath,Platon est le premier grec à « oser » étudier les propriétés d'un nombre «scandaleux car irrationnel, celui maintenant appelé « nombre d'or ».
Les historiens6,7 considèrent que l'histoire du nombre d'or commence lorsque cette valeur est l'objet d'une étude spécifique. Pour d'autres, la détermination d'une figure géométrique contenant au moins une proportion se calculant à l'aide du nombre d'or suffit. La pyramide de Khéops (vers 2600 av. J.-C.) devient, selon cette dernière convention, un bon candidat pour l'origine8D'autres encore se contentent[évasif] des restes d'un monument dont des dimensions permettent d'approximer le nombre d'or. Selon ce critère, un amas de pierres sous la mer des Bahamas est une origine plus ancienne9. Ces vestiges, dont l'origine humaine et la datation sont incertaines10 sont dénommés « temple d'Andros ».
Les historiens s'accordent tous sur l'existence d'une origine ancienne[évasif], mais l'absence de document d'époque définitif interdit une connaissance indiscutable de l'origine11. Dans ce cadre, l'hypothèse est parfois émise que le nombre d'or a son origine chez les pythagoriciens12,13 : ils auraient connu et construit empiriquement le dodécaèdre régulier.
Les pythagoriciens connaissaient déjà une construction du pentagone à l'aide de triangles isocèles. À cette époque, l'étude du nombre d'or est essentiellement géométrique, Hypsiclès, un mathématicien grec du iie siècle av. J.-C., en fait usage pour la mesure de polyèdres réguliers7. Elle revient chaque fois qu'un pentagone est présent.
L'approche arithmétique est initialement bloquée par le préjugé pythagoricien qui voudrait que tout nombre soit rationnel14 (rappelons que le nombre d'or ne l'est pas). Platon évoque cette difficulté15. Les premières preuves du caractère irrationnel de certaines diagonales de polygones réguliers remontent probablement16 auve siècle av. J.-C.. Platon cite17 les travaux de son précepteur, Théodore de Cyrène, qui montre l'irrationalité de 5 et, par voie de conséquence, celle du nombre d'or[non pertinent]Dès cette époque, les mathématiciens grecs découvrent des algorithmes d'approximation des nombres diagonaux et latéraux18. Bien plus tard,Héron d'Alexandrie, un mathématicien du ier siècle pousse plus loin cette démarche à l'aide des tables trigonométriques de Ptolémée19[pertinence contestée].
Le premier texte mathématique indiscutable est celui des Éléments d'Euclide (vers 300 av. J.-C.). Dans la 3e définition du Livre vi, le nombre d'or est défini comme une proportion géométrique :
« Une droite est dite coupée en extrême et moyenne raison quand, comme elle est tout entière relativement au plus grand segment, ainsi est le plus grand relativement au plus petit. »
Sa relation avec le pentagone, l'icosaèdre et le dodécaèdre régulier est mise en évidence. Il est donc lié aux problèmes géométriques déjà résolus par les pythagoriciens20, mais selon l'historien des sciences Thomas Heath (s'appuyant sur Proclus), c'est probablement Platon qui en avait fait ensuite un sujet d'étude spécifique[Contradiction !] :
« L'idée que Platon initia l'étude (du nombre d'or) comme sujet intrinsèque n'est pas du tout contradictoire avec la supposition que le problème d'Eucl. ii. 11 a été résolu par les pythagoriciens13. »

Moyen Âge[modifier]


Leonardo Pisano, plus connu sous le nom de Fibonacci, établit la relation entre des équations du second degré et le nombre d'or.
Les mathématiques arabes apportent un nouveau regard sur ce nombre, plus tard qualifié d'or. Ce n'est pas tant ses propriétés géométriques qui représentent pour eux son intérêt, mais le fait qu'il soit solution d'équations du second degréAl-Khawarizmi, un mathématicien perse du viiie siècle, propose plusieurs problèmes consistant à diviser une longueur de dix unités en deux parties. L'un d'eux possède comme solution la taille initiale divisée par le nombre d'or. Abu Kamil propose d'autres questions de même nature dont deux sont associées au nombre d'or. En revanche, ni pour Al-Khawarizmi ni pour Abu Kamil, la relation avec la proportion d'extrême et moyenne raison n'est mise en évidence. Il devient ainsi difficile de savoir si la relation avec le nombre d'or était claire pour eux21.
Leonardo Pisano, plus connu sous le nom de Fibonacci, introduit en Europe les équations d'Abu Kamil. Dans son livre Liber Abaci, on trouve non seulement la longueur des deux segments d'une ligne de 10 unités mais aussi, clairement indiquée la relation entre ces nombres et la proportion d'Euclide22. Son livre introduit lasuite qui porte maintenant son nom, connue « aux Indes » depuis23 le vie siècle. En revanche la relation avec le nombre d'or n'est pas perçue par l'auteur. Un élément de cette suite est la somme des deux précédents.

Renaissance[modifier]


L'homme de Vitruve de Léonard de Vincirespecte les proportions explicitées parVitruve, le nombre d'or n'intervient pas.
Trois siècles plus tard, Luca Pacioli rédige un livre dénommé La divine proportion24, illustré par Léonard de Vinci. Si l'aspect mathématique n'est pas nouveau, le traitement de la question du nombre d'or est inédit. L'intérêt du nombre ne réside pas tant dans ses propriétés mathématiques que mystiques, elles « concordent avec les attributs qui appartiennent à Dieu24… ». Pacioli cite les dix raisons qui l'ont convaincu. L'incommensurabilité prend, sous la plume de l'auteur, la forme suivante « De même que Dieu ne peut se définir en termes propres et que les paroles ne peuvent nous le faire comprendre, ainsi notre proportion ne se peut jamais déterminer par un nombre que l'on puisse connaître, ni exprimer par quelque quantité rationnelle, mais est toujours mystérieuse et secrète, et qualifiée par les mathématiciens d'irrationnelle24 ».
Pacioli rédige ainsi l'envoi de son livre : « une œuvre nécessaire à tous les esprits perspicaces et curieux, où chacun de ceux qui aiment à étudier la philosophie, la perspective, la peinture, la sculpture, l'architecture, la musique et les autres disciplines mathématiques, trouvera une très délicate, subtile et admirable doctrine et se délectera de diverses questions touchant à une très secrète science24. », il est en revanche discret sur la manière dont s'applique cette proportion. Dans son traité d'architecture25, l'auteur se limite aux proportions26 de Vitruve, un architecte de la Rome antique. Elles correspondent à des fractions d'entiers, choisies à l'image du corps humain27. S'il cite comme exemple une statue du grec Phidias, ce n'est que pour y voir le nombre d'or dans un dodécaèdre régulier, une figure associée au pentagone symbole de la quintessence, une représentation du divin28. Les architectes de la Renaissance n'utilisent pas le nombre d'or29,30.
Les mathématiciens de l'époque ne sont pas en reste. Les spécialistes des équations polynomiales que sont Gerolamo Cardano et Raphaël Bombelliindiquent comment calculer le nombre d'or à l'aide d'équations de second degré31. Un résultat plus surprenant est anonyme. Une note manuscrite, datant du début du xvie siècle et écrite dans la traduction de Pacioli des éléments d'Euclide de 1509, montre la connaissance de la relation entre la suite de Fibonacci et le nombre d'or. Si l'on divise un terme de la suite par son précédent, on trouve une approximation du nombre d'or. Plus le terme est élevé, plus l'approximation est bonne et elle peut devenir aussi précise que souhaitée32. Ce résultat est, plus tard, retrouvé parJohannes Kepler puis par Albert Girard33. Kepler est fasciné par le nombre d'or, il dit de lui « La géométrie contient deux grands trésors : l’un est le théorème de Pythagore ; l’autre est la division d’une ligne en moyenne et extrême raison. Le premier peut être comparé à une règle d’or ; le second à un joyau précieux34 »

xixe siècle : naissance d'un mythe[modifier]


Adolf Zeising appuie sa théorie sur des exemples naturels incontestables. Un Tournesol présente une figure où apparaît lasuite de Fibonacci, ainsi que la spirale d'or.
Sur le front des mathématiques, l'intérêt diminue. Au xviiie siècle, le nombre d'or ainsi que les polyèdres réguliers sont considérés « avec assez de justice, comme une branche inutile de la géométrie35 ». Concernant le nombre d'or, on lui prête encore un peu d'attention au siècle suivant : Jacques Binet retrouve en 1843 un résultat oublié, démontré initialement par Leonhard Euler en 176536. Si la lettre φ désigne le nombre d'or, le n-ième terme de la suite de Fibonacci est donné par la formule n – (1 − φ)n)5. Ce résultat est maintenant connu sous le nom de Formule de Binet. L'essentiel des travaux se reporte sur la suite de Fibonacci. Édouard Lucas trouve des propriétés subtiles associées à cette suite, auquel il donne pour la première fois le nom de Fibonacci37. Son résultat le plus important porte le nom de Loi d'apparition des nombres premiers au sein de la suite Fibonacci38,39.

D'autres sont plus polémiques. Pour retrouver le nombre d'or dans le Parthénon, il est nécessaire d'user de conventions spécifiques.
C'est durant ce siècle que les termes de « section dorée », puis « nombre d'or » apparaissent. On les trouve dans une réédition d'un livre de mathématiques élémentaires écrit par Martin Ohm. L'expression est citée dans une note de bas de page : « Certains ont l'habitude d'appeler la division en deux telles parties unesection d'or31. » Cette réédition fait surface dans une période située entre 1826 et 1835, en revanche son origine est un mystère.
L'intérêt resurgit au milieu du siècle, avec les travaux du philosophe allemand Adolf Zeising. Avec lui, le nombre d'or devient un véritable système, une clé pour la compréhension de nombreux domaines, tant artistiques — comme l'architecture, la peinture, la musique —, que scientifiques — avec la biologie et l'anatomie40. Une dizaine d'années plus tard, il publie un article41 sur le pentagramme« manifestation la plus évidente et la plus exemplaire de cette proportion ». Une relecture de la métaphysique pythagoricienne lui permet de conclure à l'existence d'une loi universelle fondée sur le pentagramme, et donc, sur le nombre d'or. Malgré une approche scientifique douteuse42,43, la théorie de Zeising obtient un franc succès.
En France, pouvoir codifier de manière scientifique la beauté est une idée qui séduit. Les dimensions du Louvre, de l'Arc de triomphe sont mesurées avec attention. Des délégations sont chargées de mesurer précisément la taille des pyramides d'Égypte ainsi que du Parthénon. Les cathédrales ne sont pas en reste. La France trouve son champion en Charles Henry (en), un érudit qui s'inscrit dans l'esprit positiviste de son temps. Dans un texte fondateur44, à l'origine du mouvementpointilliste, il associe au nombre d'or, une théorie de la couleur et des lignes. Son influence auprès de peintres comme Seurat ou Pissarro n'est pas négligeable, mais son attachement au nombre d'or n'est pas aussi profond que chez son collègue allemand : en 1895, il finit par abandonner définitivement l'idée de quantifier le beau45.

xxe siècle : le paroxysme[modifier]


Toute spirale n'est pas d'or. Celle dunautile n'a rien à voir avec la divine proportion46.
Loin de s'éteindre avec le déclin du positivisme, la popularité du nombre d'or ne fait que croître durant la première partie du siècle. Le prince roumainMatila Ghyka en devient l'incontestable chantre. Il reprend les thèses du siècle précédent et les généralise. Tout comme Zeising, il s'appuie tout d'abord sur les exemples issus de la nature, comme les coquillages ou les plantes. Il applique cette universalité à l'architecture avec des règles plus souples que son prédécesseur. Cette théorie avait déjà influé sur les notations, le nombre d'or étant noté φ en référence au sculpteur Phidias, concepteur du Parthénon47.
La dimension mystique n'est pas absente chez Ghyka48 et trouve ses origines dans la philosophie pythagoricienne. L'absence de trace écrite sur le nombre d'or chez les pythagoriciens s'expliquerait par le culte du secret. Cette idée est largement reprise et généralisée49 par les mouvements de pensées ésotériques au xxe siècle. Le nombre d'or serait une trace d'un savoir perdu, nommé Tradition Primordiale ou Connaissance Occulte chez lesRose-Croix ou des mouvements connexes. On le retrouve chez les passionnés de l'Atlantide, qui voient dans la pyramide de Khéops ou le temple d'Andros la preuve d'un savoir mathématique oublié50. Ce mouvement de pensée reprend des idées développées en Allemagne au xixe siècle par Franz Liharzik (1813 - 1866), pour qui la présence du nombre d'or, de π et de carrés magiques est la preuve « incontestable »51 d'un groupe restreint d'initiés possédant la science mathématique absolue52.
En 1929, une époque troublée par des idées d'un autre âge, Ghyka n'hésite pas à tirer comme conclusion de son étude sur le nombre d'or, la suprématie de ce qu'il considère comme sa race : « le point de vue géométrique a caractérisé le développement mental (…) de toute la civilisation occidentale (…) ce sont la géométrie grecque et le sens géométrique (…) qui donnèrent à la race blanche sa suprématie technique et politique53. » Si le prince n'insiste que très médiocrement sur cet aspect du nombre d'or, d'autres n'ont pas ses scrupules. Ils usent de l'adéquation de la morphologie d'une population avec les différentes proportions divines pour en déduire une supériorité qualifiée de raciale. Ce critère permet de fustiger certaines populations, sans d'ailleurs la moindre analyse54. Le nombre d'or est, encore maintenant, sujet à de prétendues preuves de supériorité culturelle, sociale ou ethnique55.
Sans cautionner ces idées extrêmes, certains intellectuels ou artistes éprouvent une authentique fascination pour le nombre d'or ou son mythe. Le compositeur Iannis Xenakis utilise ses propriétés mathématiques pour certaines compositions56. L'architecte Le Corbusier reprend l'idée consistant à établir les dimensions d'un bâtiment en fonction de la morphologie humaine et utilise pour cela le nombre d'or. Paul Valéry un poète et intellectuel écrit à ce sujet des vers dans son Cantique des colonnes :
« Filles des nombres d'or
Fortes des lois du ciel
Sur nous tombe et s'endort
Un dieu couleur de miel. »
Le peintre Salvador Dalí fait référence au nombre d'or et sa mythologie dans sa peinture, par exemple dans un tableau dénommé Le Sacrement de la dernière Cène.
Sur le plan mathématique, le nombre d'or suit une trajectoire inverse, son aura ne fait que diminuer et il quitte le domaine de la recherche pure. Il existe néanmoins une exception, la revueFibonacci Quarterly57 sur la suite de Fibonacci, dont l'objet est plus ludique qu'associé à la recherche[réf. nécessaire]. En revanche, le nombre d'or apparaît comme la clé de quelques sujets scientifiques. La question de phyllotaxie, se rapportant à la spirale que l'on trouve dans certains végétaux comme les écailles de la pomme de pin est-elle vraiment liée à la proportion d'Euclide ? Cette question fait couler beaucoup d'encre dès le siècle précédent. Wilhelm Hofmeister suppose que cette spirale est la conséquence d'une règle simple58. Pour le botaniste allemand Julius von Sachs, ce n'est qu'un orgueilleux jeu mathématique, purement subjectif59. En 1952, un scientifique, père fondateur de l'informatiqueAlan Turing propose un mécanisme qui donnerait raison à Hofmeister60. Deux physiciens français, Stéphane Douady et Yves Couder, finissent par trouver l'expérience confirmant Hofmeister et Turing 61. La présence du nombre d'or dans le monde végétal ne semble ni fortuite ni subjective62.

Nature[modifier]

Omniprésence[modifier]


L'absence de nombre d'or dans la spirale logarithmique décrivant la forme d'une galaxie rend l'astronome sceptique sur l'usage de cette proportion dans ce contexte.
La thèse de l'omniprésence du nombre d'or est souvent reprise63. Si un avis définitif sur ce phénomène est difficile à propos de l'œuvre des hommes, il est plus aisé de comprendre la différence d'opinion que soulève cette question pour les sciences de la nature. Elle provient de l'usage des critères utilisés pour lier ou non le nombre d'or avec un phénomène.
Dans le monde végétal, les écailles des pommes de pins engendrent des spirales particulières, dites logarithmiques. Ces spirales se construisent à l'aide d'unnombre réel non nul quelconque. Si ce nombre est égal au nombre d'or, les proportions correspondent à la moyenne et extrême proportion d'Euclide et la suite de Fibonacci apparaît. Ce phénomène se produit sur les étamines d'une fleur de tournesol. La présence du nombre d'or n'est pas controversée dans ce cas64.

Une organisation autour d'un schéma pentagonal des atomes d'un cristal de quartz explique l'usage du nombre d'or pour l'étude d'un tel minéral.
En revanche, si ce nombre n'est pas égal au nombre d'or, alors ni proportion d'or, ni suite de Fibonacci ne sont pertinents dans l'étude de la spirale logarithmique correspondante, comme celles que forment la coquille du mollusque le nautilus63, les yeux sur les plumes d'un paon65 ou encore certaines galaxies.
En minéralogie, il existe des cristaux dont les atomes s'organisent selon un schéma pentagonal. Les proportions entre les côtés et les diagonales du pentagone font intervenir le nombre d'or. Il est aussi présent dans des structures dites quasi cristallines. Les atomes dessinent des triangles d'or qui remplissent l'espace sans pour autant présenter de périodicité, on obtient un pavage de Penrose. Pour la même raison que précédemment, le nombre d'or est présent et l'on retrouve la suite de Fibonacci[réf. à confirmer]66. Le pentagone n'est pas présent dans tous les cristaux. La structure cubique à faces centrées d'un diamant ne fait pas intervenir le nombre d'or.
Ainsi, selon l'axe d'analyse, la réponse sur l'omniprésence du nombre d'or est différente. Pour un scientifique, spécialiste dans un domaine, l'usage du nombre d'or est finalement plutôt rare, limité à quelques sujets comme laphyllotaxie du tournesol ou la cristallographie du quartz. S'il recherche des concepts explicatifs pour mieux comprendre son domaine, la proportion d'Euclide est rarement de ceux-là. D'autres63 utilisent l'analogie ainsi que l'esthétique comme critère. La divine proportion est pour eux présente dans les cieux, la vie animale et végétale, les minéraux et finalement dans toute la nature.

Phyllotaxie[modifier]

Article détaillé : Phyllotaxie.

Une pomme de pin illustre par ses écailles un phénomène de phyllotaxie. On trouve des spirales dont la proportion est proche de celle d'Euclide. Le nombre d'écailles dans une spirale ainsi que le nombre de spirales correspond à deux nombres consécutifs dans la suite de Fibonacci.

Le mécanisme ne fait pas toujours apparaître le nombre d'or. Pour l'Achimenes erecta, on remarque ici trois jeux de trois feuilles. Chaque jeu est pivoté d'un sixième de tour par rapport à la génération précédente. On obtient encore deux jeux de spirales, mais qui n'ont plus rien à voir avec le nombre d'or.
En biologie, l'ordonnancement des écailles d'une pomme de pin ou de l'écorce d'un ananas induit desspirales ordonnées par des nombres entiers, souvent associés au nombre d'or. Sur la figure de gauche, on observe 8 spirales, chacune formée de 13 écailles dans un sens et 13 spirales formées de 8 écailles dans l'autre sens. Les proportions de ces spirales ne sont pas très éloignées de celles d'une spirale d'or. Les nombres 8 et 13 sont deux nombres consécutifs de la suite de Fibonacci et leur rapport est proche du nombre d'or. Un phénomène analogue se produit avec les étamines des tournesols, cette fois avec les couples d'entiers (21,34), (34,55) et (55, 89). Chacun de ces couples correspond à deux entiers consécutifs de la suite de Fibonacci.
La phyllotaxie ne suit pas toujours les lois du nombre d'or. À droite, on voit un mécanisme analogue sur des feuilles, les deux spirales sont toujours logarithmiques mais ne suivent plus la proportion d'or. Les nombres de spirales dans un sens et dans l'autre sont égaux.
Ce mécanisme est régi par la règle de Hofmeister : « Le primordium apparaît périodiquement dans le plus grand espace disponible. » Un primordium correspond à un embryon de partie de plante : écaille, feuille, d'étamine, etc. Ce mécanisme est contrôlé par la production d'une substance inhibitrice, appelée morphogène, émise par les primordia. Ainsi une nouvelle pousse ne peut naître que le plus loin possible des précédentes.
Dans le cas de l'Achimenes erecta, la tige pousse rapidement par rapport à la feuille, la deuxième feuille naît dans la direction opposée, le rapport entre la croissance de la tige et le temps d'apparition d'un nouveau primordium fait que la troisième position la meilleure est à un angle d'un tiers de tour par rapport à la première feuille et deux tiers par rapport à la deuxième. Finalement on obtient l'apparition de trois feuilles, décalées d'un tiers de tour l'une par rapport à l'autre, puis d'un nouveau jeu de trois feuilles, décalé d'un sixième de tour par rapport au jeu précédent.
La pomme de pin suit la même règle pour le primordium de l'écaille. La croissance de la tige entre deux primordia est beaucoup plus modérée. Le troisième primordium naît en conséquence entre les deux premiers, avec un angle légèrement plus faible du côté du premier primordium, la tige ayant un peu grandi. Douady et Couder ont montré qu'un tel mécanisme produit deux jeux de spirales d'or de directions opposées dont les nombres de spirales par jeu correspondent à deux éléments consécutifs de la suite de Fibonacci. Plus la croissance entre l'apparition de deux primordia est petite, plus élevés sont les deux éléments consécutifs de la suite64.

Corps humain[modifier]


Le squelette de Zeising ne respecte pas précisément les proportions du corps humain, le crâne est par exemple irréaliste.
Le corps humain est un enjeu souvent corrélé à celui du nombre d'or. Il comporte différentes facettes. Tout d'abord scientifique, la question maintes fois posée est de savoir si le corps, à l'image de la fleur de tournesol, possède une relation plus ou moins directe avec le nombre d'or. En terme artistique, la « divine proportion » est-elle utilisable pour représenter le corps ? Il existe enfin un enjeu esthétique. Si le nombre d'or, comme le pense56 le compositeur Xenakis, est relié à notre corps, son usage peut être une technique pour obtenir de l'harmonie.

Albrecht Dürer développe un moduledans le même esprit que l'homme de Vitruvede Léonard de Vinci. Le sien utilise un système de division par dix67.
La première corrélation recherchée est dans les dimensions du corps humain. Elle débouche sur la tentative d'un système de mesure construit à l'aide du seul nombre d'or. Zeising fonde toute une anatomie68 sur cette arithmétique. Après un vif effet de mode, cette approche est finalement abandonnée. Ses proportions sont à la fois trop imprécises et ne correspondent que trop mal à l'anatomie du corps humain. Les proportions du crâne, par exemple, ne sont pas réalistes69. D'autres raisons, plus profondes encore, sont la cause de l'abandon d'une démarche de cette nature. L'anatomie médicalen'est pas à la recherche d'une proportion particulière, mais des limites qui, si elles sont dépassées deviennent pathologiques. Elle utilise des fractions simples ainsi que des plages de longueur, mais jamais le nombre d'or. Là où certains voient une divine proportion, comme dans le rapport de la longueur de l'avant-bras sur celui de la main, l'anatomiste scientifique calcule le rapport entre la longueur de la main et celle de l'avant bras, il voit 2/3. La différence entre les deux approches, inférieure à 8 %, ne lui paraît pas justifier une telle complexité, au vu des variations observées entre les individus.Stephen Jay Gould, un paléontologue, a montré à quel point les mesures anthropométriques visant à étayer les doctrines de cette époque étaient biaisées par leurs auteurs70.
Une autre raison71 est que les dimensions d'un être humain sont en constante évolution. En un siècle, la stature du Français moyen a augmenté de 9 centimètres, et cette croissance n'est pas uniforme. Le jeu des proportions d'un corps humain est essentiellement dynamique, cet aspect rend difficile d'imaginer une proportion unique, clé universelle de l'anatomie humaine. Une approche de cette nature, trop normative et intemporelle, n'a pas beaucoup de sens scientifique en anatomie. Si cet axe de recherche n'est plus d'actualité, cela ne signifie pas l'abandon de la quête du nombre d'or dans le corps humain. Le cerveau est maintenant source d'attention72. Cette théorie reste minoritaire et controversée.
Les contraintes artistiques sont de natures différentes. Les artistes, attentifs au travail des médecins, ont imaginé desmodules ou systèmes de proportions, propres au corps humain. Le désir de le représenter impose une démarche de cette nature. Un très ancien module est celui des Égyptiens73, la classique proportion qu'est le rapport de la taille complète à la hauteur du nombril est estimée à 19/11, relativement loin du nombre d'or. Les modules sont, en général, purement fractionnaires. Tel est le cas de celui inventé par les Égyptiens, par Polyclète, qui nous est rapporté par Vitruve, de celui de Cousin, de Vinci ou deDürer. Il est néanmoins difficile d'en déduire que Dürer croyait en un canon universel. Il initie une conception fondée sur la pluralité des types de beauté74, ayant chacune ses proportions propres.

Œuvre de l'homme[modifier]

Peinture[modifier]

L'idée que le nombre d'or possède une qualité visuelle intrinsèque est largement citée75. Un argument est la présence de la divine proportion dans de nombreux chefs d'œuvre. Cependant les commentaires précis sont rares, ce qui amène à rechercher le rapport d'Euclide, sans information directe de la part de l'auteur. L'existence d'une forme géométrique ayant des concordances avec le tableau est, pour certains, un élément de preuve. Pour d'autres76, une démarche de cette nature est peu convaincante.

Les dimensions de La Naissance de Vénus de Sandro Botticelli respectent assez précisément la divine proportion. Il est pourtant très peu probable que cela indique une quelconque volonté de l'auteur.
Un exemple est celui de La Naissance de Vénus de Sandro Botticelli77. Ses dimensions, 172,5 × 278,5 cm, respectent précisément la proportion. Le carré, associé au rectangle d'or, correspond à un rythme du tableau ; enfin, la diagonale du rectangle restant, ainsi que celle symétrique, sont des lignes de force. Ce raisonnement n'a pas convaincu certains spécialistes. Le tableau semble faire partie d'un diptyque avec Le Printemps, un autre tableau du maître. L'aile d'Aura, un des dieux, est étrangement coupée. Pour en avoir le cœur net, une analyse finit par être faite. Le verdict est sans appel : Botticelli avait choisi une taille analogue à celle du Printemps78 ; le haut de La Naissance est amputé de 32,5 cm et avait, à sa conception, la taille du Printemps. Dans ce cas, la divine proportion n'a pas été choisie par le créateur.

De nombreuses indications laissent penser que ce n'est pas du côté de la divine proportion qu'il faut chercher à comprendre les rythmes duSaint Jérôme de Léonard de Vinci.
Pour certains, il existe un fondement scientifique à la beauté : « … la nature, ministre de la divinité, lorsqu'elle façonna l'homme, en disposa la tête avec toutes les proportions voulues24… ». Cette idée n'est pas une invention de Pacioli, le traité de peinture79 de Leon Battista Alberti, établissant les premières règles de la perspective, était déjà l'illustration d'une philosophie analogue. La découverte de lois scientifiques, modifie la peinture et permet d'incarner un nouvel idéal. Si l'approche mathématique d'Alberti obtient un large consensus, peu d'éléments laissent penser à un succès analogue pour la loi de la divine proportion.
Un exemple est le cas Vinci. Pacioli est un de ses amis proches, Vinci connaît suffisamment ses théories pour illustrer son livre. À travers ses codex, son Traité de la peinture et les multiples analyses de ses sources80, la pensée de Vinci sur la proportion en peinture nous est connue. Si, pour le maître, la peinture s'apparente à une science81, ses thèses sont forts éloignées de celle de son ami. Sa première source est l'observation et l'expérience, et non les mathématiques : « … l'expérience ayant été la maîtresse de ceux qui écrivent bien, je la choisis pour maîtresse et, en tout cas ferai appel à elle82 ». Cette attitude se traduit, par exemple pour le choix des proportions humaines. À travers de multiples dissections, il mesure systématiquement les rapports entre les dimensions des différents os et muscles. Ses planches médicales l'amènent à une conception de l'anatomie dont les rapports sont de même nature que celle de la médecine moderne : ils sont fort nombreux et s'expriment à l'aide de fractions composées de petits facteurs entiers83. La science de Vinci s'applique aussi sur des sujets déjà traités comme la perspective. Une fois encore, sa logique est plus proche de l'observation que de la rigidité mathématique. Les lois qu'il ajoute à celles d'Alberti traitent de la couleur : une chose éloignée voit sa couleur tirer vers le bleu, ainsi que de la netteté« comment les choses qui s'éloignent doivent être moins nettes proportionnellement à leur distance84 ». Les règles régissant la proportion chez Vinci sont subtiles et en opposition avec des articulations albertiennes, trop claires à ses yeux85, comme l'application directe d'une proportion sans lien avec ses observations.
À l'instar du Saint Jérôme à droite, beaucoup d'exemples de rectangle d'or trouvés chez un peintre86 supposent une approche de la proportion sans justification de la part du peintre ou, comme ici, contraire aux règles établies par son auteur. Ni Arasse dans son volumineux ouvrage sur Vinci, ni Marani dans le sien87 ne font référence à une explication de cette nature.
Le nombre d'or a aussi influencé les peintres du groupe de Puteaux, appelé aussi « Section d'or », groupe qui se crée autour de Jacques Villon en 1911. Leur emploi du nombre d'or en peinture est cependant davantage intuitif que purement mathématique.

Archéologie[modifier]


Le théâtre d'Épidaure contient deux séries de gradins, l'une de 21, l'autre de 34, deux nombres consécutifs de la suite de Fibonacci dont le rapport est proche du nombre d'or.
L'usage du nombre d’or dans les constructions anciennes est un sujet de controverse. Pour le prince Ghyka, l’archéologie offre la preuve de l'universalité du canon de beauté qu'est le nombre d'or. L'argument principal est le vaste nombre d'exemples. Le prince reprend les travaux de son prédécesseur Zeising et l'enrichit considérablement. Le théâtre d'Épidaure possède deux séries de gradins l'une de 21 et l'autre de 34 marches, deux éléments consécutifs de la suite de Fibonacci.

Si l'on en croit les canons de la beauté de Polyclète, le sculpteur à qui l'on attribue l’éphèbe Westmacott, les proportions du corps humain sont des fractions d'entiers et non le nombre d'or.
Les plus convaincus citent le temple d'Andros et celui de Salomon comme exemple d'utilisation du nombre d'or. Pour le temple d'Andros, sa forme actuelle est un losange dont deux côtés ont un rapport approximativement égal à 5/3, une valeur proche du nombre d'or. L'origine de ces vestiges, qui daterait de 10 000 ans, n'est pas avérée. Ce site, non reconnu par les archéologues officiels50 est pour ses partisans une preuve de l'existence de l'Atlantide9. Le temple de Salomon aurait une dimension d'un rapport 2/1, certains88 remarquent que ce sont deux termes consécutifs de la suite de Fibonacci, un élément suffisant à leurs yeux pour voir la trace du nombre d'or.
La pyramide de Khéops convainc un public plus vaste. Cet exemple est cité depuis le milieu du xixe siècle, une époque où la méconnaissance presque totale de l'égyptologie donne naissance à d'innombrables mythes42. La coïncidence entre les dimensions de la pyramide et le nombre d'or est ici excellente. Le rapport entre la longueur de la plus grande pente d'une des faces et la demi-longueur d'un côté correspond au nombre d'or avec une précision de moins de 1 %. Le scepticisme des professionnels est la conséquence de la connaissance actuelle de la civilisation égyptienne89. En effet, les systèmes de longueur utilisés dans les documents connus pour mesurer les pentes et les longueurs horizontales ne coïncident pas, interpréter leur rapport n’a donc pas beaucoup de sens90. On ne trouve pas non plus la moindre trace religieuse ou esthétique qui justifie un choix de cette nature91. Cette faiblesse pousse Taylor, à l'origine de cette hypothèse, à créer de toutes pièces une citation de Hérodote42,92.
Le cas grec est encore plus populaire et très largement étayé. Mais l'écart entre la culture grecque et le nombre d'or laisse perplexe les spécialistes93. Ces proportions incommensurables, que sont la diagonale d'un carré ou celle d'Euclide, sont vécues comme un scandale94, une trahison95 des dieux à l'époque de Pythagore. Un grec n'imagine pas qu'un nombre puisse être autre chose qu'une fraction d'entiers. L'existence de proportions, comme celle d'Euclide, qui ne sont pas des nombres est une source de chaos intellectuel, à l'opposé des valeurs philosophiques et mystiques des pythagoriciens96. On raconte que Hippase de Métaponte aurait été exclu de la confrérie des pythagoriciens pour avoir dévoilé le scandale de l'incommensurabilité d'une diagonale d'un dodécaèdre régulier, une autre indique qu'il aurait péri noyé97, conséquence de son impiété. Qu'une proportion aussi négative soit utilisée pour les monuments apparaît étonnant. Les textes d'architecture grecs confirment l'usage des nombres rationnels pour définir les proportions des bâtiments. Les proportions harmonieuses sont longuement relatées par Vitruve un architecte, auteur du célèbre traité De architectura en dix volumes. Pour ce faire, il utilise largement, au volume ix, les mathématiques de Platon, Pythagore ou d'autres mathématiciens. Les proportions proviennent du module de Polyclète, un sculpteur grec contemporain de Phidias. Le traité de Vitruve ne contient aucune trace de proportion irrationnelle à l'exception de la diagonale du carré27.
Enfin, les exemples choisis par le prince sont controversés. Retrouver la divine proportion dans la façade du Parthénon demande des conventions spécifiques, comme d'inclure trois des quatre marches du fronton98 ou de tronquer le toit99. L'usage de mesures non spécifiques donne une proportion différente100. Pour faire apparaître le nombre d'or dans les proportions des monuments grecs, Ghyka101 n'hésite pas à utiliser des fractions comme 1/φ4, bien difficile à différencier de 1/4, ou d'une racine quatrième de φ. Les techniques hellénistiques sont pourtant incapables[réf. souhaitée] de réaliser un tel calcul[Lequel ?].

Architecture[modifier]

Le Corbusier est l'architecte qui théorise l'usage du nombre d'or dans son métier. S'il reprend l'idée de Vitruve, consistant à proportionner un bâtiment aux dimensions d'un corps humain, il y associe d'autres éléments justifiant l'usage de la proportion d'Euclide.
Le nombre d'or permet de créer un curieux système de numération. Les mathématiques nous apprennent qu'il est possible de construire une numération positionnelle, non seulement avec dix, comme celle des humains, ou avec deux, pour les ordinateurs, mais avec n'importe quel nombre réel strictement positif et différent de un. Celui construit avec le nombre d'or, appelé base d'or, lui semble le plus adapté à l'architecture. Au premier contact, il est un peu étrange. Par exemple dans ce système 100 est égal à 10 + 1, ce qu'un mathématicien lit φ2 = φ + 1.
Cette échelle harmonique, pour reprendre son expression102, permet de réconcilier les atouts du système métrique décimal, pratique et abstrait, avec ceux du système anglais des pouces et des pieds, naturel mais peu pratique. En calant les différentes dizaines, c'est-à-dire ici les puissances du nombre d'or, sur les dimensions humaines, Le Corbusier cherche à obtenir un système alliant les deux avantages. La deuxième unité correspond à la taille d'un avant-bras, la troisième à la distance entre le nombril et le sommet de la tête, la quatrième à celle entre le sol et le nombril d'un homme debout et la cinquième à la taille d'un adulte.
En termes d'architecture, cette démarche offre un moyen naturel pour incarner l'idéal de Vitruve. Chaque dizaine correspond à une proportion humaine et les différentes proportions se répondent entre elles. En termes d'urbanisme, Le Corbusier cherche à trouver un moyen de normalisation. En 1950, date de parution du premier tome sur le Modulor, nom qu'il donne à ce système, les besoins de reconstruction sont vastes et la rationalisation de la production, un impératif. L'auteur parle de machine à habiter. Cette démarche, vise aussi un objectif esthétique. La normalisation dispose d'un avantage, elle permet plus d'harmonie. Le tracé régulateur, c'est-à-dire l'échelle construite sur la suite de Fibonacci y joue un rôle : «  Le tracé régulateur n'apporte pas d'idée poétique ou lyrique ; il n'inspire nullement le thème ; il n'est pas créateur ; il est équilibreur. Problème de pure plasticité103 »
À partir des années 1950, Le Corbusier utilise systématiquement le modulor pour concevoir son œuvre architecturale. La Cité radieuse de Marseille ou la Chapelle Notre-Dame-du-Haut de Ronchamp sont deux exemples célèbres.
es hypercubes, ou n-cubes, forment une famille de graphes. Dans un hypercube Q_n, chaque sommet porte une étiquette de longueur nsur un alphabet A = \{0,1\}, et deux sommets sont adjacents si leurs étiquettes ne diffèrent que d'un symbole. C'est le graphe squelette de l'hypercube, un polytope n-dimensionnel, généralisant la notion de carré (n = 2) et de cube (n = 3). Dans les années 1980, des ordinateurs furent réalisés avec plusieurs processeurs connectés selon un hypercube : chaque processeur traite une partie des données et ainsi les données sont traitées par plusieurs processeurs à la fois, ce qui constitue un calcul parallèle. L'hypercube est couramment introduit pour illustrer des algorithmes parallèles, et de nombreuses variantes ont été proposées, soit pour des cas pratiques liés à la construction de machines parallèles, soit comme objets théoriques.

Sommaire

  [masquer

Construction[modifier]

L'hypercube Q_1 consiste en deux sommets d'étiquettes 0 et 1 ; les étiquettes de ces sommets étant différentes par un seul symbole, ils sont donc reliés. Pour passer à la dimension supérieure, on fabrique une copie du graphe : à la partie d'origine, on rajoute le symbole 1, et sur la partie copiée le symbole 0 ; chaque sommet de la partie d'origine est ensuite relié à son équivalent dans la copie. Ainsi, Q_2 consiste en quatre sommets étiquetés 000110 et 11. L'illustration ci-dessous montre en rouge les arêtes connectant les sommets d'origine à leurs équivalents dans la copie, et l'exemple se poursuit jusqu'à Q_3 et Q_4. Cette méthode de construction est récursive, puisque pour construire Q_n on se fonde sur Q_{n-1}.
Hypercube-dim1.PNG → Hypercube-dim2.PNG → Hypercube-dim3.PNG → Hypercube-dim4.PNG
On peut aussi définir Q_n comme le produit cartésienA 1 de n graphes complets K_2, soit :
Q_n = Q_{n-1} \square K_2 = Q_{n-2} \square K_2 \square K_2 = ... = \underbrace{K_2 \square K_2 \square ... \square K_2}_{n \text{ fois}}
Enfin, on peut construire le graphe directement en appliquant sa définition. On dispose 2^n sommets, et chacun a une étiquette unique dans l'espace vectorielD 1 \{Z_2\}^n, c'est-à-dire une étiquette de la forme (x_1,x_2,...,x_n), x_i \in \{0,1\}. Deux sommets sont reliés par une arête s'ils diffèrent exactement sur un symbole de leurs étiquettes, soit formellement pour le graphe G = (V, E) :
\exists e_{uv} \in E \Longleftrightarrow u = \{x_1, ..., x_{i-1}, x_i, x_{i+1}, ..., x_n\}, v = \{x_1, ..., x_{i-1}, \bar{x_i}, x_{i+1}, ..., x_n\}
Le graphe hypercube Q_3 est le graphe hexaédrique et Q_4 est le graphe tesseract.

Propriétés[modifier]

Fondamentales[modifier]


Un cycle dans un hypercube Q_3 constitué de deux hypercubes Q_2. En rouge, un chemin dans le premier hypercube Q_2, en bleu les arêtes le reliant à sa copie et en vert le chemin dans la copie. Le cycle est de longueur 2 + 2 + 2 = 6, qui est pair.
  • Degré. Deux sommets sont connectés s'ils diffèrent exactement sur un symbole de leurs étiquettes. Comme l'étiquette a n symboles, chaque sommet est connecté à exactement n voisins : tout sommet a donc degré n, autrement dit le graphe est n-régulier.
  • Nombre de sommets. Par la construction récursive, on voit que pour passer de Q_{n-1} à Q_n, il faut faire une copie du graphe, autrement dit le nombre de sommets est doublé. Si V_n est le nombre de sommets du graphe Q_n, on obtient ainsi V_n = 2*V_{n-1}, et le premier cas est V_1 = 2 ; en déroulant la récurrence, on obtient V_n = 2*V_{n-1} = 2^2*V_{n-2} = ... = 2^n, c'est-à-dire que le graphe a 2^n sommets.
  • DiamètreA 1. Une des propriétés du produit cartésien est que le diamètre D(C) de C = A \square B est égal à D(A) + D(B). Comme Q_n est leproduit cartésien de n graphes complets K_2, son diamètre est égal à n*D(K_2) = n * 1 = n.

Les sommets de l'hypercube Q_4 sont répartis en deux ensemble. Ceux en vert ont un nombre impair de 1 et ceux en rouge un nombre pair. Le voisin d'un sommet est nécessairement de couleur différente, donc le graphe est biparti.
  • Cycles. Par construction, le plus petit cycle correspond à Q_2, qui est isomorphe au cycle C_4 (i.e. le cycle de longueur 4). Le graphe Q_3 est formé par deux graphes Q_2 : si l'on souhaite un cycle de longueur supérieur à 4 dans Q_3, alors on choisit p arêtes dans un des deux graphes Q_2p arêtes dans l'autre Q_2 et 2 arêtes supplémentaires pour naviguer entre les deux graphes, ce qui porte le total d'arêtes à 2 \times p + 2 = 2(p+1) ; ce mécanisme est illustré dans la figure ci-contre avec un cycle de longueur 6, et permet de prouver que les cycles dans un hypercube sont toujours de longueur paire.
  • Nombre chromatique. Un graphe est biparti si et seulement s'il ne contient pas de cycle impair, et il découle donc de la propriété précédente que l'hypercube est biparti. Un graphe biparti est celui pouvant être colorié avec deux couleurs, et ainsi le nombre chromatique de l'hypercube est \chi(Q_n) = 2. Pour voir qu'un graphe est biparti, il suffit de trouver un schéma afin de ranger chaque sommet dans un ensemble G_1 ou G_2, de façon telle que tout sommet d'un ensemble ait comme voisins uniquement des sommets de l'autre ensemble. Dans le cas de l'hypercubeD 2, l'ensemble G_1 peut être constitué des sommets dont l'étiquette a un nombre pair de 1, et G_2 est l'ensemble de sommets dont l'étiquette a un nombre impair de 1. Un sommet étant connecté à tous ceux dont l'étiquette diffère exactement d'un symbole, il en découle que le nombre de 1 des voisins d'un sommet est soit supérieur soit inférieur : ainsi, un sommet pair sera connecté à des sommets impairs, et vice-versa.
  • Planaire. L'hypercube est planaire (c'est-à-dire pouvant se dessiner sur un plan sans croiser deux arêtes) uniquement pour n \le 3. Pour n > 3, plusieurs arêtes vont se croiser mais déterminer le nombre minimum d'arêtes qui vont se croiser est un problème NP-completD 2 ; on sait par exemple qu'il y en a 8 pour Q_4.
  • Eulérien. Un graphe a un chemin eulérien si et seulement si tout sommet est de degré pair. Comme Q_n est n-régulier, il en résulte qu'il n'y a un chemin eulérien que pour n pair.
  • HamiltonienQ_2 étant un cycle, il est aussi un circuit hamiltonien. Pour construire un circuit hamiltonien dans Q_3, on sait qu'il y a un circuit hamiltonien dans le graphe d'origine et dans sa copie : supprimons une arête dans chacun de ces circuits et raccordons les sommets ainsi libérés pour créer un circuit hamiltonien dans l'ensemble. Ce processus est illustré ci-dessous pour Q_3 et Q_4. Le nombre exact de cycles hamiltoniens est donné ci-dessousD 2 pour les premiers hypercubes ; au-delà, l'estimation la plus précise quant au nombre k de circuits hamiltoniens dans Q_n est donnéeD 3 par :
    \left(\frac{n*\log2}{e \log \log n}*(1 - o(1))\right)^{2^n} \le k \le \frac{(2^n)!^{\frac{2^n}{2n}}((n-1)!)^{\frac{2^n}{2(n-1)}}}{2}
    .
H3hamilton.png H4hamilton.png
Nombre de cycles hamiltoniens dans l'hypercubeD 2
nSans compter les cycles isomorphesEn comptant tous les cycles
211
316
491344
5275 065906 545 760
  • Graphe de Hamming. Un graphe de Hamming H(d,q) est le graphe obtenu par produit cartésien de d graphes complets K_q. L'hypercube Q_d étant obtenu par produit cartésien de dcopies de K_2, il découle de la définition que tout hypercube Q_d est isomorphe à H(d,2). Une définition alternative d'un graphe de Hamming montre le rapport direct avec celle utilisée pour introduire l'hypercube : H(d,q) est le graphe dont les sommets sont S^d, l'ensemble des mots de longueur d sur un alphabet S, où |S|=q. Deux sommets sont adjacents dans H(d,q) s'ils sont à une distance de Hamming de 1, c'est-à-dire si leurs étiquettes ne diffèrent que d'un symbole.
  • Distance-régulier. Un hypercube est un graphe distance-régulierB 1 et son vecteur d'intersection est \{n,n-1,n-2,...,1,1,2,3,...,n\}.
  • Diagramme de Hasse. L'hypercube Q_n est isomorphe au diagramme de Hasse d'une algèbre de Boole à n éléments.
  • Reconnaissance. Étant donné une liste d'adjacence, on peut savoir en temps et espace linéaire si le graphe qu'elle représente est un hypercubeA 2.
  • Code de GrayC 1. Les étiquettes ordonnées des sommets dans un cycle hamiltonien sur Q_n définissent le code de Gray sur n bits. De plus, ce code suit une construction similaire à celle de l'hypercube : les mots de n bits sont déterminés en copiant les mots de n - 1 puis en rajoutant 0 devant l'original, 1 devant la copie, et en inversant les mots de la copie.
  • Distance-unité. L'hypercube est un graphe distance-unité : il peut s'obtenir à partir d'une collection de points du plan euclidien en reliant par une arête toutes les paires de points étant à une distance de 1.

Aspects algébriques[modifier]

Groupe d'automorphisme[modifier]

Le groupe d'automorphisme \Gamma(Q_d) de l'hypercube Q_d est d'ordre 2^dd!. Il est isomorphe au produit en couronne des groupes symétriques S_2 et S_d : S_2 \wr S_dD 4. Le produit en couronne deA et B étant défini comme le produit semi-direct A \wr B = A^B \rtimes B où A^B  est l'ensemble des fonctions de A dans B et où A agit sur A^B par décalage d'indice :
(g.\lambda)(s)= \lambda (g^{-1}s) pour g \in A et \lambda \in A^B.
L'hypercube Q_d est un graphe arc-transitif : son groupe d'automorphisme \Gamma(Q_d) agit transitivement sur l'ensemble de ses arcs. Étant donné deux arêtes e1 = u1v1 et e2 = u2v2 de G, il existe deux automorphismes (f_V,f_E) : Q_n \rightarrow Q_n et (g_V,g_E) : Q_n \rightarrow Q_n tels que f_E(e_1) = e_2g_E(e_1) = e_2, et f_V(u_1)=u_2f_V(v_1)=v_2g_V(u_1) = v_2g_V(v_1) = u_2.
L'hypercube Q_d est donc a fortiori symétrique. Le groupe \Gamma(Q_d) agit donc également transitivement sur l'ensemble de ses sommets et sur l'ensemble de ses arêtes. En d'autres termes, tous les sommets et toutes les arêtes d'un hypercube jouent exactement le même rôle d'un point de vue d'isomorphisme de graphe.
Le graphe hexaédrique (Q_3) est l'unique graphe cubique symétrique à 8 sommetsD 5. Le graphe tesseract (Q_4) est l'unique graphe symétrique régulier de degrés 4 à 16 sommetsA 3.

Graphe de Cayley[modifier]

L'hypercube Q_d est un graphe de Cayley Cay(G, S) avec :
G = \underbrace{{\frac { \mathbb Z} {2 \mathbb Z}} \times {\frac { \mathbb Z} {2 \mathbb Z}} \times ... \times {\frac { \mathbb Z} {2 \mathbb Z}}}_{d\text{ fois}}
S=\{(1,0,0,...,0),(0,1,0,...,0),...,(0,0,...,1,0),(0,0,...,0,1)\}
Cela découle d'une propriété plus générale statuant que tous les graphes de Hamming sont des graphes de CayleyA 4.

Matrice d'adjacence et spectre[modifier]

La matrice d'adjacence A(Q_2) de l'hypercube Q_1 est définie ci-dessous. Par la définition récursive de l'hypercube, pour passer à la dimension supérieure Q_2, on duplique Q_1 et connecte les sommets d'origine à leur équivalent dans la copie.
01
001
110
On obtient ainsi la matrice d'adjacence A(Q_3) ci-dessous :
00011011
000110
011001
101001
110110
Au niveau de la matrice, l'opération passant de Q_1 à Q_2 se comprend comme suit : les entrées \{A_{00-00},A_{00-01},A_{01-00},A_{01-01}\} correspondent à la matrice d'origine, et se trouvent dupliquées en \{A_{10-10},A_{10-11},A_{11-10},A_{11-11}\}. Dans les autres entrées, on connecte chaque sommet à sa copie. Ainsi, la forme générale de la matrice est donnée de la façon suivanteD 6, où I_{2^n-1} représente la matrice identité de dimension 2^n - 1 :
A(Q_n) = \begin{pmatrix}
Q_{n-1} & I_{2^n-1}\\
I_{2^n-1} & Q_{n-1}\\
\end{pmatrix}
Pour comprendre l'évolution du spectre de la matrice en fonction de n, il faut revenir à la définition comme produit cartésien. Le spectre d'un produit cartésien A \square B est \{\alpha_i+\beta_j\}, où \{\alpha_i\}est le spectre de A et \{\beta_j\} le spectre de B ; autrement dit, le spectre est la somme de toutes les paires possiblesA 5. Sachant que le spectre de Q_1 = K_2 est \{+1, -1\}, on en déduit que le spectre de Q_2 est \{+2,0,-2\} : en effet, elles correspondent aux combinaisons 1 + 1 = 21 - 1 = 0-1 -1 = -2. Si l'on passe au stade suivant, soit Q_3, on a d'un côté le spectre \{+2,0,-2\} de Q_2, et de l'autre \{-1,+1\} de K_2 : le résultat du produit cartésien est \{+3,+1,-1,-3\}.
On en déduit par récurrence la formule suivante pour le polynôme caractéristique de la matrice d'adjacence (et donc du graphe):
p_n(x)=\prod_{k=0}^n(x-n+2k)^{\frac{n!}{k!(n-k)!}}. Ce polynôme caractéristique n'admet que des racines entières. Le graphe d'un hypercube est donc un graphe intégral, un graphe dont le spectreest constitué d'entiers.

Chemins et sous-graphes[modifier]

Navigation[modifier]

Pour aller d'un sommet à un autre, on utilise à nouveau le fait que deux sommets sont connectés s'ils diffèrent exactement sur un symbole de leurs étiquettes. Ainsi, un chemin est trouvé en faisant correspondre une à une les coordonnées du sommet de destination avec celui d'origine. Par exemple, pour aller de 0010 à 1011, on obtient 0010 \rightarrow 1010 \rightarrow 1011. Dans le cas général, pour aller de (x_1,x_2,...,x_n) à (y_1,y_2,...,y_n) on obtient :
(x_1,x_2,...,x_n) \rightarrow (y_1,x_2,...,x_n) \rightarrow (y_1,y_2,x_3,...,x_n) \rightarrow (y_1,y_2,y_3,...,y_n)
Notons deux choses. Premièrement, la longueur d'un chemin entre deux sommets est le nombre de symboles sur lesquels leurs étiquettes diffèrent : ainsi, si les étiquettes sont complètement différentes, le chemin sera de longueur n, ce qui est une autre explication quant au diamètre du graphe. Deuxièmement, le chemin choisi n'est pas unique : au lieu d'aller de 0010 en 1010, on aurait tout d'abord pu passer par 0011 avant d'aller en 1011. Le nombre de chemins différents pour aller entre deux sommets est un problème de combinatoire : considérons que les sommets diffèrent sur k symboles, combien de façons a-t-on de générer des chemins ? On a k choix pour le premier symbole à changer, puis k-1 choix pour le second symbole à changer, jusqu'à un seul choix quand il n'y a plus qu'un symbole à changer ; ainsi, le nombre de chemins entre deux sommets différant sur k symboles est k!.

Hypercubes induits[modifier]

Les chemins entre deux sommets ont d'autres propriétés intéressantes, particulièrement pour les sous-graphes qu'ils définissent. Ainsi, l'union des chemins entre deux sommets distants de k(i.e. différant de k symboles) donneA 2 l'hypercube Q_k. Ceci est illustré par l'exemple ci-dessous : dans le cas de deux sommets voisins u et v, il n'y a qu'un chemin et on obtient l'hypercube Q_1 ; dans le cas où ils sont à distance 2, il y a deux chemins entre eux qui définissent Q_2, et s'ils sont à distance 3 alors l'union des chemins représente l'ensemble de l'hypercube Q_3.
L'union des chemins entre des sommets à distance  défini .
Le nombre \alpha_d d'hypercubes Q_d compris dans Q_n est donné par la formule suivanteD 7 :
\alpha_d(Q_n) = \binom{n}{d} \times 2^{n-d}
L'hypercube est aussi un graphe médian, et en particulier le seul graphe médian régulier. On peut donc appliquer la formule suivante des graphes médiansD 7 :
\sum_{k \ge 0} (-1)^k \times \alpha_k(Q_n) = 1

Spanners[modifier]

Certains types de sous-graphe sont particulièrement utiles en termes de communications. Par exemple, un spanner est un sous-graphe couvrant, c'est-à-dire qui contient tous les sommets, mais qui contient moins d'arêtes. Contenir moins d'arêtes peut augmenter les distances entre des sommets du graphe, et l'on distingue ainsi les spanners multiplicatifs, où la distance peut être multipliée par un facteur k, des spanners additifs où la distance peut être augmentée d'un montant k. Dans le cas d'un spanneur additif sur Q_n, des résultatsD 8 concernent les degrés du spanneur :
  1. si k \ge 2 et n \le 21, alors le plus petit degré maximal \Delta(k,n) est e^{-2k}*\frac{n}{\ln n} \le \Delta(k,n) \le 20*\frac{n \ln \ln n}{\ln n}.
  2. si k \ge 4 et n est grand, il existe un spanneur de degré moyen au plus 2 + 2^{4-\frac{k}{2}} + o(1).

Pour avoir un spanner 2-additif de Q_3 on sélectionne les arêtes satisfaisant une des trois conditions.
De nombreuses études sur les spanners, et des constructions pour des modèles généralisés de l'hypercube, sont dues à Arthur L. Liestman et Thomas C. ShermerB 2. Ils ont en particulier proposé un spanner additif avec un montant 2 où les arêtes sont celles dont les extrémités u, v \in V sont données par les trois conditions suivantes :
  1. u = (0, x_2, ..., x_i, ..., x_n), v = (0, x_2, ..., \bar{x_i}, ..., x_n), \forall \text{ i pair}
  2. u = (1, x_2, ..., x_i, ..., x_n), v = (1, x_2, ..., \bar{x_i}, ..., x_n), \forall \text{ i } > 1 \text{ impair}
  3. u = (0, x_2, ..., x_n), v = (1, x_2, ..., x_n)
Ce processus est illustré dans l'image ci-contre où les arêtes satisfaisant une des conditions sont surlignées ; l'ensemble de ces arêtes constitue le spanner. Pour obtenir un chemin entre deux sommets, considérons que l'on démarre d'un sommet (0, x_2, ..., x_n). On inverse d'abord ses coordonnées paires, car la condition (1) impose l'existence d'une arête sur tout sommet commençant par 0 avec une différence sur bit pair. On change ensuite la première coordonnée en 1 grâce à la condition (3), à partir de quoi on peut inverser toutes les coordonnées impaires par la condition (2). Si le sommet de destination est (1, y_2, ..., y_n) alors on est arrivé car on commence par 1 et les coordonnées paires comme impaires ont pu être inversé ; si le sommet de destination est (0, y_2, ..., y_n) on utilise une dernière inversion par la condition (3). Le cas où le sommet d'origine est (1, x_2, ..., x_n) est traité de façon similaire : inverser les coordonnées impaires, passer la première coordonnée en 0, inverser les coordonnées paires, passer la première coordonnée en 1 si nécessaire. Dans l'image ci-contre, on voit le délai de 2 si on cherche un chemin de 001 à 000 : ce qui se ferait normalement directement en une étape doit se faire en trois étapes, en passant par 101 et 100.

Diffusions[modifier]

Dans le problème de la diffusion (anglais broadcast), un nœud source souhaite diffuser une information à tous les autres nœuds. Dans le modèle classique, à chaque étape un nœud donné peut transmettre au plus une information, cette information utilisant une arête et étant transmise à la fin de l'étape. Dans ce modèle, la diffusion la plus performante est celle où, à chaque étape, chaque nœud en contacte un autre, c'est-à-dire que le nombre de nœuds contactés est doublé. Le nombre d'étapes minimal est donc \log_2 n ; un graphe pouvant finir une diffusion en \log_2 nétapes quelle que soit l'origine et en minimisant le nombre d'arêtes est un graphe de diffusion minimale (anglais minimal broadcast graph). Dans le cas où n = 2^k, le nœud source doit avoir au moins k voisins car il doit diffuser à chaque étape pour faire doubler le nombre de voisins ; la source n'étant pas fixée, on obtient que chaque nœud doit avoir au moins k voisins d'où \frac{1}{2}(n*2^k) = k*2^{k-1} arêtes (\frac{1}{2} vient du partage de chaque arête dans un graphe non-orienté), ce qui est précisément le cas d'un hypercube. Ainsi, l'hypercube est un graphe de diffusion minimale.
Parmi les problèmes proches se trouve le commérage (anglais gossip) où chaque nœud veut échanger une information avec tous les autres, autrement dit chaque nœud est la source d'une diffusion. Des cas particuliers s'intéressent aux variantes locales : par exemple, dans un commérage 'local', chaque nœud veut apprendre les messages de ses voisinsD 9.

Utilisations[modifier]

Architectures de machines parallèles[modifier]


L'addition de 8 nombres en séquentiel (haut) et en parallèle (bas). Les étapes sont numérotées en rouge.
Pour avoir une idée du gain en performances en utilisant des machines parallèles, considérons l'addition de N nombres. Sur une machine séquentielle, on additionne le premier nombre avec le second, puis on rajoute le troisième, etc., Au total, N-1 étapes sont nécessaires. Sur une machine parallèle, chaque processeur réalise l'addition d'une paire de nombres en une étape, puis les résultats de deux paires sont additionnés, etc. Au total, 1 + \log_2Nétapes sont nécessaires. Ainsi, pour 1 000 nombres, une machine séquentielle utilisera 999 étapes tandis qu'il n'en faut que 11 sur une machine parallèle ; un autre exemple est illustré ci-contre. Le gain est encore plus significatif pour d'autres opérations, par exemple une instance d'inversion de matrice peut nécessiter 40 000 étapes sur une machine séquentielle contre 61 sur une machine parallèleD 10.
Au début des années 1960, des idées furent proposées pour concevoir un ordinateur parallèle avec une architecture en hypercube : « il y a 2^n modules, chacun connecté directement à n autres ; en particulier, chaque module est placé sur le sommet d'un cube n-dimension, et les arêtes de ce cubes sont les câbles »D 10. Les justifications dans le choix de l'hypercube peuvent paraître faible au regard des connaissances actuelles sur les familles de graphes, mais il s'avère que l'hypercube a de nombreuses propriétés utiles : il est arc-transitif et distance-transitif (en), ce qui implique que toutes ses arêtes jouent le même rôle et que tous ses sommets ont les mêmes propriétés de distance. Par ailleurs, le compromis entre le degré des sommets et la distance entre eux reste raisonnable, et la navigation peut se faire de façon délocalisée, ce qui est une des principales raisons citées à l'origine. En résumé, les propriétés de transitivité permettent d'obtenir une égalité entre les processeurs, et la communication entre les processeurs peut-être rapide (distance faible) en ayant besoin de peu d'informations (délocalisé).
Vingt ans se sont écoulés entre les idées du début des années 1960 et la première production, avec le Cosmic CubeD 11 de Caltech (64 processeurs Intel 8086/86 embarquant chacun 128Kb de mémoire) en 1983. De nombreuses autres machines sont alors produites, comme les Ametek série 2010, lesConnection Machine (en)D 12 CM-1/CM-2, les nCUBE (en) et les iPSC d'Intel. De nombreuses études sur les performances des machines parallèles utilisant une architecture en hypercube sont réalisées au laboratoire national d'Oak Ridge sous le contrat DE-AC05-84OR21400D 13. En effet, ce laboratoire créé à l'origine pour le Projet Manhattan (conception de la première bombe atomique) s'est reconverti sur des sujets tels que la sécurité nationale et lessupercalculateurs. Parmi les modèles étudiés figurent les Intel iPSC/860, iPSC/1 et iPSC/2, ainsi que les nCUBE 3200 et 6400 ; les caractéristiques de ces machines sont résumées ci-dessous.
Configurations de supercalculateurs avec architectures en hypercubeD 13
iPSC/860iPSC/2iPSC/1N6400N3200
Nombre de nœuds12864 (max 128)64 (max 128)64 (max 8192)64 (max 1024)
Processeur du nœudIntel i860Intel 80286/387Intel 80386/28764-bit32-bit
Fréquence d'horloge40 MHz16 MHz8 MHz20 MHz8 MHz
Mémoire par nœud8M4M (max 16M)512K (max 4.5M)4M (max 64M)512K
Débit nominal22 Mb/s22 Mb/s10 Mb/s20 Mb/s8 Mb/s
Système d'exploitationNX V3.2XENIXXENIXVertex v2.0Vertex 2.3
Les performances précises de ces processeurs peuvent être trouvées dans les rapports d'Oak Ridge. Au niveau de l'analyse des performances pour la communication, il est préférable d'utiliser un modèle à coût linéaire plutôt qu'à coût constant. Autrement dit, on ne peut pas considérer qu'envoyer un message m ait un coût en temps fixe C(m) = k quelle que soit la longueur du message : on considère plutôt que le coût en temps est fonction de la longueur du message, et qu'initier la transmission a également un coût \alpha, ce qui entraîne le modèle C(m) = \alpha + \beta*|m|. Le coût \alpha est significatif par rapport à \beta : cela prend par exemple prend 697µs pour établir la communication dans un iPSC/2, mais seulement 0.4µs pour chaque bit transmit.

Algorithmes parallèles[modifier]

Répartir les données sur un hypercube[modifier]

Division de données sur un hypercube

On souhaite appliquer un filtre sur une image.
Play Pause Stop Précédent Suivant 
De nombreuses informations sur les algorithmes pour des architectures en hypercubes à la fin des années 80 furent publiées dans la troisième conférenceHypercube Concurrent Computers and ApplicationsA 6 (« Ordinateurs concurrents en hypercube et applications »). Utiliser une machine parallèle n'augmente pas automatiquement la performance d'un algorithme : non seulement les algorithmes doivent être conçus de façon à tirer profit de l'architecture, mais les données ne peuvent pas toujours être partitionnées pour être traitées par différents processeurs, et ces processeurs ont également besoin de communiquer. Dans l'exemple de l'addition, le coût de communication était considéré comme négligeable, et ceci est l'hypothèse que nous conserverons par la suite : en effet, les propriétés de la machine (temps de communication, lecture/écriture, ...) sont généralement ignorés dans l'analyse des algorithmes, et on se concentre sur les dépendances entre les données et les façons de rendre le calcul parallèle sur un hypercube.
Une des opérations les plus courantes en traitement d'image consiste à utiliser un filtre linéaire, c'est-à-dire à appliquer une matrice de convolution. Pour bénéficier de l'architecture en hypercube, l'image doit être divisée en zones égales, et chaque zone assignée à un processeur. Mudge et Abdel-Rahman ont suggéré de considérer l'image comme étant une table de Karnaugh utilisant le code de GrayD 14, ainsi que sur l'exemple ci-contre : si on considère une zone de l'image et ses coordonnées dans la table, alors on obtient directement le processeur auquel l'assigner. Par ailleurs, l'utilisation du code de Gray conserve l'adjacence : deux zones adjacentes dans l'image seront placées sur deux processeurs adjacents, sauf pour les coins. Le filtre, tel que celui de Sobel, est appliqué par chaque processeur à la zone qui lui est assigné. Si le filtre a besoin de certains pixels dépassant la zone disponible à un processeur, il peut la demander au processeur voisin en utilisant les propriétés d'adjacence ; pour des coûts plus faibles en communication, chaque processeur peut également avoir une zone de l'image dont la taille correspond à celle nécessaire pour le traitement plutôt qu'à une partition stricte.

Réutilisation d'algorithmes par plongements[modifier]

Un plongement permet à ce qu'un réseau soit simulé par un autre : aux sommets du réseau d'origine sont associés des sommets dans le réseau simulant, et deux sommets voisins sont séparés par un chemin. Ainsi, un algorithme conçu spécialement pour un réseau peut être réutilisé dans un autre grâce à un plongement. On s'intéresse donc à deux cas : réutiliser des algorithmes sur des hypercubes (1), ou utiliser des algorithmes pour l'hypercube dans d'autres réseaux (2). Autrement dit, l'hypercube est soit un réseau simulant (1), soit un réseau simulé (2). La qualité d'un plongement permet de savoir quelles sont les différentes pertes en performance de l'algorithme. Pour cela, on considère plusieurs facteursC 2 :
  • Congestion. Elle donne le ralentissement si plusieurs arrêtes du réseau simulé sont utilisées simultanément : elle mesure le nombre d'arêtes du réseau simulé qui sont associées à une seule arête dans le réseau simulant, et ainsi une congestion de 2 indique que le réseau simulant aura besoin de 2 étapes pour transporter les messages que le réseau simulé pouvait avoir en une étape.
  • Dilatation. Elle peut-être considérée comme le ralentissement des communications : elle mesure l'augmentation de la distance entre deux sommets dans le réseau simulant par rapport au simulé, et ainsi une dilatation de 2 signifie que toute communication qui se faisait en une étape en prendra maintenant 2.
  • Charge. Elle indique le ralentissement pour le calcul sur un processeur : elle donne le nombre de sommets du réseau simulé associés à un seul sommet dans le réseau simulant
Pour l'hypercube comme réseau simulant, toute grille à deux dimensions a un plongementC 1 avec une dilatation d'au plus 2 et une expansion minimale, une grille à trois dimensions a une dilatation entre 2 et 5, et l'arbre binaire complet à 2^n - 1 nœuds a un plongement de dilatation 1 sur Q_{n+1}.

Parallélisme automatique[modifier]

Si un programme utilise plusieurs tâches et que l'on a des informations sur la façon dont ces tâches communiquent, alors il peut être possible de faire bénéficier le programme d'une machine parallèle. En effet, la structure de la communication des tâches définit un graphe, et celui-ci peut être simulé entre autres par un hypercube en cherchant un plongement, tel qu'étudié dans la section précédente. Dans l'autre cas extrême, si toute tâche communique fréquemment avec toutes les autres, alors les communications sont données par un graphe complet et la simulation par une machine parallèle est peu performante. Des solutions intermédiaires ont été développées s'il n'y a pas d'informations sur la communication des tâches mais qu'elle se fait à fréquence modéréeD 15.

Variantes[modifier]

L'hypercube était très utilisé pour les architectures de machines parallèles, et certaines de ses propriétés étaient jugées perfectibles dans ce cadre. Le principal problème est la croissance d'un hypercube, où le nombre de sommets doit doubler d'une dimension à l'autre : dans une machine, plus de flexibilité est désirable afin de pouvoir ajouter quelques processeurs. Plusieurs aspects sont aussi liés à sa réalisation par des circuits électroniques. Premièrement, l'hypercube n'est pas planaire et aura donc des chevauchements dans le circuit : en réduire le nombre simplifie le circuit. Deuxièmement, l'hypercube est défini comme un graphe non-orienté, mais « un réseau basé sur une orientation \vec{G} de G utilise la moitié du nombre de broches et câbles par rapport à G »D 16 : il est donc intéressant de trouver une orientation conservant des performances similaires. Enfin, il peut être désirable de réduire les distances dans l'hypercube pour les performances en termes de communications.

L'hypercube comme bloc de base[modifier]


HCN(2,2) formé de 2^2 = 4 hypercubes Q_2, chacun constituant un cluster dont le numéro est encadré.
Un hierarchical cubic networkD 17 HCN_{n,n} est formé de 2^n n-cubes, où chaque cube est désigné comme un cluster. Chacun de ces clusters est utilisé comme un bloc de base, et chaque nœud d'un cluster a un lien supplémentaire le reliant à un autre cluster ; ces liens sont déterminés par l'algorithme suivante pour le graphe G = (V, E) composé de 2^n n-cubes, où (I, J) désigne le sommet J du cluster I et \bar{i} est le complément bit à bit de i :
\begin{array}{crl} \rm \text{pour } i = 0..2^n-1 & \rm & \rm \\ & \text{pour } j = 0..2^n-1 & \\ & & \text{si } i \neq j, E(G) \leftarrow E(G) \uplus \{e_{ij},e_{ji}\} \\ & & \text{sinon}, E(G) \leftarrow E(G) \uplus \{e_{i \bar{i} }, e_{j \bar{j} }\} \end{array}
Les auteurs montrèrent que, à tailles égales, ce graphe a un diamètre d'un quart plus faible que celui de l'hypercube, et la moitié du nombre de liens. Cependant, dans certaines situations la diffusion est plus lente que sur un hypercube, et avoir un graphe moins dense revient à être plus exposé lorsque des pannes surviennent sur les liens.

Cubes de Fibonacci[modifier]

Une autre variante ayant été depuis particulièrement étudiée est le Cube de FibonacciD 18. Les conditions fondamentales du cube de Fibonacci de dimension n, noté FC_n, sont les mêmes que celles de l'hypercube : chaque sommet porte une étiquette de longueur n sur un alphabet A = \{0,1\}, et deux sommets sont adjacents si leurs étiquettes ne différent que d'un symbole. Cependant, on rajoute une contrainte : une étiquette valide ne peut avoir deux 1 consécutif. Ainsi, ci-dessous, on voit que les cubes de Fibonacci FC_1, FC_2, FC_3, FC_4 peuvent se retrouver comme sous-graphes des hypercubes Q_1,Q_2,Q_3,Q_4 en éliminant les étiquettes contenant deux 1 consécutifs.
Les cubes de Fibonacci  comme sous-graphes des hypercubes .
La construction par récurrence D 19 peut-être définie par une grammaire formelle en énonçant les étiquettes valides pour les sommets, puis en considérant le graphe FC_n comme le sous-graphe de l'hypercube Q_n induit par les sommets valides V(FC_n) :
\begin{cases} V_0 = \epsilon \\ V_1 = \{0,1\} \\ V_i = \{0 \alpha | \alpha \in V_{i-1}\} \cup \{10 \alpha | \alpha \in V_{i-2}\}, \forall i > 2 \end{cases}

Hypercubes recâblés[modifier]

Dans le cas où réduire la distance soit le principal objectif, il est courant d'utiliser des procédures de recâblage comme on le voit encore dans le cas de l'effet petit monde. De nombreuses procédures ont été proposées, et les plus significatives sont résumées dans le tableau ci-dessous avec leurs performances sur la distance maximale (i.e. le diamètre) et moyenne ainsi que le nombre de recâblages nécessaire. Le nom de chacune des procédures est conservé à partir des articles d'origines, où twisted signifie recâblé, et suivi de l'année à laquelle la procédure fut publiée.
Listes de variantes de l'hypercube par recâblageD 1. Le temps de routage est toujours en O(n).
NomDiamètreDistance moyenneNombre d'arêtes recâblées
Hypercuben\frac{n}{2}0
Twisted cube (1987)\frac{n+1}{2}\approx \frac{3n}{8}(n-1)2^{n-4}
Twisted hypercube (1991)n - 1\approx \frac{n}{2} - \frac{1}{8}2^{n-1}
Twisted N-cube (1991)n - 1\approx \frac{n}{2}2
Generalized twisted cube (1993)\frac{2n}{3}\approx \frac{11n}{24}n2^{\lfloor n/3 \rfloor}
0-Möbius Cube (1995)\frac{n+2}{2}\approx \frac{n}{3}(n-2)2^{n-1}

Graphe libre d'échelle par contraction[modifier]


L'hypercube Q_2 a été contracté dans Q_4 et deux coordonnées remplacées par « _ ».
Dans les années 2000, de nombreux modèles furent proposés pour prendre en compte des caractéristiques communes à de nombreux réseaux. Deux des principales caractéristiques sont l'effet petit monde et l'effet libre d'échelle. Il est possible de modifier un hypercube afin d'obtenir l'effet libre d'échelle, tout en continuant à bénéficier de sa propriété de routage localC 3. Pour cela, des sommets sont contractés à la condition qu'ils ne diffèrent que sur une coordonnée qui sera remplacé par un joker « _ ». Après une séquence de contractions, c'est-à-dire plusieurs contractions successives, il est toujours possible de trouver un chemin d'un sommet A à un sommet B en utilisant leurs coordonnés et en remplaçant les jokers « _ » par les coordonnées de B.
La condition de ne différer que sur une coordonnée tout en opérant une séquence de contractions conduit à ce qu'un sous-hypercube soit contracté, et le degré du sommet s résultant de la contraction d'un hypercube Q_p dans Q_n1 < p < n est :
d_{q_p}(s) = 2^{p}(n-p)
En résumé, l'effet libre d'échelle est obtenu par contraction de sous-hypercubes de grande taille et les algorithmes de navigation n'ont pas besoin d'être modifiés.

Galerie[modifier]

Références


Musique[modifier]

En musique, le nombre d'or est recherché à la fois dans l'harmonie et dans le rythme.
Le terme d'harmonie désigne ici une technique permettant de choisir les différentes notes jouées simultanément. Durant une période qui s'étend du xvie siècle au début du xxe siècle, elle est essentiellement tonale, à l'image de la musique de Bach ou Mozart. Aucune série de deux notes ne définit une proportion d'or. L'approximation la plus proche étant la sixte mineure obtenue par deux sons dont les fréquences définissent un rapport de 8/5 = 1,6 (la sixte majeure correspondant à un rapport de fréquence de 5/3 = 1,66 est une approximation moins bonne). Pour cette raison, le nombre d'or est souvent recherché dans la musique du xxe siècle. De nouvelles gammes sont explorées, comme la gamme décatonique ou 10-TET104 (ten-ton equal temperament). Dans celle-ci, l'octave est partagée en 10 parties égales. Chaque degré représente alors un écart de 21/10. Pour cette gamme, le nombre d'or est proche du rapport défini par deux notes séparées de 7 degrés. La présence du nombre d'or ici est néanmoins un peu fortuite. Un écart entre 7 degrés donne une proportion de 27/10 approximativement égal à 1,624.
Le rythme est plus largement associé au nombre d'or et sur une période musicale plus vaste. Son traitement par Bach est l'objet d'une thèse de doctorat105, sur l'analogie entre les rythmes de laSuite en do mineur pour luth106 (BWV 997) et la Passion selon saint Matthieu (BWV 244). Roy Howat montre que Debussy était associé à des revues symbolistes auxquelles il participait et qui analysaient les proportions et le nombre d'or. Il montre aussi comment on retrouve cette approche à travers des œuvres comme La Mer ou Reflets dans l'eau107. Des études montrent des résultats analogues pour Erik Satie108Béla Bartók109 ou encore Karlheinz Stockhausen110. Certains compositeurs de musique électro-acoustique ont fabriqué des sons synthétiques dont les fréquences des partiels sont basées sur le nombre d'or111.
À l'exception de compositeurs comme Xenakis où l'usage du nombre d'or est explicité par l'auteur56, l'absence de preuve définitive empêche le consensus112. La polémique est néanmoins de nature différente de celle qui sévit, par exemple en archéologie. Ici la position favorable à l'existence d'un usage large du nombre d'or est défendue par des institutions professionnelles comme l'Ircam110 ou une thèse d'université comme celle de Montréal105.

Esthétique mathématique[modifier]

Une question récurrente est celle de l'existence ou non d'une réalité scientifique de l'idée de beauté associée au nombre d'or. Elle s'inscrit dans le cadre général d'une théorie scientifique de l'esthétique. Certains artistes, comme Xenakis en sont persuadés : « Or, les durées musicales sont créées par des décharges musculaires qui actionnent les membres humains. Il est évident que les mouvements de ces membres ont tendance à se produire en des temps proportionnels aux dimensions de ces nombres. D’où la conséquence : les durées qui sont en rapport du nombre d’or sont plus naturelles pour les mouvements du corps humain56 ». Charles Henry, dans le domaine des arts picturaux, inscrit le nombre d'or dans une vaste théorie de cette nature, traitant non seulement des proportions, mais aussi de la couleur et des contrastes44.
Préfigurant une démarche de nature sociologique comme celle d'Émile Durkheim, le philosophe allemand Gustav Fechner tente des expériences statistiques pour valider scientifiquement une association humaine entre le beau et le rectangle d'or113. Des formes sont présentées à un public qui évalue les proportions les plus esthétiques. Si les résultats vont dans le sens de l'existence d'un canon de beauté construit à l'aide de la divine proportion, le protocole choisi ne correspond pas aux critères actuels de rigueur114. Une deuxième expérience, plus objective114 met en évidence une préférence pour un format proche du 16/9 de la télévision. Une fois encore, et malgré son caractère plus rigoureux, le caractère universel d'un tel format n'est pas établi.
Si l'intuition d'artistes comme Xenakis, Valéry ou Le Corbusier laisse présager l'existence d'une transcendance esthétique du nombre d'or, aucune approche scientifique ne permet aujourd'hui de confirmer cette hypothèse.

Bibliographie[modifier]

  • Marguerite Neveux et H. E. Huntley, Nombre d'or - radiographie d'un mythe, Seuil, coll. « Points / Sciences » (no 108), 1995 (ISBN 978-2-02025916-3).
    Ce livre est la référence sur l'analyse critique de l'usage du nombre d'or dans les différents domaines artistiques.
  • Matila GhykaLe nombre d’or : Rites et rythmes pythagoriciens dans le développement de la civilisation occidentale, Gallimard, 1976 (1re éd. 1931), 456 p. + hors texte 65 p.(ISBN 978-2-07029298-1).
    Cet ouvrage est à l'origine du mythe moderne du nombre d'or. Ce livre a séduit de nombreux penseurs comme Paul Valéry ou Le Corbusier.
  • Le CorbusierLe Modulor : Essai sur une mesure harmonique à l'échelle humaine applicable universellement à l'architecture et à la mécaniqueL'Architecture d'aujourd'huicoll. « Ascoral », 1983 (1re éd. 1949) (ISBN 978-2-90483301-4).
    Ce livre est le premier d'une série de deux avec Modulor 2 – 1955 (La parole est aux usagers). Il explicite et théorise les raisons qui amènent Le Corbusier à utiliser le nombre d'or en architecture.
  • Guy Marchand, Bach ou la Passion selon Jean-Sébastien : De Luther au nombre d'or, L'Harmattan, 2003 (ISBN 978-2-7475-4651-5).
    Ce livre est tiré d'une thèse de doctorat de l'université de Montréal. Il présente une analyse technique des rythmes de la musique de Bach et particulièrement de la Passion selon saint Matthieu à l'aide du nombre d'or.
  • (en) Roger Herz-Fischler, A Mathematical History of the Golden Number, Dover, 1998 (ISBN 978-0-48640007-5)
  • La théorie des graphes est une théorie informatique et mathématique. Les algorithmes élaborés pour résoudre des problèmes concernant les objets de cette théorie ont de nombreuses applications dans tous les domaines liés à la notion de réseau (réseau socialréseau informatiquetélécommunications, etc.) et dans bien d'autres domaines (par exemple génétique) tant le concept de graphe, à peu près équivalent à celui de relation binaire (à ne pas confondre donc avec graphe d'une fonction), est général. De grands théorèmes difficiles, comme le théorème des quatre couleurs et le théorème des graphes parfaits, ont contribué à asseoir cette matière auprès des mathématiciens, et les questions qu'elle laisse ouvertes, comme la conjecture d'Hadwiger, en font une branche vivace des mathématiques discrètes.

    Sommaire

      [masquer

    Définition de graphe et vocabulaire[modifier]

    Article détaillé : Lexique de la théorie des graphes.
    Un graphe est un ensemble de points, dont certaines paires sont directement reliées par un (ou plusieurs) lien(s). Ces liens peuvent être orientés, c'est-à-dire qu'un lien entre deux points u et vrelie soit u vers v, soit v vers u : dans ce cas, le graphe est dit orienté. Sinon, les liens sont symétriques, et le graphe est non orienté.
    Dans la littérature récente de la théorie des graphes, les points sont appelés les sommets (en référence aux polyèdres) ou les nœuds (en références à la loi des nœuds). Les liens sont appelésarêtes dans les graphes non orientés et arcs dans un graphe orienté.
    L'ensemble des sommets est le plus souvent noté V, tandis que E désigne l'ensemble des arêtes. Dans le cas général, un graphe peut avoir des arêtes multiples, c'est-à-dire que plusieurs arêtes différentes relient la même paire de points. De plus, un lien peut être une boucle, c'est-à-dire ne relier qu'un point à lui-même. Un graphe est simple s'il n'a ni liens multiples ni boucles, il peut alors être défini simplement par un couple G = (V, E), où E est un ensemble de paires d'éléments de V. Dans le cas d'un graphe simple orienté, E est un ensemble de couplesd'éléments de V. Notons qu'un graphe sans arête multiple peut être représenté par une relation binaire, qui est symétrique si le graphe est non orienté.
    Pour définir un graphe général, il faut une fonction d'incidence \gamma qui associe à chaque arête une paire de sommets (ou un couple en cas orienté). Ainsi, un graphe est un triplet G=(V,E,\gamma) avec \gamma : E \rightarrow V \times V. Toutefois l'usage veut que l'on note simplement G=(V,E), sachant que ce n'est parfaitement rigoureux que pour les graphes simples.

    Origines[modifier]

    Un article du mathématicien suisse Leonhard Euler, présenté à l'Académie de Saint Pétersbourg en 1735 puis publié en 1741, traitait du problème des sept ponts de KönigsbergO 1, ainsi que schématisé ci-dessous. Le problème consistait à trouver une promenade à partir d'un point donné qui fasse revenir à ce point en passant une fois et une seule par chacun des sept ponts de la ville de Königsberg. Un chemin passant par toute arête exactement une fois fut nommé chemin eulérien, ou circuit eulérien s'il finit là où il a commencé. Par extension, un graphe admettant un circuit eulérien est dit graphe eulérien, ce qui constitue donc le premier cas de propriété d'un graphe. Euler avait formulé1 qu'un graphe n'est eulérien que si chaque sommet a un nombre pair d'arêtes. L'usage est de s'y référer comme théorème d'Euler, bien que la preuve n'y ait été apportée que 130 ans plus tard par le mathématicien allemand Carl HierholzerO 2. Un problème similaire consiste à passer par chaque sommet exactement une fois, et fut d'abord résolu avec le cas particulier d'un cavalier devant visiter chaque case d'un échiquier par le théoricien d'échec arabe Al-Adli dans son ouvrage Kitab ash-shatranj paru vers 840 et perdu depuisO 3. Ce problème du cavalier fut étudié plus en détails au xviiie siècle par les mathématiciens français Alexandre-Théophile VandermondeO 4Pierre Rémond de Montmort et Abraham de Moivre; le mathématicien britannique Thomas Kirkman (en) étudia le problème plus général du parcours où on ne peut passer par un sommet qu'une fois, mais un tel parcours prit finalement le nom de chemin hamiltonien d'après le mathématicien irlandais William Rowan Hamilton, et bien que ce dernier n'en ait étudié qu'un cas particulierO 5. On accorde donc à Euler l'origine de la théorie des graphes parce qu'il fut le premier à proposer un traitement mathématique de la question, suivi par Vandermonde.

    Konigsberg bridges.png → 7 bridges.svg → Konigsburg graph.svg

    Liste des arbres à 2, 3 et 4 sommets.
    Au milieu du xixe siècle, le mathématicien britannique Arthur Cayley s'intéressa aux arbres, qui sont un type particulier de graphe n'ayant pas de cycle,i.e. dans lequel il est impossible de revenir à un point de départ sans faire le chemin inverse. En particulier, il étudia le nombre d'arbres à n sommetsO 6et montra qu'il en existe n^{n-2}. Ceci constitua « une des plus belles formules en combinatoire énumérative »O 7, domaine consistant à compter le nombre d'éléments dans un ensemble fini, et ouvrit aussi la voie à l'énumération de graphes ayant certaines propriétés. Ce champ de recherche fut véritablement initié par le mathématicien hongrois George Pólya, qui publia en 1937 le théorème de dénombrement qui porte son nom, et le mathématicien hollandais Nicolaas Govert de Bruijn. Les travaux de Cayley, tout comme ceux de Polya, présentaient des applications à la chimie et le mathématicien anglais James Joseph Sylvester, co-auteur de Cayley, introduisit en 1878 le terme de "graphe" basé sur la chimie :
    « Il peut ne pas être entièrement sans intérêt pour les lecteurs de Nature d'être au courant d'une analogie qui m'a récemment fortement impressionné entre des branches de la connaissance humaine apparemment aussi dissemblables que la chimie et l'algèbre moderne. […] Chaque invariant et covariant devient donc exprimable par un graphe précisément identique à un diagramme Kékuléan ou chemicographO 8. »

    Équivalence entre les régions d'une carte et un graphe pour le théorème des quatre couleurs.
    Un des problèmes les plus connus de théorie des graphes vient de la coloration de graphe, où le but est de déterminer combien de couleurs différentes suffisent pour colorer entièrement un graphe de telle façon qu'aucun sommet n'ait la même couleur que ses voisins. En 1852, le mathématicien sud-africain Francis Guthrie énonça le problème des quatre couleurs par une discussion à son frère, qui demandera à son professeur Auguste De Morgan si toute carte peut être coloriée avec quatre couleurs de façon à ce que des pays voisins aient des couleurs différentes. De Morgan envoya d'abord une lettre au mathématicien irlandais William Rowan Hamilton, qui n'était pas intéressé, puis le mathématicien anglais Alfred Kempe publia une preuve erronéeO 9 dans l’American Journal of Mathematics, qui venait d'être fondé par Sylvester. L'étude de ce problème entraîna de nombreux développements en théorie des graphes, par Peter Guthrie TaitPercy John HeawoodFrank Ramsey et Hugo Hadwiger.
    Les problèmes de factorisation de graphe émergèrent ainsi à la fin du xixe siècle en s'intéressant aux sous-graphes couvrants, c'est-à-dire aux graphes contenant tous les sommets mais seulement une partie des arêtes. Un sous-graphe couvrant est appelé un k-facteur si chacun de ses sommets a karêtes et les premiers théorèmes furent donnés par Julius PetersenO 10 ; par exemple, il montra qu'un graphe peut être séparé en 2-facteurs si et seulement si tous les sommets ont un nombre pair d'arêtes (mais il fallut attendre 50 ans pour que Bäbler traite le cas impairO 11). Les travaux de Ramsey sur la coloration, et en particulier les résultats du mathématicien hongrois Pal Turan, permirent le développement de la théorie des graphes extrémaux s'intéressant aux graphes atteignant le maximum d'une quantité particulière (par exemple le nombre d'arêtes) avec des contraintes donnéesO 12, telles que l'absence de certains sous-graphes.
    Dans la seconde moitié du xxe siècle, le mathématicien français Claude Berge contribue au développement de la théorie des graphes par ses contributions sur les graphes parfaitsO 13 et l'introduction du terme d’hypergraphe (suite à la remarque de Jean-Marie Pla l'ayant utilisé dans un séminaire) avec un monographeO 14 sur le sujet. Son ouvrage d'introduction à la théorie des graphesO 15 proposa également une alternative originale, consistant plus en une promenade personnelle qu'une description complète. Il marquera également la recherche française en ce domaine, par la création conjointe avec Marcel-Paul Schützenberger d'un séminaire hebdomadaire à l'Institut Henri Poincaré, des réunions le lundi à la Maison des Sciences de l'Homme, et la direction de l'équipe Combinatoire de Paris.

    Flots dans les réseaux[modifier]


    Représentation du flot dans un graphe, indiquant pour chaque arête le flot a qui la traverse et sa capacité maximale b, sous la forme a/b.

    Coupe dans un graphe, avec la source set le puits t'.

    Exemple d'application des flots réseaux pour le mouvement d'un fluide dans un réseau hydraulique.
    Les Allemands Franz Ernst Neumann et Jacobi, respectivement physicien et mathématicien, fondèrent en 1834 une série de séminaires. Le physicien allemand Gustav Kirchhoff était un des étudiants participant au séminaire entre 1843 et 1846, et il étendit le travail de Georg Ohm pour établir en 1845 les Lois de Kirchhoff exprimant la conservation de l'énergie et de la charge dans un circuit électrique. En particulier, sa loi des nœuds stipule que la somme des intensités des courants entrant dans un nœud est égale à celle qui en sort. Un circuit électrique peut se voir comme un graphe, dans lequel les sommets sont les nœuds du circuit, et les arêtes correspondent aux connexions physiques entre ces nœuds. Pour modéliser les courants traversant le circuit, on considère que chaque arête peut être traversée par un flot. Ceci offre de nombreuses analogies, par exemple à l'écoulement d'un liquide comme l'eau à travers un réseau de canauxFlot 1, ou la circulation dans un réseau routier. Comme stipulé par la loi des nœuds, le flot à un sommet est conservé, ou identique à l'entrée comme à la sortie ; par exemple, l'eau qui entre dans un canal ne disparaît pas et le canal n'en fabrique pas, donc il y a autant d'eau en sortie qu'en entrée. De plus, une arête a une limite de capacité, tout comme un canal peut transporter une certaine quantité maximale d'eau. Si l'on ajoute que le flot démarre à un certain sommet (la source) et qu'il se termine à un autre (le puits), on obtient alors les principes fondamentaux de l'étude des flots dans un graphe.
    Si on considère que la source est un champ pétrolifère et que le puits est la raffinerie où on l'écoule, alors on souhaite régler les vannes de façon à avoir le meilleur débit possible de la source vers le puits. En d'autres mots, on cherche à avoir une utilisation aussi efficace que possible de la capacité de chacune des arêtes, ce qui est le problème de flot maximum. Supposons que l'on « coupe » le graphe en deux parties, telle que la source est dans l'une et le puits est dans l'autre. Chaque flot doit passer entre les deux parties, et est donc limité par la capacité maximale qu'une partie peut envoyer à l'autre. Trouver la coupe avec la plus petite capacité indique donc l'endroit où le réseau est le plus limité, ce qui revient à établir le flot maximal qui peut le traverserFlot 2. Ce théorème est appelé flot-max/coupe-min et fut établi en 1956.
    L’étude des flots réseaux se généralise de plusieurs façons. La recherche d'un maximum, ici dans le cas du flot, est un problème d'optimisation, qui est la branche des mathématiques consistant à optimiser (i.e. trouver un minimum ou maximum) une fonction sous certaines contraintes. Un flot réseau est soumis à trois contraintesFlot 3 : la limite de capacité sur chaque arête, la création d'un flot non nul entre la source et le puits (i.e. la source crée un flot), et l'égalité du flot en entrée/sortie pour tout sommet autre que la source et les puits (i.e. ils ne consomment ni ne génèrent une partie du flot). Ces contraintes étant linéaires, le problème d'un flot réseau fait partie de l'optimisation linéaire. Il est également possible de rajouter d'autres variables au problème pour prendre en compte davantage de situations : on peut ainsi avoir plusieurs sources et puits (en), une capacité minimale (en) sur chaque arête, un coût lorsqu'on utilise une arête (en), ou une amplification du flot (en) passant par une arête.

    Introduction de probabilités[modifier]


    Schéma d'une transition de phase, ayant l'allure typique rencontrée dans le cas d'un graphe aléatoire.
    Jusqu'au milieu du xxe siècle, l'algorithme construisant un graphe n'avait rien d'aléatoire : tant que les paramètres fournis à l'algorithme ne changeaient pas, alors le graphe qu'il construisait était toujours le même. Une certaine dose d'aléatoire fut alors introduite, et les algorithmes devinrent ainsiprobabilistes. Le mathématicien d'origine russe Anatol Rapoport eut d'abord cette idée en 1957Proba 1 mais elle fut proposée indépendamment deux ans après, de façon plus formelle, par les mathématiciens hongrois Paul Erdős et Alfréd RényiProba 2. Ceux-ci se demandèrent à quoi ressemble un graphe « typique » avec n sommets et m arêtes. Ils souhaitaient ainsi savoir quelles propriétés pouvaient être trouvées avec n sommets, et m arêtes créées au hasard. Une quantité fixe m n'étant pas pratique pour répondre à cette questionProba 3, il fut décidé que chaque arête existerait avec une probabilité p. Ceci fut le début de la théorie des graphes aléatoires, où l'on considère un nombre de sommets n assez grand, et l'on s'intéresse à la probabilité psuffisante pour que le graphe ait une certaine propriété.

    Abstraction d'une pierre par une grille de 50 x 50. Seuls les canaux sont représentés.
    Exemples de graphes aléatoires

    20 sommets et probabilité 0.1
    Play Pause Stop Précédent Suivant 

    La distribution du degré donne la quantité de sommets par nombre de connexions (par exemple, il y a 30 sommets ayant 25 voisins, où 30 est en ordonnée et25 en abscisse). Le graphe aléatoire d'Erdős et Rényi engendre une distribution normale.
    Erdős et Rényi découvrirent que le graphe n'évoluait pas de façon linéaire mais qu'il y avait au contraire une probabilité critique p après laquelle il changeait de façon radicale. Ce comportement est bien connu en physique : si l'on observe un verre d'eau que l'on met dans un congélateur, il ne se change pas progressivement en glace mais plutôt brutalement lorsque la température passe en dessous de 0 °C. L'eau avait deux phases (liquide et glace) et passe de l'une à l'autre par un phénomène nommé transition de phase, la transition étant rapide autour d'un point critique qui est dans ce cas la température de 0 °C. Pour nombre de propriétés observées, les graphes aléatoires fonctionnent de la même manièreProba 4 : il existe une probabilité critique p_c en dessous de laquelle ils se trouvent dans une phase sous-critique, et au-dessus de laquelle ils passent en phase sur-critique. Dans le cas d'un graphe aléatoire, la probabilité que l'on observe la propriété nous intéressant est faible en phase sous-critique mais devient très forte (i. e.quasi-certitude) en phase sur-critique ; le tracé de la probabilité d'avoir la propriété en fonction de p a donc une allure bien particulière, simplifiée dans le schéma à droite.
    Au-delà du vocabulaire commun des phases, la théorie des graphes aléatoires se retrouve en physique statistique sous la forme de la théorie de la percolationProba 5. Cette dernière visait à l'origine à étudier l'écoulement d'un fluide à travers un matériau poreux. Par exemple, si l'on immerge une pierre ponce dans un seau rempli d'eauProba 6, on s'intéresse à la façon dont l'eau va s'écouler dans la pierre. Pour modéliser ce problème, on se concentre sur les paramètres importants : l'âge ou la couleur de la pierre n'importe pas, tandis que les ouvertures ou 'canaux' dans lesquels peut circuler l'eau sont primordiaux. L'abstraction la plus simple est de voir une pierre comme une grille, où chaque canal existe avec une probabilité p. On retrouve ainsi le modèle du graphe aléatoire, mais avec une contrainte spatiale : un arc ne peut exister entre deux sommets que s'ils sont voisins dans la grille. Cependant, cette contrainte peut être levée pour établir une équivalence entre la théorie des graphes et celle de la percolation. Tout d'abord, un graphe de n sommets peut être représenté par une grille avec n dimensions ; puisqu'on s'intéresse au cas où n est assez grand, c'est-à-dire n \rightarrow \infty, ceci établit une équivalence avec la percolation en dimension infinie. De plus, il existe une dimension critique d_c telle que le résultat ne dépend plus de la dimension dès que celle-ci atteint d_c ; on pense que cette dimension critique est 6, mais elle n'a pu être prouvéeProba 7 que pour 19.
    De nombreux modèles ont été proposés depuis le début des années 2000 pour retrouver des phénomènes observés dans des graphes tels que celui représentant les connexions entre des acteurs de Hollywood (obtenu par IMDb) ou des parties du Web. En 1999, Albert-László Barabási et Réka Albert expliquèrent qu'un de ces phénomènes « est une conséquence de deux mécanismes : le réseau grandit continuellement avec l'ajout de nouveaux sommets, et les nouveaux sommets s'attachent avec certaines préférences à d'autres qui sont déjà bien en place »Proba 8. Une certaine confusion s'installa autour de leur modèle : s'il permet effectivement d'obtenir le phénomène souhaité, il n'est pas le seul modèle arrivant à ce résultat et on ne peut donc pas conclure en voyant le phénomène qu'il résulte d'un processus d'attachement préférentiel. Les phénomènes de petit monde et de liberté d'échelle (en), pour lesquels de très nombreux modèles ont été proposés, peuvent être réalisés simplement par des graphes aléatoiresProba 9 : la technique de Michael Molloy et Bruce Reed (en)Proba 10 permet d'obtenir l'effet de libre d'échelle, tandis que celle de Li, Leonard et Loguinov conduit au petit-mondeProba 11.

    Représentations et invariants[modifier]

    Étiquetage et morphismes[modifier]

    Formellement un graphe est étiqueté : chaque sommet ou arête appartient à un ensemble, donc porte une étiquette. Typiquement, les graphes sont étiquetés par des nombres entiers, mais une étiquette peut en fait appartenir à n'importe quel ensemble : ensemble de couleurs, ensemble de mots, ensemble des réels. Les exemples ci-contre montrent des graphes étiquetés par des entiers et par des lettres. L'étiquetage d'un graphe peut être conçu de façon à donner des informations utiles pour des problèmes comme le routage : partant d'un sommet u, on veut arriver à un sommet v, c'est-à-dire que l'on souhaite acheminer une information de u à v. Selon la façon dont les sommets sont étiquetés, les étiquettes que portent u et v peuvent nous permettre de trouver facilement un chemin. Par exemple, dans le graphe de Kautz (en) où la distance maximale entre deux sommets est D, imaginons que l'on soit à un sommet étiqueté (x_1,x_2,...,x_D) et que l'on souhaite aller à (y_1,y_2,...,y_D) : il suffit de décaler l'étiquette en introduisant la destinationR 1, ce qui donne le chemin
    (x_1,x_2,...,x_D) \to (x_2,...,x_D,y_1) \to (x_3,...,x_D,y_1,y_2) \to ... \to (x_D,...,y_{D-2},y_{D-1}) \to (y_1,...,y_D).
    Ce chemin se lit de la façon suivante : si on se trouve au sommet étiqueté (x_1,x_2,...,x_D) alors on va vers le voisin portant l'étiquette (x_2,...,x_D,y_1), et ainsi de suite.
    On se retrouve cependant face à un problème : si on regarde plus haut l'illustration de la liste des arbres à 2, 3 et 4 sommets, beaucoup d'entre eux ont exactement la même structure mais un étiquetage différent (donné ici par des couleurs). Pour étudier uniquement la structure, il faut donc un outil permettant d'ignorer l'étiquetage, c'est-à-dire de donner une équivalence structurelle. Pour cela, on introduit la notion de morphisme. Un morphisme de graphesR 2, ou homomorphisme de graphe, est une application entre deux graphes qui respecte la structure des graphes. Autrement dit l'image du graphe G dans H doit respecter les relations d'adjacences présentes dans G. Plus précisément, si G et H sont deux graphes, une application f: G \to H est un morphisme de graphe si f = (f_V, f_E) où f_V:V_G \to V_H transforme les sommets de G en ceux de H, et f_E:E_G \to E_H les arêtes de G en celles de H en respectant la contrainte suivante : s'il existe une arête e_{uv} \in E(G) entre deux sommets de G alors il doit y avoir une arête e_{f_V(u),f_V(v)} \in E(H) entre les deux sommets correspondants de H. On dit de l'homomorphisme f qu'il est une injection (respectivement surjection) si ses deux fonctions f_V et f_E sont injectives (respectivement surjectives); si elles sont à la fois injectives et surjectives, c'est-à-dire bijectives, alors f est un isomorphisme de graphes. Si deux graphes sont isomorphes, alors ils ont la même structure : peu importe la façon dont ils sont dessinés ou étiquetés, il est possible de déplacer les sommets ou de changer les étiquettes pour que l'un soit la copie conforme de l'autre, ainsi qu'illustré ci-dessous. On désigne alors par graphe non étiqueté la classe d'équivalence d'un graphe pour la relation d'isomorphisme. Deux graphes isomorphes seront alors considérés comme égaux si on les considère en tant que graphes non étiquetés.
    Graphe GGraphe HIsomorphisme
    entre G et H
    Graph isomorphism a.svgGraph isomorphism b.svgƒ(a) = 1
    ƒ(b) = 6
    ƒ(c) = 8
    ƒ(d) = 3
    ƒ(g) = 5
    ƒ(h) = 2
    ƒ(i) = 4
    ƒ(j) = 7
    Le mot graphe peut désigner, selon les contextes, un graphe étiqueté ou non étiqueté. Quand on parle du graphe du web, les étiquettes sont des URL et ont un sens. Le mot est utilisé pour désigner un graphe étiqueté. À l'opposé le graphe de Petersen est toujours considéré à isomorphisme près, donc non étiqueté, seules ses propriétés structurelles étant intéressantes.

    Graphes et algèbre linéaire[modifier]

    Tout graphe G=(V,E) peut être représenté par une matrice. Les relations entre arêtes et sommets, appelées les relations d'incidence, sont toutes représentées par la matrice d'incidencedu graphe. Les relations d'adjacences (si deux sommets sont reliés par une arête ils sont adjacents) sont représentés par sa matrice d'adjacence. Elle est définie par

    a_{ij}=\left\{\begin{array}{rl}
	1 & \mbox{si } (v_i,v_j)\in E \\
        0 & \mbox{sinon.}
\end{array}\right.
    GrapheReprésentation par une matrice d'adjacenceReprésentation par une matrice laplacienne (non normalisée)
    6n-graf.svg
    \begin{pmatrix}
0 & 1 & 0 & 0 & 1 & 0\\
1 & 0 & 1 & 0 & 1 & 0\\
0 & 1 & 0 & 1 & 0 & 0\\
0 & 0 & 1 & 0 & 1 & 1\\
1 & 1 & 0 & 1 & 0 & 0\\
0 & 0 & 0 & 1 & 0 & 0\\
\end{pmatrix}
    \begin{pmatrix}
 2 & -1 &  0 &  0 & -1 &  0\\
-1 &  3 & -1 &  0 & -1 &  0\\
 0 & -1 &  2 & -1 &  0 &  0\\
 0 &  0 & -1 &  3 & -1 & -1\\
-1 & -1 &  0 & -1 &  3 &  0\\
 0 &  0 &  0 & -1 &  0 &  1\\
\end{pmatrix}
    De nombreuses informations d'un graphe peuvent être représentées par une matrice. Par exemple, la matrice des degrés D est une matrice diagonale où les éléments D_{ii} correspondent au nombre de connexions du sommet i, c'est-à-dire à son degré. En utilisant cette matrice et la précédente, on peut également définir la matrice laplacienne L=D-A ; on obtient sa forme normalisée L' par L' = D^{-1/2}LD^{-1/2} = I - D^{-1/2}AD^{-1/2}, où I dénote la matrice identité, ou on peut aussi l'obtenir directement par chacun de ses éléments :
    \ell_{i,j}:=
\begin{cases}
1 & \mbox{si}\ i = j\ \mbox{et}\ \deg(v_i) \neq 0\\
-\frac{1}{\sqrt{\deg(v_i)\deg(v_j)}} & \mbox{si}\ i \neq j\ \mbox{et}\ v_i \text{ est adjacent a } v_j \\
0 & \text{sinon}.
\end{cases}
    Ces représentations dépendent de la façon dont les sommets du graphe sont étiquetés. Imaginons que l'on garde la même structure que dans l'exemple ci-dessus et que l'on inverse les étiquettes 1 et 6 : on inverse alors les colonnes 1 et 6 de la matrice d'adjacence. Il existe en revanche des quantités qui ne dépendent pas de la façon dont on étiquette les sommets, tels que le degré minimal/maximal/moyen du graphe. Ces quantités sont des invariants du graphe : elles ne changent pas selon la numérotation. Tandis qu'une matrice d'adjacence ou laplacienne varie, sonspectre, c'est-à-dire l'ensemble de ses valeurs propres \lambda_0 \le \lambda_1 \le \cdots \le \lambda_{n-1}, est un invariant. L'étude du rapport entre les spectres et les propriétés d'un graphe est le sujet de lathéorie spectrale des graphesR 3 ; parmi les rapports intéressants, le spectre donne des renseignements sur le nombre chromatique, le nombre de composantes connexes et les cycles du graphe.

    Décompositions arborescentes et en branches[modifier]


    Décomposition arborescente à 6 sommets d'un graphe à 8 sommets. Chaque nœud de la décomposition contient au plus trois sommets du graphe original, et la profondeur de cette décomposition est donc 2.
    Les graphes permettant de représenter de nombreuses situations, il existe de nombreux algorithmes (i.e. programmes) les utilisant. La complexité d'un algorithme consiste essentiellement à savoir, pour un problème donné, combien de temps est nécessaire pour le résoudre et quel est l'espace machine que cela va utiliser. Certaines représentations de graphes permettent d'obtenir de meilleures performances, c'est-à-dire que le problème est résolu plus rapidement ou en occupant moins d'espace. Dans certains cas, un problème NP-complet (classe la plus ardue) sur une représentation d'un graphe peut être résolu en temps polynomial (classe simple) avec une autre représentation; l'idée n'est pas qu'il suffit de regarder le graphe différemment pour résoudre le problème plus vite, mais que l'on « paye » pour le transformer et que l'on « économise » alors pour résoudre le problème. Une telle transformation est la décomposition arborescente proposée par les mathématiciens Robertson et Seymour dans leur série Graph MinorsR 4. Intuitivement, une décomposition arborescente représente le graphe d'origine G par un arbre, où chaque sommet correspond à un sous-ensemble des sommets de G, avec quelques contraintes. Formellement, pour un graphe donné G = (V, E), sa décomposition arborescente est (f, T) où Test un arbre et f une fonction associant à chaque sommet p \in T un ensemble de sommets f(p) \subset V(G). Trois contraintes doivent être satisfaites :
    • \cup_{p \in V(T)} f(p) = V(G)La décomposition n'oublie aucun sommet du graphe d'origine.
    • \forall e_{uv} \in E(G), \exists p \in V(T) tel que u \in f(p), v \in f(p).
    • \forall p, q, r \in V(T) si q est sur le chemin de p à r alors f(p) \cap f(r) \subseteq f(q)Si l'on prend l'intersection des sommets abstraits par deux nœuds de l'arbre, alors cette intersection doit être contenue dans un sommet intermédiaire. Sur l'exemple ci-contre, l'intersection de {A,B,C} et {C,D,E} est {C} qui est bien contenue dans le sommet intermédiaire {C,B,E}.
    La largeur arborescente tw(G) d'une décomposition (f,T) d'un graphe G est \max_{p \in V(T)}|f(p)| - 1, c'est-à-dire la taille du plus grand ensemble représenté par un sommet moins 1 ; on peut la voir comme l'abstraction maximale : pour un sommet de l'arbre, jusqu'à combien de sommets du graphe représente-t-on ? Construire la décomposition arborescente d'un graphe quelconque avec la plus petite largeur arborescente est un problème NP-durR 5. Cependant, cela peut être fait rapidement pour certains graphesR 6, ou approximéeR 7 pour d'autres tels les graphes planaires (i. e. pouvant être dessinés sans croiser deux arêtes).

    Exemple d'un arbre, ayant 1 comme racine, {2,4,5,7} comme nœuds internes et{3,6,8,9,10,11,12} comme feuilles.
    Robertson et Seymour développèrent également le concept de décomposition en branches. Pour la comprendre, il faut introduire davantage de vocabulaire sur un arbre. Dans les graphes, un arbre est dessiné "à l'envers" : on démarre de la racine en haut, et on descend jusqu'à atteindre les feuilles en bas ; tout sommet n'étant pas une feuille est appelé un 'nœud interne'. La décomposition en branches résulte en un arbre dans lequel tout nœud interne a exactement trois voisins (comme sur l'exemple ci-contre), et où chaque feuille représente une arête du graphe d'origine. La profondeur minimale de la décomposition d'un graphe G est notée bw(G), et on a la relation bw(G) \le tw(G) + 1 \le \left\lfloor \frac{3 \times bw(G)}{2} \right\rfloor. De même que pour la décomposition arborescente, il est NP-dur de construire une décomposition en branches avec bw(G) minimal pour un graphe quelconque ; dans ce cas, cette construction est réalisable pour un graphe planaireR 8.
    Ces représentations sont utilisées sur des problèmes NP-complets par des techniques de programmation dynamique, qui prennent généralement un temps exponentiel en bw(G) ou tw(G). Un tel problème est par exemple l'ensemble dominant : on veut savoir s'il y a un sous-ensemble D de sommets de taille au plus k tel qu'un sommet n'étant pas dans D y soit relié par une arête. Si le graphe est planaire, cette technique permet de résoudre le problèmeR 9 en temps O(2^{3 \times log_4(3l(H))} \times E|H| + n^3).

    Aspect algorithmique[modifier]

    Structures de données[modifier]

    La façon dont le graphe est représenté en tant qu'objet mathématique a été exposée dans la section précédente. Dans l'aspect algorithmique de la théorie des graphes, on cherche à concevoir un processus efficace pour traiter un problème faisant intervenir un graphe. Les principaux critères d'efficacités d'un processus sont le temps nécessaire avant d'obtenir la réponse, et l'espace que le processus consomme dans son travail. La façon dont on représente le graphe influence la performance en temps et en espace : par exemple, si l'on veut connaître l'existence d'une arête entre deux sommets, la matrice d'adjacence permettra d'obtenir un résultat immédiatement, ce que l'on appelle en \theta(1). En revanche, une opération de base telle que trouver le voisin d'un sommet est en O(n) sur une matrice d'adjacence : dans le pire des cas, il faudra scanner la totalité de la colonne pour s'apercevoir qu'il n'y a pas de voisin. Une autre structure de données est la liste d'adjacences, consistant en un tableau dont l'entrée i donne la liste des voisins du sommet i : sur une telle structure, trouver un voisin se fait en \theta(1) tandis que l'existence d'une arête est en O(n). Ainsi, au niveau du temps, le choix de la structure dépend des opérations de base que l'on souhaite optimiser.

    Un graphe étiqueté et sa représentation par liste d'adjacence ci-contre
    Représentation par liste d'adjacence du graphe ci-contre:
    0adjacent à0,1,2,3
    1adjacent à0
    2adjacent à0,3,4
    3adjacent à0,2
    4adjacent à2
    De même, l'espace qu'une structure consomme dépend du type de graphe considéré : un raccourci abusif consiste à dire qu'une liste d'adjacences consomme moins d'espace qu'une matrice car celle-ci sera creuse, mais cela prend par exemple plus d'espace pour stocker un graphe aléatoire avec les listes qu'avec une matrice ; dans le cas général, une matrice utilise un espace \theta(n^2)et les listes utilisent \theta(m\log n) donc si le graphe est dense alors m peut être suffisamment grand pour qu'une matrice consomme moins d'espace, et si le graphe est peu dense alors les listes consommeront moins d'espace. Des modifications simples d'une structure de données peuvent permettre d'avoir un gain appréciable : par exemple, dans une représentation partiellement complémentée d'une liste, un bit spécial indique si la liste est celle des voisins présents ou manquants ; cette technique permet d'avoir des algorithmes linéaires sur le complément d'un grapheAlgo 1.
    Tandis que ces structures sont locales, il existe aussi des structures de données distribuées. Le principe de ces structures est de concevoir un schéma d'étiquetage tel que, pour deux sommets x et y, on puisse répondre à une question comme « quelle est la distance entre x et y » uniquement en utilisant les étiquettes de ces nœuds ; une telle utilisation des étiquettes a été vue en section « Étiquetage et morphismes » avec le graphe de Kautz où l'on peut déduire le chemin entre deux sommets uniquement grâce à leur étiquette, et la longueur de ce chemin nous donne la distance. Un étiquetage est efficace s'il permet de répondre à une question donnée uniquement en utilisant deux étiquettes, tout en minimisant le nombre maximum de bits d'une étiquetteAlgo 2. Outre la distance, une question type peut être de tester l'adjacence, c'est-à-dire de savoir si deux sommets sont voisins ; notons que cela se ramène également au cas particulier d'une distance 1. Le premier exemple d'étiquetage efficace pour tester l'adjacence fut proposé dans le cas des arbres, et chaque étiquette est constituée de deux parties de \log n bits : la première partie identifie le sommet, et un nombre allant jusqu'à n nécessite \log n bits pour être codé, tandis que la seconde partie identifie le parent de ce sommet ; pour tester l'adjacence, on utilise le fait que deux sommets sont voisins dans un arbre si et seulement si l'un est le parent de l'autreAlgo 3.

    Sous-graphes utiles : séparateurs, spanners et arbres de Steiner[modifier]

    L'efficacité d'un schéma d'étiquetage est lié à la taille des séparateurs du graphe.
    Définition — un séparateur S est un sous-ensemble de sommet qui « sépare » les sommets du graphe en deux composants A_1 et A_2 tel que A_1 \cup A_2 \cup S = V et il n'y a pas d'arêtes entre des sommets de A_1 et A_2.
    Illustration d'un séparateur

    Étant donné un graphe avec un ensemble de sommets V, ...
    Play Pause Stop Précédent Suivant 
    Si un graphe a des séparateurs de taille r(n), alors on peut par exemple concevoir des étiquettes de O(r(n)\log^2n) bits pour la distance ; ceci permet directement d'en déduire l'étiquetage pour des graphes dont on connaît la taille des séparateurs, tels un graphe planaire où le séparateur est de taille r(n) = \sqrt{n}Algo 4. Enfin, il ne faut pas considérer que la taille de l'étiquetage mais également le temps nécessaire, étant donnés deux étiquettes, pour effectuer le décodage répondant à la question (i.e. quelle est la distance ? sont-ils voisins ?).

    Réduction de données[modifier]

    De nombreux problèmes sur les graphes sont NP-complets, c'est-à-dire durs à résoudre. Cependant, cette dureté est inégale : certaines parties du problème pe