LE DADAMÈTRE 
Etalon de la déchéance de l'aura du langage

Jeu de Paume
Accueil Concept Dadamap R.R.Engine Méthodologie Documentation
Crédits     -    En / Fr
Une carte du langage à grande échelle

Vous pouvez simplement regarder les cartes ci-dessous et essayer de vous représenter ce qu'elles veulent dire. Si vous voulez comprendre comment elles ont été produites, reportez-vous aux sections Concept et Méthodologie. Comme expliqué dans ces sections, les premiers pas consistent à extraire des quantités massives d'information textuelle depuis Google et à les analyser en termes de sémantique et d'homophonie. Cette procédure longue et complexe permet d'obtenir une description géométrique du langage, considéré comme l'hypergraphe des mots et des pages stocké dans la base de donnée de Google.

La première chose à comprendre est que chaque pixel de la carte correspond à un couple de mot - et non pas à un seul mot. Cela peut sembler peu intuitif, mais n'oubliez pas que nous sommes principalement intéressés aux correlations entre les mots pris deux à deux. Nous sommes partis d'un lexique de plusieurs milliers de mots de manière à former environ 800 000 couples (et donc autant de pixels), et nous avons cherché à évaluer les corrélations homophoniques, comme billard / pillard, ainsi que les corrélations sémantiques. Plus précisément, notre procédure permet d'extraire trois mesures pour chaque couple de mots :

1) Homophonie
L'homophonie désigne le rapport entre deux mots différents possédant des prononciations proches. Dans notre contexte la distance homophonique sera mesurée grâce à la distance de Damerau-Levenshtein, un outil standard en théorie de l'information.

2) Google Similarity (ou proximité sémantique)
La Google Similarity distance reflète la proximité sémantique entre deux mots. Cette distance est d'autant plus petite que les deux mots tendent à apparaître plus souvent dans les mêmes pages Web.

3) Degré d'équivoque
Il indique si un mot possède un sens univoque ou s'il est au contraire polysémique. Dans le cas d'un graphe, il est relié au clustering coefficient. D'un point de vue technique nous prenons le minimum de ce coefficient pour un couple de mots donné.

Nous associons l'homophonie à la couleur Rouge, la Google Similarity avec le Vert (mais en relation inverse) et le Degré d'équivoque avec le Bleu (en relation inverse). Chaque pixel a une couleur définie par ses composants (Rouge,Vert,Bleu), par conséquent chaque couple de mots est associé avec un triplet (R,V,B). Cette carte auto-adaptative est générée grâce à un réseau de neurones qui rassemble entre eux les pixels ayant des composants (R,V,B) similaires (voir ici pour plus d'explications).

Interprétation des différentes zones 

   


Bien que cette carte puisse être utilisée pour localiser les couples de mots (cela devrait être le cas dans la prochaine version qui sera interactive), son principal objectif est de localiser différentes zones du langage, en utilisant les trois critères ci-dessus : Homophonie, Google Similarity et Degré d'équivoque. En considérant les variations possibles pour chacun des coefficients nous pouvons définir sur la carte les régions suivantes :

Homophony
- Région d'homophonie élevée.
Wasteland - La Friche (ou Jachère), où la proximité sémantique est faible : contient des couples de mots qui sont rarement utilisés dans les mêmes contextes et ont peu en commun. C'est une zone à partir de laquelles nouvelles significations et surprises émergent.
Mainstream - Les Courants Dominants, où la proximité sémantique est élevée : les mots sont très corrélés entre eux et tout est prédictible.
Utilitarianism - Zone d'équivoque basse : chaque mot possède un sens univoque et il n'y a pas de place pour l'ambiguïté.
Au confins du Mainstream, s'étend le royaume de l'Ennui : Boredom.

Déterminer avec précision les frontières de ces différententes zones est pour l'instant impossible : nous ne savons pas comment définir des échelles pour séparer ce qui est grand de ce qui est petit. L'Equivocation Separation Line qui délimite la zone de haute équivoque de la zone de basse équivoque ne peut donc pas vraiment être localisée précisément.

Une région particulièrement intéressante est la zone de haute homophonie, haute proximité sémantique et haut degré d'équivoque. C'est ce que nous avons appelé la région Dada, point de départ de notre étude. C'est la zone rouge en haut à gauche. Si celle-ci est grande, alors l'humanité est très Roussellienne ou Dada. Bien sûr Dada ne se limite pas à cette région et s'étend au-delà du champ de cette carte.

Dans la mesure où nous ne sommes pas encore capables de déterminer les frontières entre les différentes zones, il est pour l'instant difficile de déterminer la valeur d'un indice global comme le Dadamêtre, qui est supposé mesurer la taille de la région Dada. Il faudrait probalement faire ici des normalisations arbitraires... mais l'étude de la dynamique du système devrait se révéler importante ici dans la mesure où la variation avec le temps de tels indices nous en apprendrait beaucoup. Nous laissons ces questions pour des développements ultérieurs.

Il faut également noter que même si deux régions semblent proches sur la carte, cela veut simplement dire qu'elles partagent un certain nombre restreint de caractéristiques (les trois définies dans cette étude), mais pas toutes : de même, les étoiles dans le ciel peuvent sembler proches et appartenir à la même constellation, mais sont en réalité très éloignées. Le rayons de lumière qui en émanent et nous arrivent, sont cependant proches les uns des autres.

Nous pouvons maintenant superposer deux autres notions : premièrement les phénomènes médiatiques et deuxièmement, les artistes et mouvements artistiques. Parmi les phénomènes médiatiques on trouve le Hapax et le Googlewhacks. Ils se trouvent dans la région ou la proximité sémantique est minimale. Un hapax est un mot qui apparaît une fois et une seule dans la litérature (le plus fameux est dû à Stéphane Mallarmé). Un Googlewhack est un couple de mots qui apparaît dans une et une seule page Web, dans les résultats de recherche de Google.

Les Spam streams (courants de spam) sont des flux marketing linguistiques allant du Wasteland au Mainstream. Ils sont également reliés à l'Homophonie : les spambots (robots spammeurs) cherchent à tromper les filtres anti-spam en utilisant des termes tels Viaa.gr*a au lieu de Viagra. Les courants de spam ne sont pas une région, ils appartiennent à l'aspect dynamique du problème, pour lequel il n'y a pour l'instant pas d'analyse quantitative. Ces questions feront éventuellement l'objet d'études futures, mais en raison de la grande difficulté à obtenir toutes ces informations, l'analyse de leur évolution dans le temps sera une tâche très difficile. Sur la gauche du Wasteland, on trouve les Epiphanies selon la définition de James Joyce. Elles participent à la destruction de l'aspect totalisant de la signification et ne se trouvent donc pas très loin des limites de la carte, là où la question de la signification se dissout.

Cette zone hors Signification, déchéance de l'Imaginaire, est située hors de la carte. Jacques Lacan avait rapproché l'effondrement du narcissisme de Joyce, la déchéance de l'Imaginaire, et le rôle que les épiphanies jouent dans son oeuvre. A l'extérieur de la carte au-dessus de Dada nous avons situé la déchéance du Symbolique, après avoir lu cet article de Jean-Claude Maleval qui met en rapport ce point d'évanescence de l'énonciation avec les épisodes de crise de la vie de Roussel, qui se sent envahit par le sentiment d'"avoir la gloire". De même que l'écriture de Joyce serait, selon Lacan, une tentative de suppléer la déchéance de l'Imaginaire, l'oeuvre de Roussel, selon Maleval, dénote une entreprise de restauration articifielle du Symbolique par le biais d'une mécanisation du langage. Nous supposons ici que cette inflation de la dimension Imaginaire dans l'oeuvre de Roussel est en fait une prémonition du Pop, en opposition au narcissisme évanescent de Joyce. Il est intéressant de relier ceci avec l'idée que le Pop Art serait une réponse à la déchéance de l'aura de Walter Benjamin, selon le commentaire de Jean Baudrillard dans son texte De la marchandise absolue. On comprendra également que la région du Pop ne se situe pas très loi du royaume de l'Ennui, Boredom, un des mots favorits de Warhol. D'un autre côté, le positionnement de la région Pop ne reflète pas son ironie essentielle, en relation au fétichisme de la marchandise. Nous atteignons ici les limites d'une telle représentation cartographique.

Entre ces deux déchéances s'étendent le capitalisme sémantique et la taylorisation du discours. La Modernité peut sans doute être identifiée avec l'Utilitarisme et une partie du Discours Courant (mais pas l'Ennui), mais en principe elle contient également certaines des Avant-Gardes en haut à gauche... bien que je tendrais à les considérer plutôt comme précurseurs de la Postmodernité. Les courants de Spam qui partent de la Friche vers le Discours Courant et l'Utilitarisme sont d'un grand intérêt. Ce mécanisme pourrait être comparé aux processus que l'on retrouve aux origines du capitalisme, comme le développement du capitalisme agraire à la Renaissance. La Friche est utilisée comme une Zone d'Autonomie Temporaire permettant le ressourcement du capitalisme en permanence menacé par l'Ennui et l'extinction du désir.

 

*     *     *