vendredi 20 janvier 2012

Les experts : De la musique à la finance

Victor Ginsburgh

Comment espérer que S&P ou Moody’s distinguent entre AAA et D alors que des violonistes professionnels ne distinguent pas un Stradivarius d’un crincrin ? (*)

Un article de Fritz et al. (1) paru dans les Proceedings of the National Academy of Sciences (Etats-Unis) montre que des musiciens professionnels ne parviennent pas à distinguer un Stradivarius (qui coûte entre 3 et 4 millions d’euros) d’un violon contemporain (quelque milliers d’euros). 21 violonistes âgés de 20 à 65 ans, qui jouent depuis 15 ans au moins (certains depuis 61 ans) ont été amenés à tester six instruments : deux Stradivarius, un Guarnerius del Gesu, qui datent tous trois de la première moitié du 18e siècle, et trois instruments contemporains. Chaque violoniste a joué sur les six instruments, par paires de deux (un ancien et un contemporain) et a répondu à trois questions : quel est l’instrument qu’il préférerait avoir chez lui, quel est le meilleur, et quel est le plus médiocre. Les conditions étaient telles que les violonistes ne pouvaient pas identifier l’instrument utilisé, si ce n’est par ses qualités musicales. Voici ce que le test a donné. L’un des deux Stradivarius a systématiquement été choisi moins souvent que n’importe lequel des trois instruments modernes qui faisaient partie de la paire. Dans les autres essais par paires (celles dans lesquelles ce Stradivarius n’apparaissait pas), le violon ancien a été choisi aussi souvent que le contemporain, mais l’un des trois instruments contemporains a été choisi comme étant le meilleur plus souvent que les autres, qu’ils soient anciens ou modernes. Huit violonistes sur 21 seulement on choisi un instrument ancien comme étant celui qu’ils aimeraient ramener chez eux.

Est-ce un signe de surdité de la part des musiciens, ou est-ce le prix des instruments anciens qui est largement exagéré ? Ces résultats ne sont pas sans rappeler ceux décrits dans un article de Ginsburgh et van Ours (2), qui se sont intéressés aux classements des 12 finalistes (3) de 11 concours Reine Elisabeth de piano organisés entre 1952 et 1991. Ils montrent que ce classement dépend de l’ordre dans lequel les candidats se présentent lors de la finale du concours. Cet ordre étant choisi de façon aléatoire avant le début du concours, un tel résultat est statistiquement peu probable et doit provenir de facteurs d’écoute durant le concours : les candidats qui jouent durant les dernières soirées et ceux qui jouent en deuxième partie de chaque soirée sont en moyenne mieux classés. Puisque l’ordre de passage est aléatoire, le classement final l’est en partie aussi. Il n’en reste pas moins que ceux qui arrivent en tête ont plus de succès par la suite. Le « vrai talent » ne tient pas beaucoup de place.

Ashenfelter et Quandt (4) ont montré qu’il n’y a que très peu d’accord entre les dégustateurs d’un même vin. Hodgson (5) fait encore mieux en montrant que les dégustateurs ne sont pas d’accord avec eux-mêmes lorsqu’ils goûtent le même vin dans des circonstances ou à des moments différents.

Dans les épreuves de patinage artistique qui font partie de l’International Skating Union, les évaluations de chaque juge sont comparées à celles des autres juges, et si l’évaluation d’un juge s’écarte trop de la moyenne, il est entendu par une commission et tenu de s’expliquer. S’il se dérobe à l’entrevue ou s’il ne peut justifier son évaluation, il est pénalisé et risque de n’être plus invité à juger d’autres compétitions, ce qui peut lui paraître déshonorant. Etant donné que les résultats doivent être affichés 30 secondes après l’épreuve, les juges recourent en général à des notes inspirées des performances antérieures des candidats. Les notes finales données par chaque juge finissent par être très proches les unes des autres, et n’ont probablement pas grand chose à voir avec les qualités déployées dans l’épreuve qui est en cours (6).

André Gide, lecteur chez Gallimard avant la première guerre mondiale, a refusé le premier volume d’À la recherche du temps perdu de Proust. Combien des 106 écrivains récompensés par le prix Nobel de littérature depuis 1901, année de Sully Prudhomme, sont encore lus aujourd’hui. En connaît-on ne fût-ce que les noms ? A commencer par Prudhomme lui-même. Qui connaît ou a lu Bjornstjerne Bjornson (1903), Rudolf Eucken (1908), Paul Heyse (1910), Henrik Pontopiddan (1917), Wladyslaw Reymont (1924), Eric Karlfeldt (1930), Halidor Laxness (1955), ou Nelly Sachs (1966). Qui lit encore le Quo Vadis de Sienkiewicz, prix Nobel en 1905. Qui par contre ne connaît pas Léon Tolstoï, Kafka, Proust, Joyce, Zweig, et Borges qui eux n’ont pas été sélectionnés ?

Les données d’un test relatif aux conséquences de certaines lésions du cerveau ont été soumises à des médecins spécialisés ainsi qu’à leurs secrétaires. Les différences de diagnostics posés par les deux groupes de personnes n’étaient statistiquement pas significatives. Par ailleurs, les résultats des examens d’entrée dans les facultés de médecine à l’Université de Toronto sont corrélés aux conditions météorologiques. Les candidats interviewés quand il pleut sont moins bien évalués que ceux qui le sont durant les beaux jours (7). Pour couronner le tout, les procédures statistiques basées sur des notes d’évaluation de caractéristiques explicites et qui sont traitées par ordinateur, fournissent des diagnostics plus précis sur les conditions de santé des individus que des méthodes d’examen clinique, basées, elles, sur des processus mentaux implicites (8).

Les oreilles des musiciens ne sont manifestement pas parfaites. Pas plus que les papilles gustatives des experts en vin, ou les yeux de ceux qui jugent les compétitions sportives, ou les goûts de lecteurs des maisons d’édition et des jurys de littérature du comité Nobel, ni même les diagnostics de ceux qui sont censés nous prodiguer des soins.

Bien que les conséquences des avis des devins financiers s’avèrent souvent (9) bien plus catastrophiques, pourquoi devrions-nous croire que les Standard & Poor’s, Moody’s et Fitch de ce monde qui ont donné des AAA à des titres financiers véreux, soient de meilleurs juges que les autres (10) ? Jusqu’à ce que toutes les dettes souveraines et autres soient notées D, ce qui devrait entraîner, enfin, la faillite des agences de notation, puisqu’elles n’auront plus rien à faire. On ne peut que s’en réjouir et espérer, mais sans trop de conviction, que la note de la dette française France repassera à AAAAAAAAAA.

(*) Une version un peu différente de ce blog signé par le même auteur, a paru en anglais sur VoxEU, http://www.voxeu.org/. Merci à O.A.

(1) Fritz, C., J. Curtin, J. Poitevineau, P. Morrel-Samuels, and F-C. Tao (2012), Player preferences among new and old violins, www.pnas.org/cgi/doi/10.1073/pnas.1114999109.

(2) Ginsburgh, V. and J. van Ours (2003), Expert opinion and compensation: evidence from a musical competition, American Economic Review 93, 289-298.

(3) Il n’y en a plus que 6 qui sont classés depuis quelques années.

(4) Ashenfelter, O. and R. Quandt (1999). Analyzing wine tasting statistically, Chance 12, 16–20.

(5) Hodgson, R. (2008), An examination of judge reliability at a major US wine competition, Journal of Wine Economics 3, 105-113.

(6) Voir Lee, J. (2004), Outlier aversion in evaluating performance: Evidence from figure skating, IZA Discussion Paper 1257.

(7) Redelmeier, D and S. Baxter, "Rainy weather and medical school admission interviews", Canadian Medical Association Journal 181, 2009.

(8) Meehl, P. (1954), Clinical versus Statistical Prediction. Northvale, New Jersey and London, Jason Aronson Inc., 1996 (first published in 1954).

(9) Pas toujours. La dégradation de la note française était attendue depuis pas mal de temps. Mais qui de nous peut dire qu’il n’a pas été influencé par son « banquier » à investir dans des actifs sur lesquels, au mieux, il ne perd pas le capital investi.

(10) L’objectivité et les critères utilisés par ces agences sont très relatifs, comme le souligne un article du New York Times, Beyond the raters, Dec. 14, 2011. Les régulateurs américains suggèrent d’utiliser des formules objectives d’évaluation, dont celles proposées par l’OCDE pour le cas des dettes souveraines.

1 commentaire:

  1. Peu importe le flacon, pourvu qu'on ait l'ivresse. J'ai toujours aimé les musiciens capables de jouer sur n'importe quel instrument. L'instrument n'a jamais fait la musique: c'est le musicien qui fait la musique. Quant au paralèle avec les agences de notations, je le trouve léger: la perception du beau est indicible, celle de la soliditée financière devrait être argumentée et, si possible, scientifiquement fondée. Elle n'est ni l'une, ni l'autre, et en plus elle n'est pas impartiale.

    RépondreSupprimer