Le phénomène de masquage: un outil pour la composition

by Ana Dall'Ara-Majek

Introduction

Depuis ses origines, la musique est faite par et pour nos oreilles d’êtres humains. C’est pour cette raison que les règles d’écriture, d’harmonie, d’orchestration, les factures instrumentales, la conception même de la musique, sont intuitivement adaptées à notre système auditif.
Avec le développement de la technologie, notamment l’essor de l’enregistrement à la fin du XIXe siècle, le son, maintenant fixé, est devenu un élément analysable et reproductible, porte ouverte aux expérimentations qui nécessitent une lecture répétée de ce son, par exemple : l’écoute réduite de Pierre Schaeffer.
Le développement de la synthèse sonore, quant à elle, ouvre la voie aux expérimentations de laboratoire, par l’utilisation de sons purs (dans ses composantes simples suivant l’analyse de Fourier). Cela permet d’analyser, au niveau le plus primaire, donc le plus neutre possible, les caractéristiques perceptives de notre oreille.

Mais les musiciens ne restent pas en marge de ces technologies. En effet, de nouvelles tendances émergent: la musique spectrale en première ligne, utilise l’analyse des représentations physiques du son comme fondement pour la composition. Dans l'oeuvre Partiels de Gérard Grisey, le compositeur assigne à chaque instrument de l’ensemble, les caractéristiques tridimensionnelles (spectrale, dynamique et temporelle) du son analysé d’un trombone.
Le développement des outils de représentation du son (sonagramme, spectrogramme...) ont permis, non seulement de visualiser l’onde sonore hors temps, mais également de nous rendre compte à quel point une représentation physique peut différer de notre perception. En effet, certains phénomènes échappent à la représentation du son, tels les sons différentiels, la sensation de rugosité, etc. Une musique telle la musique spectrale, ne peut donc se fier entièrement à des données exclusivement physiques pour pouvoir sonner. C’est ici, qu’entre en jeu le domaine psychoacoustique. Cela explique également le fait que l’on cherche à représenter davantage le son en fonction de notre perception humaine (échelles de fréquences logarithmiques - ondelettes, évolution des représentations sonores vers une modélisation de la perception [1]).

Aujourd’hui, pour un compositeur de musique contemporaine, le domaine de la psychoacoustique est un terrain d’exploration qui permet de comprendre le pourquoi des règles musicales préétablies, mais également d’aller à l’encontre des ces règles, et savoir jouer de manière consciente avec la perception : la rendre plus ambiguë, la dérouter, réaliser des illusions sonores, etc... De plus, une partition ne rend pas compte d’un phénomène sonore. Il suffit, par exemple, d’observer une partition de Ligeti ou de Xenakis, pour constater que les tissages complexes de notes, joliment agencées sur le papier, ne s’entendent pas. Disons plutôt que l’on perçoit un effet général de masse, que chaque ligne instrumentale apporte un enrichissement des composantes internes d’une texture, sans que l’on réussisse à les entendre isolément. Ainsi, pour le compositeur, l’objectif est de connaître quelques principes perceptifs de base, pour pouvoir déterminer ce qui, dans une écriture complexe, sera réellement perçu. Tel un magicien, il s’agit de prendre connaissance des « trucs », qui permettront de réaliser de manière efficace un tour de magie avec les meilleurs effets ! Le musicien-magicien dissimule la réalité, il en utilise une autre pour rendre effective son illusion ; connaître les astuces, telle est la direction que va prendre ce projet.

Le travail traitera de l’effet de masquage. Il apparaît fondamental car il intègre la notion de bande critique, d’où dépendent : la perception des hauteurs, des intervalles, de la dynamique et des timbres. En tant que harpiste, habituée à être masquée par l’orchestre, j’ai commencé à développer un intérêt grandissant pour les mécanismes liés au masquage. Mon expérience dans le domaine électroacoustique m’a ouvert les portes sur l’exploitation empirique du phénomène. L’objectif de ce travail est donc une prise de conscience des mécanismes entrant en jeu dans l'effet de masquage afin de l'exploiter comme un outil, comme un atout dans la composition.

La recherche s’organisera en deux parties :

Un volet théorique détaillera le phénomène de masquage et son lien avec les bandes critiques à travers diverses définitions qui illustreront leur implications acoustiques, perceptives et musicales. Pour bien comprendre le phénomène, nous nous intéresserons, dans un premier temps, à l’effet de masquage dans ses propriétés de laboratoire (réalisé avec des sons purs et des bruits), et déterminer dans quelle mesure les résultats obtenus peuvent être appliqués au sein de la composition musicale. Dans un second temps, nous traiterons le phénomène dans une optique plus musicale, en abordant les notions d’altération de timbre, d’orchestration, de spatialisation.

Un volet pratique consistera à réaliser une étude pour instruments et sons de synthèse, explorant tour à tour les différents effets liés au masquage et aux bandes critiques : unisson, battement, rugosité, fluctuation, résolution du son, masquage postérieur, masquage simple, masquage mutuel.


PREMIER VOLET : THEORIQUE

1. Le masquage lié aux bandes critiques : définitions

On aborde communément la définition du phénomène de masquage sous deux angles : le masquage en tant qu’effet, et la notion de résolution fréquentielle (d’avantage rattaché à la cause).

Dans le premier cas, il s’agira de dire que l’effet de masquage a lieu lorsqu’un son de fort niveau couvre un autre son de plus faible niveau. Il est assimilé à un affaiblissement de l’ouïe puisqu’il faut augmenter l’intensité du son masqué pour pouvoir l’entendre à nouveau (Pierce) [2].

Dans le second cas, on explique le masquage comme un manque de sélectivité (ou résolution) fréquentielle de l’oreille pour discriminer deux sons simultanés (Moore) [3].

La seconde définition nous apporte beaucoup d’éléments dans le sens où elle induit une des caractéristiques principales de l’oreille qui est celle d’être un analyseur fréquentiel, et que son analyse contient ses limites (sa résolution). Elle se définit en fonction des bandes critiques (Fletcher, Zwicker) ou bande rectangulaire équivalente –ERB- (Moore, Glasberg).
La théorie de Fletcher consiste à dire que le système auditif contient une série de filtres passebande qui se chevauchent. La bande critique est la largeur de bande de ces filtres auditifs. Cette largeur est stable jusqu’à 500 Hz, puis logarithmiquement croissante (en fonction de la fréquence centrale) au-delà.
D’un point de vue perceptif, Howard [4] définit la bande critique comme la différence fréquentielle entre deux sons purs, où l’on va percevoir un passage entre une sensation de rugosité et une sensation de deux sons distancés et ‘lisses’. On parlera dans ce dernier cas de résolution.

Quelles sont les implications acoustiques et musicales du phénomène de masquage et des bandes critiques ?

En nous appuyant sur les deux définitions évoquées, nous nous intéresserons, dans un premier temps, aux résultats d’expériences de laboratoire menées par Zwicker et Weger-Lane, qui établissent des courbes dites de masquage. L’étude de ces courbes permettent d’observer un comportement type de l’oreille.
Dans un second temps, nous aborderons, plus en détail, la notion de résolution fréquentielle et ses implications dans la perception qualitative du son (rugueux, lisse).


2. Expériences de laboratoire

2.1 Courbes de masquage

2.1.1 Référence

Les expériences de laboratoire de Zwicker consistent à masquer un son pur (son test) par différents types de sons masquants (bruits à bande large, bruit à bande étroite, sons purs et sons complexes) et de mesurer le seuil de perception du son masqué sur des participants en bonne santé. Il établit ainsi diverses courbes de masquage et en étudie ses caractéristiques. Comme référence pour ses mesures, il se sert du seuil d’audibilité, établi grâce aux expériences sur le sonomètre de Békésy, et comparera toutes les courbes de masquage par rapport à ce seuil.

Le résultat se présente sous forme de courbes d’isosonie où tous les niveaux sur une même courbe donnent une même sensation sonore. La courbe en ligne continue correspond à un seuil d’audibilité fixé à 3 dB pour 1000 Hz, et une sensibilité maximale de l’oreille entre 2 et 5 kHz (Fig. 1).

Figure 1

D’autres expériences mettent en évidence ce creux caractéristique dans les courbes isosoniques. Sur l’expérience avec des participants à l’ouïe fine (Fig. 2), Pierce corrèle différentes courbes isosoniques (à différents phones) avec des nuances instrumentales allant de pianissimo (ppp) à fortissimo (fff). Il définit l’étendue des niveaux d’intensité des sons d’orchestre de 40 à 100 dB, et établit 6 niveaux de sonie correspondants, entre le son d’orchestre le plus faible et le plus fort. Il associe ces niveaux avec des nuances instrumentales : pp, p, mp, mf, f, ff.

Figure 2

2.1.2 Expériences

Les expériences de Zwicker consistent à masquer un son pur de 1000 Hz à 80 dB par différents types d'ondes, détaillées dans le tableau ci-dessous.

2.1.3 Résultats

En observant chacune des courbes de masquage, on peut remarquer des différences de comportement en fonction de la nature du son masquant. Nous allons passer en revue les principales caractéristiques de ces courbes afin de mieux comprendre le fonctionnement du masquage.

Courbes plates – courbes avec pentes accentuées
On constate nettement le contraste entre la linéarité des courbes du bruit blanc masquant (1) et l’accentuation des pentes des autres courbes (2 à 7 : bruit à bande étroite, sons purs, sons complexes). Le bruit blanc est le seul qui masque quasi uniformément à toutes les fréquences. Cela peut expliquer pourquoi un grand coup de cymbale ou de tam-tam fortissimo est capable de masquer tout un orchestre !

Asymétrie caractéristique des courbes
Hormis le schéma n°1, les autres courbes font apparaître une asymétrie caractéristique : la pente est accentuée du côté des fréquences graves et plus atténuée du côté des fréquences aiguës. Cela revient à dire que le masquage est plus efficace dans les aigus, ou que les sons graves masquent plus facilement les sons aigus. Zwicker en conclut pourquoi les chœurs mixtes ont besoin de plus de voix de femmes que d’hommes pour trouver un équilibre. Cette caractéristique est valable à partir d’un certain niveau d’intensité. Les schémas nos 4 et 5 montrent bien que les courbes restent symétriques à des faibles niveaux (30, 40 dB) et commencent à devenir asymétriques à partir d’environ 50 dB.

Quel est donc le lien entre l’intensité et l’efficacité du masquage des sons graves sur les sons aigus ?

Pierce donne une explication physiologique du phénomène : la perception des fréquences est localisée en différents endroits de la membrane basilaire, sur toute la longueur de notre cochlée, en forme de colimaçon (tonotopie passive). Les fréquences graves excitent la membrane à l’extrémité apicale de la cochlée (en fin de parcours). Les fréquences aiguës excitent la membrane à l’extrémité basale de la cochlée (en début de parcours). Pour rejoindre leur emplacement d’excitation, les ondes graves passent nécessairement par les endroits d’excitation des fréquences aiguës, ce qui, à un niveau suffisamment fort, finit par saturer ces localisations et interférer avec la perception des hautes fréquences (Fig. 3).

Figure 3

Courbes de bruit blanc linéairement ascendantes à partir de 500 Hz

Zwicker introduit la notion de bande critique dans son observation du comportement des courbes de bruit blanc : à partir de 500 Hz, le seuil d'audition masqué s'élève de 10 dB lorsque la fréquence est multipliée par 10. « Cela est dû au fait que l'oreille perçoit la puissance du bruit blanc non dans sa totalité mais par bandes de fréquences. Ces bandes ont une largeur constante au-dessous de 500 Hz et une largeur proportionnellement croissante avec la fréquence centrale, au-dessus de 500 Hz. Elles correspondent aux bandes critiques de l'oreille ».

L’ensemble des courbes montrent une différence de niveau entre son test et le son masquant : on peut entendre un son masqué quelques dB en dessous du niveau du son masquant. Zwicker, introduit ainsi la notion de taux de masquage. Pour avoir un effet de masque efficace, nous avons donc besoin d’une différence de niveau plus notable, en suivant les courbes de Zwicker : au moins 4 dB.

Creux (ou bosses) caractéristiques sur les courbes de sons purs : battements

Lorsque la fréquence du son test rencontre celle du son masquant, à des forts niveaux sonores (70-80 dB), on remarque des creux (ou bosses) sur les courbes de sons purs, ou de bruit à bande étroite (Schémas 2, 4, 5). Cela signifie que l’efficacité du masquage est réduite à ces fréquences par rapport à leurs fréquences voisines. Cela correspond à la perception d’une sensation de battement caractéristique. Les courbes établies par Wegel et Lane (Fig. 4) mettent davantage en évidence le phénomène et y ajoutent un paramètre : le battement avec les harmoniques du son, qui devient effectif pour un son masquant de fréquence entre 800 et 1200 Hz.

Figure 4

Pour Pierce, le phénomène est du à l’interférence de deux sons sinusoïdaux à des fréquences voisines. Entre deux sons purs de fréquences proches, les oscillations (variations de pression) se déphasent et se rephasent. Cela signifie qu’en fonction du temps, les pressions successivement atteignent leur maximum au même moment (s’ajoutent), ou passent l’une en dessous de l’autre (pression combinée inférieure à la pression moyenne), ce dernier cas faisant chuter la courbe de masquage.

Pourquoi il y a-t-il d’autres creux au niveau des harmoniques ?

Zwicker et Pierce expliquent cet effet par la non-linéarité de l’équipement électronique utilisé, ou de l’oreille moyenne ou interne. Cela peut amener un son masquant très fort, à produire des composantes harmoniques (2e, 3e), dont les vibrations vont créer des battements avec les fréquences voisines.

Emergence des sons différentiels dans les courbes de sons purs

La courbe de son pur n°4 du tableau fait apparaître trois seuils : le seuil d’audition en présence du masque, le seuil différentiel (où l’on entendra un 3ème son) et le seuil où l’on finira par entendre le son test (combiné avec le son masquant et le son différentiel). C’est à partir de l’information du son test et du son masquant que l’oreille forme un son différentiel qui correspond à la différence entre les fréquences en présence. On entendra une sorte de bourdonnement grave.

Pressnitzer et McAdams [5] évoquent le phénomène – « paradoxal » - en se référant à la particularité des mécanismes de codage du son par notre système auditif (codage à la fois spectral et temporel). Il évoquent l’excitation de la membrane basilaire à des localisations, correspondant aux fréquences en présence, mais aussi près des basses fréquences, qui agissent en complément de la série harmonique.

Ce nouveau son grave perçu n’est pas présent dans le signal physique mais il est recréé physiquement dans l’oreille interne, et peut engendrer des battements comme si un vrai signal était présent, puisqu’il est mécaniquement présent au niveau de la membrane basilaire.
Evidemment, il est nécessaire que le niveau sonore soit fort pour que le phénomène soit effectif. Pressnitzer et McAdams évoquent un exemple type de cet effet dans la fin du premier mouvement de Zehn Stücke für Blaäserquintett de Ligeti, où le quintette à vent entonne un unisson triple forte dans le registre aigu.

Fluctuation des courbes de sons complexes

Les cas 6 et 7 du tableau présentent des courbes avec d’importantes fluctuations. Les sons naturels utilisés (notes de violon), contrairement aux sons de laboratoire, présentent une déperdition d’énergie caractéristique dans le temps. Les composantes aiguës de la note de violon s’éteignent plus rapidement que les graves, et d’autant plus que le niveau sonore est bas.
C’est la raison pour laquelle, pour les niveaux sonores choisis les plus élevés (80dB), les courbes sont moins perturbées car le son est plus stable (moins de déperdition d’énergie).
Aux niveaux plus faibles, les courbes présentent une grande irrégularité : on retrouve, de manière plus accentuée, les « bosses » de battements lorsque la fréquence du son test (son pur) coïncide avec celle d’un harmonique du violon. Dans le cas de la courbe du son aigu de violon (schéma n°7), comme l’on s’y attend, les fréquences graves ne sont nullement masquées (jusqu’à une demi-octave du son joué), en revanche, le masquage demeure efficace dans la zone de fréquences au-dessus du son joué.
Ces résultats sur les sons acoustiques sont très révélateurs, ils impliquent plusieurs principes à prendre en compte si l’on veut exploiter finement le masquage:

On peut évoquer ici l’expérience du chanteur qui surpasse l’orchestre (Johann Sundberg). Le phénomène s’explique par la comparaison de distribution de puissance (répartition de l’énergie spectrale) entre un orchestre et un chanteur ténor. « Le niveau d’intensité du son orchestral baisse rapidement pour des fréquences supérieures à 500 Hz. Alors que la puissance de la voix d’un chanteur présente un premier pic à 500 Hz puis un autre à 2500 Hz, ce qui lui donne un avantage sur l’orchestre d’environ 13 dB ». [6]

Absence de battements sur les courbes de bruit

Pierce établit une distinction plus nette entre les courbes de masquage par une bande étroite de bruit et par un son pur.

Figure 5: Son pur masquant à 400 Hz

Figure 6: Bruit masquant à bande étroite allant de 365 à 455 Hz (largeur = 90 Hz)

Par l’observation des courbes des Figures 5 et 6, on peut en conclure que : le « bruit ajouté à un son pur ne fait pas entendre de battements », le bruit masque plus efficacement que le son pur (le seuil est nettement plus élevé), mais la courbe décroît plus vite dans les aigus. Le son pur masque donc une zone de fréquence plus grande au-dessus de la sienne, alors que le bruit masque une zone plus étroite.

En théorie, on pourrait donc en déduire le principe suivant : Si l’on veut masquer quantitativement, on utilisera de préférence un bruit (intensité). Si l’on veut masquer qualitativement, on utilisera plutôt un son pur (zones de fréquences).


2.2 Résolution fréquentielle

Une autre manière de définir le masquage, est de s’intéresser à ses causes en intégrant les notions de bandes critiques et de résolution de l’oreille. Ce nouveau point vue nous renseigne sur les limitations de perception de notre oreille, non pas dans sa précision, mais plutôt dans sa sélectivité, c’est-à-dire sa capacité à distinguer deux sons simultanés. A partir de cette notion découle toute une série de propriétés de l’ouïe concernant la perception des intervalles et des timbres.
Greenwood [7] évoque la bande critique comme la « résolution minimale dans laquelle l’oreille ne peut séparer deux fréquences simultanées ». Angus et Howard [8] évoquent la bande critique comme la limite entre la sensation de rugosité et la distinction nette de deux sons « lisses ». Outre le lien évident de l’effet de masquage avec l’intensité, cette notion de résolution met plus en avant la relation de l’effet de masquage avec le domaine fréquentiel.

2.2.1 Perception de la bande critique à travers la rugosité

Angus et Howard établissent très précisément une échelle qui va de l’unisson à la discrimination en passant par la sensation de rugosité. Pour ce faire, on fait jouer deux sons purs à l’unisson, l’un de fréquence fixe (F1), l’autre mobile (F2). On distancie progressivement le second son du premier sur l’axe des fréquences, afin d’en étudier les effets. La Figure 7 montre les effets produits par les différents degrés de distanciation des ces deux fréquences.

Figure 7

La Figure 8 résume les différentes perceptions:
-à l’unisson : on perçoit un seul son
-distance environ de 12.5 Hz à 15 Hz : on perçoit des battements (oscillations) dont la fréquence est de F2-F1 ou F1-F2 si F1>F2.
-distance à partir de 15 Hz : on perçoit un son rugueux
-distance au-delà à partir d’un certain point (relatif aux auditeurs) : on perçoit deux sons rugueux
-distance au-delà de ce point : on perçoit deux sons lisses.
La bande critique se situe aux points où l’on perçoit le passage de deux sons lisses à deux sons rugueux (noté CB sur la Fig. 8).

Figure 8

Les valeurs de fréquences qui déterminent un changement d’état dans la perception sont approximatives et dépendent de chacun. Néanmoins la moyenne de ces valeurs reste commune à tous les auditeurs, ainsi que l’ordre d’apparition des phénomènes.

Les expériences de Plomp et Levelt [9] (Fig. 9) montrent ont également que la sensation de rugosité émerge approximativement autour de 20 Hz de différence, devient maximale à un quart de la bande critique, et disparaît lorsque la différence de fréquence excède la bande critique.

Figure 9

Pressnitzer et McAdams [10] font une distinction plus précise dans la séparation des fréquences, où l’on perçoit les battements allant de lentes fluctuations, vers l’accélération (au pic du rugosité) puis en diminution à mesure que l’on dépasse la bande critique.
Ils mettent en évidence le fait que la sensation de rugosité ne dépend pas d’une fréquence de différence absolue, mais plutôt d’une différence liée à la largeur de bande critique (pour une fréquence centrale donnée). La conséquence est que, comme la largeur de bande varie en fonction des fréquences, un intervalle de hauteurs n’aura pas la même rugosité selon les registres. Par exemple : des tierces seront très rugueuses dans le registre grave mais pas dans le registre aigu. Des harmonies serrées dans le grave vont manquer de résolution. Ces phénomènes sont liés aux règles classiques de l’harmonie.
Les compositeurs vont à l’encontre de ces principes basiques pour créer des effets de tension (exemple : un cluster serré dans le grave, donnant un effet dramatique), ou de timbre. A cet égard, les deux auteurs citent l’oeuvre de Grisey : Jour contre jour où émerge du silence des sons de qualité rugueuse. Ils citent également l’oeuvre de Hugues Dufourt : La tempesta d’après Giogione, où des instruments à vents employés dans le registre grave font tomber les partiels dans la même bande critique avec une grande sensation de rugosité.
Notons que dans l'oeuvre Critical Band de James Tenney, le compositeur joue de la rencontre des timbres instrumentaux et de la variation des vitesses de battements entre les harmoniques des instruments.

Aujourd’hui au sein de la musique contemporaine, la dissonance au sens traditionnel est devenue obsolète et l’on parlera davantage de ‘frottement’, ou ‘rugosité’ qui peut impliquer un effet de tension. La manipulation du timbre permet de traiter sur une échelle continue des notions de rugosité et de résolution des sons.

Dans l'oeuvre Verblendungen (1982-4) de Kaija Saariaho, la compositrice définit un axe son/bruit qui tente de reproduire la capacité harmonique de tension/détente.

2.2.2 Dissonance et musique contemporaine

Helmhotz voit dans la rugosité le fondement acoustique de la dissonance des intervalles musicaux [11]. Les intervalles d’octaves ou de quintes ont un fort degré de consonance dû à la coïncidence harmonique de leurs composantes. A l’inverse, l’intervalle de quarte augmentée (Triton), a des composantes qui présentent des battements et une forte sensation de rugosité (Fig.10).

Figure 10

2.2.3. Asymétrie caractéristique des filtres auditifs

Enfin, Angus et Howard évoquent l’asymétrie caractéristique des filtres auditifs qui expliquent également l’asymétrie dans les courbes de masquage. L’action de la membrane basilaire peut-être pensée comme l’équivalent de nombreux filtres passe-bande qui se chevauchent. On ne peut délimiter précisément l’étendue de ces chevauchements (Fig. 11).

Figure 11

Cette asymétrie caractéristique, qui croît avec l’amplitude, implique un comportement spécifique de l’effet de masquage.

Figure 12

On voit nettement sur la Fig. 12 que le son pur grave, même s’il est plus faible n’est pas masqué par la bande de bruit étroite plus aigue (b). A l’inverse le son pur plus aigu tombe en plein dans la bande critique du bruit à bande étroite plus grave, le masquage a donc lieu de manière efficace (d).

2.2.4 Ouvertures…

Il apparaît que les résultats de ces expériences sont valables dans le cadre du laboratoire et seuls certains aspects peuvent être transcrits en pratique dans le domaine musical. Néanmoins, ces expériences donnent une bonne notion de base du comportement de l’oreille ainsi que des pistes compositionnelles à explorer. Dans des conditions réelles hors laboratoire, l’effet de masquage est plus complexe d’autant plus qu’il est lié à divers facteurs de perception impliquant notre système cognitif

Dans le domaine musical, l’effet de masquage pour les sons musicaux (complexes) va davantage se comporter comme le masquage de composantes individuelles sur d’autres composantes du son. Il s’agit de ce que Hartmann [12] appelle le masquage mutuel, qui offre, selon lui plus de potentiel que des effets de disparition du son, dans la mesure où il est la porte ouverte à la création de nouveaux timbres par la fusion et/ou par l’altération des caractéristiques individuelles du son.


3. Applications dans le domaine musical

3.1 Perception du timbre, le masquage des instruments musicaux

3.1.1 Masquage des harmoniques

Hartmann évoque l’expérience d’altération de la perception du timbre d’un même instrument en fonction de sa relation avec les autres instruments. En effet, des instruments graves tels le violoncelle ou la contrebasse sonnent plus « brillants » en soliste, et plus « mat » au sein d’un ensemble. Cela est dû au fait que dans le dernier cas, les composantes harmoniques aiguës de ces instruments graves sont masquées (totalement ou partiellement) par les composantes fondamentales plus intenses des instruments du registre medium. Nous entrons dans le domaine vaste et empirique de l’orchestration.

3.1.2 Masquage partiel et fusions instrumentales

Sandell [13] constate que les traités d'orchestration donnent une information précise sur la combinaison des timbres, mais de manière empirique (par expérience, l'on établit que : "X fusionne bien avec Y"). Il propose donc d'expliquer le jugement sur la fusion des timbres par une information plus acoustique et perceptive, au moyen d'une expérience d'écoute : 120 paires d'instruments présentées à 8 musiciens qui doivent les classifier sur une échelle de 1 (séparé) à 10 (fondu). Pour son investigation, il prend en compte plusieurs facteurs:

Grâce aux résultats de son expérience, Sandell en arrive à plusieurs observations, notamment, le fondu est plus optimal :
- entre 2 instruments de timbre "mat" plutôt que "brillants" (centroïde spectral situé dans les basses fréquences).
- lorsqu'un des instruments a une attaque rapide plutôt que 2 instruments avec des attaques lentes.

Il en arrive donc à l'établissement d'une théorie qui consiste à dire que l'appréciation du fondu est inversement liée à chacune des sommes des fréquences centrales (centroïde spectral) et du temps d'attaque des deux sons. Plus la valeur du centroïde et/ou la durée de l'attaque sera petite, meilleur sera le fondu.
Sandell avance que certaines notions de synergie de timbres décrites comme "un son qui absorbe, modifie ou adoucit un autre" dans les traités d'orchestration, sont corrélées à des effets de masquage plus complexes tels que: la suppression (Shannon 1976) et les résultats du masquage par comodulation (Hall, 1987).

3.1.3. Masquage des transitoires d’attaque et effet de choeur

Enfin, Hartmann précise l’importance des transitoires d’attaques dans la perception du timbre instrumental, d’où résultent de nombreuses problématiques de synthèse. Outre, la combinaison de timbres différents, le masquage s’opère également dans la combinaison des mêmes timbres. Un jeu à l’unisson va se différencier d’un jeu soliste par le masquage mutuel des transitoires d’attaque.
Ces transitoires sont plus faibles en intensité que la tenue du son, mais à l’inverse, elles véhiculent le maximum d’information. D’une part, elles contiennent la qualité expressive des notes individuelles. D’autre part, leur caractère idiosyncratique est fondamental pour la reconnaissance instrumentale, tel que le démontre l’expérience de la cloche coupée de Pierre Schaeffer [14] où le fait de couper l’attaque d’un son de cloche altère complètement la perception de son timbre (elle devient méconnaissable).

Dans le domaine de la synthèse instrumentale on trouve une application concrète du masquage mutuel. Il est difficile de synthétiser de manière réaliste un passage d’instrument soliste alors que la synthèse d’un chœur instrumental peut donner un résultat convaincant. L’imprécision des transitoires recréées dans le jeu soliste conduit l’auditeur à percevoir un caractère ennuyeux, sans âme, un peu artificiel. En revanche, la synthèse d’un choeur à l’unisson permet d’omettre les détails des transitoires à faveur d’une action généralisée plus aléatoire, l’auditeur n’a pas besoin de les entendre finement et s’en trouve satisfait.

Enfin, Hartmann précise que l’effet de masquage n’est pas linéaire. L’interaction mutuelle des instruments est différente à des niveaux sonores différents. D’une manière générale, la quantité relative de masquage augmente avec le niveau global. C’est pour cette raison que la nuance forte met plus en évidence les effets de choeur.


3.2 Le masquage temporel et la spatialisation des musiques électroacoustiques

3.2.1 La technique du démasquage

Le phénomène du masquage postérieur peut être mis en relation avec une technique de spatialisation des musiques électroacoustiques qu'Annette Vande Gorne appelle le démasquage. [15]

Le masquage postérieur concerne l’axe temporel, il a lieu lorsque le son masqué n’est toujours pas audible même après la disparition du son masquant. Il est très efficace à partir de 3 ms et diminue graduellement jusqu’à 200 ms pour disparaître ensuite.

Rappelons que l’interprétation des musiques électroacoustiques en concert, se fait à l'aide d'une console de diffusion, où chaque potentiomètre agit sur l'intensité sonore à attribuer à chacun des haut-parleurs présents sur la scène.

Figure 13: Schéma de l’acousmonium Motus (France) où l’interprète à la console (au centre) contrôle le volume des hautparleurs situés tout autour.

La technique de spatialisation par démasquage consiste à déplacer l’attention de l’auditeur par l’exagération du volume d’une des sources suivie de sa disparition.

Figure 14

La Figure 14 montre les deux étapes de la technique du démasquage:

1) Notre attention est focalisée par la source A beaucoup plus forte que la source B.

2) Les sons disparaissent de la source A. Nous cherchons où se trouve l’information et notre attention est défocalisée vers B.
Nous percevons alors un déplacement de A vers B.

L’hypothèse ici émise est que la durée de recouvrement de l’oreille qui suscite l’effet de masquage postérieur correspond à la durée de perception d’un déplacement entre les sources sonores.

3.1.2 Fade in / Fade out instrumental et mixte

En composition, ce principe de "déplacement" de l'attention est très effectif dans les écritures de textures stratifiées, où la disparition soudaine d'une strate sonore dans un ensemble est plus notable que l'entrée progressive d'une nouvelle strate. Il s’agit d’un procédé d’articulation qui se fait par jeu de masquage entre absence et présence du son. Cette articulation peut être liée à une spatialisation.
Nous entrons ainsi dans l’esthétique de l’émergence : la disparition d’une masse sonore plus intense met en évidence le contraste avec des sons plus ténus.

Le phénomène s’avère pratique dans l’écriture instrumentale : par exemple, pour faire entrer discrètement un instrument (brouillé par une masse plus intense), puis le faire émerger par disparition de ce bruit. L’on peut à partir de ces éléments, concevoir un jeu scénique d’ambiguïtés entre les sources : l’on voit l’instrumentiste jouer quelque chose que l’on n’entend pas ou qui ne correspond pas aux sons en présence, etc…

3.1.3 Loi de la Gestalt : Figure et fond

Pour terminer, évoquons le principe gestaltiste de figure et fond où notre cerveau classifie les informations par ordre de pertinence. Ce principe stipule que, tout comme dans le cas de la vision, ce qui est « pointu » représente un danger potentiel qui va se détacher des formes plus « arrondies ». Dans le cas de l’audition, d’après François Bayle [16] , notre attention donne priorité aux éléments saillants (articulations, attaques, morphologies instables) sur les informations dites « prégnantes » ou potentielles (tenues, arrière-plan, morphologies stables).

Luciano Berio dans Les Chants parallèles joue de ce principe en faisant émerger une trame de fond et en la masquant par des événements articulés au premier plan.

Notre organisation cognitive rend beaucoup plus complexe un phénomène simple de masquage, qui ne pourrait donc se limiter uniquement à des données physiologiques de bandes critiques et de sélectivité de l’oreille. L’exemple le plus démonstratif est celui de l’effet cocktail qui permet d’isoler une information précise (une conversation) au milieu d’un brouhaha d’informations. La binauralité de notre perception a également une influence sur l’efficacité du masquage (le seuil masquant augmente à une écoute monophonique), la reconstitution de la scène auditive joue également son rôle, etc…

On ne saurait donc exploiter complètement toutes les données qui sont liées au masquage, mais on peut savoir en tirer quelques ficelles pour la composition. C’est ce qui nous conduit à élaborer une partie pratique afin de mettre en application les principes étudiés tout au long de cette recherche.



SECOND VOLET : PRATIQUE

1. Projet personnel

Le projet personnel a consisté à réaliser une petite étude mixte (instruments et sons électroniques) afin d’expérimenter quelques résultats de laboratoire : le masquage par un bruit à bande étroite et par un sinus ; la création de timbres rugueux par le frottement des fréquences (situées à l’intérieur d’une même bande critique) ; et des effets de spatialisation par masquage temporel.

Formation :
Instruments acoustiques : une flûte à bec, un piano, deux tuyaux d’orgue

La source électronique a été créée grâce au Signal Generator (Digidesign) sur ProTools 7, qui a permis de générer des sinus, des bruits rose et blanc.

2. Méthodologie

Selon l’objectif visé, le travail s’est organisé en plusieurs temps ici détaillés :

2.1 Création des masques

1) Enregistrement des instruments acoustiques : flûte à bec.
2) Analyse spectrale (sonagramme) des sons acoustiques avec Izotope RX (Fig. 15).
3) Création de masques de bruits à partir de cette analyse avec l’Equalizer Masterworks MOTU sur le logiciel Digital Performer 6 (Fig. 16).
4) Montage/mixage final sur ProTools 7. Il s’agit de combiner les deux sources : la flûte et son masque.

Figure 15 : analyse d’un son de la 880 Hz à la flûte à bec (Izotope RX)

Figure 16 : il s’agit d’appliquer sur un bruit rose l’enveloppe spectrale du son de flûte, afin d’obtenir un bruit à bande étroite qui épouse les caractéristiques harmoniques de la flûte. Ici le même la 880 Hz.

2.2 Création de timbres rugueux

1) Enregistrement des instruments : flûte à bec, tuyaux d’orgue. Classement des fichiers sons.
2) Transposition de n centièmes des fichiers sons grâce à l’outil Pitch Shift de Digidesign sur ProTools 7.
3) Combinaison (superposition ou tuilage) du son original et de ses transpositions sur ProTools 7.

2.3 Masquage des harmoniques

1) Superposition simple de l’enregistrement de piano et de flûte à bec.

2.4 Spatialisation

1) Utilisation des automations de volume de ProTools 7 sur un bruit rose.

3. Résultats

L’étude musicale a permis d’explorer différents phénomènes impliquant le masquage, ils sont présentés dans l’ordre suivant :

- la spatialisation gauche-droite grâce à la technique du démasquage

- le masquage simple d’une flûte par une bande étroite de bruit rose

- le masquage des harmoniques : ceux du piano par la flûte

- le masquage simple : un sinus par la flûte

- le masquage simple : la flûte par le sinus (inversion)

- la création de timbres rugueux dans le grave. Deux sons de tuyaux d’orgue séparés par 75, 100, 250 puis 45 centièmes. Mise en évidence de la variation de la vitesse du battement en fonction de l’écartement des sons.

- le frottement de deux sons presque purs : deux sons de flûtes séparés par 45c, présentés sur 2 canaux différents (le son A sur le canal gauche et le son B sur le canal droit), afin de souligner la ségrégation de l’information qui estompe la sensation de rugosité ; puis en stéréo normale (les sons A et B sortent simultanément à gauche et à droite des panoramiques) mettant en valeur la rugosité.

- la création de timbres rugueux dans l’aigu : superposition de plusieurs sons de flûtes dont les fondamentales sont séparées entre 16 et 65 centièmes.


Conclusion

En explorant le phénomène de masquage à travers les expériences de laboratoire nous avons pu mettre en évidence quelques caractéristiques principales des courbes de masque : masquage uniforme du bruit blanc, masquage irrégulier du son pur (présence de battements et de sons différentiels), le masquage plus quantitatif du bruit à bande étroite et le masquage plus qualitatif son pur, la déperdition d’énergie caractéristique des sons acoustiques qui rend plus complexe la courbe de masque.

A travers la notion de bande critique, nous avons tenté d’expliquer les raisons du phénomène : constitution de notre oreille en filtres passe-bande qui se chevauchent, asymétrie caractéristique de ces filtres qui expliquent pourquoi les graves masquent les aigus, et perception de la rugosité lorsque deux sons purs se trouvent à l’intérieur d’une même bande critique.

Dans le monde musical, le phénomène est plus difficile à cerner en raison de l’interaction de sons musicaux (sons complexes) qui ont chacun des propriétés très différentes (contrairement à des son purs). Nous avons pu dénoter quelques phénomènes, comme le masquage des transitoires, le masquage des harmoniques, le masquage partiel lié à la fusion instrumentale ; qui sont déterminants dans la perception du timbre dans un ensemble instrumental.

Enfin, quelques principes de notre organisation cognitive (analyse de la scène auditive, lois gestaltistes) mettent en évidence d’autres facteurs, plus subjectifs, entrant en compte dans le phénomène de masquage. Pour la partie pratique, l’étude musicale a permis d’explorer des phénomènes simples, plutôt dans l’optique d’une application de résultats de laboratoire à des instruments acoustiques. Il s’avère que d’une manière générale, les propriétés de laboratoire s’appliquent assez bien au monde musical, à condition d’utiliser des instruments comme la flûte à bec qui s’apparentent à des sons purs. La notion de bande critique associée à la perception de rugosité a été pour moi un outil précieux pour mieux comprendre l’interaction des harmoniques et l’appréciation des timbres instrumentaux.
Cette recherche m’a donc permis de théoriser et mettre des mots sur des phénomènes que l’on utilise intuitivement en tant que musicien, notamment les principes d’orchestration.



Bibliographie

BAYLE F. Une logique des sensations dans L'Analyse Perceptive des musiques électroacoustiques, Revue Lien, Musiques et Recherches, 2006.
http://www.musiques-recherches.be/edition.php?lng=fr&id=110

BOUCKAERT L. Les chants parallèles de Berio, Université Sorbonne-Paris IV, 2005.
www.musimediane.com/numero4/LBouckaert/presentation.html

GREENWOOD D. Auditory Masking and the Critical Band. Journal of the Acoustical Society of America, 1961, vol. 33, pp. 484–502.

GREENWOOD D. Critical Bandwidth and the Frequency Coordinates of the Basilar Membrane. Journal of the Acoustical Society of America, 1961, vol. 33, pp. 1344–1356.

HARTMANN W.M, Psychoacoustics and contemporary music, 1983.
www.pa.msu.edu/acoustics/37mus.pdf

HASEGAWA R. Aux Etats-Unis, des voies parallèles au spectralisme, Revue étincelle, IRCAM, Novembre 2006.
http://etincelle.ircam.fr/646.html

HOWARD D.M & ANGUS J. Acoustics and Psychoacoustics, 2nd Edition. Amsterdam Focal Press, 2001. pp. 74-79, 221-236 MOORE Brian C.J. Hearing and Psychoacoustics. Grove Music Online. Oxford Music Online. 27 Jan. 2010.
http://www.oxfordmusiconline.com/subscriber/article/grove/music/42531

PIERCE John R. Le Son musical, Pour la Science-Belin 1984

PLOMP & LEVELT, Tonal consonance and Critical Bandwith, Journal of the Acoustical Society of America, vol 38, p.548, 1965

PRESSNITZER D., MCADAMS S. Acoustics, Psychoacoustics and Spectral Music, Contemporary Music Review, 2000, Vol.19, part. 2, p.33-59

SANDELL G.J. Perception of concurrent timbres and implications for orchestration, Thèse from International Computer Music Conference, p.268-272. San Francisco, CA: The Computer Music Association, 1989.

SCHAEFFER P. Traité des Objets Musicaux : essai interdisciplines, Paris, Edition du Seuil, 1966.

VANDE GORNE A. L’interprétation spatiale. Essai de formalisation méthodologique, Revue Démeter, décembre 2002, Université de Lille 3. p.9.
http://demeter.revue.univ-lille3.fr/interpretation/vandegorne.pdf




[1] Modèles de Patterson, Allerhand et Guigére, Seneff.

[2] PIERCE J.R. Le Son Musical, 1984. p.120

[3] MOORE Brian C.J. Masking and frequency analysis dans Hearing and psychoacoustics. Grove Music Online. Oxford Music Online. 19 Mar. 2010

[4] HOWARD D.M. & ANGUS J. Critical bands dans Acoustics and psychoacoustics, 2001. p.75

[5] MC ADAMS & PRESSNITZER, More than just a transmission, dans Acoustics, Psychoacoustics and Spectral Music, p.44

[6] PIERCE J.R., Le Son Musical, 1984. p.126

[7] GRENNWOOD D. Auditory Masking and the Critical Band, Journal of the Acoustical Society of America, avril 1961 vol 33, n°4, pp. 484–502.

[8] HOWARD D.M & ANGUS J. Critical bands (Chapitre 2.2 ) dans Acoustics and psychoacoustics, 2001. p.75

[9] PLOMP & LEVELT. 9 Tonal Consonance and critical bandwith, JASA vol 38, p. 548, 1965

[10] PRESSNITZER & MC ADAMS Acoustics, Psychoacoustics and Spectral Music, p.47

[11] PRESSNITZER & MC ADAMS Acoustics, Psychoacoustics and Spectral Music, p.41-42

[12] HARTMANN W.M. Psychoacoustics and contemporary music, 1983

[13] SANDELL G.J. Perception of concurrent timbres and implications for orchestration, Thèse, International Computer Music Conference, 268-272. San Francisco, CA: The Computer Music Association, 1989.

[14] SCHAEFFER P. Traité des objets musicaux, 1966

[15] VANDE GORNE A. L’interprétation spatiale. Essai de formalisation méthodologique, Revue Démeter, décembre 2002, Université de Lille 3. p.9

[16] BAYLE F. Une logique des sensations dans L'Analyse Perceptive des musiques électroacoustiques, Revue Lien, Musiques et Recherches, 2006

[TOP]