Perception auditive

Dans cette thématique, l’objet de recherche est le système auditif humain. L’enjeu est de comprendre et modéliser les mécanismes d’élaboration de percept comme la sonie et la hauteur tonale. Nous utilisons aussi ces connaissances pour proposer et tester des modifications du codage des sons dans l’implant cochléaire. Les domaines d’application recouvrent les télécommunications, la santé, le confort et la gêne acoustique.

Participants permanents : Renaud Côte (MCF), Emmanuel Friot (CR), Olivier Macherey (CR), Sabine Meunier (DR), Marc Pachebat (IR), Guy Rabau (IR)

Perception des très basses fréquences et des sons d’éoliennes

Personnel associé : Sabine Meunier, Ossen El Sawaf, Guy Rabau, Marc Pachebat, Emmanuel Friot, Renaud Côte

Collaborations : Paul Avan (Institut de l’Audition, Institut Pasteur), Catherine Marquis-Favre (LTDS, ENTPE), Benjamin Cotté (IMSIA, Ensta-ParisTech), Anne-Sophie Evrard (Umrestte, Univ. Gustave Eiffel), Chrystèle Phillipps-Bertin (AME-MODIS, Univ. Gustave Eiffel), David Ecotière et Benoit Gauvreau (UMRAE, Univ. Gustave Eiffel), Arnaud Norena (CRPN, CNRS), Maya Elzière et Maeva Montero (Hôpital Européen, Marseille), Christophe Lambourg et Pierre Leroy (Arteac-Lab), Simon Bazin et Arthur Chavaroc (Factem).

La question de la perception des sons très basses fréquences (TBF, fréquence <200 Hz) émerge depuis plusieurs années car les sources de bruit basse fréquence sont en expansion (bruit de transport souvent transmis par voie solidienne dans les habitations, bruits industriels). Les niveaux (en dB A) ne sont pas très élevés, mais la gêne peut être importante et les outils actuels de sa quantification ne permettent pas de prendre en compte les TBF. Ces problèmes sociétaux posent de nombreuses questions concernant la perception des TBF. En effet, la majorité des connaissances du système auditif humain ont été élaborées pour des sons de fréquences moyennes (souvent entre 200 et 8 000 Hz). La plage des TBF est encore largement inexplorée, et les données que nous commençons à avoir montrent des comportements différents pour les TBF de ce que l’on connaît à plus haute fréquence. Nos travaux sur ce sujet recoupent des aspects fondamentaux et applicatifs. D’un point de vue fondamental, nous étudions l’intégration spectrale et temporelle de la sonie, ainsi que les filtres auditifs. Ces travaux nous permettront de modéliser la sonie de sons TBF afin, entre autres, d’alimenter les modèles de gêne sur lesquels nos partenaires du LTDS travaillent dans le cadre de l’ANR RIBEolH, concernant les sons d’éoliennes.

Nous travaillons également avec les sociétés Arteac-Lab et Factem dans le cadre du développement d’un appuie-tête de véhicule construit pour réaliser du contrôle actif de bruit. L’objectif de nos travaux est de quantifier l’apport perceptif du contrôle qui réduit plus spécifiquement les TBF.
Nous nous intéressons également au cas spécifique des personnes hypersensibles aux TBF. En effet, certaines personnes se plaignent de perception de sons très graves très gênants dont ils n’arrivent pas à identifier l’origine ; alors que ces personnes sont en très grande souffrance, leur entourage ne perçoit rien. Dans le projet PISTE (MITI-CNRS), en collaboration avec l’Institut de l’audition, le CRPN et l’hôpital Européen de Marseille, nous explorons la problématique de l’hypersensibilité aux TBF selon deux axes : par une caractérisation acoustique des sons possiblement responsables de cette hypersensibilité et par une exploration psychoacoustique et physiologique dans le but de comprendre les mécanismes auditifs impliqués dans cette hypersensibilité.
Pour étudier la perception des TBF, il est nécessaire de pouvoir restituer les signaux à des niveaux audibles sans distorsions. Pour cela, nous avons conçu un équipement composé d’un ensemble de 72 haut-parleurs pilotés par 36 canaux indépendants dans une cabine close, nous permettant de restituer la gamme 4-3000 Hz sans distorsions audibles.

Figure 1 : Cabine de synthèse de champ sonore construite au LMA pour reproduire des sons très basse fréquence qui soient audibles par l'humain. Le champ sonore est contrôlé en un point de la cabine (totalement hermétique) à l'aide d'un ensemble de 32 subwoofers et 40 haut-parleurs basse permettant une restitution à des niveaux audibles sans distorsion audibles sur la gamme de fréquences de 4 à 3000 Hz.

Perception de l’intensité sonore

Personnel associé : Sabine Meunier, Olivier Macherey
Collaborations : Patrick Susini (IRCAM)

L’intensité sonore est codée par le taux de décharges du nerf auditif, puis dans les différentes structures des voies afférentes pour former, dans le cortex auditif, le percept de sonie. Nos recherches sont orientées d’une part, vers un aspect particulier du codage dans le nerf auditif qui concerne l’effet du contexte sur la perception de l’intensité sonore et, d’autre part, sur la formation de la sonie des sons non stationnaires.

Effet du contexte – Adaptation de la plage dynamique

Plusieurs études ont montré que le codage de l'intensité sonore ne peut pas être vu comme indépendant du contexte sonore. Par contexte sonore, on entend les sons présentés avant ou après le son d'intérêt, voire simultanément. En électrophysiologie, il a été montré, chez l'animal, que la plage dynamique d’un neurone donné peut se modifier de façon à ce que le niveau auquel le neurone est le plus sensible dépende du niveau moyen des sons présentés en amont. L’objectif de nos recherches est de déterminer si l'adaptation de la plage dynamique est également présente chez l’humain. L'hypothèse est que nos capacités de discrimination de l’intensité devraient être meilleures lorsque les sons à discriminer (cibles) sont précédés de sons précurseurs ayant un niveau similaire aux cibles que lorsqu’ils sont précédés de sons précurseurs ayant un niveau très différent des cibles. Nous avons confirmé cette hypothèse, mais uniquement pour des sons larges bandes, alors que les mesures physiologiques l’ont montré pour des sons étroits et larges en fréquence. Nous avons également mis en évidence l’adaptation de la dynamique dans le nerf auditif humain en mesurant des potentiels d’actions composites du nerf auditif chez des personnes portant un implant cochléaire. Ce résultat est important car il montre que ce phénomène existe chez l’humain et surtout permet de mieux en comprendre l’origine. En effet, plusieurs hypothèses ont été formulées, notamment une origine au niveau des cellules ciliées. Les personnes implantées cochléaires ayant une perte quasi complète des cellules ciliées, il est très peu probable que l’origine de l’adaptation de la plage dynamique se fasse uniquement à ce niveau-là du système auditif.

Figure 2 : Représentation schématique d’une expérience de discrimination d’intensité destinée à mettre en évidence l’adaptation de dynamique chez des participants normo-entendants. La plus petite différence d’intensité perceptible est mesurée à deux niveaux sonores : un niveau relativement faible (standard en bleu, gauche de la figure) et un niveau relativement élevé (standard en rouge, à droite). Ces seuils de discrimination sont déterminés dans le silence (A et B) pour référence mais également dans un contexte sonore de niveau faible (C, D) et fort (E et F). Une adaptation de la dynamique devrait se manifester par des performances en discrimination d’intensité meilleures lorsque les niveaux du standard et du contexte sont identiques (C et F) que lorsqu’ils sont différents (D et E).

Sonie des sons croissants et décroissants

Nos travaux sur la perception de l’intensité sonore ont concerné également le percept de sonie. L’objectif est d’étendre nos connaissances psychophysiques sur la sonie à des cas peu étudiés dans la littérature ou soulevant encore de nombreuses questions, nous travaillons actuellement sur la sonie des sons non stationnaires, et en particulier des sons dont l’intensité croît ou décroît dans le temps. On sait qu'une simple inversion de l'enveloppe temporelle d'un son, tout en conservant les autres caractéristiques acoustiques, a un effet important sur la perception. Concernant la sonie, si l'on considère deux sons dont l’intensité croît pendant quelques secondes pour l'un et décroît pendant la même durée pour l'autre, sur la même plage d’intensité, la sonie globale (sonie perçue sur la globalité du son) du son croissant est plus forte que la sonie globale du son décroissant (ce phénomène est appelé asymétrie de sonie). Nous avons mené différentes études dans le passé pour caractériser ce phénomène. Nous avons notamment montré qu'un son croissant est perçu 4 phones plus fort qu’un son décroissant (Ponsot et al., 2015). Nous avons ensuite cherché à mettre en évidence les mécanismes sous-jacents à la formation de la sonie globale de sons d'intensité croissante ou décroissante ainsi qu'à l'asymétrie observée. Nous avons émis l'hypothèse que la sonie globale se formait par une intégration du signal sur sa partie la plus forte, nos expériences confirment cette hypothèse (Ponsot et al., 2017). Nous avons également émis l’hypothèse que l'asymétrie de sonie serait due à un "mécanisme d'affaiblissement" ("decay mechanism" en anglais), lié à la mémoire, qui viendrait réduire cette intégration au fil du temps pour les sons décroissants. Pour l'instant, nous n'avons pas réussi à confirmer cette hypothèse. Nous étudions actuellement l’interaction entre la hauteur tonale et l’asymétrie en sonie. Nous avons en effet trouvé que lorsque les sons ne procurent pas de sensation de hauteur tonale, l’asymétrie est moins importante que lorsqu’ils produisent une sensation de hauteur tonale. On sait qu’il y a également une asymétrie de perception de la hauteur tonale entre sons croissants et décroissants. On émet l’hypothèse que l’asymétrie décrite dans la littérature pour la hauteur tonale viendrait renforcer l'asymétrie de sonie. Ce lien entre hauteur tonale et sonie n'est pas étonnant car on sait que ces deux dimensions interagissent. Nous avons poursuivi en recherchant s'il existe une corrélation entre saillance de hauteur tonale (c'est-à-dire prégnance de la sensation de hauteur tonale) et asymétrie de sonie, les premiers résultats semblent montrer que oui, mais ils sont à confirmer.

Figure 3 : Asymétries de sonie entre sons croissants et décroissants et effet de la saillance de hauteur tonale. Une asymétrie positive indique que le niveau du son décroissant doit être plus fort que celui du son croissant pour que les deux soient perçus comme ayant la même sonie, ce qui signifie que le son décroissant serait perçu comme mois fort que le son croissant de même niveau. Les barres d'erreur correspondent à l'écart-type.
WN : White Noise (bruit blanc, large bande, ne procure pas de sensation de hauteur tonale)
MT : Multi Tone (son pur dont la fréquence varie sur des intervalles de temps variables, entre 920 et 1080 Hz, saillance de hauteur tonale faible)
RWN : Random White Noise (Bruit blanc gelé répété toutes les millisecondes, saillance de hauteur tonale forte à 1 kHz)
PT : son pur de 1 kHz (son pur de 1 KHz, saillance de hauteur tonale forte).

Perception de la hauteur tonale chez le normo-entendant et l’implanté cochléaire

Personnel associé : Thu Ngân Dang, Olivier Macherey
Collaborations : Bob Carlyon (University of Cambridge)

La hauteur tonale est le corrélat perceptif de la fréquence fondamentale des sons. L’humain utilise la hauteur tonale non seulement pour suivre la mélodie d’une musique mais aussi pour extraire la voie d’un locuteur dans un bruit de fond. La hauteur tonale nous aide en effet à regrouper les différentes composantes fréquentielles appartenant à cette voix d’intérêt. L’être humain est capable de percevoir des différences de fréquence extrêmement petites. Pour des sons purs, cette différence est plus de 20 fois inférieure à un demi-ton (qui est la plus petite différence présente dans la musique occidentale ; Moore, 2003). Les mécanismes sous-jacents à la perception de la hauteur tonale, en particulier les indices présents au niveau du nerf auditif que le système utilise pour juger qu’un son est plus aigu qu’un autre, ont fait et continuent de faire débat au sein de la communauté. Un son pur excite une portion restreinte de neurones auditifs. Lorsque la fréquence de ce son pur augmente, deux changements s’opèrent de façon concomitante : tout d’abord, la membrane basilaire vibre à un autre locus (les vibrations se déplaçant vers sa base). Ceci fait que d’autres neurones sont stimulés. Deuxièmement, la membrane basilaire vibre plus rapidement, ce qui fait que ces neurones déchargent plus rapidement. Potentiellement, le système auditif peut donc utiliser ces deux indices (indice de place et indice temporel) pour percevoir qu’un son est plus aigu qu’un autre. L’extraction de la hauteur tonale de sons complexes peut également être expliquée par l’un ou l’autre de ces mécanismes.

Perception de la hauteur tonale chez le normo-entendant

Nous avons récemment développé un nouvel outil destiné à étudier la contribution des indices temporels à la perception de la hauteur tonale (Hilkhuysen and Macherey, 2014 ; Macherey, 2024). Nous avons montré que ces indices temporels sont perceptibles même dans des cas où les indices de place sont très réduits.

Perception de la hauteur tonale chez le porteur d’implant cochléaire

A l’heure actuelle, nous ne parvenons pas à transmettre des sensations de hauteur tonale fines aux personnes implantées et il n’est pas rare qu’il faille imposer des différences de 3 ou 4 tons (c’est-à-dire une différence de 6-8 touches de piano) pour engendrer un changement perceptible. Dans une série d’études en collaboration avec l’Université de Cambridge, nous avons étudié la perception de la hauteur tonale sur base d’indices purement temporels chez l’implanté cochléaire. Nous avons montré que transmettre cet indice temporel à l’aide d’une seule électrode pouvait procurer des bénéfices comparé à ce qui est réalisé dans les stratégies de codage actuels (Macherey et Carlyon, 2025 ; De Groote et al., 2024). Nous avons également démontré que le système auditif ne parvenait pas à déchiffrer plusieurs codes temporels différents délivrés par différentes électrodes, démontrant les limites de ces mêmes indices temporels et leur incapacité à fournir une perception de la hauteur tonale normale (De Groote et al., 2025).

Figure 4 : Schéma d’un implant cochléaire montrant la partie externe comprenant le contour d’oreille (microphone et processeur vocal) et l’antenne émettrice et la partie interne montrant le récepteur/stimulateur et le faisceau d’électrodes implantées dans la cochlée stimulant électriquement les neurones du ganglion spiral

Stratégie de rééducation auditive de patients implantés avec audition résiduelle controlatérale

Personnel associé : Marine Jambois, Olivier Macherey

Collaborations : Alexis Hervais-Adelman (Université de Genève), Mathieu Marx (CHU Toulouse)

Les scores de reconnaissance de la parole des patients implantés cochléaires montrent en général une progression au cours des premières semaines/premiers mois après l’opération. L’asymptote est en général atteinte après 6-7 mois. Il existe donc une période sensible durant laquelle s’effectue un apprentissage perceptif des signaux de parole délivrés par l’implant. Les patients apprennent à entendre et à comprendre avec leur nouvelle oreille et à donner du sens à ces stimuli distordus. Au cours des deux dernières décennies, les critères d’implantation ont été fortement élargis. Il n’est désormais pas rare d’implanter des patients avec des restes auditifs significatifs (en général basse fréquence) dans l’oreille controlatérale. De plus, depuis 2023, l’IC est aussi indiqué en France pour les patients sourds unilatéraux souffrant d’acouphènes invalidants (l’IC montre des effets bénéfiques sur la réduction de l’acouphène dans l’oreille sourde). Ces patients se retrouvent donc avec une oreille normale et avec un IC de l’autre côté ! Il a été montré dans plusieurs études que les scores de reconnaissance de la parole obtenus avec l’implant seul plusieurs mois après l’opération sont plus faibles chez les patients ayant des restes auditifs que chez les patients sourds bilatéraux. Nous postulons que ceci est dû au fait que les restes auditifs de l’oreille controlatérale peuvent freiner l’apprentissage perceptif des signaux de parole transmis par l’implant. Pour prendre un cas extrême, celui des patients ayant une audition normale de l’autre côté, ils n’ont pas « besoin » de l’IC pour comprendre la parole et n’ont donc pas besoin de prêter attention à cette oreille. L’objectif de ce projet est de pallier à cette limite et de tenter de maximiser l’apprentissage chez ces patients. Nous estimons que cela est important car certains patients abandonnent l’usage de leur IC de façon prématurée tandis que d’autres n’en tirent pas tous les bénéfices possibles.
Notre hypothèse de travail est que leur apprentissage pourrait être potentialisé avec des protocoles d’entrainement spécifiques, en particulier en modifiant le signal présenté à l’oreille normale pour que celle-ci ne délivre que certains indices dégradés par l’IC (mais que ces indices ne soient pas suffisants pour comprendre la parole lorsqu’ils sont présentés de manière isolée). En d’autres termes nous voulons étudier s’il est possible d’utiliser l’audition controlatérale de ces sujets pour accélérer leur apprentissage des sons de parole transmis par l’IC et maximiser ainsi, à terme, leur intelligibilité de la parole.
Nous cherchons donc à étudier l’effet d’une stimulation controlatérale sur l’apprentissage de la parole dégradée. Ces études étant difficiles à réaliser chez l’implanté cochléaire pour des raisons éthiques et de nombre de patients, nous avons décidé de commencer à étudier cette question chez des auditeurs normo-entendants auxquels nous présentions des simulations acoustiques d’IC (développées précédemment au laboratoire, c.f. Mesnildrey et al., 2015 ; Karoui et al., 2019). De façon cohérente avec notre hypothèse, une première étude a montré qu’un signal de parole intelligible présenté dans l’oreille contralatérale à la simulation d’IC pouvait freiner l’apprentissage (Chavant et al., 2021). Une deuxième étude plus complète et impliquant un plus grand nombre de patients a confirmé ces résultats. Nous étudions actuellement plusieurs modifications du signal de parole et testons leurs effets sur l’apprentissage perceptif à la fois chez des auditeurs normo-entendants et implantés cochléaires.

Stimulation ultrasonore du système auditif

Personnel associé : Olivier Macherey, Vinay Parameshwarappa, Emilie Franceschini, Eric Debieu, Serge Mensah

Collaborations : Arnaud Norena (CRPN), Aziz Moqrich (IBDM), Damir Kovacic (Université de Split, Croatie)

La neurostimulation électrique consiste à stimuler des neurones du corps humain à l’aide d’électrodes implantées par chirurgie. C’est une technique invasive qui est notamment utilisée pour le traitement de la douleur chronique en stimulant les neurones des ganglions dorso-rachidiens (DRG) et pour les surdités profondes en stimulant les neurones du ganglion spiral (SGN) avec un implant cochléaire. Une des principales limites de la neurostimulation électrique est son manque de précision spatiale et son incapacité à stimuler des populations de neurones ciblées. Cette limite a des effets majeurs sur les percepts induits par la neurostimulation électrique. Dans le cas de l’implant cochléaire par exemple, bien que nombre d’utilisateurs d’implant parviennent à suivre des conversations dans des environnements calmes, leurs performances se détériorent dans des situations d’écoute plus complexes, comme en présence de bruit. Notre objectif est ici d’étudier la neurostimulation ultrasonore comme alternative à la stimulation électrique afin de pouvoir stimuler les neurones avec une plus grande précision spatiale. Notre approche combine des expériences in Vitro réalisées sur des cultures primaires de neurones auditifs et de neurones du ganglion dorso-rachidien et in Vivo chez le cobaye.
Le premier objectif de notre travail a été de démontrer que les neurones DRG et SGN peuvent être activés par ultrasons focalisés. Nous avons développé un dispositif expérimental permettant de suivre l’activité des neurones DRG et SGN soumis à des stimuli ultrasonores par imagerie calcique (c.f. Figure 2). La stimulation ultrasonore était réalisée grâce à un transducteur de fréquence centrale 20 MHz focalisé sur des cultures de neurones primaires. Nous avons identifié une gamme de paramètres de stimulation permettant d’activer directement les neurones DRGs et SGNs, apportant la preuve que ces neurones sont bien sensibles aux ultrasons. Cette stimulation est de plus très précise puisqu’elle permet de stimuler des zones de l’ordre de 250 micromètres de diamètre. En utilisant des paramètres de stimulation optimaux, nous avons montré que respectivement 52% et 75% des DRGs et des SGNs étaient activés, suggérant que certains neurones ne sont pas sensibles. L’imagerie ultra-rapide a révélé que la déformation cellulaire à grande échelle est concomitante à l’activation des neurones DRG et SGN, renforçant l’hypothèse selon laquelle les forces mécaniques jouent un rôle majeur dans l’activation cellulaire. Nos efforts se concentrent actuellement sur la partie in Vivo et cherchent à stimuler différentes parties du système auditif avec des ultrasons focalisés et à comprendre les mécanismes mis en jeu par ces stimulations.

Figure 5: Réponse calcique de cultures primaires de neurones du ganglion spiral à une stimulation ultrasonore