Par Matthew Hutson
D’une manière ou d’une autre, même dans une pièce pleine de conversations bruyantes, notre cerveau peut se concentrer sur une seule voix dans quelque chose appelé l’effet de cocktail. Mais plus ça devient fort – ou plus on vieillit – plus c’est difficile à faire. Maintenant, les chercheurs ont peut-être trouvé comment résoudre ce problème – avec une technique d’apprentissage automatique appelée le cône du silence.
Les informaticiens ont formé un réseau neuronal, qui imite à peu près le câblage du cerveau, pour localiser et séparer les voix de plusieurs personnes parlant dans une pièce. Le réseau l’a fait en partie en mesurant le temps qu’il fallait pour que les sons atteignent un groupe de microphones au centre de la pièce.
Lorsque les chercheurs ont testé leur configuration avec un bruit de fond extrêmement fort, ils ont constaté que le cône de silence localisait deux voix. à 3,7 ° ou moins de leurs sources, ont-ils rapporté ce mois-ci lors de la conférence en ligne sur les systèmes de traitement de l’information neuronale. Cela se compare à une sensibilité de seulement 11,5 ° pour la technologie de pointe précédente. Lorsque les chercheurs ont formé leur nouveau système sur des voix supplémentaires, il a réussi le même truc avec huit voix – à une sensibilité de 6,3 ° – même s’il n’en avait jamais entendu plus de quatre à la fois.
Un tel système pourrait un jour être utilisé dans des appareils auditifs, des installations de surveillance, des haut-parleurs ou des ordinateurs portables. La nouvelle technologie, qui peut également suivre des voix en mouvement, peut même faciliter vos appels Zoom, en séparant réduire le bruit de fond, des aspirateurs aux enfants turbulents.
“Introverti hardcore. Pionnier de la bière. Amoureux d’Internet. Analyste. Spécialiste de l’alimentation. Passionné de médias sociaux.”