🏁 This page has been validated by alexoudeon on 2024-08-31 at 00:00:00.
Théorie spectrale du son
Si vous enregistrez le son de votre accordéon avec un microphone (si possible de bonne qualité ;), vous êtes en mesure d'observer son spectre. La théorie mathématique de Fourier nous dit en gros que tout son est décomposable en une somme de sinusoïdes définies en fréquence, amplitude et phase. Une sinusoïde est l'oscillation la plus simple qui soit.
Sur un graphique, on peut représenter un son par fréquence et où la couleur donne l'amplitude. La phase est souvent nulle, donc non représentée. Cela forme des raies caractéristiques et fluctuantes dans le temps. L'exemple suivant est celui d'un signal triangulaire Do/C4 avec une amplitude constante. C'est pourquoi les raies sont très simples à visualiser :
Lorsqu'on joue une note, il y a d'abord une fondamentale, c'est-à-dire une fréquence la plus basse avec une grande amplitude, qu'on entend très bien et qui correspond à la note jouée. La mécanique des vibrations nous démontre que cette fréquence est accompagnée d'harmoniques, c'est-à-dire de fréquences multiples de la fondamentale et d'amplitudes généralement inférieures. Une sinusoïde n'a pas d'harmonique contrairement à un son en dents de scie qui en a énormément (c'est lié à la variation brusque de la forme du signal qui génère des hautes fréquences pour compenser). L'accordéon est un mélange harmonique selon une certaine distribution des fréquences qui dépend des matériaux, de la fabrication, du montage, de l'accordage, de la température, de l'usure, etc...
Attention : il ne faut pas confondre « fréquence d'une note de musique » avec « fréquence des harmoniques ». En effet, si vous jouez un La/A4 de 440 Hz, le spectre entendu sera potentiellement composé des fréquences multiples 440, 880, 1320, 1760, 2200, 2640 Hz... (on ajoute à chaque fois la fréquence fondamentale). Toutes ces fréquences peuvent correspondre à d'autres notes. Par exemple, la deuxième harmonique du La/A4 vaut 1320 Hz qui est presque équivalente au Mi/E6, mais vous n'avez pas joué de Mi/E6 à la main droite ! Quand vous passez à l'octave supérieure pour changer la note, vous multipliez la fréquence de l'octave inférieure par 2, ce qui forme un schéma exponentiel. Il traîne ainsi des fréquences dont on a l'illusion qu'il s'agit de notes de musique.
Tableau des fréquences des notes
Chaque note est associée à une fréquence selon cette formule :
Note | Note US | 2 | 3 | 4 | 5 | 6 | 7 |
---|---|---|---|---|---|---|---|
Do | C | 65,4 | 130,8 | 261,6 | 523,3 | 1046,5 | 2093 |
Do# Réb | C# Db | 69,3 | 138,6 | 277,2 | 554,4 | 1108,7 | 2217,5 |
Ré | D | 73,4 | 146,8 | 293,7 | 587,3 | 1174,7 | 2349,3 |
Ré# Mib | D# Eb | 77,8 | 155,6 | 311,1 | 622,3 | 1244,5 | 2489 |
Mi | E | 82,4 | 164,8 | 329,6 | 659,3 | 1318,5 | 2637 |
Fa | F | 87,3 | 174,6 | 349,2 | 698,5 | 1396,9 | 2793,8 |
Fa# Solb | F# Gb | 92,5 | 185 | 370 | 740 | 1480 | 2960 |
Sol | G | 98 | 196 | 392 | 784 | 1568 | 3136 |
Sol# Lab | G# Ab | 103,8 | 207,7 | 415,3 | 830,6 | 1661,2 | 3322,4 |
La | A | 110 | 220 | 440 | 880 | 1760 | 3520 |
La# Sib | A# Bb | 116,5 | 233,1 | 466,2 | 932,3 | 1864,7 | 3729,3 |
Si | B | 123,5 | 246,9 | 493,9 | 987,8 | 1975,5 | 3951,1 |
Une note MIDI est un numéro normé pour identifier une note. Par exemple, 69 est le diapason La/A4 de 440 Hz. Par conséquent, si on pose M le numéro de note MIDI, la fréquence f est la donnée par la relation : f = 440 * 2^((M - 69) / 12)
. À partir de la fréquence, on retrouve la note en inversant la formule : M = 69 + 12/ln(2) * ln(f/440)
. Il nous est possible de l'approximer pour obtenir : M = 17,31 * ln(f) - 36,38
. La note s'obtient en lisant ce nouveau tableau :
Note | Note US | 2 | 3 | 4 | 5 | 6 | 7 |
---|---|---|---|---|---|---|---|
Do | C | 36 | 48 | 60 | 72 | 84 | 96 |
Do# Réb | C# Db | 37 | 49 | 61 | 73 | 85 | 97 |
Ré | D | 38 | 50 | 62 | 74 | 86 | 98 |
Ré# Mib | D# Eb | 39 | 51 | 63 | 75 | 87 | 99 |
Mi | E | 40 | 52 | 64 | 76 | 88 | 100 |
Fa | F | 41 | 53 | 65 | 77 | 89 | 101 |
Fa# Solb | F# Gb | 42 | 54 | 66 | 78 | 90 | 102 |
Sol | G | 43 | 55 | 67 | 79 | 91 | 103 |
Sol# Lab | G# Ab | 44 | 56 | 68 | 80 | 92 | 104 |
La | A | 45 | 57 | 69 | 81 | 93 | 105 |
La# Sib | A# Bb | 46 | 58 | 70 | 82 | 94 | 106 |
Si | B | 47 | 59 | 71 | 83 | 95 | 107 |
Analyse spectrale d'un accordéon
Je me demandais combien il y a de voix dans la main gauche de mon accordéon sans le démonter. Je sais juste qu'il a 2 registres, l'un étant plus fort et plus consommateur d'air que l'autre un peu pâle. Pour ce faire, il suffit d'enregistrer le son et d'observer le rendu spectral en temps réel.
C'est ce que j'ai fait à l'aide d'Equalizer 2 dans FL Studio. Cela m'a donné deux spectres pour la note de Do/C central. Sur le premier graphique, on observe 2 raies fondamentales en C3 et C5. Sur le deuxième graphique, on observe 2 raies fondamentales supplémentaires en C2 et C4. De ce fait, l'accordéon a 4 voix et on sait quelles sont les notes jouées en fonction du registre.
Vérifier un accordage
Les manufactures utilisent des accordeurs Korg pour s'assurer que les anches produisent un son à la bonne fréquence. Parfois, cela est fait à l'oreille sachant qu'une oreille est capable de détecter la variation d'un hertz. Mon vieil accordéon a été réparé. Pourtant, je trouve qu'il pourrait sonner mieux. Comment le vérifier ?
Grâce aux informations précédentes, je vais tout simplement jouer toutes les notes de la flûte main droite et relever la fréquence à l'aide d'un logiciel. Le résultat sera hautement empirique pour de nombreuses raisons :
- Seule la flûte est testée alors qu'il y a des voix additionnelles (basson, vibrato ou piccolo),
- Seule une des deux directions du soufflet est testée, l'accordéon étant chromatique,
- L'instrument est âgé donc les anches ne sont pas neuves,
- Le micro est bas de gamme, sa réponse en fréquence (capacité à restituer le son fidèlement) est inconnue, le bruit est élevé vu la qualité du câble,
- La mesure dans le logiciel se fait à ±2 pixels, car les raies sont affichées sur plusieurs pixels,
- Le logiciel a une résolution mathématique liée à l'algorithme FFT implémenté,
- L'échelle des fréquences est logarithmique, donc un pixel aigu d'écart est beaucoup plus large que son équivalent dans les graves.
Ceci étant dit, nous obtenons ces mesures :
Note | Note US | 3 | 4 | 5 | 6 | 7 |
---|---|---|---|---|---|---|
Do | C | - | 265 | 529 | 1057 | 2119 |
Do# Réb | C# Db | - | 279 | 560 | 1122 | 2250 |
Ré | D | - | 297 | 595 | 1188 | - |
Ré# Mib | D# Eb | - | 315 | 631 | 1264 | - |
Mi | E | 167 | 333 | 672 | 1337 | - |
Fa | F | 177 | 353 | 707 | 1412 | - |
Fa# Solb | F# Gb | 187 | 374 | 748 | 1498 | - |
Sol | G | 198 | 396 | 792 | 1588 | - |
Sol# Lab | G# Ab | 210 | 421 | 842 | 1679 | - |
La | A | 223 | 445 | 892 | 1783 | - |
La# Sib | A# Bb | 236 | 473 | 943 | 1896 | - |
Si | B | 250 | 499 | 997 | 1998 | - |
Projetons le résultat par rapport à la fréquence théorique. L'erreur est linéaire mais ça ne nous dit pas grand chose. L'échec était prévisible.
Définir la profondeur du vibrato
La voix de vibrato permet d'avoir un joli son à l'accordéon. Il s'agit d'une note jouée systématiquement plus haute, voire plus basse aussi en tant que 3ème voix (« triple musette »). Contre-intuitivement, il faut que le son soit assez décalé sinon votre son va être une ventouse. Certains musiciens aiment quand c'est très décalé.
Pour comprendre, j'ai simulé le décalage de fréquence à l'aide du logiciel 3xOsc de FL Studio et ça a donné ce 🎧 signal vibrant de type triangulaire triple musette. Toutes les 4 secondes environ, le décalage augmente de 0,01 demi-ton à la hausse et à la baisse jusque 0,25. Quand le décalage est faible, le son pompe. Quand il est grand mais pas trop, il vibre d'une manière beaucoup plus intéressante qu'au tout début où le son était très sec.
Mon accordéon possède un vibrato dont j'ignore les caractéristiques. Dans les mêmes conditions d'expérience que précédemment, je relève les fréquences pour 2 notes en supposant que le vibrato est uniforme. Je choisis des notes pas trop aiguës pour réduire l'imprécision de ma mesure :
- Mi/E4 : 333 et 338 Hz
- Do/C5 : 529 et 536 Hz
On convertit ces fréquences en notes MIDI avec la formule vue précédemment, puis on calcule la différence absolue. On trouve respectivement 0,26 et 0,23. L'écart entre deux notes MIDI équivaut à un demi-ton linaire, alors que la fréquence est exponentielle et dépendante de la note jouée. Pour trouver une valeur plus stable, il faudrait faire une moyenne avec plusieurs boutons. Mais ce premier résultat confirme déjà qu'il faut bien décaler jusqu'à un quart de demi-ton en général.
Sur un synthétiseur virtuel, le vibrato de 0,25 demi-ton (semi-tone en anglais) se définirait comme suit avec « cent 25 » :
Accordéon virtuel
Dans la perspective de l'analyse spectrale se trouve la possibilité de modéliser virtuellement un accordéon à l'aide d'un logiciel synthétiseur. Le résultat se bute au talent requis pour le sound design mais c'est pas mal quand même.
Ajusteurs fréquentiels
Pour finir avec les spectres, évoquons le reverse-engineering musical. Il s'agit d'utiliser des technologies numériques pour décomposer un son enregistré, et pourquoi pas de retrouver les notes de sa mélodie ou de rectifier les erreurs en post-production. On appelle ça des algorithmes audio to score comme Edison ou AnthemScore.
Dans tous les cas, il est bon d'isoler au maximum ce qui doit être décomposé spectralement. Justement, FL Studio implémente un stem separator qui est hautement inspiré du logiciel demucs de Facebook. Il s'agit d'un algorithme exceptionnel qui découpe tout son en 4 pistes : voix, basse, mélodie et percussions.
Ces outils s'utilisent pour identifier les mélodies, car la fondamentale trahit les notes de musique. Mais on l'utilise aussi pour la voix : un chanteur devant chanter juste doit dire les paroles à la fréquence des notes. Quand ça n'est pas le cas, un algorithme de pitch correction peut venir corriger la voix et la rendre juste. C'est le principe de NewTone ci-après.
Vous devriez regarder cette vidéo pour comprendre quel est le problème existentiel de ces correcteurs de justesse. Pendant les Jeux Olympiques de Paris 2024, il a été question de savoir si Céline Dion avait chanté en playback ou pas. La presse jure que non : elle a certes chanté en vrai du haut de son balcon de 10 kt mais la télévision a diffusé autre chose avec une parfaite synchronisation. Pour preuve, on récupère la vidéo de sa prestation sur X/Twitter grâce à yt-dlp, puis on sépare les voix avec le stem separator de FL Studio qui est plus rapide que demucs, et on charge le vocal de Céline Dion dans NewTone. On obtient ce qui suit : le pitch en orange est absolument parfait sur l'intégralité (sic) des 3 minutes de l'enregistrement.
L'exercice a été fait de même avec un concert live de La Traviata sur Luciano Pavarotti. Nul doute que son talent et la justesse de sa voix soient unanimement reconnus. Les conditions classiques d'enregistrement empêchent que sa voix ait été modifiée par ordinateur :
Graphiquement, c'est... différent, très irrégulier, très découpé par le logiciel qui détecte des variations. Le richesse spectrale n'est pas standardisée comme dans l'enregistrement des JO. C'est ce qu'explique la vidéo en citant un expert du sujet qui a déroulé ce type de réflexion.
Toujours pas convaincu ? Voici la voix d'Axelle Saint-Cirel durant ces mêmes jeux olympiques avec des notes bien soutenues dans les aigus lors de son interprétation de La Marseillaise. Sans surprise, le résultat est similaire au ténor d'opéra italien et on a bien entendu ce qu'on a vu :
Voilà pour quelques cas d'emploi. Tous ces algorithmes sont bien pratiques pour analyser le son. C'est assez rapide de voir si votre accordéon est bien accordé en jouant les notes unes à unes, puis d'observer le résultat à l'écran.
Revision #8 was last modified by alexoudeon
on 2024-08-30 at 00:00:00 — 7552e99808168907