Parametres

From Librivox wiki
Jump to: navigation, search

En bref!

Merci de soumettre vos enregistrements avec les paramètres suivants:

  • Fréquence d’échantillonage: 44.1 kHz (44,100 Hz)
  • Format: MP3 (MPEG-1 Audio Layer III)
  • Bit rate: 128 Kbps constant bit rate
  • Mode d’enregistrement: Mono (merci de vérifier que votre enregistrement est audible dans les deux écouteurs)
  • Volume: environ 89 dB
  • Format d’échantillonage: 16 bit
  • Balises ID3: ID3v2 Merci de ne remplir que les champs suivants: Nom de l’artiste; Titre de la piste; Titre de l’album (comme indiqué dans le premier poste du fil du projet). Toutes les autres balises seront remplies lors du catalogage.

Si vous n’êtes pas sûr que vos paramètres sont corrects, essayer l’outil Checker.

Si vous ne savez pas comment faire tout ca, ne vous arrachez pas les cheveux. Pour plus d’information, allez sur Audacity 1-2-3 (ou sur youtube: tutoriel en francais ou en anglais ) ou sur GarageBand. Vous pouvez aussi poster vos fichiers sur le forum Listeners and Editors wanted , ou demander de l’aide à votre BC (coordinateur) qui vous aidera. Dans la plupart des cas les fichiers seront bons! :-)

( Faites un test)

Pourquoi ces paramètres en particuliers?

La liste des paramètres possibles lorsqu’on enregistre et que l’on convertit ensuite en MP3 est longues, la liste des combinaisons possibles encore plus. Même si toutes ces techniques et tous ces formats sont standardisés, tous les programmes et les équipements ne marchent pas aussi bien avec toutes les combinaisons. Les valeurs ci-dessus forment une combinaison classique qui devrait “bien marcher (TM)” avec tous les lecteurs audio. En utilisant les standards ci-dessus, vous simplifiez la vie de tout le monde.

Cet ensemble de paramètres confère aussi une qualité proche de la qualité CD pendant l’enregistrement et presque égale après la compression.

Enfin, archive.org nous demande d’utiliser ces paramètres afin de faciliter la dérivation des fichiers vers d’autres formats utilisés aux USA, ce qui serait difficile ou impossible avec d’autres valeurs.


Mais il y a d’autres fréquences d’échantillonnage qui sont plus adaptées aux enregistrements vocaux, non?

Ceci a fait l’objet de bien des discussions, parce qu’il y a de bonnes raisons de vouloir utiliser d’autres fréquences d’échantillonnage. La version officielle complète est la suivante:

  1. 44.1 kHz est la fréquence d’échantillonnage par défaut dans de nombreux programmes. Il nous faut les fichiers à cette fréquence parce que c’est celle qui est utilisée par le site qui héberge nos fichiers, archive.org, pour son flash player.
  2. Merci de ne pas utiliser d’autre fréquence d’échantillonnage. Si vous vous trompez et en utilisez une autre, la personne qui s’occupe du catalogage le changera pour vous et vous expliquera comment enregistrer avec la bonne fréquence. Pas d’inquiétude, vous n’aurez pas travaillé pour rien!


Tous ces termes techniques, ca veut dire quoi?

Ce qui suit est assez technique et n’explique que les paramètres les plus importants. Pour le reste, allez voir sur le Glossary.


Format de fichier

Au début de l’ère informatique, les ordinateurs pouvaient stocker et diffuser des données audio. Personne n’envisageait d’échanger des fichiers audio avec d’autres utilisateurs. C’est pour cela que tous les systèmes qui ont 10 ans ou plus ont leur propre format audio. Pour SUN c’est le format .au, pour Microsoft .wav, les Macs ont le leur propre, ainsi que SGI et sûrement bien d’autres companies. Mais tous contenaient des [wiki:self:AboutSampling PCM data] avec des informations supplémentaires, telles que la nature des paramètres d’enregistrement. Le format .wav a rendu la plupart de ces formats hors d’actualité. Pour les formats comprimés, cependant, la représentation des données audio peut varier de manière significative. Ceci a créé le besoin de formats particuliers pour conserver les données comprimées en utilisant une technique particulière, tels que le MP3, AAC, OggVorbis ou RealMedia.


Échantillonnage

Les ondes sonores sont perçues lorsqu’elles sont transmises au cerveau après avoir pénétré l’appareil auditif. Pendant ce processus, l’onde est analogue, ou encore continue. Ca signifie que l’onde a une amplitude donnée à chaque point temporel. Celle amplitude peut avoir n’importe quelle valeur, et leur nombre est infini (vraiment!).

Mais les ordinateurs ne savent pas gérer l’infini. Les ondes doivent donc être numérisées. Pendant ce processus des points d’échantillonnage sont choisis et leur amplitude est mesurée. C’est une puce appelée convertisseur A/D qui s’en occupe; une carte son peut faire bien plus. Le processus s’appelle Pulse Code Modulation or PCM.

Toutes les données audio qui entrent dans un ordinateur ou un autre système digital commencent par être représentées sous la forme de données PCM. L’inconvénient est qu’elles demandent beaucoup d’espace de stockage. Des systèmes plus intelligents pour stocker ces informations ont donc été développés, tels que la compression MP3 ou GSM, qui sont basés sur l’un des deux principes suivants.

  1. L’oreille humaine ne peut pas percevoir tout ce qui est stocké dans les données PCM. Les systèmes MP3, ogg et AAC sont basés sur cette caractéristique.
  2. Les données PCM sont très redondantes, ce qui signifie qu’une valeur donnée peut être calculée de manière assez précise si les valeurs précédentes sont connues. Les systèmes GSM et ADPCM qu’on trouve sur les PC sont basés sur ce principe.

Les algorithmes de compressions calculent donc quelles parties des données PCM peuvent être exclues sans modifier les sons générés lors de l’émission.


Fréquence d’échantillonnage

Ceci détermine la plus haute fréquence. Si la valeur de réglage est trop basse, vos enregistrements seront mornes et auront un écho métallique.

La fréquence d’échantillonnage représente le nombre de mesures effectuées par le convertisseur A/D en une seconde. L’unité Hertz (Hz) représente 1/seconde. Une fréquence d’échantillonnage de 44.1 kHz stipule donc que 44100 échantillons sont effectués en une seconde.

Il y a une règle sympathique qui stipule que si le son le plus haut dans un morceau audio est connu et que la fréquence d’échantillonnage est deux fois plus haute, il est possible de reconstruire exactement l’onde originale à partir des données numériques.

En d’autres termes, la fréquence la plus haute qui peut être enregistrée sans perte de qualité avec une fréquence d’échantillonnage de 44.1 kHz est de 22050 Hz. La fréquence la plus haute que l’oreille humaine peut percevoir dépend de l’âge mais est estimée à 18 kHz pour les oreilles jeunes, et 12 kHz pour les personnes âgées sans problème auditif particulier. La voix humaine monte jusqu’à 8 kHz environ. En conclusion, une fréquence d’échantillonnage de 16 kHz suffit en général largement. Une fréquence plus haute permet de conserver les sons autres que la voix qui donnent ce je ne sais quoi à votre enregistrement et qui ont une fréquence supérieure à 8 kHz.


Format d’échantillonnage

Ce paramètre détermine la portée dynamique. Plus il est haut, plus votre enregistrement sera vivant. Vous pourrez entendre les variations plus subtiles du volume de votre enregistrement, comme les murmures ou les cris.

Ce paramètre détermine aussi la précision de chaque mesure (ou échantillon). Plus la valeur est grande, plus la qualité est bonne.

Le standard pour les CDs est une taille d’échantillonnage de 16 bit. Ceci est suffisant pour stocker les données audio avec une très bonne qualité, si le procédé est bien équilibré. Si vous prévoyez de faire des manipulations comme de l’amplification, de la normalisation our de la compression, il est préférable d’utiliser la taille d’échantillonnage la plus haute possible.


Autres informations (WWW liens)

  • mp3-tech: information technique concernant le format mp3
  • Wikipedia: Digital sampling: information concernant le procédé de conversion des signaux analogues en signaux numériques.