Les voyelles toniques sont conservées lorsque elles sont entravées dans le passage du latin à l’ancien français, mais lorsque les voyelles ę ouvert et o ouvert sont libres, elles s’allongent et se segmentent, dès le IIIe–IVe siècle, laissant apparaître une diphtongaison dite spontanée : après l’étape de la segmentation ę > ęę et ǫ > ǫǫ, vient la différenciation qui conduit à la fermeture de la première voyelle : ẹ́ę > íę et ǫ́ǫ > úǫ avant la fermeture de la deuxième voyelle de la diphtongue ainsi obtenue.
De plus, les voyelles ne se distinguent plus par leur longueur (brève/longue), mais par leur timbre (ouverte/fermée). C’est donc le degré d’articulation des voyelles qui est alors pris en compte : leur aperture (degré d’ouverture de la bouche lors de leur articulation) qui se définit comme « la distance qui sépare du palais la langue soulevée ; […] une voyelle de grande aperture est une voyelle ouverte (ainsi a), une voyelle de petite aperture est une voyelle fermée (ainsi i) » (N. Laborderie : 11). On distingue également des voyelles articulées vers l’avant (i, e) ou vers l’arrière du palais (u, o).
Voir le schéma ci-dessous :
En outre, la voyelle u tend à se palataliser jusqu’au VIIIe siècle : ü qui se maintient jusqu’au français classique, tout comme le ī long, qui ne subit pas de modification depuis le latin. En revanche, les voyelles non accentuées en hiatus subissent une fermeture avant de se consonnifier à partir du Ier siècle avant notre ère, ce qui aboutit, avec la disparition de la voyelle, à une perte de la syllabe : i et e > y (yod) et u > w.
Enfin, une voyelle dite prothétique, non étymologique, purement phonétique, qui prend la forme du e en Ancien français, se glisse à l’initiale des mots commençant par le groupe s+consonne occlusive (sp-, st-, etc.) afin de faciliter la prononciation de ces doubles consonnes en début de mot pour les mots d’origine populaire ou courante.