Le français relève, avec les autres langues romanes (portugais, espagnol, catalan, italien, roumain, romanche, etc.), de la branche indo-européenne des langues latines. Durant la domination de la Méditerranée par les Romains, qui s’étend jusqu’aux portes de l’Écosse et de la Germanie, le latin exerce une influence plus ou moins considérable sur les provinces conquises ; seul le grec tend à résister à la langue latine. Ainsi, à l’issue de la conquête de la Gaule par César, le latin est adopté progressivement par les tribus celtes devenues bilingues, mais la langue orale que constitue, dès lors, le latin vulgaire, subit des altérations résultant de la prononciation. Le sud de la Loire, en particulier, se romanise rapidement. La langue gauloise ne subsiste que dans le lexique (une soixantaine de mots environ, quelques suffixes) et ne fonctionne que comme substrat héréditaire (faible influence syntaxique).
Le latin se transforme alors progressivement sous l’effet de ce substrat. Aussi, c’est à partir du IVe–Ve siècle, période correspondant aux grandes invasions barbares, que l’on glisse linguistiquement vers la formation du gallo-roman jusqu’au IXe siècle. En effet, trois grandes populations s’installent en Gaule : les Wisigoths au Sud-Ouest, les Burgondes dans les régions du Centre et les Francs (Rhénans, Alamans et Saliens) dans le Nord. Ce nouveau contexte géopolitique donne naissance à des divisions linguistiques : les langues germaniques du Nord renforcent l’opposition langue d’oc et langue d’oïl.