L'expression « linguistique de corpus » vient de l’anglais Corpus Linguistics. Cette discipline est habituellement rattachée au monde anglophone et notamment à la date de 1755, année durant laquelle fut édité le dictionnaire de Johnson, premier dictionnaire basé sur un corpus de textes dit « authentiques », bien que ceux-ci soient encore des textes littéraires « nobles ». Le travail de Johnson pose les bases de la discipline et dans le même temps sert d’exemple à l’Oxford English Dictionary.
Entre 1930 et 1950, John R. Firth propose une théorie contextuelle du sens inductive basée sur l’étude de phénomènes concrets. Il considère que la linguistique ne doit pas s’éloigner de la parole en la forçant à entrer dans des systèmes artificiels. Pour Firth, « aucun énoncé ne peut être compris en dehors du contexte culturel et situationnel dans lequel il est produit, sans tenir compte des informations d’ordre sociologique (âge, sexe, milieu) ainsi que des informations qui concernent l’acte énonciatif (genre de discours, endroit où il a été produit, buts de l’énonciation, etc. » (Di Vito, 2013). C’est pourquoi on parle d’école contextualiste.
Sinclair poursuit le travail contextualiste de Firth et permet à la linguistique de corpus de connaitre un succès certain. Sinclair observe les corpus et fait des hypothèses sur le fonctionnement de la langue et choisi de prêter attention à « what is going on » (ce qui se passe) (Hanks, 2008 : 220). Il est notamment connu pour avoir initié le projet COBUILD, (Collins Birmingham University International Language Database) et publié en 1987 le Collins COBUILD Advanced Dictionary, dictionnaire pour les apprenants en anglais, fournissant des définitions sur des phrases complètes et non simplement sur des extraits (prend en compte le contexte).
Aujourd’hui encore, il existe une dissension quant à la discipline : tandis que certains spécialistes du domaine l’envisagent comme une méthodologie applicable à différentes disciplines (McEnery & Wilson 2001) ; d’autres, l’envisagent justement comme est une discipline à part entière (Sinclair, 1991 ; Leech, 1992 ; Tognini-Bonelli, 2001).