Le développement de la linguistique de corpus est directement corrélé à l’avènement des nouvelles technologies, notamment informatiques. Effectivement, celles-ci permettent d'obtenir de plus en plus facilement des analyses linguistiques textuelles. La création de corpus linguistiques est facilitée, le chercheur peut compter sur des outils statistiques et de programmes informatiques pour créer des corpus toujours plus importants et complets.

1964 marque particulièrement l’histoire de cette discipline. C’est en effet à cette date qu’est créé le premier corpus informatisé par une équipe de chercheurs de l'université Brown aux États-Unis. Il s’agit du Computational Analysis of Present-Day American English, un corpus général, compilé en 1967 par Henri Kučera et W. Nelson Francis, qui possède 500 échantillons de textes en anglais.

Il faut attendre une dizaine d’années supplémentaires pour que la linguistique de corpus française se développe, notamment avec la création de Frantext, première base de données de textes français (textes littéraires, philosophiques, scientifiques et techniques) qui fournit des exemples pour le Trésor de la langue française (TLF)

Dans les années quatre-vingt, les logiciels de traitement de texte facilitent la saisie automatique des textes et permettent la création de corpus de plus grande taille. Petit à petit, des corpus oraux (CLAPI, PFC, CRFP, ESLO, etc.) vont également apparaitre. Leur volume est toutefois moins volumineux car ces derniers demandent une transcription manuelle des enregistrements sonores.

La linguistique de corpus connait un virage dans les années 1990 grâce à l’évolution du traitement automatique du langage (TAL) et notamment à la performance toujours plus rapide et fiable des machines utilisées.

L’objectif du TAL est de fabriquer des outils et technologies pour traiter la langue naturelle. Il faut le distinguer de la linguistique informatique, discipline cherchant plutôt à comprendre les langues au moyen d'outils informatiques : l’ordinateur reste un outil permettant de mieux saisir certains phénomènes, les techniques ou outils ne sont pas des fins en eux-mêmes.