D’après la définition proposée par le Larousse, une concordance est un index de mots présentés avec leur contexte permettant d'étudier dans plusieurs exemples, les divers emplois du même vocable. Une concordance permet d’approfondir le sens d'un mot ou d'une expression. Le corpus permet de regrouper l’ensemble des passages où figure un mot dans les différents textes.

Une concordance peut se définir à partir de trois éléments :

  • Un pivot, en général un mot (ou toute occurrence repérable : lemme, expression, etc.). On s’intéresse au(x) contexte(s) de ce mot.
  • Une taille de contexte (ce peut-être aussi à la gauche et ou à la droite des mots pivots). On utilise souvent la longueur d'une ligne.
  • Un ordre de présentation de contextes sélectionnés (ordre de présence dans le corpus, tri alphabétique sur le mot qui précède le ou sur celui qui le suit).

Bien que cette méthode ne soit pas nouvelle, le développement de l’informatique facilite l’accès à des bases textuelles foisonnantes et permet dans le même temps l’extraction d’une concordance quasi instantanément.

Le concordancier, aussi appelé KWIC (KeyWord In Context) est un logiciel qui permet de trier de l’ensemble des mots des textes dans l’optique de situer des mots-pivot en contexte, de compter les occurrences, etc. Le concordancier est outil d’observation très pertinent pour l’exploration lexicale. Le contexte du mot pivot donne une idée assez complète des différents sens de ce dernier et de ses propriétés combinatoires (morphosyntaxiques, mais aussi idiomatiques, phraséologiques, collocationnelles, etc.).

Pour Pincemin (2006), les concordances sont des tentatives pour extraire « l’ordre lexical du « désordre » textuel. », des intermédiaires entre « le désordre » du texte et la « structuration synthétique de l’entrée du dictionnaire" comme le note Kraif, 2011.