Que signifie "N-grams"?
Table des matières
Les n-grams sont des groupes de mots ou de caractères qui apparaissent ensemble dans un texte. Le "N" dans n-grams fait référence à combien d'éléments sont dans chaque groupe. Par exemple, un 2-gram (aussi connu sous le nom de bigramme) inclut des paires de mots, tandis qu'un 3-gram (trigramme) comprend des ensembles de trois mots.
Comment fonctionnent les n-grams
Quand on regarde un morceau d'écriture, on peut le décomposer en ces groupes. Ça nous aide à voir des motifs et comment les mots se relient entre eux. Par exemple, la phrase "J'aime la glace" peut être décomposée en n-grams comme "J'aime," "aime la," et "la glace."
Pourquoi les n-grams sont utiles
Les n-grams peuvent être super utiles pour déterminer si un texte a été écrit par une personne ou un bot. En examinant quels n-grams sont utilisés plus souvent, on peut voir des différences entre l'écriture humaine et le texte généré par machine. Les motifs dans les n-grams nous aident à comprendre le style et la structure de l'écriture, ce qui rend plus facile de repérer d'où peut venir un texte.