Ressources pour développeur web

Théme de la semaine : Outil pentest

Liste complète des Stop-Word français + Comment les supprimer

Temps de lecture estimé : 12 minutes
Accueil PHP 8 Liste complète des Stop-Word français + Comment les supprimer

Vous avez déjà essayé d’analyser un texte… et vous vous êtes retrouvé avec une bouillie de mots sans réel intérêt ? Des “le”, “la”, “de”, “et” qui polluent tout ? C’est normal. Ces petits mots, omniprésents, sont appelés stop-words, et ils peuvent littéralement brouiller vos analyses. Voici donc la liste compléte des stop-word français et comment les supprimer d’un texte ou d’un fichier.

Que vous soyez en train de travailler sur du SEO, du traitement de texte ou un projet de développement web, savoir identifier et supprimer les stop-words est une compétence clé. Vous allez voir que ce n’est ni compliqué, ni réservé aux experts.

  • La liste complète des stop-word français et pourquoi leur suppression améliore l’analyse de vos contenus
  • Gagner du temps en manipulant efficacement vos textes grâce à des solutions simples depuis terminal, en PHP et / ou JavaScript
  • Améliorer la qualité de vos analyses SEO et de vos projets en filtrant uniquement les mots réellement pertinents

Dans ce tutoriel complet, vous allez apprendre ce que sont réellement les stop-words, pourquoi il est souvent utile de les supprimer… et surtout comment le faire concrètement, avec des exemples simples depuis le terminal, en PHP et / ou JavaScript.

Supprimer les Stop-Words

Résultat…

Qu’est-ce qu’un stop-word (et pourquoi les retirer) ?

Un stop-word, c’est tout simplement un mot très courant dans une langue, mais qui n’apporte pas de valeur informative forte.

Prenons une phrase simple :

“Le développement web est une activité passionnante”

Si vous retirez les stop-words, il reste :

“développement web activité passionnante”

Sans aucun stop-word, vous obtenez immédiatement l’essentiel.

Pourquoi ces mots posent problème ?

Les stop-words sont utiles pour parler… mais beaucoup moins pour analyser.

Ils posent problème dans plusieurs cas :

  • Lorsqu’on veut extraire des mots-clés
  • Lorsqu’on fait du SEO (analyse de contenu)
  • Lorsqu’on construit des clusters sémantiques
  • Ou encore lorsqu’on développe des outils

Imaginez analyser 700 pages de votre site… si 40% des mots sont des “le”, “de”, “et”, votre analyse sera faussée.


Pensez aux stop-words comme à du bruit de fond.

Quand vous êtes dans un café, vous entendez plein de voix… mais vous vous concentrez sur celle de votre interlocuteur.

👉 Supprimer les stop-words, c’est exactement ça : faire taire le bruit pour entendre le message important.

La liste complète des stop-word en français

a
à
â
abord
afin
ah
ai
aie
aient
aies
ainsi
ait
allaient
allo
allons
allô
alors
anterieur
anterieure
anterieures
apres
après
as
assez
attendu
au
aucun
aucune
aujourd
aujourd'hui
aupres
auprès
auquel
aura
aurai
auraient
aurais
aurait
auras
aurez
auriez
aurions
aurons
auront
aussi
autre
autres
autrui
aux
auxquelles
auxquels
avaient
avais
avait
avant
avec
avoir
avons
ayant
ayante
ayantes
ayants
ayez
ayons
b
bah
bas
basee
bat
beau
beaucoup
bien
bigre
boum
bravo
brrr
c
ça
ca
car
ce
ceci
cela
celle
celle-ci
celle-là
celles
celles-ci
celles-là
celui
celui-ci
celui-là
cent
cependant
certain
certaine
certaines
certains
certes
ces
cet
cette
ceux
ceux-ci
ceux-là
chacun
chaque
cher
chers
chez
chiche
chut
ci
cinq
cinquantaine
cinquante
cinquantieme
cinquieme
clac
clic
combien
comme
comment
compris
concernant
contre
couic
crac
d
da
dans
de
debout
dedans
dehors
deja
déjà
delà
depuis
dernier
derniere
derriere
derrière
des
desormais
désormais
desquelles
desquels
dessous
dessus
deux
deuxieme
deuxièmement
devant
devers
devra
devrait
different
differente
differentes
differents
dire
divers
diverse
diverses
dix
dixieme
doit
doivent
donc
dont
douze
douzieme
dring
du
duquel
durant
e
effet
egale
egalement
egales
eh
elle
elle-même
elles
elles-mêmes
en
encore
entre
envers
environ
es
est
et
etaient
etais
etait
etant
etc
ete
etre
eu
eue
eues
euh
eurent
eus
eusse
eussent
eusses
eussiez
eussions
eut
eux
eux-mêmes
exactement
excepté
f
façon
fais
faisaient
faisant
fait
feront
fi
flac
floc
font
g
gens
h
ha
hein
helas
hé
hélas
hem
hep
hi
ho
holà
hop
hormis
hors
hou
houp
hue
hui
huit
huitieme
hum
i
il
ils
importe
j
je
jusqu
jusque
juste
k
l
la
là
laquelle
las
le
lequel
les
lesquelles
lesquels
leur
leurs
longtemps
lors
lorsque
lui
lui-même
m
ma
maint
mais
malgre
malgré
maximale
me
meme
même
memes
merci
mes
mien
mienne
miennes
miens
mille
mince
moi
moi-même
moins
mon
moyennant
n
na
ne
neanmoins
néanmoins
neuf
neuvieme
ni
nombreuses
nombreux
non
nos
notre
nous
nous-mêmes
nul
o
o
ô
oh
ohé
olé
ollé
on
ont
onze
onzieme
ore
ou
où
ouf
ouias
oust
ouste
outre
p
paf
pan
par
parce
parfois
parle
parlent
parler
parmi
partant
particulier
particuliere
particulierement
pas
passé
pendant
personne
peu
peut
peuvent
peux
pff
pfft
pfut
pif
plein
plouf
plus
plusieurs
plutot
plutôt
pouah
pour
pourquoi
premier
premiere
premierement
pres
près
proche
psitt
puis
puisque
q
qu
quand
quant
quant-à-soi
quanta
quarante
quatorze
quatre
quatre-vingt
quatrieme
que
quel
quelle
quelles
quelqu
quelque
quelques
quelquun
quelqu'une
quelqu'un
quels
qui
quiconque
quinze
quoi
quoique
r
rare
rarement
revoici
revoilà
rien
s
sa
sacrebleu
sans
sapristi
sauf
se
seize
selon
semblable
semblent
sent
sept
septieme
sera
serai
seraient
serais
serait
seras
serez
seriez
serions
serons
seront
ses
seulement
si
sien
sienne
siennes
siens
sinon
six
sixieme
soi
soi-même
soit
soixante
son
sont
sous
souvent
soyez
soyons
stop
suis
suivant
sur
surtout
t
ta
tac
tant
te
tel
telle
tellement
telles
tels
tenant
tes
tic
tiens
toc
toi
toi-même
ton
touchant
toujours
tous
tout
toute
toutes
treize
trente
tres
très
trois
troisieme
trop
tsoin
tsouin
tu
u
un
une
unes
uns
v
va
vais
valeur
vas
vers
via
vif
vifs
vingt
vivat
vive
vives
vlan
voici
voilà
vont
vos
votre
vous
vous-mêmes
vu
w
x
y
z
zut

Comment supprimer les stop-words depuis le terminal

Passons à la pratique. Vous allez voir que même sans coder, on peut déjà faire beaucoup.

Supprimer les stop-words d’un texte directement

Imaginons que vous avez un texte :

echo "Le SEO est un élément important du développement web"

Vous pouvez filtrer certains mots avec grep.

Exemple :

echo "Le SEO est un élément important du développement web" | grep -vwE "le|un|du|est"
  • grep : outil de recherche
  • -v : inverse → on exclut
  • -w : mot entier
  • -E : expressions régulières

Cela affichera :

SEO élément important développement web

👉 Pour aller plus loin : Tout savoir sur la commande GREP.

Commande avec un fichier .txt contenant les stop-words

Si vous avez un fichier stopwords.txt (un mot par ligne), vous pouvez utiliser l’option -f de grep :

echo "Le SEO est un élément important du développement web" | grep -vwFf stopwords.txt

Au lieu d’écrire les stop-words directement dans la commande ("le|un|du|est"), vous les externalisez dans un fichier. Grâce à -f stopwords.txtgrep lit automatiquement chaque ligne du fichier comme un mot à exclure.

Les options utilisées :

  • -v → inverse la sélection (on exclut les mots trouvés)
  • -w → correspondance mot entier (évite les faux positifs)
  • -F → recherche littérale (plus rapide que regex)
  • -f → lit les mots depuis un fichier

Vous obtiendrez la phrase sans les stop-words, de manière propre, maintenable et scalable.

Supprimer les stop-words dans un fichier

C’est là que ça devient vraiment intéressant. Comme précédemment avec la commande GREP, nous allons utiliser un fichier contenant les stop-words.

Étape 1 : créer un fichier de stop-words

nano stopwords.txt

Ajoutez vos mots dedans (un par ligne).

Formation web et informatique - Alban Guillier - Formateur

Des formations informatique pour tous !

Débutant ou curieux ? Apprenez le développement web, le référencement, le webmarketing, la bureautique, à maîtriser vos appareils Apple et bien plus encore…

Formateur indépendant, professionnel du web depuis 2006, je vous accompagne pas à pas et en cours particulier, que vous soyez débutant ou que vous souhaitiez progresser. En visio, à votre rythme, et toujours avec pédagogie.

Découvrez mes formations Qui suis-je ?

Étape 2 : filtrer un fichier

grep -vwf stopwords.txt input.txt > output.txt
  • -f stopwords.txt → liste des mots à supprimer (fichier contenant les stop-words)
  • input.txt → votre texte source
  • output.txt → résultat nettoyé

Le fichier input.txt :

Le référencement naturel est une stratégie efficace

Le fichier output.txt :

référencement naturel stratégie efficace

Soyons honnêtes, cette méthode à des limites :

  • Ne gère pas bien la ponctuation
  • Sensible aux majuscules
  • Pas intelligent (pas de contexte)

Mais pour un premier niveau, c’est déjà très puissant.

Supprimer les stop-words avec PHP

Passons maintenant à quelque chose de plus propre et intégrable dans vos projets.

Le script PHP complet

<?php

// Ajoutez tous les stop-words de votre choix
$stopWords = [
    'le', 'la', 'les', 'de', 'du', 'des', 'un', 'une', 'et', 'à', 'en'
];

$text = "Le développement web est une activité passionnante";

$words = explode(' ', $text);

$filteredWords = [];

foreach ($words as $word) {
    $cleanWord = strtolower(trim($word, ".,;!?"));

    if (!in_array($cleanWord, $stopWords)) {
        $filteredWords[] = $word;
    }
}

$result = implode(' ', $filteredWords);

echo $result;

Prenons le temps de bien comprendre.

1. Liste des stop-words

$stopWords = [...]

Vous définissez les mots à ignorer.

2. Découper le texte

$words = explode(' ', $text);

On transforme une phrase en tableau de mots.

3. Nettoyer chaque mot

$cleanWord = strtolower(trim($word, ".,;!?"));
  • strtolower → éviter les problèmes de majuscules
  • trim → enlever la ponctuation

4. Filtrer

if (!in_array($cleanWord, $stopWords))

Si le mot n’est pas un stop-word, on le garde.

5. Reconstituer le texte

implode(' ', $filteredWords);

Résultat

développement web activité passionnante

Comment utiliser ce script PHP ?

Vous pouvez :

  • L’intégrer dans un script PHP plus global
  • Nettoyer vos contenus avant analyse SEO
  • Créer un système de scoring sémantique

Et là, on commence à toucher à quelque chose de très puissant.

Supprimer les stop-words avec JavaScript

Maintenant, voyons comment faire côté navigateur ou Node.js.

Script JavaScript complet

const stopWords = [
"le", "la", "les", "de", "du", "des", "un", "une", "et", "à", "en"
];

const text = "Le développement web est une activité passionnante";

const words = text.split(" ");

const filtered = words.filter(word => {
const clean = word.toLowerCase().replace(/[.,!?]/g, "");
return !stopWords.includes(clean);
});

const result = filtered.join(" ");

console.log(result);


Découpage

text.split(" ")

Transforme la phrase en tableau

Nettoyage

replace(/[.,!?]/g, "")

Enlève la ponctuation

Filtrage

!stopWords.includes(clean)

Garde uniquement les mots utiles

Résultat

développement web activité passionnante

Où utiliser ce script ?

  • Dans un outil SEO en ligne
  • Dans un plugin ou script Javascript plus global
  • Dans une interface d’analyse de contenu

Parfait pour un futur dashboard de maillage interne 😉

La constante JavaScript contenant l’ensemble des stop-words JavaScript

const STOP_WORDS_FR = [
"a","à","â","abord","afin","ah","ai","aie","aient","aies","ainsi","ait","allaient","allo","allons","allô","alors",
"anterieur","anterieure","anterieures","apres","après","as","assez","attendu","au","aucun","aucune","aujourd",
"aujourd'hui","aupres","auprès","auquel","aura","aurai","auraient","aurais","aurait","auras","aurez","auriez",
"aurions","aurons","auront","aussi","autre","autres","autrui","aux","auxquelles","auxquels","avaient","avais",
"avait","avant","avec","avoir","avons","ayant","ayante","ayantes","ayants","ayez","ayons",

"b","bah","bas","basee","bat","beau","beaucoup","bien","bigre","boum","bravo","brrr",

"c","ça","ca","car","ce","ceci","cela","celle","celle-ci","celle-là","celles","celles-ci","celles-là","celui",
"celui-ci","celui-là","cent","cependant","certain","certaine","certaines","certains","certes","ces","cet","cette",
"ceux","ceux-ci","ceux-là","chacun","chaque","cher","chers","chez","chiche","chut","ci","cinq","cinquantaine",
"cinquante","cinquantieme","cinquieme","clac","clic","combien","comme","comment","compris","concernant","contre","couic","crac",

"d","da","dans","de","debout","dedans","dehors","deja","déjà","delà","depuis","dernier","derniere","derriere",
"derrière","des","desormais","désormais","desquelles","desquels","dessous","dessus","deux","deuxieme","deuxièmement",
"devant","devers","devra","devrait","different","differente","differentes","differents","dire","divers","diverse",
"diverses","dix","dixieme","doit","doivent","donc","dont","douze","douzieme","dring","du","duquel","durant",

"e","effet","egale","egalement","egales","eh","elle","elle-même","elles","elles-mêmes","en","encore","entre",
"envers","environ","es","est","et","etaient","etais","etait","etant","etc","ete","etre","eu","eue","eues","euh",
"eurent","eus","eusse","eussent","eusses","eussiez","eussions","eut","eux","eux-mêmes","exactement","excepté",

"f","façon","fais","faisaient","faisant","fait","feront","fi","flac","floc","font",

"g","gens",

"h","ha","hein","helas","hé","hélas","hem","hep","hi","ho","holà","hop","hormis","hors","hou","houp","hue","hui",
"huit","huitieme","hum",

"i","il","ils","importe",

"j","je","jusqu","jusque","juste",

"k",

"l","la","là","laquelle","las","le","lequel","les","lesquelles","lesquels","leur","leurs","longtemps","lors",
"lorsque","lui","lui-même",

"m","ma","maint","mais","malgre","malgré","maximale","me","meme","même","memes","merci","mes","mien","mienne",
"miennes","miens","mille","mince","moi","moi-même","moins","mon","moyennant",

"n","na","ne","neanmoins","néanmoins","neuf","neuvieme","ni","nombreuses","nombreux","non","nos","notre","nous",
"nous-mêmes","nul",

"o","o","ô","oh","ohé","olé","ollé","on","ont","onze","onzieme","ore","ou","où","ouf","ouias","oust","ouste","outre",

"p","paf","pan","par","parce","parfois","parle","parlent","parler","parmi","partant","particulier","particuliere",
"particulierement","pas","passé","pendant","personne","peu","peut","peuvent","peux","pff","pfft","pfut","pif",
"plein","plouf","plus","plusieurs","plutot","plutôt","pouah","pour","pourquoi","premier","premiere","premierement",
"pres","près","proche","psitt","puis","puisque",

"q","qu","quand","quant","quant-à-soi","quanta","quarante","quatorze","quatre","quatre-vingt","quatrieme","que",
"quel","quelle","quelles","quelqu","quelque","quelques","quelquun","quelqu'une","quelqu'un","quels","qui","quiconque",
"quinze","quoi","quoique",

"r","rare","rarement","revoici","revoilà","rien",

"s","sa","sacrebleu","sans","sapristi","sauf","se","seize","selon","semblable","semblent","sent","sept","septieme",
"sera","serai","seraient","serais","serait","seras","serez","seriez","serions","serons","seront","ses","seulement",
"si","sien","sienne","siennes","siens","sinon","six","sixieme","soi","soi-même","soit","soixante","son","sont",
"sous","souvent","soyez","soyons","stop","suis","suivant","sur","surtout",

"t","ta","tac","tant","te","tel","telle","tellement","telles","tels","tenant","tes","tic","tiens","toc","toi",
"toi-même","ton","touchant","toujours","tous","tout","toute","toutes","treize","trente","tres","très","trois",
"troisieme","trop","tsoin","tsouin","tu",

"u","un","une","unes","uns",

"v","va","vais","valeur","vas","vers","via","vif","vifs","vingt","vivat","vive","vives","vlan","voici","voilà",
"vont","vos","votre","vous","vous-mêmes","vu",

"w",

"x",

"y",

"z","zut"
];

Optimiser la suppression des stop-words

Supprimer les stop-words, c’est bien… mais bien les gérer, c’est mieux.

Attention à ne pas trop supprimer

Certains mots peuvent être utiles :

  • “comment”
  • “pourquoi”
  • “avec”

En SEO, ces mots peuvent être stratégiques.

Adapter la liste des stop-words selon votre objectif

  • Analyse sémantique → suppression forte
  • SEO éditorial → suppression légère
  • UX / lisibilité → aucune suppression

Créez votre propre liste personnalisée. C’est ce qui fera toute la différence.


Les stop-words sont partout. Invisibles, discrets… mais pourtant très impactants. En les supprimant intelligemment, vous transformez un texte brouillon en une structure claire, exploitable et surtout utile.

Que vous utilisiez le terminal, PHP ou JavaScript, vous avez maintenant toutes les clés pour intégrer cette logique dans vos projets grâce à notre liste complète des stop-word en français. Et si vous développez des outils SEO ou d’analyse de contenu, cette étape devient vite indispensable.

Mais rappelez-vous : l’objectif n’est pas de supprimer à tout prix… c’est de mieux comprendre. Et parfois, même les mots les plus simples ont leur rôle à jouer.

Alors testez, ajustez… et surtout, amusez-vous avec vos données.

👉 Maintenant que vous savez retirer les stop-words, découvrez comment extraire les mots-clés d’un site web.