Cosa sono le Stop Words? Sono ancora rilevanti per la SEO?

Per Stop Words si intendono, in una elaborazione informatica dei dati, tutte quelle parole che vengono filtrare dal sistema in quanto non rilevanti ai fini della raccolta. Si attribuisce il termine stop words a Hans Peter Luhn, uno dei pionieri dei processi di Information Retrieval  (recupero delle informazioni). Dopo il suo utilizzo in una presentazione di Luhn del 1959 anche la letteratura informatica inizia a utilizzare frequentemente il termine stop words. Solitamente si tratta di termini che hanno funzione sintattica (articoli, congiunzioni, preposizioni, etc.) importanti per la costruzione delle frasi ma non fondamentali nell’acquisizione e nella successiva selezione dei dati.
Fin dai primi anni del 2000 iniziarono a fare la comparsa sul web elenchi di stop words, tutt’ora facilmente reperibili, a cui fare riferimento per gestire al meglio title, meta descrption e altre informazioni tecniche da includere nelle pagine web ai fini di una corretta indicizzazione. Allora non si parlava ancora di ottimizzazione del Crawl Budget ma il Keyord Stuffing imperava ed era facile trovare posizionate in SERP pagine piuttosto illegibili con testi poco articolati e piene solo di keyword ripetute. A distanza di anni le cose sono cambiate, Google ha continuamente perfezionato i suoi algoritmi per escludere risultati non qualitativi frutto di tecniche di black hat SEO e nel 2013 con Hummingbird ha forse introdotto l’update più rilevante per le query di tipo conversazionale. Con Humingbird l’obiettivo di Google era poter far emergere pagine che rispondano all’intero significato della query, rispetto a pagine che rispondano solo ad alcune keyword. Sappiamo che Google modifica e migliora costantemente i suoi algoritmi al di là degli update che vengono pubblicizzati e promossi con eventi e dichiarazioni.

Esempi di Stop Words che influiscono nella SERP

Ad oggi però il dilemma su come gestire le stop words e come gestire titoli e tag permane e spessissimo ogni SEO deve valutare nell’ottimizzare un certo contenuto su quale query voglia focalizzare il risultato.
Quelle che vengono tutt’ora definite stop words su alcune query sono determinanti: se si cerca ad esempio la parola “Mercurio”, Google presenterà una SERP molto diversificata in cui andrà ad includere il risultato associato in ambito astronomico, in ambito chimico e in ambito mitologico. Effettivamente il termine “Mercurio”, se non contestualizzato, non può offrire una query chiara al motore di ricerca che quindi restituisce risultati interdisciplinari. E’ sufficiente aggiungere l’articolo “il” insieme al termine “Mercurio”, l’unico caso in cui vengono accostati i termini in corretto italiano per indicare l’elemento chimico, e troviamo la SERP con risultati conformi e inerenti alla stesso intento di ricerca.

stop_words
Non è un risultato isolato e particolarmente eccezionale. Quelle che ancora in molti considerano stop words sono probabilmente determinanti nella composizione della SERP più di fattori di ranking di autorevolezza attribuita da fattori off-page e da accortezze di SEO tecnica. Abbiamo confrontato le query “Hotel Roma” e “Hotel a Roma”. Un’unica lettera riesce a determinare 2 varianti rilevanti in SERP di due siti che sfruttano  l’exact match domain (nome a dominio identico alla query) che riescono a incunearsi tra i risultati di importanti OTA e siti internazionali. Nel primo caso riesce a trovare il posizionamento in prima pagina un “Hotel Roma” di Bologna, (ha rimpiazzato il posizionamento all’Hotel Roma di Firenze che per anni si posizionava bene con la stessa query), nel secondo caso troviamo un Hotel di nome “A.roma” che si trova effettivamente nella capitale ma che ottiene il posizionamento solo se viene aggiunta la preposizione “a” nella query..

il famoso hotel A.Roma… a Roma (https://www.hotel-aroma.com/it/)

Come comportarsi quindi per l’ottimizzazione per query che vengono formulate con o senza stop words?

Intanto è necessario analizzare i volumi di ricerca per le varie keywords, i tool più utilizzati per il monitoraggio SEO offrono indicazioni sulle ricerche mensili, la stagionalità dell’andamento delle ricerche nel corso dell’anno e la keyword difficulty che viene determinata dalla concorrenza sulla keyword. Generalmente le le keyword composte da meno termini sono quelle che offrono volumi maggiori e sono più concorrenziali, al contrario quelle con più parole hanno dei volumi di ricerca inferiori. In linea di massima è più semplice indicizzare un contenuto del proprio sito per keywords più articolate (sarebbe improprio parlare di keywords a coda lunga se ci limitiamo a includere come variante un articolo o una preposizione). Se non si sta operando su un sito web con altissimi livelli di trust o su una query con bassissima concorrenza sarebbe opportuno considerare la keyword con stop words come qualsiasi altra keyword correlata della combinazione senza stop words.

Considerazioni Finali

Gli algoritmi di Google hanno fatto passi da giganti nel corso degli anni per presentare SERP sempre più pertinenti alle query di ricerca, un grosso limite che offre ancora oggi margini di errore è dato da come gli utenti formulino le ricerche online, tentando di ridurre il numero di parole da digitare (per pigrizia o perchè confidano in ogni caso in una SERP utile). Non effettuiamo ricerche online nello stesso modo in cui scriviamo testi sui blog e sui social. Probabilmente sono ancora milioni gli utenti che non immaginano quanto sia sofisticato l’algoritmo di ricerca e talvolta si rivolgono a Google come a un turista straniero in vacanza. Non dimentichiamoci che sono gli utenti stessi tendono a influenzare in parte la SERP attraverso le statistiche di ricerca e le relative interazioni. Sicuramente un cambiamento importante, al di là dei vari update degli algoritmi di Google, si potrà ottenere quando avremo numeri consistenti nella ricerca vocale, quando le query conversazionali vocali supereranno quelle digitate e gli utenti potranno comprendere meglio che hanno a che fare con un’intelligenza artificiale più o meno complessa in grado di comprendere sfumature semantiche.

Autore: Francesco Magistro

Francesco Magistro consulente seo e sem, formatore e co-fondatore della web agency KMA di Roma.
Mi occupo web marketing dal 2005 offrendo le mie competenze a professionisti e imprenditori,
da allora la SEO e in generale le strategie di marketing online non stancano di appassionarmi.