Ottimizzare un sito per Google News

02/03/2009

L’indicizzazione di un sito su Google News rispetta bene o male gli algoritmi e le regole richieste per la  ricerca nel web.

In generale quindi è buona norma seguire i tipici accorgimenti richiesti dal SEO per ottimizzare le pagine di un sito, tenendo presente tuttavia alcuni fattori specifici che riguardano il servizio di indicizzazione dei siti che forniscono notizie:

  • aggiornamento e freschezza dei contenuti: chiaramente l’interesse di Google è di fornire per ogni tema le notizie più aggiornate (oltre che più rilevanti)
  • complessità delle pagine: tipicamente le pagine dei quotidiani online sono molto ricche di elementi, derivanti spesso da esigenze promozionali e di raccolta pubblicitaria
  • popolarità: le notizie più interessanti sono tipicamente segnalate e commentate da molti utenti in tempi rapidi, dopodichè tendono a “scadere” e perdere di “notiziabilità”

Url

Per essere indicizzate, le pagine del sito devono rispettare alcune regole nella gestione degli URL:

  • ogni articolo deve essere ospitato in una pagina specifica (evitare pagine che ospitano più notizie) e deve essere associato a un URL univoco
  • il contenuto di ciascun URL non deve cambiare nel tempo
  • Google non segue i link gestiti come immagini
  • se non usate la sitemap (vedi paragrafo successivo), l’URL deve contenere un numero di almeno 3 cifre. Attenzione: evitare di avere solo 4 cifre che indicano l’anno (no “/news/article2006.html”, sì “/news/article7364.html”), queste pagine non verranno indicizzate. Questo requisito è necessario perchè aiuta Google a riconoscere la pagina come una notizia: le URL delle news infatti di solito contengono anche un numero che ne garantisce l’unicità, a differenza delle pagine di un sito che usano indirizzi “parlanti” (google-friendly).

Sitemap

In generale consiglio di leggere le linee guida per creare una sitemap gradita a Google. Molto utili sono i tool che vengono installati sul server e generano la sitemap automaticamente (qui un esempio).

In particolare, per i siti di news online sono da tenere presenti alcuni accorgimenti:

  • includere nella sitemap solo le pagine aggiunte negli ultimi 3 giorni
  • evitare di includere ID di sessione univoci negli url
  • inserire nella sitemap al massimo 1000 url (onde evitare di sovraccaricare i server di Google)

In aggiunta Google prevede la possibilità di utilizzare una sitemap lievemente ottimizzata per i siti di notizie:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84" xmlns:news="http://www.google.com/schemas/sitemap-news/0.9">
   <url>
      <loc>http://example.com/article1234.html</loc>
      <news:news>
         <news:publication_date> 2006-08-14T03:30:00Z </news:publication_date>
         <news:keywords>Business, Mergers, Acquisitions</news:keywords>
      </news:news>
   </url>
</urlset>

Come si può vedere, oltre all’indicazione dell’url, è fondamentale inserire la data di pubblicazione, comprensiva di timestamp (in formato W3C, es. 008-12-29T06:30:00Z), senza la quale la pagina non viene inclusa da Google nel suo indice. Per facilitare l’opera di classificazione è molto interessante la possibilità di aggiungere delle parole chiave che descrivono meglio l’articolo, magari riproponendo le categorie previste da Google News.
Per approfondimenti consiglio comunque di visitare le pagine dell’help center di Google dedicate alle sitemap per le notizie.

Matrice di link

Tra tutti i fattori onsite consiglio di prestare particolare attenzione a come vengono linkati gli articoli.
Articolare le news semanticamente affini, utilizzando la tecnica delle notizie correlate, prestando particolare attenzione a inserire le parole chiave rilevanti all’interno del titolo (che di solito viene utilizzato come ancora del link).

Testo e Immagini

Il corpo dell’articolo deve essere facilmente identificabile dallo spider; è importante quindi presentarlo come un blocco unico, evitando di inframezzarlo con annunci, tags e altri elementi non inerenti il contenuto principale della pagina. Google consiglia inoltre di inserire il contenuto il più vicino possibile all’inizio del BODY.

Le immagini devono essere inserite vicino al testo dell’articolo. Usare immagini proporzionate (con un buon rapporto tra altezza e larghezza), meglio se in formato jpg e accompagnate da una descrizione contenente le keyword desiderate.
E’ importante ricordare che le immagini non devono essere linkate.

Selezione delle keyword

Quasi dimenticavo…come per il SEO “tradizionale” è strategico  il momento di selezione delle parole chiave sulle quali puntare per l’ottimizzazione. Val la pena ribadire che ogni keyword è un potenziale catalizzatore di traffico (targettizzato); consiglio quindi di ponderare bene la scelta delle parole chiave che verranno utilizzate nei vari elementi testuali della notizia, soprattutto il titolo dell’articolo che, molto spesso, viene utilizzato nel meta TITLE, nell’url e come ancora nei link. Apparentemente quest’ultima è l’accortezza più semplice da mettere in pratica, che risulta subito cosa ardua quando si ha a che fare con le redazioni giornalistiche, le quali tendono a preferire titoli ad effetto che però sono poco efficaci in ottica SEO (vedi punto successivo).
Per selezionare le parole chiave personalmente trovo molto utile uno strumento come Google insights.