Gentetwork e tracciamento delle schede di metadato sui ragni di ricerca.

Previous Topic Next Topic
 
classic Classic list List threaded Threaded
3 messages Options
Reply | Threaded
Open this post in threaded view
|

Gentetwork e tracciamento delle schede di metadato sui ragni di ricerca.

Andrea Peri
Salve,

penso che sia una informazione utile a svariati utenti:

come qualcuno sapra',
per non farsi indicizzare una pagina da Google,
serve inserire nella pagina il seguente tag:

<meta name="robots" content="noindex" />

In realta' i maligni dicono che BigG la indicizza ugualmente, poi peor' non la mostra nelle ricerceh.
Vabbeh, per me il risultato è paragonabile, se quello che si vuole ottenere è solamente
che non appaia nei risultati.
:)
Il mio problema è che sto lavorando sul nostro prossimo venturo catalogo di metadati,
e vorrei evitare che BigG ci tracciasse le singole schede di metadato.

Per questo vorrei che nelle pagine XML ci comparisse il suddetto  tag:

Ho dei dubbi pero' che questo sia fattibile perche' in effetti
tale tag non fa parte della specifica ISO19115/ISO19139.

Quindi , forse una soluzione potrebbe essere inserire tale tag
nella pagina di home di GeoNetwork che presenta i link alle pagine di
metadato delle singole schede.

Ora indago su come si ottiene questo risultato e poi faccio sapere.

--
-----------------
Andrea Peri
. . . . . . . . .
qwerty àèìòù
-----------------

_______________________________________________
[hidden email]
http://lists.gfoss.it/cgi-bin/mailman/listinfo/gfoss
Questa e' una lista di discussione pubblica aperta a tutti.
I messaggi di questa lista non hanno relazione diretta con le posizioni dell'Associazione GFOSS.it.
666 iscritti al 22.7.2013
Reply | Threaded
Open this post in threaded view
|

Re: Gentetwork e tracciamento delle schede di metadato sui ragni di ricerca.

Alessandro Sarretta

Ciao Andrea,posso per curiosità chiederti come mai non vuoi avere le singole schede indicizzate?
Ale


_______________________________________________
[hidden email]
http://lists.gfoss.it/cgi-bin/mailman/listinfo/gfoss
Questa e' una lista di discussione pubblica aperta a tutti.
I messaggi di questa lista non hanno relazione diretta con le posizioni dell'Associazione GFOSS.it.
666 iscritti al 22.7.2013
Reply | Threaded
Open this post in threaded view
|

Re: Gentetwork e tracciamento delle schede di metadato sui ragni di ricerca.

Andrea Peri
On 02/11/2013 16:41, Alessandro Sarretta wrote:
>
> Ciao Andrea,posso per curiosità chiederti come mai non vuoi avere le
> singole schede indicizzate?
> Ale
>

Google, non è un sistema di ricerca per metainformazione e il fatto che
ritorni delle schede di metainfo crea confusione.
Le schede di metainfo non esistono realmente , ma sono prodotte da un
sistema dinamico al volo.
Come tali non dovrebbero mai comparire sui risultati di un motore tipo
google.
Questo perche' esse non sono vere e proprie risorse statiche (pagine
html) archiviate su un qualche server web, ma bensi' una risorsa
astratta inesistente perche' generata al volo da un sistema di catalogo.

Nel nostro caso poi vi è il fastidio extra che facendo determinate
ricerche ci compare come primo risultato una nostra scheda di
metainformazione in xml che in realtà poiche' faceva riferimento a un
sistema recentemente dismesso da' pure errore.

Ma tornando al caso piu' generale.
Per fare un esempio concreto:

Come si sa' le schede su GN sono invocabili sia tramite il loro prefisso
univoco contenuto nell'tag FileIdentifier (UUID) che tramite il loro
numero di indice di archiviazione.

PURTROPPO GN ('ritacci sua) presenta i links usando l'indice interno
anziche l' UUID.

Questo ha una conseguenza molto fastidiosa.
Infatti se io in fase di gestione delle schede su GN cancello una o piu'
schede e poi le ricarico, magari delle nuove versioni ricorrette (prassi
abbastanza consueta), l' UUID delle singole schede resta invariato
perche' ovviamente se si fa' le cose per bene si mantiene tale valore
invariato. Come è giusto che sia perche' è cio' che secondo ISO
realmente identifica la scheda per sempre.

Ma l'indice interno che la indicizza sul DB di GN cambia perche' esso
viene preso da un progressivo del DB.

Il risultato è che se oggi la scheda era linkata con

  ....?id=17

Dopo averla ricaricata la nuova scheda che sostituiva la vecchia (ma che
ne dovrebbe ereditare in tutto e per tutto il ruolo e lo scopo) sara'
linkata con un nuovo indice, ad esempio
...?id=38

MA Google, continua a presentarla sempre con  ...id=17 perche' tale è
cio' che si era memorizzato al momento del pasaggio dei suoi ragni.
E quindi quando la presenta, il link di invocazione su GN dara' come
risultato
che la scheda è inesistente

Questo se va bene, se invece va male, puo' addirittura capitare che GN
presenti una altra scheda completamente differente e che non centra niente.

La ragione se ci si pensa bene è sempre legata al fatto che la scheda
xml non è na risorsa statica, ma dinamica.
Per questo sono convinto che è meglio che Google stia fermo e non
presenti schede XML come risultait di ricerche.

Certo anche qui si potrebbe dissertare che se GN presentasse i links
tramite l' UUD del fileidentifier quesot problema non sussiterebbe.
Ma resta il punto che la scheda di MTD è una risorsa dnamica e non
dovrebbe essere proposta come risultato da un motore di ricerca.
Putroppo la soluzione maestra, il tag di "noindex" va a cozzare con l'
XSD della ISO19115 e quindi si bloccano a vicenda.

:(

Andrea.


_______________________________________________
[hidden email]
http://lists.gfoss.it/cgi-bin/mailman/listinfo/gfoss
Questa e' una lista di discussione pubblica aperta a tutti.
I messaggi di questa lista non hanno relazione diretta con le posizioni dell'Associazione GFOSS.it.
666 iscritti al 22.7.2013