Aide - Recherche - Membres - Calendrier
Version complète : Verifier le duplicate content d'un site
Utilisable > Référencement, développement et hébergement > Référencement Internet
Jits
Salut,

A votre avis ce moteur de recherche est-il efficace pour verifier le duplicate content ?
http://www.copyscape.com

Je me demande si son algo est le meme que GG pour faire cette analyse .. Dans tout les cas je pense que c'est un indicateur credible ... non ?

Si vous connaissez des outils pour faire ce genre d'analyse je suis preneur ..Si en plus ils utilisent l'algo de GG , ce serait parfait ...

Autre petite question si par exemple j'ai souscri à des annuaires dupliqués est ce que cela me penalise hormis le fait que mes liens ne soit pas comptabilisées ?

Merci ...

@++
Him
Pour ce que j'ai pu en voir, cela n'as pas l'air d'être le plus efficace...
Si je lui demande http://www.creloaded-fr.net

Plus tot que de me parler des mes concurrents directs, il me parle de WRI avec une page qui n'as RIEN A VOIR avec mon site smile.gif

Perso, j'utilise : http://www.webconfs.com/similar-page-checker.php
Tu dois systématiquement coller 2 urls, & comparer page par page, mais les résultats observer sont plus que prometteurs.

Cordialement
Patrick
Non rien à voir !
Pour voir les pages similaires sur GG il faut utiliser la commande "site:".

++

Patrick
Jits
Oki ... merci ...

PAr contre j'ai l'impression que la commande "site:" n'est pas tres efficace .
Domage qu'il n'existe pas un outil ou entre une seule URL ... Se pourrait etre bien utile car on conait pas forcement les adresses de pages dupliquées ...

@++
Him
Bah si, comme l'as dit patrick, tu as la commande "site".

Seul hic, comme tu l'as dit, si ton site est normalement référencé, il faut bien compter 7 jours pour voir la mise à jour... !

exemple :

http://www.google.com/search?hl=fr&q=s...+Google&lr=

Un petit site à que j'ai laissé se planter dernièrement, & qui me donne un bel exercice smile.gif

Tu vois 3 liens sortir sur 18, clic sur "afficher les resultats ignorés" te voila avec les 18 pages.

Tu sais donc pertinemment bien quelles sont les pages considérées comme "duplicate" par google.

même chose, chez yahoo, msn, etc...
Jits
Salut Him,

J'ai regardé le lien google que tu a mis en exemple et les pages sont relativement differentes ...
J'ai testé avec mon url et c'est pareil, le contenu sementique des "pages ignorés" , est totalement different meme si la structure de la page reste quasi identique .

Et les pages retournées de mon site sont indexées , donc je pense pas qu'il les considere comme dupliquées .

@suivre smile.gif
Xyz
Glps, l'outil de webconf m'indique que des pages à priori bien différentes de mon site sont similaires à 63 % .. ça me parait énorme, et cela juste à cause de la navigation...

Grave ??
Patrick
Avec l'url des pages concernées cela beaucoup plus facile de te répondre.
Merci de nous les donner qu'on puisse regarder ça.

++

Patrick
Xyz
Bonjour..

Les pages testées étaient http://www.ficgs.com/forum.html et http://www.ficgs.com/problem.html

L'outil de WebRankInfo me donne même 73 % et 84 % de similarité avec les 2 méthodes employées... :/


Je pense qu'outre l'architecture, les news sur la colonne de gauche et publiées sur chaque page sont peut etre de trop, mais j'ai pu lire ci et là que 85 % de similarité, c'était encore considéré comme "normal"....

En rapport avec le "bug" de la commande site: de Google, qui donne depuis quelques semaines 260 ou 280 pages pour pas mal de sites et dont certains ont fait le rapprochement avec la similarité, il semble également que cela revienne à la normale au bout de 3 semaines environ...

Pas d'inquiétude donc... (enfin j'espère)
Patrick
Salut,

je ne sais comment ces outils propriétaires mesures la similarité, mais il est évident que te 2 pages ne présente pas ce problème.

++

Patrick
Xyz
Bon... rassurant.. c'est vrai qu'objectivement il n'y a pas de quoi paniquer.. (ça s'est vu ? smile.gif )

Je vais quand meme raccourcir certains titres de page générés, trop longs et ayant trop de mots communs... Ca ne peut pas faire de mal à long terme...
Xyz
Citation (Xyz @ 23-02-2007, 15:01) *
En rapport avec le "bug" de la commande site: de Google, qui donne depuis quelques semaines 260 ou 280 pages pour pas mal de sites et dont certains ont fait le rapprochement avec la similarité, il semble également que cela revienne à la normale au bout de 3 semaines environ...

Pas d'inquiétude donc... (enfin j'espère)



Juste pour signaler que le "bug" s'est arrêté pour moi également... revenu à 33,000 pages.. rassuré smile.gif
Ceci est une version "bas débit" de notre forum. Pour voir la version complète avec plus d'informations, la mise en page et les images, veuillez cliquer ici.
Invision Power Board © 2001-2012 Invision Power Services, Inc.