O que é normalização de URL ?
A canonização da URL significa ter classificações de backlink do mecanismo de pesquisa espalhadas com conteúdo duplicado ou semelhante consolidado na URL canônica.
O Google tentará consolidar URLs duplicados em um único URL sem que você faça nada.
Por exemplo, se os dois URLs “url.htm?utm=greencheeseandham” e “url.htm” exibirem conteúdo comum, o URL mais curto “url.htm” será normalizado.
No entanto, nem sempre as classificações são combinadas como o operador do site deseja.
Para controlar a avaliação e o índice, vamos especificar a URL canônica com o atributo canônico.
Qual é o atributo canônico ?
O atributo canônico é um método de descrição usado para especificar essa URL canônica.
Canônico é pronunciado canônico e significa “ortodoxo” ou “padrão” em inglês.
Por que é necessário especificar um URL canônico no atributo canônico?
Nos casos a seguir, mesmo que o conteúdo exibido seja o mesmo, existem vários padrões de URL.
Vários padrões de URL que precisam de canonização
versão com | versão sem | |
---|---|---|
www | http://www.allegro-inc.com | http://allegro-inc.com |
index.html | https://www.allegro-inc.com/index.html | https://www.allegro-inc.com |
https | https://www.allegro-inc.com | http://www.allegro-inc.com |
parâmetro | https://www.allegro-inc.com/?ref=blog | https://www.allegro-inc.com |
Vários padrões de URL que precisam de canonização
O Google reconhece URLs com vários padrões como este como páginas diferentes e as avalia individualmente. Ou pode mesclar automaticamente as classificações como páginas duplicadas, mas talvez não.
Ao usar o atributo canônico, é possível consolidar as avaliações de backlink distribuídas em vários padrões de URL em uma única URL.
Para evitar a dispersão da avaliação, é eficaz unificar o método de vinculação do seu próprio site, mas você não pode controlar os links de sites externos. Assumindo tal caso, você pode integrar a avaliação especificando a URL canônica usando o atributo canônico.
além desses, também usamos o atributo canônico ao realizar testes AB. Para obter mais informações, consulte Como reduzir o impacto na Pesquisa Google ao testar seu site.
Como especificar o URL canônico
Existem dois padrões para especificar um URL canônico usando o atributo canônico.
- Como descrever na tag head do HTML
- Como especificar no cabeçalho HTTP
O primeiro método é o método mais comum e o último método pode especificar o atributo canônico no cabeçalho HTTP quando o primeiro método não pode ser especificado, como para arquivos PDF.
Como descrever na tag head do HTML
Ao descrevê-lo na tag head da seguinte maneira, você pode normalizar URLs com www, sem www, com parâmetros etc. em um URL e unificar o índice dos mecanismos de pesquisa.
<head>
・
<link rel=” canonical ” href=”https://example.com/product.php”>
・
</head>
Como especificar no cabeçalho HTTP
Por exemplo, digamos que você tenha os dois URLs a seguir com o mesmo conteúdo: A versão HTML de white-paper.pdf é white-paper.html
- http://www.example.com/white-paper.html
- http://www.example.com/white-paper.pdf
Se você não especificar o atributo canônico, o Google considerará os dois URLs separados e a avaliação do link será distribuída.
No entanto, como se trata de um arquivo PDF e não HTML, o atributo canônico não pode ser escrito na tag head.
Nesse caso, quando o Google acessa “http://www.example.com/white-paper.pdf”, o cabeçalho HTTP é usado para gerar a versão HTML da URL “http://www.example.com/ white-paper.pdf”. -paper.html” é um URL canônico e você pode integrar a avaliação.
Para verificar após a configuração, se for Chrome, clique na guia “Rede” da função de verificação e selecione o arquivo correspondente.
Verifique se está assim:
GET /white-paper.pdf HTTP/1.1
Host: www.example.com
(…outros cabeçalhos de solicitação HTTP…)
HTTP/1.1 200 OK
Content-Type: application/pdf
Link: <http://www.example .com/ white-paper.html>; rel=” canonical ”
Content-Length: 785710
(…outros cabeçalhos de resposta HTTP abaixo…)
Perguntas frequentes sobre normalização
O Google também processará canônicos escritos em JavaScript?
O Google costumava ignorar os canônicos que são adicionados no lado do cliente após a renderização, mas parece que eles mudaram e agora são capazes de lidar com eles. John Mueller reconhece.
Agora parece que também pode ser usado para cross-domain. Por exemplo, se você opera vários sites de compras e lida com a mesma mercadoria, teoricamente pode usá-los em vários domínios. No entanto, na maioria dos casos, pode haver restrições do lado da plataforma. (O motivo é que, uma vez que as avaliações sejam integradas a outra plataforma, sua plataforma não aparecerá mais nos resultados de pesquisa.)Devo usar redirecionamentos 301 ou canônicos para canonização?
Do ponto de vista do Google, rel=” canonical ” age como um redirecionamento 301. Por outro lado, em comparação com os redirecionamentos 301, rel=canonical é escrito para mecanismos de pesquisa e não funciona funcionalmente para o visualizador.
Basicamente, ao normalizar usando 301, também é uma boa ideia escrever o atributo canônico, pois ele pode ser vinculado de um site externo com parâmetros.A ordem dos atributos afeta o reconhecimento do Google?
Não. Por exemplo, as duas declarações a seguir são válidas.
<link rel=” canonical ” href=”https://example.com” />
<link href=”https://example.com” rel=” canonical ” />
Notas sobre normalização
tempo antes da normalização
Na verdade, parece que o Google não reconhece imediatamente os URLs que foram normalizados usando o atributo canônico. Parece que é recebido como um pedido e finalmente processado após a confirmação de que não há possibilidade de erro de especificação.
Portanto, parece que leva algum tempo para que a URL seja normalizada.
De acordo com o comentário de John Mueller, mesmo que rel=canonical seja especificado, ele pode não ser processado conforme descrito. Isso parece possível porque o Google analisa vários fatores para determinar a canonização.
Um erro comum é especificar a página principal como o URL canônico para todas as páginas do site. Nesses casos, o Google parece reconhecer isso como um erro e ignorar a própria descrição.
https://youtube.com/watch?v=sQBPSxrbE8g%3Fstart%3D2014%26feature%3Doembed%26enablejsapi%3D1%26origin%3Dhttps%253A%252F%252Fwww.allegro-inc.com
Diferença de reconhecimento dependendo da presença ou ausência de / (barra) na URL
De acordo com o comentário de John Muller do Google, o Google parece ter um reconhecimento diferente dependendo da presença e posição da / (barra).
- http://www.example.com/
- http://www.example.com
- https://www.example.com/
- https://www.example.com
- https://example.com/
- https://example.com/fish
- https://example.com/fish/
Parece não haver problema com a presença ou ausência de uma barra após o nome do host, como (1) e (2), (3) e (4). Em outras palavras, 1 e 2 são reconhecidos como iguais e 3 e 4 são reconhecidos como iguais.
O nome do host e o protocolo, por outro lado, são tratados como URLs diferentes. Em outras palavras, ① e ③ são diferentes e ③ e ⑤ são diferentes, portanto, são reconhecidos como URLs diferentes.
A manipulação de barras em caminhos/arquivos também será reconhecida como URLs separados. Em outras palavras, ⑥ e ⑦ são reconhecidos como URLs diferentes.
Não normalize da página 2 em diante para a página 1 com paginação
As páginas usadas para paginação não devem ter conteúdo duplicado. Se você usar assim, mesmo que a segunda página de paginação seja exibida, a terceira página e posteriores podem ser excluídas dos resultados da pesquisa e você perderá a avaliação do conteúdo.
Se você deseja exibir a primeira página nos resultados da pesquisa, pode criar uma página de componente que combine as páginas usadas para paginação e especificar rel=canonical para ela.
Descreva o caminho absoluto para o URL especificado por rel=canonical
Existem dois tipos de especificação de URL: caminho absoluto e caminho relativo. Para um caminho absoluto, comece com “https://”.
Usando este site como exemplo, se você especificar “href=”www.allegro-inc.com””, o mecanismo de busca será “http://www.allegro-inc.com/www.allegro-inc.com” . será reconhecido como
Outras notas gerais
- Certifique-se de que o conteúdo da página duplicada e o conteúdo do URL canonizado sejam praticamente os mesmos.
Mesmo que os tópicos abordados sejam semelhantes, a designação canônica pode ser ignorada se as palavras ou frases não forem exatamente as mesmas. - Verifique se o destino rel=canonical existe (erro 404, sem soft 404) Um
soft 404 é quando a página exibe um erro 404, mas o servidor não retorna um erro 404 para o navegador. . - Verifique se o destino rel=canonical não está indexado na meta tag robots.
- Verifique se a URL especificada por rel=canonical é aquela que você deseja exibir nos resultados da pesquisa. Certifique-se de não especificar acidentalmente URLs duplicados que não sejam canônicos.
- Certifique-se de que o link rel=canonical esteja incluído no cabeçalho http ou na tag <head> da página.
- Verifique se rel=canonical existe mais de uma vez na página.
Qualquer coisa mais do que um será ignorado pelos motores de busca. - Não use robots.txt para normalização . Bloquear conteúdo duplicado com robots.txt fará com que cada página perca sua classificação, resultando em uma classificação diluída.
Como extrair erros canônicos em massa
A ferramenta de inspeção de SEO de sites do SE Ranking extrai problemas relacionados a SEO em todas as páginas do site, incluindo erros de especificação canônica. Por favor, tente os seguintes passos.
PASSOCrie uma conta SE Ranking
Você pode criar uma conta de avaliação gratuita de 2 semanas sem registro de cartão de crédito. Por favor, tente se registrar na página abaixo.
Inscreva-se para uma avaliação gratuita de 14 dias
PASSOcriar projeto
Crie um projeto consultando o procedimento de instalação abaixo.
PASSORealizar inspeção de SEO do site
Faça login no SE Ranking, vá em “Site SEO Inspection” no menu à esquerda e execute a inspeção.
Ir para o relatório de problemas
Após a conclusão da inspeção, acesse a subseção ‘Relatório de problemas’ em ‘Inspeção de SEO do site’ no menu à esquerda.
Erros relacionados a conteúdo duplicado e erros de especificação canônica são extraídos de uma só vez. Se um erro for exibido, clique no número na coluna “Página” da tabela para verificar a página correspondente.
Leave a Reply