「重複內容(Duplicate Content)」指的是相同或高度相似的內容,同時出現在網際網路上多個不同的網址。由於每個 URL 都被搜尋引擎視為一個獨立的「位置」,當同一份內容散落在多個 URL 上,就會被認定為重複內容。雖然重複內容在技術上不算「懲罰」,但 Google 在面對多個高度相似頁面時,會難以判斷該把哪個版本排進搜尋結果,最終影響的就是您的網站排名與流量。
一、為什麼要避免重複內容?
對搜尋引擎而言
重複內容主要會造成搜尋引擎三個困擾:
- 不知道該把哪一個版本納入索引(或從索引中排除)。
- 不知道該把連結權重(網站信任度、權威值、反向連結價值)集中到哪一頁,或要分散給多個版本。
- 不知道該讓哪一個版本出現在搜尋結果中。
對網站擁有者而言
當網站存在重複內容時,網站所有者通常會在排名與流量上遭受損失,原因來自兩個層面:
- 為了提供最佳的搜尋體驗,搜尋引擎極少同時顯示同一內容的多個版本,最終只會挑選其中一個,其餘版本的曝光度則被稀釋。
- 連結權重(Link Equity)會被分散,因為其他網站在引用時也必須從多個版本中挑選,導致原本應集中在一個頁面的反向連結,被分散到好幾個重複頁面,整體 SEO 能見度因此下降。
二、重複內容如何產生?
絕大多數情況下,網站所有者並非刻意製造重複內容,但這並不代表問題不會發生。根據統計,網際網路上高達 29% 的網頁內容實際上是重複的。以下是幾種最常見、無意間造成重複內容的情境:
1. URL 變體(網址參數)
網址中夾帶參數(如點擊追蹤碼、分析代碼)是最常見的重複內容來源之一。問題不只出在參數本身,連參數的排列順序都可能被視為不同 URL。
同樣地,Session ID 也是常見的元兇——每位訪客的網址都帶有不同的 Session 編號,等於替每個訪客生成一個獨立 URL。此外,友善列印頁(Print-friendly version)若被搜尋引擎索引,也會造成同一內容存在多個版本。
2. HTTP 與 HTTPS、www 與非 www 版本
如果您的網站同時存在 www.site.com 與 site.com 兩個版本,且兩者都能開啟相同內容,等於替每個頁面建立了一份重複版本。同樣的狀況也發生在 http:// 與 https:// 並存的網站上。只要兩個版本都能被搜尋引擎抓取,就會構成重複內容問題。
3. 抓取或拷貝內容
重複內容不僅限於部落格文章或編輯內容,產品說明頁同樣是重災區。如果在自己的網站中重新刊登舊文章,可能無意間製造重複內容;電子商務網站也常遇到類似狀況——當許多賣家使用製造商提供的原廠商品描述時,同一段文字會出現在數十個甚至上百個網站上。
三、如何解決重複內容問題?
解決重複內容的核心目標是:明確告訴搜尋引擎,哪一份才是「正確」版本。只要您的網站上同一份內容能透過多個 URL 存取,就應該主動進行「規範化(Canonicalization)」處理。常用方法有以下四種:
1. 301 永久轉址
處理重複內容最直接、最有力的方式就是設定 301 永久轉址,將「重複」網頁實際導向原始內容網頁。它能把舊網址累積的所有流量與權重,永久轉移到單一新的網址上,是搜尋引擎最能理解的訊號。
2. Rel="canonical"
處理重複內容的另一個選項是使用 rel="canonical" 屬性,這個標籤會告訴搜尋引擎:某個網頁應該被視為「指定 URL 的副本」,請把權重集中到指定的那一頁。
3. Meta Robots Noindex
在處理重複內容時,Meta Robots 標籤也非常實用。當您在頁面中放入 "noindex, follow",等於告訴搜尋引擎:「請抓取這個網頁、追蹤其中的連結,但不要將它編入索引。」這個方法特別適合用在內部搜尋結果頁、篩選頁、列印版本等不應出現在搜尋結果中的頁面。
4. Google Search Console 主網域與參數處理
透過 Google Search Console,您可以設定網站的「偏好主網域」(如指定 www 或非 www 版本),並告訴 Googlebot 該如何處理 URL 中的各種參數,有助於減輕重複內容的影響。
5. 處理重複內容的其他方法
- 網站內部連結保持一致格式。例如全站統一使用
http://www.example.com/,不要混用http://example.com/。 - 若有彙整或重新整理文章內容的需求,應在彙整頁中清楚標示連回原始文章。
- 在重複頁面中加入
rel="canonical"標籤,指向原始網頁,告訴搜尋引擎「這才是正本」。
四、常見問答 FAQ
重複內容會被 Google 處罰嗎?
rel="canonical" 標籤要怎麼正確使用?
<head> 區塊內加入 <link rel="canonical" href="正確網址" />,告訴搜尋引擎這個頁面的「正本」是哪一頁。重點是:canonical 必須使用絕對網址(含 https://),且每個頁面只能有一個 canonical 標籤。即使是主頁本身,也建議自己指向自己(self-canonical),可避免被 URL 參數或追蹤碼干擾。
301 轉址和 canonical 標籤有什麼不同?該選哪一個?
同個產品在多個分類下顯示,會被視為重複內容嗎?
/category-a/product 與 /category-b/product。解決方法是為每個產品指定一個「主要網址」,並在其他分類路徑的網址上加入 canonical 標籤指向主要網址;或在程式邏輯中,直接將所有路徑統一導向同一個產品網址,避免不同 URL 顯示相同內容。