Sitemap 中文稱為「網站地圖」或「網站導覽」,是 SEO 與網站結構規劃中相當核心的元素。每個網站建議至少建立兩種 sitemap:一種給使用者瀏覽的 HTML 網頁地圖,另一種給搜尋引擎檢索的 XML Sitemap。兩者名稱相近,但檔案格式、放置位置與功能用途完全不同。在 AI 搜尋時代,網站不只要被 Google 收錄,還要能被 ChatGPT、Perplexity、Google AI Overviews 抓取理解,清楚的 Sitemap 就是讓 AI 與搜尋引擎正確識別您網站架構的第一道入口。這篇文章適合網站經營者、行銷人員、SEO 初學者閱讀,從觀念到實務一次說明完整。
Sitemap 是什麼?網頁地圖的核心定義
Sitemap 也稱為網站地圖、網頁地圖或網站導覽,簡單來說,就是「把整個網站的頁面與結構,整理成一份清單或地圖」,讓使用者與搜尋引擎都能快速理解網站包含哪些內容、頁面之間有什麼關係。
Sitemap 是網站的結構說明書,它不負責呈現視覺設計,而是專門告訴瀏覽者與搜尋引擎「這個網站有哪些頁面、各頁面的重要性如何」。
每個網站建議都要建立兩種類型的 sitemap,兩者格式與用途完全不同:
/sitemap.html)。用文字與連結列出網站所有頁面,讓訪客能像看目錄一樣選取想看的內容。/sitemap.xml)。包含網址、最後更新時間等資訊,協助建立網站索引。HTML 網頁地圖與 XML Sitemap 的差別
很多人會混淆這兩種 Sitemap,以為只是檔案格式不同。實際上,它們面向的對象、製作方式、放置位置、檢視結果都完全不一樣。以下用一張對照表幫您一次釐清:
| 比較項目 | HTML 網頁地圖 | XML Sitemap |
|---|---|---|
| 對象 | 真實使用者 | 搜尋引擎與 AI 爬蟲 |
| 檔案格式 | HTM / PHP / ASP / ASPX | XML(也支援 TXT、RSS、Atom) |
| 呈現方式 | 有設計排版的網頁 | 純資料結構,人類看不懂 |
| 放置位置 | 網站導覽列或頁尾連結 | 網站根目錄(如 /sitemap.xml) |
| 主要用途 | 協助瀏覽、降低跳出率 | 協助檢索、建立索引 |
| 提交給搜尋引擎 | 不需要 | 需要(透過 Search Console) |
HTML 網頁地圖:給人看的網站導覽
HTML 網頁地圖是一個真正的網頁,網址通常是 /sitemap.html 或 /sitemap.php,瀏覽者點進去之後會看到網站所有頁面的清單,用文字連結組織,通常會依照分類或階層排列。
HTML 網頁地圖的主要功能
網頁地圖的存在不只是「方便」,它在三種情境特別有用:
-
大型網站的瀏覽輔助
當網站有幾十、幾百個頁面,光靠導覽列不夠用,使用者可能不知道某個資訊藏在哪裡。網頁地圖把所有頁面一次列出,讓使用者能快速找到目標。
電商網站有上百種商品分類,網頁地圖可讓使用者一眼看見所有類別,不用層層點選。
-
結構複雜時的視覺索引
如果網站階層深(三層以上),使用者很容易在子頁面迷路。網頁地圖等於提供一張「全景圖」,看完就能掌握網站全貌。
企業官網有「服務 → 服務細項 → 案例 → 案例細節」四層結構,網頁地圖能避免使用者卡在深層頁面。
-
無法檢索按鈕的替代入口
部分網站使用 JavaScript、Flash(雖已淘汰)或圖片按鈕,搜尋引擎可能無法判讀。網頁地圖能用純文字連結把這些頁面補回來,確保不被遺漏。
飯店訂房系統若用 JS 動態載入房型頁,網頁地圖可直接列出每間房型的網址,讓爬蟲能進入。
HTML 網頁地圖的製作要點
- 使用純文字連結,不要用圖片或 JS 按鈕
- 依照網站階層分組(主分類 → 子分類 → 頁面)
- 放在頁尾(footer)或導覽列,讓使用者隨時能找到
- 連結文字使用「關鍵字相關」的描述,不要只寫「點此」
- 頁面總數超過 200 個時,可拆成多個分類網頁地圖
XML Sitemap:給搜尋引擎看的網站索引
XML Sitemap 是給搜尋引擎與 AI 爬蟲看的,人類打開會看到一堆 XML 標籤,但對 Googlebot、Bingbot、GPTBot、PerplexityBot 來說,這就是最清楚的「網站地圖」。它告訴爬蟲網站有哪些網址、哪些重要、何時更新。
XML Sitemap 不會直接提高排名,但會讓搜尋引擎更快、更完整、更正確地收錄您的網站,間接幫助 SEO 表現。
XML Sitemap 的標準格式
一份基本的 XML Sitemap 內容如下,每個頁面都用 <url> 包覆,並提供四個核心欄位:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://www.example.com/</loc>
<lastmod>2026-05-22</lastmod>
<changefreq>weekly</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>https://www.example.com/about</loc>
<lastmod>2026-04-15</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
四個核心欄位說明
| 欄位 | 說明 | 是否必填 |
|---|---|---|
| <loc> | 頁面的完整網址(必須是絕對路徑) | 必填 |
| <lastmod> | 頁面最後更新日期(YYYY-MM-DD 格式) | 建議填 |
| <changefreq> | 更新頻率(always / hourly / daily / weekly / monthly / yearly / never) | 可選 |
| <priority> | 頁面相對重要性(0.0 至 1.0,首頁通常 1.0) | 可選 |
priority 與 changefreq 值(Gary Illyes 形容為「a bag of noise」)。lastmod 則是 Google 仍會參考的訊號,但前提是必須「可一致驗證」——也就是 lastmod 要對應實際內容更新時間,若造假被 Google 比對到頁面實際內容沒變,反而會降低信任。建議實務做法:必填 <loc> 與正確的 <lastmod>,priority 與 changefreq 可省略。
Sitemap 對 SEO 與 AI 搜尋的影響
Sitemap 是 SEO 不可或缺的一環。Google 已將搜尋全面 AI 化,推出 AI Mode 與 AI Overviews;ChatGPT、Perplexity、Google AI Overviews 等 AI 搜尋同樣依賴 sitemap 來理解網站結構。當 AI 爬蟲(GPTBot、PerplexityBot、ClaudeBot)成為新的訪客主力,Sitemap 的重要性反而比過去更高。
對傳統 SEO 的幫助
- 加速新頁面被收錄:新文章上線後,提交 Sitemap 可讓 Google 在 1–7 天內發現,而不是等待數週
- 提升收錄完整度:確保深層頁面、孤兒頁面(orphan pages)不被遺漏
- 協助結構分析:讓搜尋引擎理解網站的階層與內容比重
- 傳達更新訊號:透過 lastmod 告訴爬蟲哪些頁面剛更新,促使優先重新檢索
- 避免重複內容:配合 canonical 與 sitemap,讓爬蟲只索引主要版本
對 AI 搜尋(AEO)的影響
AI 搜尋引擎在抓取網站時,同樣會讀取 robots.txt 中標示的 Sitemap 位置。Sitemap 完整、lastmod 正確的網站,內容更容易被 AI 收錄並用於回答生成:
- 提升被 AI 引用的機會 AI 模型在回答使用者問題時,會優先參考結構清楚、有完整 Sitemap的網站。沒有 Sitemap 的網站,深層文章可能完全不被 AI 看見。
- 確保新內容快速進入訓練 ChatGPT、Perplexity 等服務的爬蟲會定期重訪 Sitemap,lastmod 越精準,新內容越快被納入回答資料源。
- 降低 AI 引用錯誤資訊的風險 如果舊版本頁面沒被 Sitemap 排除、新版本沒被優先提交,AI 可能引用過時資訊。Sitemap 是控制 AI 看見哪個版本的有效工具。
Sitemap 之外:robots.txt 與 llms.txt
在 AI 搜尋時代,sitemap.xml 之外還有兩個值得認識的相關檔案,三者各司其職、互相配合:
-
robots.txt — 控制爬蟲存取權限
放在網站根目錄(
/robots.txt),用來告訴爬蟲哪些路徑可以爬、哪些不可以。可針對特定 AI 爬蟲(GPTBot、ClaudeBot、PerplexityBot、Google-Extended、CCBot)設定 Allow 或 Disallow 規則,決定您的內容是否能被 AI 收錄或用於訓練。想被 ChatGPT、Claude、Perplexity 引用,就在 robots.txt 對這些 User-agent 設Allow: /;不希望內容被拿去訓練,就設Disallow: /。 -
llms.txt — 給 AI 系統的內容導覽(2024 年新標準)
由 Answer.AI 的 Jeremy Howard 於 2024 年提出的新提案,放在根目錄(
/llms.txt),以 Markdown 格式列出網站最重要的內容,方便大型語言模型快速理解網站結構。目前 Perplexity、部分學術爬蟲已開始採用,OpenAI 與 Anthropic 表示會逐步納入考量;Google 明確表示不會讀取 llms.txt,Sitemap.xml 仍是 Google 唯一認可的格式。內容豐富的網站(文件、知識庫、教學)做 llms.txt 受益較大;一般中小企業官網不是必要,但做了對 AI 引用有助益。 -
三者分工配合最完整
robots.txt 控制誰可以爬、sitemap.xml 告訴爬蟲有哪些頁面、llms.txt 告訴 AI 哪些內容最重要。完整的「AI 友善網站」是三者並用,但若資源有限,優先順序為:robots.txt(必做)→ sitemap.xml(必做)→ llms.txt(進階)。
robots.txt 開放 AI 爬蟲、sitemap.xml 提供完整 URL 清單、llms.txt 補充精選導覽,三者並用最理想。
如何製作 XML Sitemap?三種常見方式
XML Sitemap 不必手寫,實務上有三種主流做法,可依網站類型選擇最適合的方案:
-
CMS 內建外掛(最推薦)
如果網站使用 WordPress、Shopify、Wix 等 CMS,可直接安裝 Yoast SEO、Rank Math、Google XML Sitemaps 等外掛,Sitemap 會自動生成並隨內容更新,完全不需手動維護。
WordPress 安裝 Yoast SEO 後,Sitemap 自動產生於
https://example.com/sitemap_index.xml,新文章發布後自動加入。 -
線上工具產生(適合靜態網站)
如果是純 HTML 靜態網站,可用 XML-Sitemaps.com、Screaming Frog 等工具掃描網站後產出 sitemap.xml,再上傳到根目錄。
公司形象網站只有 30 頁,用 XML-Sitemaps 免費版掃描後下載,FTP 上傳到根目錄即可。
-
程式自動生成(適合大型網站)
電商、新聞、資料庫驅動型網站,通常會用程式從資料庫動態產生 Sitemap,並設定每日或每週自動更新,確保新商品、新文章即時被搜尋引擎發現。
電商網站每天凌晨用 Cron Job 重新生成 sitemap.xml,確保當日上架的新商品立即被 Google 抓取。
大型網站要拆分 Sitemap
單一 Sitemap 檔案不能超過 50,000 個 URL 或 50MB(壓縮前)。若網站頁面更多,需拆成多個 sitemap,並用一份 sitemap_index.xml 索引檔串接:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://www.example.com/sitemap-posts.xml</loc>
<lastmod>2026-05-22</lastmod>
</sitemap>
<sitemap>
<loc>https://www.example.com/sitemap-products.xml</loc>
<lastmod>2026-05-21</lastmod>
</sitemap>
</sitemapindex>
提交 Sitemap 給 Google 與 Bing
Sitemap 做好之後,還要主動告訴搜尋引擎在哪裡,否則 Google 不會自動知道。提交方式有兩種,建議兩種都做:
方式一:透過 Google Search Console 提交
- 登入 Google Search Console 前往 Google Search Console,選擇您要操作的網域,確認使用正確的協議版本(HTTPS 或 HTTP)。
- 進入 Sitemap 頁面 左側選單點選「索引 → Sitemap」,進入 Sitemap 管理介面。
-
輸入 Sitemap 路徑
在「新增 Sitemap」欄位輸入
sitemap.xml或sitemap_index.xml(依您的設定),點擊「提交」。 - 確認狀態 提交後從幾分鐘到幾天內,狀態會顯示「成功」並列出已發現的網址數量,可定期回來查看是否有錯誤訊息。
方式二:在 robots.txt 中宣告
在網站根目錄的 robots.txt 檔案中加上一行,所有搜尋引擎與 AI 爬蟲(包含 GPTBot、PerplexityBot、ClaudeBot)都能自動發現:
User-agent: * Allow: / Sitemap: https://www.example.com/sitemap.xml
方式三:Bing 與 IndexNow(加速收錄)
除了 Google,建議同步到 Bing Webmaster Tools 提交一次。Bing 不只是傳統搜尋引擎,更是 ChatGPT、Microsoft Copilot 的搜尋資料來源,做了等於同時加強傳統搜尋與 AI 搜尋的曝光。
若想要新頁面被即時通知,可額外使用 IndexNow 協定。IndexNow 是 Microsoft 主導的即時推播協定,網頁一更新就主動通知搜尋引擎,通常幾分鐘內就會被抓取。支援 IndexNow 的搜尋引擎:Bing、Yandex、Naver、Seznam、Yep。Google 不支援 IndexNow,Google 仍須透過 Search Console 與 Sitemap 收錄。
Sitemap 常見錯誤與排除
即使做了 Sitemap,如果格式錯誤或內容不一致,反而會讓搜尋引擎困惑,甚至降低信任。以下是六個最常見的 Sitemap 錯誤:
- 包含已刪除或 404 的頁面 Sitemap 中列出實際上已經不存在的網址,爬蟲跑過去發現是 404,會降低對網站的信任。改善方式:定期(每月一次)用 Screaming Frog 等工具掃描 Sitemap,移除無效網址。
- lastmod 從未更新或日期錯誤 所有頁面的 lastmod 都是建站當天,或設為未來日期,Google 會判定資料不可信而忽略。改善方式:確保 lastmod 反映真實的最後編輯時間,自動化生成最理想。
- 包含被 noindex 或 robots.txt 封鎖的頁面 Sitemap 說「請收錄」,但頁面卻有 noindex 或被 robots.txt 禁止,訊號矛盾會被 Google 標記為錯誤。改善方式:只把希望被收錄的頁面放進 Sitemap,排除登入後台、感謝頁、購物車等。
-
使用相對網址而非絕對網址
<loc>/about</loc>是錯誤格式,必須寫完整的https://www.example.com/about。改善方式:所有 URL 都用絕對路徑,並注意 HTTPS 與 www 是否一致。 - 超過 50,000 URL 或 50MB 限制 單一 Sitemap 太大時,Google 會直接拒絕讀取。改善方式:拆成多個分類 Sitemap(例如文章、產品、分類頁分開),用 sitemap index 串接。
- 忘記在 Search Console 提交 Sitemap 放在伺服器,但從未提交,Google 可能需要更久才會發現。改善方式:新網站上線、改版後、Sitemap 路徑變更時,都要主動在 Search Console 重新提交。
結論:做好 Sitemap,讓網站被人與 AI 都看見
Sitemap 雖然只是一個小檔案,卻是網站結構、SEO 與 AI 搜尋的基礎建設。HTML 網頁地圖讓人類能快速瀏覽,XML Sitemap 讓搜尋引擎與 AI 爬蟲能正確檢索。兩者各有功能,缺一不可。
無論您是剛建立網站,還是準備改版,可以用以下五個問題自我檢查:
- 網站是否同時有HTML 網頁地圖與XML Sitemap?
- XML Sitemap 是否包含網站所有重要頁面,且lastmod 正確反映更新時間?
- Sitemap 是否已透過 Google Search Console 與 robots.txt 正式宣告?
- Sitemap 中是否沒有 404 頁面、沒有 noindex 頁面、沒有重複內容?
- 新增或修改頁面後,Sitemap 是否能自動同步更新?
常見問答 FAQ
Sitemap 是什麼?為什麼網站要做 Sitemap?
HTML 網頁地圖和 XML Sitemap 有什麼差別?
/sitemap.html。XML Sitemap是一份 .xml 檔案,內容是結構化資料,給搜尋引擎與 AI 爬蟲讀取,通常放在網站根目錄 /sitemap.xml。理想做法是兩種都建立,各司其職:HTML 網頁地圖提升使用者體驗,XML Sitemap 提升 SEO 與 AI 收錄。如果只能選一種,優先做 XML Sitemap,因為它對 SEO 影響更直接。提醒:有些教學會用「小寫 sitemap / 大寫 Sitemap」來區分,但這只是英文書寫習慣差異,業界主流是直接用「HTML sitemap」與「XML sitemap」來區分,並無大小寫的功能慣例。
沒有做 Sitemap,網站還會被 Google 收錄嗎?
XML Sitemap 要多久更新一次?
lastmod 欄位要反映真實的更新時間,不要造假——Google 會交叉比對頁面實際內容,若 lastmod 經常造假,Google 會降低對 Sitemap 的信任,反而拖累 SEO。自動化是最理想的做法。
如何把 Sitemap 提交給 Google?
sitemap.xml 或 sitemap_index.xml → 點擊「提交」。幾分鐘到幾天後狀態會顯示「成功」並列出已發現的網址數。方式二:在 robots.txt 宣告——在網站根目錄的 robots.txt 加上一行 Sitemap: https://www.example.com/sitemap.xml,所有搜尋引擎(包含 Bing、Yandex)與 AI 爬蟲(GPTBot、PerplexityBot、ClaudeBot)都會自動發現。額外建議:到 Bing Webmaster Tools 也提交一次,Bing 同時是 ChatGPT、Microsoft Copilot 的搜尋資料來源。若想要新頁面立即被 Bing/Yandex 抓取,可額外使用 IndexNow 協定(但Google 不支援 IndexNow,僅限 Bing、Yandex、Naver 等)。
Sitemap 對 AI 搜尋(ChatGPT、Perplexity)有影響嗎?
robots.txt 中宣告的 Sitemap 路徑,並依此理解網站結構。具體影響有三個層面:1. 提升被 AI 引用的機會——AI 模型回答問題時,優先參考結構清楚、有完整 Sitemap 的網站;沒有 Sitemap 的網站,深層文章可能完全不被 AI 看見。2. 確保新內容快速進入 AI 知識——GPTBot、PerplexityBot、ClaudeBot 會定期重訪 Sitemap,lastmod 越精準,新內容越快被納入 AI 回答資料源。3. 降低被引用過時資訊的風險——Sitemap 是控制 AI 看見哪個版本的有效工具,舊版本沒被排除、新版本沒被優先提交時,AI 可能引用錯誤資訊。AI 搜尋時代的網站經營者,Sitemap 已經不只是「SEO 工具」,更是「AEO(Answer Engine Optimization)」的基礎建設。
Sitemap 可以提高網站排名嗎?
Sitemap 之外,網站還需要做 llms.txt 嗎?
/llms.txt),用 Markdown 格式列出網站最重要的內容,讓大型語言模型(ChatGPT、Claude、Perplexity、Gemini)能快速理解網站結構。與 Sitemap 的關係是「互補,不是替代」:sitemap.xml 列出所有 URL 給搜尋引擎與 AI 爬蟲;llms.txt 則用精選方式告訴 AI「網站重點在哪」。採用狀況:Perplexity、部分學術爬蟲已採用;OpenAI 與 Anthropic 表示會逐步納入;Google 明確表示不會讀取 llms.txt,Sitemap.xml 仍是 Google 唯一認可的格式。實務建議:中小企業官網不一定要做(優先做好 sitemap.xml 與 robots.txt 即可);內容豐富的網站(文件、知識庫、教學部落格、產品說明)則建議補做 llms.txt,有助於提升 AI 引用機會。WordPress 已有現成外掛(如 LLMs.txt Sitemap Manager)可自動產生。