筛选页 SEO 怎么做:参数、索引与抓取治理(2026)
Faceted navigation 做不好,很容易把筛选系统做成抓取黑洞。关键不是把所有组合都放开,而是先分清哪些筛选页值得索引,哪些只该服务站内浏览。
Faceted navigation 做不好,很容易把筛选系统做成抓取黑洞。关键不是把所有组合都放开,而是先分清哪些筛选页值得索引,哪些只该服务站内浏览。
很多站点的流量问题,不是出在内容太少,也不是出在关键词没做,而是出在“页面太多”。分类页一层,品牌一层,价格一层,颜色一层,库存状态再来一层,最后一个产品列表能长出几十万种 URL 组合。站长自己看着都头大,更别说 Googlebot。
这类问题,往往都和 faceted navigation 有关。中文里常叫筛选导航、分面导航、筛选页系统。电商站最常见。产品目录站、招聘站、房产站、旅游站、B2B 型号库,也一样会碰到。它本来是个用户体验设计。用得好,找东西更快。用不好,抓取预算被吃空,重复页暴涨,真正重要的分类页和产品页反而更慢被发现。
Google 这两年把这件事讲得更直白了。官方先有 Managing crawling of faceted navigation URLs,后又在 2024 年底专门写了 Crawling December: Faceted navigation。核心意思很简单:筛选页不是不能做,而是你得先想清楚,到底哪些筛选结果值得被抓、被收、被排;剩下那些没有搜索价值的组合,不要让它们无限长出来。
这篇文章不讲虚的。只讲企业站和独立站真会遇到的事:什么样的筛选页值得索引,什么样的不值得;参数 URL、静态路径、canonical、robots.txt、noindex 分别用在什么地方;分页、排序、load more、infinite scroll 怎么不把站点带进抓取黑洞;以及上线前后到底该怎么排查。
先别急着谈技术。先把概念钉住。分类页是“男鞋”“工业泵”“不锈钢法兰”这种主集合。faceted navigation 是在这个集合里继续筛,比如品牌、材质、尺寸、价格区间、库存状态、地区、功率、接口类型。
这点很关键。因为很多站把 faceted navigation 和普通分类目录混在一起谈,最后策略就乱了。分类页通常更容易有明确搜索需求,也更值得长期建设。筛选页则不一样。它的价值差异极大。有些筛选组合是用户真实会搜的词。有些只是站内浏览动作,并不适合让搜索引擎长期抓取。
| 页面类型 | 用户作用 | SEO 常见价值 |
|---|---|---|
| 分类页 | 进入一个核心主题集合 | 通常较高,适合重点优化 |
| 筛选页 | 在集合内进一步缩小范围 | 差异很大,需逐类判断 |
| 搜索结果页 | 基于用户临时输入返回结果 | 多数情况下不建议索引 |
因为它天然会制造组合爆炸。一个分类页上,如果有颜色 10 个、品牌 8 个、价格段 6 个、尺寸 12 个、排序 5 个,理论上组合就已经很多了。如果再允许参数重复、顺序变化、空结果页、分页叠加,URL 数量会更夸张。
Google 在官方文档里提醒得很直接:这种实现会带来 overcrawling,也就是大量抓取“并不值得抓”的新 URL;然后是 slower discovery,也就是真正重要的新页面发现更慢。这个逻辑和我们之前做过的 抓取预算排查文章 是一条线。抓取资源不是无限的。你让爬虫在低价值筛选组合里来回绕,它就没那么多精力去看你真正想推的页。
问题还不只是抓取。很多筛选页看上去“内容不同了一点”,但页面主干、文案、模块、标题结构几乎一样。这样的页一多,重复内容、信号稀释、内链分流、索引膨胀就都会跟着来。
这一步最容易做错。很多团队一听 faceted navigation 危险,就一刀切,全挡。结果把本来应该吃流量的组合也一起挡掉了。另一些团队则反过来,什么组合都放开抓。结果是页面池膨胀,真正该排的页排不上去。
更现实的做法是:先分层。筛选页里只有一小部分,值得作为独立 SEO 页面长期建设。判断标准通常不是“这个页能不能打开”,而是“这个组合是否对应稳定、明确、可复用的搜索需求”。
比如 “black safety shoes”“stainless steel ball valve”“1200w servo motor” 这类词,本身就可能对应品牌、材质、功率、用途一类的长期搜索需求。如果筛选结果页能稳定对应这个意图,并且页面内容、产品集合、标题与文案都能做得清楚,它就可能值得索引。反过来,像“价格从 301 到 327 元”“只看周三前发货”“蓝色+M 码+促销中+评分 4 星以上+第 7 页”这类组合,大多不值得成为搜索页资产。
| 筛选类型 | 是否更可能值得索引 | 原因 |
|---|---|---|
| 品牌 / 品类 / 材质 / 规格 | 较可能 | 常对应稳定搜索词 |
| 价格区间 / 排序 / 页码 | 通常不建议 | 搜索需求弱,组合太多 |
| 库存 / 促销 / 临时活动 | 谨慎 | 生命周期短,内容波动大 |
一个筛选页就算有搜索量,也不一定适合做索引页。还要看三件事。
Google 在 ecommerce URL structure 文档 里提到,没什么内容的页不值得索引,必要时空集合可以直接用 `404`,或者至少 `noindex`。这点非常重要。因为很多筛选页的问题,不是“理论上有价值”,而是它现实里长期只剩 1 个产品,甚至 0 个结果。这样的页就算放出来,也很难成为强页面。
对 B2B 独立站来说,这种判断更要克制。很多企业站产品库本身没有几千个 SKU,却套了商城式筛选系统。结果看上去很像大站,实际却把本就不多的权重分到了大量组合页上。这样的站,比起追求更多筛选 URL,通常更该先把核心分类页、产品页和服务页做扎实。你可以顺着看我们站里的 技术 SEO 指南 和 SEO 审计清单,先把页面分层做清楚。
Google 新文档虽然写了不少细节,但核心路径其实就两个:
注意,Google 的重点不是“你用了什么框架”,而是“你到底是想挡,还是想留”。怕就怕第三种状态:一边不想让它们被索引,一边又到处给它们可抓取链接、参数 URL、站内入口、站点地图。这种摇摆状态,通常最耗站点资源。
| 策略 | 适用场景 | 核心动作 |
|---|---|---|
| 阻止抓取 | 大多数低价值筛选组合 | robots.txt、片段 URL、减少链接暴露 |
| 保留并优化 | 少数有搜索价值的筛选页 | 规范 URL、独立标题、自引用 canonical、稳定内链 |
Google 在 faceted navigation 文档里给出的第一条直接建议,就是如果你根本不需要这些筛选页出现在搜索里,可以用 `robots.txt` 阻止抓取。这个动作对“抓取浪费”特别有效,因为它直接减少了 Googlebot 继续往下跑的空间。
但这里要分清楚:`robots.txt` 阻止的是抓取,不是索引控制的万能开关。一个 URL 就算被 robots 挡住,也不代表它绝对不会以其他信号形式出现在索引系统里。尤其当外部或内部很多地方都在指向它时,更容易让诊断变复杂。
所以 `robots.txt` 更适合用在你非常明确不想让 Google 反复抓的一类参数组合上。比如排序、临时筛选、价格段、会无限衍生的过滤参数。它不太适合拿来粗暴地一刀切掉所有参数 URL,而不管里面有没有少数真的值得保留的组合页。
很多站遇到筛选页问题,第一反应就是上 canonical。这个方向没错,但常常被高估。Google 在 faceted navigation 文档里也说得很保守:`rel=”canonical”` 可能会随着时间降低非规范版本的抓取量,但它并不是最强、最直接的长期抓取控制方法。
原因很简单。只要你还在大量暴露这些可抓取 URL,Google 还是得先看到它们,理解它们,再慢慢决定怎么处理。也就是说,canonical 更像信号归并,不是源头减量。
所以 canonical 更适合这些情况:
如果你站里几十万条排序页、价格页、空结果页都在靠 canonical “兜底”,那多半不是 canonical 不够努力,而是策略本身就太晚了。相关的归并逻辑,建议结合 Google 的 canonical 文档 一起看。
`noindex` 的位置也常被误用。它适合那些你希望用户还能访问、页面还能打开,但不希望它进搜索结果的页。比如某些临时筛选、空库存集合、短期活动过滤页。
但要注意一个老问题:如果你一边用 `robots.txt` 把 URL 挡死,一边又希望 Google 读取页内的 `noindex`,这两边会互相卡住。因为 Google 连页都抓不到,自然也看不到 meta robots。
所以实际选择时,通常得先定优先级。是“先减少抓取”,还是“先确保可读取 noindex 信号”。不要把所有控制方式叠一起,最后自己都说不清哪条在起作用。
Google 在 faceted navigation 新文档和 URL structure best practices 里都强调了,参数最好用行业通用写法,也就是 `?key=value&key2=value2`。别搞稀奇古怪的分隔符,也别让同一参数重复出现,更别让参数顺序随机变化。
很多站的 faceted navigation 问题,不是因为用了参数,而是因为参数毫无纪律。今天是 `?color=blue&size=m`,明天又冒出 `?size=m&color=blue`;一会儿 `?brand=nike&brand=adidas`,一会儿又是 `?brand=adidas,nike`;再叠上 `utm`、session、排序、库存、分页,Googlebot 看到的是一个不断分裂的 URL 池。
参数 URL 要是管理得好,未必比静态伪静态路径差。管理得差,再好看的目录路径也会出事。
| URL 处理方式 | 优点 | 风险 |
|---|---|---|
| 规范参数 URL | 实现清晰,易识别组合关系 | 若无控制,容易组合爆炸 |
| 静态目录路径 | 更易做少量重点组合页 | 顺序不稳时同样会重复 |
| 哈希片段 | 可弱化抓取影响 | 不适合拿来承载需要索引的内容 |
Google 在 faceted navigation 文档里专门提醒了一点:如果你不是用参数,而是用路径表达筛选,比如 `/shoes/black/leather/`,那么逻辑顺序必须始终一致。别今天是颜色在前,明天是材质在前。否则同一个集合会变成多个 URL。
这对很多定制商城和独立站系统很关键。因为开发为了“URL 更漂亮”,会把筛选做进目录里。形式上看着整洁,实际上如果没有严格约束,重复问题一点不比参数少。甚至更难一眼看出来。
Google 在 faceted navigation 文档中讲得很明确:如果一个筛选组合没有结果,应该返回 `404`。包括不存在的组合、重复筛选、无意义筛选、越界分页。这一点很多站做得很差。
最常见的错误是页面明明没有商品,只剩一行“没有找到结果”,但状态码仍然是 `200`。这就很容易变成 soft 404。对搜索引擎来说,这不是一个有价值的正常列表页,却又被当成了正常页面。时间一长,索引信号和抓取信号都会被污染。
如果你的网站还是 SPA 或 JS 渲染型筛选系统,这个问题更要小心。因为前端界面看起来“处理得很体面”,底层 HTTP 状态却根本没变。类似的渲染诊断方法,可以参考我们刚排进去的 `JavaScript SEO` 这条线,核心逻辑是一致的:别只看页面有没有显示,得看搜索系统最终拿到了什么。
这几类筛选,是 faceted navigation 里最容易制造垃圾 URL 的来源。
它们有一个共同点:大多数时候只是站内浏览辅助,不是稳定的搜索需求。而且这些值经常变化,生命周期短,结果集合波动大。就算短时间能有流量,也很难成为长期资产页。
所以对这类筛选,常见更合理的做法是:
真正值得做成搜索资产的筛选页,通常具备几个特点:词本身有人搜;集合结果比较稳定;页面可以扩充清楚的标题、文案、FAQ、面包屑和产品集合;和业务成交路径也接得上。
比如 B2B 站里,“316 不锈钢阀门”“防爆电机”“食品级软管”这类组合就比“价格从 300 到 500”“库存大于 10”更值得做。前者是需求词。后者更像临时筛选状态。
这也是 Ahrefs 在 Faceted Navigation: Definition, Examples & SEO Best Practices 里反复强调的点:faceted navigation 不只是风险源,也可能成为长尾流量入口,但前提是你挑得准,不是把所有组合全放开。
Google 在 Pagination best practices 文档里说得很直白:Google 一般是通过 `` 里的链接发现分页页,不会替你点按钮,也不会像真实用户一样不断触发“加载更多”。
这条规则一旦和 faceted navigation 叠在一起,问题就很多了。因为不少站的筛选结果页第一页有产品,后面的列表全靠按钮加载。用户没问题。Google 只看到第一页。或者它能看到第一页和少量链接,但很难稳定发现更深层产品。这样一来,你的筛选集合页看似很丰富,实际爬虫看到的路径非常浅。
更稳的做法通常是:
很多现代站喜欢 infinite scroll。体验上顺。尤其在移动端,滑起来省事。但对 SEO 来说,单纯无限滚动不是问题,只有滚动、没有可抓取分页才是问题。
Google 在分页文档里讲得不复杂:用户端可以继续用渐进加载,但底层最好仍能访问到每一页。也就是 `/category?page=2`、`/category?page=3` 这类路径要真实存在,而且能通过 `` 被发现。否则筛选系统里越往后的产品,越可能长期处在“用户能刷到,Google 不一定稳稳刷到”的状态。
这对 SKU 很多的站尤其重要。因为 faceted navigation 本身就在制造组合页,如果每个组合里后半段产品又依赖前端滚动才会出现,那实际可发现深度会更浅。最后的结果很常见:第一页抓得勤,后面的页抓得少;头部产品总被看见,长尾产品更难获得发现机会。
Google 在分页文档里强调了 incremental page loading 的处理思路。简单说,就是你可以给用户保留“加载更多”或无限滚动,但底层仍然要有可访问、可链接、可抓取的分页 URL。否则搜索引擎只能看到第一段,后面的商品或内容可能长期发现不全。
这点和我们做 页面速度优化 时一个原则很像:交互层可以现代,底层路径得稳。别为了界面顺滑,把发现路径做没了。
很多筛选系统现在都靠 JavaScript 驱动。这本身不是原罪。真正的风险在于:你是不是还给了 Google 一个能解析的 URL 入口。
Google 的 Link best practices 讲得很清楚,最稳的可抓取链接,仍然是带 `href` 的 `` 元素。不是 `span`,不是纯 `onclick`,不是只靠前端事件切状态。筛选项如果只是点一下改了页面内容,但没有明确链接路径,那么搜索引擎很难稳定理解这些组合页。
所以你要先想清楚:
还有一个常见混乱点,是把产品变体和 faceted navigation 放一起处理。比如颜色、尺寸、包装数,既可能出现在列表筛选里,也可能是单个产品的变体维度。Google 在 ecommerce URL structure 文档 里单独讲了 variant URL 的处理,和筛选页不是一回事。
产品变体更关心的是单品关系、canonical、变体 URL 是否独立、结构化数据和 Merchant Center 的一致性。筛选页关心的是列表集合是否值得独立抓取。两者混在一起,最容易导致 canonical 乱指、标题乱套、面包屑乱跳。
很多团队卡在 faceted navigation 上,不是不会写 robots,也不是不会加 canonical,而是从没先做过白名单。白名单的意思不是“我们想保留哪些 URL”,而是“哪些筛选维度和哪些组合,值得被当成搜索资产页来管理”。
这份白名单通常至少要回答四个问题:
比如一个工业品站,可能只允许“产品大类 + 材质”“产品大类 + 适用行业”“产品大类 + 功率区间”这三类重点组合进入搜索系统;而价格、排序、库存、促销一律不进。这样的规则一旦写出来,后面 robots、noindex、canonical、路径生成、模板输出都好落地。最怕的是没有白名单,所有控制动作都在 URL 已经爆出来后才补。
| 维度 | 是否允许索引 | 组合限制 | 额外条件 |
|---|---|---|---|
| 品牌 | 可 | 可与主分类组合 | 至少 5 个有效结果 |
| 材质 / 规格 | 可 | 不超过 2 维组合 | 需有稳定需求词 |
| 价格 / 排序 | 不可 | 不进入抓取体系 | 仅站内浏览使用 |
| 库存 / 促销 | 通常不可 | 不与其他筛选叠加索引 | 生命周期短 |
很多文章会把 robots、canonical、noindex、404、哈希片段列一遍,但不告诉你什么时候该选哪个。实际判断时,先问自己:你是想减少抓取,还是想减少索引,还是想归并信号,还是想直接告诉搜索引擎“这个页根本不成立”。这四种目标不同,动作就不同。
如果是会无限制造低价值 URL 的参数,优先考虑减少抓取;如果是能访问但不值得展示在搜索里的结果页,更像 noindex 的场景;如果只是近似版本之间要归并主页,那 canonical 更合适;如果这个组合本身就无效、无结果、越界,那直接 404 更干脆。
把这些目标混着做,就容易出现一类常见事故:本来只是想挡掉一批排序页,最后却连少数有价值的筛选组合也被一起挡了;或者本来应该 404 的无效页,被拿 canonical 轻轻一贴,结果问题并没有真正消失。
电商站 SKU 多,筛选系统有时确实是核心结构。B2B 目录站则不一样。很多外贸站、工业站、设备站,真实产品数量没有多到必须靠海量筛选组合来承接搜索。它们更需要的是清晰的产品大类、应用场景页、型号页、解决方案页和服务页。
这类站如果照搬电商平台式筛选,最容易出现两个问题。一个是筛选组合页太多,另一个是每个组合页的结果太薄。比如一个阀门站,总共就几十个产品,却放出材质、口径、驱动方式、压力等级、连接方式、介质、品牌、库存、价格等一堆筛选。用户看起来很专业,SEO 上却像把有限资源切得过碎。
所以对 B2B 站来说,更稳的思路往往是:
这样更符合 B2B 询盘站的真实目标。你要的是让买家尽快找到对应解决方案,不是把每一个筛选状态都送去争排名。
Search Console 不会直接告诉你“你的网站 faceted navigation 做坏了”。但它会留下很多痕迹。常见信号包括:
看到这些模式时,不要急着挨个请求编入索引。那只是表面动作。更有效的是先把异常 URL 提取出来,看它们有没有统一参数、统一目录、统一模板,再反推是哪类筛选策略出了问题。Google 的 debugging traffic drops 和 URL Inspection Tool 文档,也都更强调模式判断,而不是逐页碰运气。
很多站会说“我们 sitemap 已经很干净了”。这不代表 Google 就只会抓 sitemap 里的 URL。真正更诚实的,是日志。日志会告诉你 Googlebot 这段时间到底在请求什么路径,哪些参数页被反复抓,哪些分页页被来回探,哪些无效组合还在被碰。
如果你在日志里看到大量请求集中在 `?sort=`、`?price=`、`?instock=`、`?page=` 这类模式上,而核心分类页和产品详情页抓取得并不积极,那就说明 faceted navigation 的漏口还在。你可以改 sitemap,但如果站内模板、筛选控件和历史链接还在持续暴露这些 URL,Google 还是会继续来。
所以日志的意义不是“证明我们被抓了”,而是“证明 Google 把时间花在哪了”。这点对 faceted navigation 诊断尤其关键。
这件事最好别等上线后再补。上线前最少做四件事。
如果是改版项目,这一步更要跟网站迁移检查一起做。因为很多站不是“新做了筛选系统”,而是“改版时把旧规则打散了”。一旦参数规则、canonical 和分页逻辑一起变,问题会成片冒出来。虽然站里已经有一篇 网站迁移 SEO 指南,但 faceted navigation 这一块,最好单独列出核查项。
治理 faceted navigation 后,很多人会急着问:“为什么流量还没涨?”这个问题太早了。更先该看的,是低价值参数 URL 的抓取和暴露有没有下降,重复页和无结果页的出现频率有没有降下来,核心分类和产品页的抓取占比有没有变高。
如果这些底层迹象在变好,通常说明方向是对的。流量和索引的变化,往往要在后面才慢慢体现出来。反过来,如果参数页还在被疯狂抓,或者日志里只是换了一种新参数形式继续爆,那说明策略没有真的收口。
很多团队资源有限,不可能一次把 faceted navigation 全改完。那就先抓收益最大的几件事:
这个顺序的逻辑是先止损,再提效。因为 faceted navigation 出问题时,最常见的不是“好页不够好”,而是“坏页太多”。先把坏页的入口关小,搜索系统才有空间重新看见你的核心页。
这条看似简单,实际很多站没做到。sitemap 的作用,本来就是告诉搜索引擎哪些 URL 值得注意。如果你一边说“这些筛选页不重要”,一边又把它们批量塞进 sitemap,那等于自己给自己拆台。
更合理的做法是:
Google 在 build sitemap 文档 里没有让你把所有能打开的页都塞进去。sitemap 是清单,不是垃圾桶。
筛选页问题还有一个常被低估的副作用:内链分流。一个列表页如果在左侧筛选栏、顶部排序、底部推荐里一下放出几百个可抓取链接,内部 PageRank 就会被摊薄。真正该吃链接的主分类、子分类、核心产品,反而没得到足够强调。
Google 在 ecommerce site structure 文档里提到,Google 更看重站内链接关系来理解页面重要性。对这类站点来说,分类树、子分类、产品页的层级,比一长串筛选组合更重要。
所以结构上最好保持一个原则:主导航和分类体系服务“主题层级”,筛选系统服务“浏览缩小”。别让后者反客为主。
| 内链位置 | 更建议的作用 | 常见错误 |
|---|---|---|
| 主导航 | 核心分类与服务入口 | 塞满低价值筛选链接 |
| 分类页主体 | 子类、产品、重点专题 | 只剩筛选控件,没有有效文本链接 |
| 筛选栏 | 辅助用户浏览 | 把所有组合都暴露为可抓取链接 |
很多团队喜欢问:“筛选页需要写 SEO 文案吗?”答案不是永远需要,也不是永远不需要。关键看你是不是把这个页当成真正想排名的页。
如果只是用户站内临时筛选状态,那一般没必要单独写。可如果这个筛选组合本身就是目标词,比如“食品级硅胶软管”“四氟密封球阀”,那你就不能只给一个空列表和几个产品卡片。标题、H1、导语、FAQ、面包屑、内链、筛选说明,都要跟上。否则它和随机组合页的差别太小,很难成为强着陆页。
这一步和我们做 站内 SEO 的原则一致:真正想排名的页,不能只有 URL 不同,内容信号也得跟上。
这不是拍脑袋判断。至少看三处。
如果你看到 Googlebot 很勤快,但真正新产品、新分类却收得慢,往往就要怀疑 faceted navigation 在吃资源。日志层面的验证方法,可以接着看我们站里的 服务器日志分析指南。日志最能看清 Google 到底在抓什么,不是你以为它在抓什么。
很多人打开 Search Console,只看“已收录多少”。这对 faceted navigation 诊断不够。更该看的,是异常 URL 有没有共同模式。是不是都带某个筛选参数?是不是都属于某个目录?是不是越界分页和空结果页?
如果无效页、重复页、被 Google 选作其他规范页的 URL,大量集中在某类筛选模式上,那基本就不是单页问题,而是系统问题。这个时候去一页一页提交索引,没有什么意义。你该回去改的是规则。
平台不同,坑长得不一样。Shopify 常见问题是集合页、标签页、排序参数和过滤组合并存。WooCommerce 常见问题是属性筛选、分页、排序、产品变体关系混杂。自研站最常见的则是“功能很自由,规则却没写死”,结果 URL 顺序、空结果页、无效组合都没人兜底。
但别被平台细节带跑。判断逻辑始终是这几条:
如果这几条答不清楚,换什么平台都一样会出问题。相关平台型站点,可以顺手看我们之前写过的 Shopify SEO 指南 和 WooCommerce SEO 指南,但 faceted navigation 这条规则并不会因为平台不同而失效。
这其实是很多站最稳的做法。不是放任系统自动生成所有筛选页,而是从真实搜索需求里挑出少量值得做的组合,再把它们升级成人工策划页。这样做有几个好处:
比如你可以保留用户站内随便筛选,但真正面向搜索的,只挑“按品牌”“按材质”“按应用场景”这类组合,做成少量静态或半静态集合页。这样既保留 UX,也更容易把 SEO 信号收束在少数值得做的页上。
这类问题往往跨团队。SEO 说抓取浪费。前端说筛选功能必须这么做。后端说参数逻辑是产品需求。运维说服务器也没挂。最后谁都没错,问题也没人真的处理。
更高效的做法是把规则落成表。把哪些参数可抓、哪些不可抓、哪些需要 canonical、哪些需要 `404`、哪些要进 sitemap、哪些不能出现在主导航里,都提前定下来。这样上线时就不是边跑边猜。
| 问题 | 应该谁先确认 | 确认内容 |
|---|---|---|
| 筛选 URL 是否可抓 | SEO + 开发 | 按参数类型建立白名单和黑名单 |
| 空结果页状态码 | 后端 / 网关 | 无结果时返回 404 或明确 noindex |
| 链接是否可解析 | 前端 | 使用 ``,不是纯脚本事件 |
| sitemap 是否干净 | SEO | 只保留核心分类、产品和重点集合页 |
这些误区里,前四个最常见,也最伤站点。特别是第二条。很多人把 faceted navigation 当成长尾词工厂,结果做出来的是低质量 URL 工厂。两者不是一回事。
这个顺序的好处在于,它先解决“留哪些”,再解决“怎么留”。很多团队失败,是一上来就讨论技术实现,却从没先判断哪些筛选页值得存在于搜索里。
如果你已经出现这些信号,就别再犹豫了:
这时候继续细抠单页标题、单页描述,多半都不是重点。重点是把系统规模收回来。因为你现在的问题不是“某些筛选页不够好”,而是“筛选页这台机器产出了太多不该产出的页”。
很多系统会自动把筛选值拼进标题里,比如“黑色 真皮 男鞋 价格从低到高 第 3 页”。这种标题对站内浏览无所谓,但对 SEO 来说往往又长又乱,还会把排序、分页、临时状态这些低价值词一起带进去。
如果某类筛选页真的要拿来承接搜索,就别完全放任系统自动拼。至少要确认三件事:标题是否对应真实搜索表达,H1 和 title 是否一致,分页和排序是否没有被错误写进核心标题。真正值得保留的筛选页,最好还是有人审一遍标题模板,而不是让系统把所有筛选状态都原样输出到 head 里。
这听起来像开发细节,但其实很影响 SEO。只要同一集合可以被多种参数顺序表达,重复 URL 就会自然长出来。最典型的就是 `?brand=a&color=black` 和 `?color=black&brand=a` 同时存在;更麻烦的是用户还能重复点同一个筛选,生成 `?brand=a&brand=a` 这类本来就不该成立的路径。
Google 在 faceted navigation 文档里对这类问题的态度很明确:无效、重复、无结果、越界的组合,不要当正常页对待。要么做规范化合并,要么直接失效。别让这些路径长期存活,更别让它们还能被站内反复链接出来。
最后再把边界说重一点。凡是这几类页,通常从策略起点上就不该进搜索系统:
把这些页留在站内给用户用,没有问题;把它们推去和分类页、专题页、产品页争抓取和索引,就不值当了。faceted navigation 做到最后,其实拼的不是技术多复杂,而是边界够不够清楚。
这类错误很常见。一个企业站本来只有几十到几百个产品,理论上完全可以靠清晰分类、产品详情、应用场景页和少量专题页把结构搭稳。但改版时一上商城模板,就把颜色、规格、品牌、价格、标签、排序、库存、地区、活动等筛选一口气全开了。看起来功能很全,实际上是在给一个不大的站点制造过多 URL 分叉。
这种站的共同问题是:核心分类页并没有很强,产品页内容也未必足够深,却先拥有了一套会不断长出低价值组合页的筛选系统。结果不是“覆盖更广”,而是“信号更散”。Googlebot 爬得很勤,真正值得看的页却不一定被重点看见。
所以如果你的网站规模本来就不大,先别急着追求 faceted navigation 的复杂度。更实在的顺序往往是:先把分类层级做清楚,把产品详情做完整,把站内链接做顺,把少量真的值得排名的集合页策划出来。等这些基础都稳了,再决定哪些筛选维度要不要开放给搜索系统。对多数企业站来说,简单、稳定、可控,通常比“功能很多”更值钱。
很多站一开始都以为自己缺的是“更多入口”。可真正把日志、收录、模板和参数规则一起看完后,常发现缺的不是入口,而是边界。哪些入口该保留,哪些入口只是看起来热闹,实际上在分散抓取和索引资源。对 faceted navigation 来说,能把不该存在的组合收掉,本身就是优化,而且往往是最有效的优化。
如果你现在还拿不准,就先记住一个很朴素的判断:这个筛选页离真实搜索需求越近,越值得被认真建设;离站内临时浏览状态越近,越应该留在站内,不要急着送去搜索系统。很多站一旦把这条线划清,后面的技术动作反而会简单很多。
反过来讲,如果一个筛选页脱离筛选控件本身就说不清自己存在的意义,没有独立标题、没有稳定集合、没有长期需求、也没有清楚内链位置,那它大概率就不该背负 SEO 任务。把这类页从搜索策略里拿出去,往往不是损失,而是在给真正重要的页腾地方。
这也是为什么 faceted navigation 最后拼的不是“能生成多少页”,而是“能不能把少数有价值的页留下来,把大多数没价值的页管住”。这件事做清楚了,站点结构会轻很多,后面的抓取、收录和维护成本也会低很多。
对很多站来说,这一步一旦做对,后续 SEO 工作会简单不少,因为团队终于知道哪些页值得继续投资源,哪些页只需要安静地服务用户浏览。
筛选导航本来是为了让用户更快找到东西。这件事没错。错的是把用户体验和搜索可见性混成一件事,以为用户能点,搜索引擎就该全抓;以为组合越多,流量就越多。事实通常相反。组合太多,真正有价值的页反而更难被看见。
所以 faceted navigation SEO 的核心,不是把所有筛选都优化一下,而是先做取舍。哪些留下,哪些挡掉;哪些做成真正的落地页,哪些只做站内浏览功能。这个取舍做对了,筛选系统才是帮手。做不对,它就是站点里最会吃资源的一块。
如果你们站的筛选系统已经和分页、抓取预算、模板渲染纠缠在一起,最好顺着再看 抓取预算、SEO 审计、技术 SEO 和 Shopify SEO。筛选页治理真正难的地方,不在某一条参数规则,而在整站结构要不要继续让低价值组合无限长出来。