大家都知道我喜欢打比方,今天继续聊 Technical SEO 的本质。
一句话说清它要解决什么:让网站先具备被 Google 抓取、理解、收录和正常访问的基础能力。
Google 本质上就是一只爬虫加一套页面理解系统。它先派爬虫上门翻你的网站,再尝试读懂每一页讲了什么,最后决定要不要收录、给什么排名。所以如果你的网页打不开、加载慢、结构混乱、移动端体验差、服务还不稳定,就像一本书破到翻不开,连摆上书架都难,更别提被人翻到。
也正因为这样,Technical SEO 的重点不是直接冲排名,而是先把这些地基问题解决掉:
页面性能、前后端加载、CDN、稳定性、URL 结构、目录层级、内链、多语言、响应式、lang / hreflang、结构化数据、robots.txt、sitemap、404 和重定向。
我们的目标只有一个:让网站基建达到 SEO Friendly。
下面是我认为最值得拎出来讲的 10 个 Technical SEO 错误案例,以及对应的解决思路 ~
1、test.xx.ai 测试子域名,跟 www 一模一样
很多团队为了测试方便,会照着 www 搭一套一模一样的环境,部署在一个测试子域名上。最神奇的是,用 site: test.xx.ai 一搜,发现谷歌居然把它也收录了,而且内容跟正式官网几乎没区别。
问题就出在这里。对 Google 来说,test.xx.ai 和 www.xx.ai 是两个长得完全相同的页面,它分不清谁是正主,于是判定为「重复页面」,权重被两边分摊,正式官网的排名反而被自己的测试环境拖累。
怎么处理:
给 test.xx.ai 加访问密码,让爬虫根本进不去;
在 test.xx.ai 的 robots.txt 里明确禁止所有搜索引擎爬虫抓取和收录。

两本一模一样的破书都摆不上架,Google 干脆判成重复页面,权重两边分摊。
2、产品上了多语言,SEO 却没跟上
有时候 /en 和不带语言前缀的地址都能打开,内容还一模一样。对 Google 来说,这就是两个独立页面,等于自己跟自己抢同一份首页权重。
建议的做法:
把英文设为默认语言,统一收口到不带
/en的规范 URL,比如直接用https://soloent.ai。权重集中在一个首页上,也避免了默认语言的重复页面问题。其他语言走清晰、可被索引的独立路径,比如
/zh/、/ja/、/ko/,而不是只靠前端的语言切换按钮换文案,那种方式 Google 根本看不到其他语言版本。全站补齐
hreflang和canonical,让 Google 明确知道「默认英文页」和「各语言版本」之间的对应关系,减少误判、重复内容和地区流量错配。注意 canonical 要和实际 URL 路径保持一致。
像 xx.ai 现在已经有多语言切换了,但 URL 结构和 SEO 信号还不完整,搜索引擎既不知道这些语言版本的存在,也不知道该怎么收录它们。所以核心页面要优先处理:首页、feature 页、Blog 博客页。
两个一致原则记住就行:
hreflang 要一致
lang 要一致

一份首页权重被天平劈成两半,收口到规范 URL 才能把它合回来。
3、全站 E-E-A-T 信任信号
有些站连 privacy(隐私政策)和 terms(服务条款)页面都没有,最好再补一个 about 页面,pricing 也单独成页。
这些页面看着不起眼,作用却很实在:让 Google 和用户都更容易确认,网站背后是一个真实、可信、可联系的团队或公司,从而提升整站的信任感和权威信号。这正是 E-E-A-T 想衡量的东西。
4、URL 唯一
同一个页面不该有好几个能访问的地址。逐项检查:
http 全部跳转到 https;
统一带 www 或统一不带 www,二选一;
结尾斜杠也要统一,要么都带
/,要么都不带。
5、谷歌抓取状态异常
在 GSC 的抓取统计里,重点看请求中的错误占比。像图里这种错误比例就明显偏高了。什么时候会出现尖刺波动?通常是 CF 或 AWS 这类底层服务宕机的时候。
这里有个关键概念,抓取预算:Google 每天分给一个站的抓取次数是有限的。如果 4xx/404、5xx 占比偏高,说明 Googlebot 把宝贵的预算大量浪费在了打不开的死链和报错资源上,真正该被抓的好页面反而轮不到。

预算从 404/5xx 的裂缝漏光,真正该抓的好页面只剩一线细流。
6、PageSpeed Insights 性能分
性能不只是体验问题,也是排名信号。可以在 GSC 后台看「核心网页指标」报告,或者直接用官方测试地址:https://pagespeed.web.dev/。
我这边的要求是:
首页 PC 端:【性能】最好 90 分以上,其他几项尽量做到 100;
首页移动端:【性能】最好 80 分以上,其他几项尽量做到 100。
7、sitemap.xml 不完整
sitemap 是给 Google 的「目录索引」,常见两个坑:
漏掉了多语言的 URL,等于没告诉 Google 还有别的语言版本;
页面量很大时没做分片处理,一个超大文件容易抓取不全。
8、结构化数据(Schema)
结构化数据是用一套标准格式,把「这是一篇文章」「这是个产品」「这是 FAQ」这类信息直接喂给 Google,让它更准确地理解页面,还可能拿到富媒体搜索结果。常见两个问题:
schema 属性配置错误,字段写错或缺失,Google 直接忽略;
Schema 没有做多语言,各语言版本应该有各自对应的结构化数据。
9、URL 不规范
估计是 AI 自动生成的,没人给定规范,导致 URL 又长又乱,最常见的是 Blog 文章的 slug 一长串。
理想的 slug 应该短、英文小写、用连字符分隔关键词,比如 /blog/technical-seo-checklist,而不是把整句标题或一串随机字符塞进去。
10、Technical SEO 的检查修复思路
最后说下我自己整套的检查修复打法:
首页单独处理,它通常最特殊、权重也最高;
其余页面按模板归类,比如
/blog、/blog/xxx一套,/tools、/tools/xxx一套;能靠改模板一次性修复全站的,就在模板层一次解决,不要逐页手动改;
剩下少数页面才有的个性化问题,用 plugins 这类插件化方式单独叠加,避免污染通用模板。

别逐页手改,按首页 / 模板 / 插件三层来,一次修一层。
一句话总结:地基稳了,排名才有的谈。Technical SEO 不性感,但它是后面一切内容和外链能不能生效的前提。