(拍大腿)哎我说各位老板,您是不是也遇到过这种抓狂事?网站更新半个月了,百度搜公司名都找不着?今儿咱利市把手教您设置收录,保准看完就能让搜查引擎乖乖爬过来!
第一关:网站地图咋整才及格?
客岁乌鲁木齐某旅行社官网半年没被收录,厥后发现sitemap.xml里居然藏着赌博中心词!这就好比拿着假身份证去办签证,可能运用才怪!
- 根基答案:
网站地图就是给搜查引擎的导航图,得告诉蜘蛛:
- 哪些页面重要(优先级设置)
- 多久更新一次(changefreq参数)
- 最后撰改时间(lastmod标签)
-
场景操作:
用在线天生东西(比如说XML-Sitemaps)自动创建
每周三定时更新,就像给蜘蛛养成打卡习惯 -
致命错误:
① 屏蔽CSS/JS文件
② 忘却提交到百度资源平台
③ 包括已删除的404页面
第二关:robots.txt到底该咋写?
昌吉某机器厂的血泪史:误把商品页都屏蔽了,三个月损失23万潜伏顾客!
准确姿势对照表
要求场景 | 准确写法 | 错误树模 |
---|---|---|
屏蔽后盾目次 | Disallow: /admin/ | Disallow: / |
允许抓取图片 | Allow: .jpg$ | Allow: /images |
制约特定爬虫 | User-agent: Baiduspider | User-agent: * |
检讨东西推举:
百度资源平台的robots检测东西 + Screaming Frog校验
第三关:死链处理怎么避坑?
石河子某商城网站收录暴跌,一查竟有3000多个死链,都是商品下架没算帐!
四步算帐大法:
- 用尖叫田鸡爬虫全站扫描
- 重要页面做301跳转(比如说下架商品跳转到同类目)
- 无效链接提交死链规则(更新到百度站长平台)
- 设置404创意页引诱网民回忆页
行业秘密数据:
2023年收录异样的网站中,68%存在未处理的死链,平均每个死链致使20个抓取配额糟蹋
三大必杀技加速收录
- 主动推送接口:新内容发布后即时调用百度API推送
- 自动推送代码:在网页底部嵌入百度自动推送JS
- 手动提交入口:每周三登录站长平台手动提交10条重点URL
效果对比实测:
推送方式 | 平均收录速率 | 收录几率 |
---|---|---|
不推送 | 7-15天 | 62% |
仅自动推送 | 3-7天 | 78% |
API+自动+手动 | 12小时内 | 95% |
老司机忠告
干了八年SEO,总结出三条铁律:
- 新站天天更新不少于3篇原创
- 每周四下昼2点提交链接(百度爬虫活跃期)
- 移动端收录占比必须>70%
记着喽,收录设置就像种葡萄——架子(网站架构)搭好了,肥料(内容)给足了,防虫(死链处理)做到位了,自然会有好收获!