当梦想照进现实

SEO 三部曲之 SEO 三大系统

2019.06.27

随着网站规模和流量的增长,SEO 不可避免会遇到跨平台、多维度的数据、复杂的功能和配置、以及海量、分层的关键词,这个时候就需要 SEO 系统来辅助决策,提高运营效率。
我总结了日常工作中使用的 3 个系统,分别是 SEO 数据系统、SEO 运营系统、词库系统

SEO 数据系统


SEO 数据系统是监控 SEO 各项数据,包括过程数据和结果数据、内部数据和外部数据,也是对 SEO 增长公式中各要素进行监控,有点像是太空舱中的各个显示屏,数据在不停的滚动。
主要有以下几个数据项:

  • 流量罗盘
    • 主要有 UV 数据、转化数据和用户数据。并且有分频道、地域、新老用户等多个维度
    • 百度统计、Google Analystics、CNZZ 就是这类工具
  • 抓取监控
    • 对爬虫的抓取环节进行监控,重点监控的数据有:总抓取量和不重复抓取量、平均下载时间、爬虫总量
    • 主要是对网站 log 进行分析,市面上好像没有此类工具, Shell 或 Python 应该是比较简单的实现方式(我之前在途牛用 shell + Django 实现过)
  • 收录监控
    • 监控网站收录情况,主要有总收录量、各频道收录量和收录率等
    • 百度站长工具和 GSC 就有数据,也可以搭配上自己实际抽样调查的数据
  • 排名监控
    • 监控关键词排名情况,需要分层监控,比如对关键词类型、搜索量和所在频道进行分层,比如品牌关键词、热门关键词和长尾关键词的分层
    • 排名工具比较常见,官方的、第三方的、自己开发的都有
  • 网页性能监控
    • 监控网页性能,也就是网页速度,包含 TTFB、首屏时间、渲染完成时间等(如果有条件,可以咨询下公司的前端同学)
    • 其中 TTFB 直接影响爬虫抓取速度,首屏和渲染完成时间是影响用户体验,在 WAP 端尤其重要,而且已经是排名的影响因素
    • 性能监控和分析工具有特别多,比如监控包、Chrome 的 Lighthouse、Gtmetrix
  • 网页状态码监控
    • 监控网页状态码,也是监控服务器的健康情况
  • 竞手数据监控
    • 竞手的流量、排名、关键词数量进行监控
    • 知己知彼。有些时候流量下降,只是因为对手的排名上升了
    • 主要用第三方工具,比如 5118、SEMrush、Ahrefs 等
  • 搜索引擎监控
    • 搜索引擎的调整对网站流量有直接的影响,比如算法、广告、样式、特殊展现的调整,每个 SEOer 都被算法折磨过 :(
    • Google 算法监控我一般会用 Algoroo、SEMrush Sensor

SEO 运营系统

SEO 运营系统是对 SEO 各元素、参数、可配置项进行控制和管理,就像太空舱中的按钮、操纵杆。主要有以下几部分:

  • Sitemap & Robots 管理
    • 管理搜索引擎爬虫的抓取环节,给搜索引擎提交的哪些网页,禁止爬虫抓取哪些网页
  • 内外链管理
    • 管理网站的内链和外链(主要是内链),包含覆盖哪些网页,链接的倾斜程度
  • TDK 管理
    • 对网页 TDK 进行精细化管理,不过实际发现人工成本很高
  • SEO 组件管理
    • 管理网页中会有一些 SEO 组件,比如内容组件、链接组件、H1 等,可以对这些组件进行管理
  • SEO 实验工具
    • SEO 作为黑客增长的一种方式,实验是不可或缺的
    • SEO 实验工具可以控制各项试验是否开启,参与实验的数量和比例,以及观测实验数据,记录实验结果
  • 内容管理工具(CMS)
    • 对 SEO 频道应用的内容进行管理,比如途牛的攻略文章
  • 抓取系统
    • 这个抓取系统主要是抓取外部数据,比如竞手关键词、搜索引擎的数据、外部的文章内容等
    • 也可以用 火车头,Python 的 Scrapy 来实现
  • 页面诊断工具
    • 页面诊断工具主要对新上线的页面进行自动化的诊断,比如检查是否缺少 TDK、适配代码等

SEO 词库系统

SEO 的主要生产要素之一是关键词,所以把词库单独拎出来作为一个系统。主要有以下几个功能

  • 筛选 & 过滤机制
    • 新增关键词时进行自动化的筛选和过滤,主要是搜索量、相关度、产品数量等
  • 上下线机制
    • 建立关键词自动上下线机制:对于实际效果差的关键词,进行下线处理;对于重新产生价值的关键词,进行上线处理
  • 自动化挖掘
    • 从多个来源定期挖掘关键词,保证词库的活力
  • 数据关系匹配
    • 关键词数据跟抓取、收录、流量、内外链数据进行匹配,对关键词进行多维度的审视,并制定数据模型进行下一步的自动化调控
  • 频道分配
    • 根据关键词的搜索量、类型、语向进行不同频道的分配
  • 类目预测
    • 对关键词的类目、属性进行自动化判断
  • 语向识别
    • 识别关键词的语向
  • 违禁词同步
    • 跟集团违禁词保持同步,避免违规,减少风险

更多词库的内容,还可以看我之前的文章:《SEO 词库完整指南》。

注意事项

首先要说明的是,以上 3 个系统及功能是理想情况,即便是阿里,也未完全实际完成。(部分已经完成;部分未产品化,以 SQL、Excel 来表现);
其次,以上系统主要是根据我所在项目儿总结,并不完善(比如转化系统是缺失的),也不一定适合其他网站和项目,可以选取部分来使用和参考
最后,建议在实现过程中,尽量用开源软件,避免重复造轮子,减少开发成本。

关于 SEO 三部曲

SEO 三部曲是我对现有 SEO 业务做系统化梳理时,提炼出的 3 个系统性框架,正好以 3 篇文章的方式整理出来,分别是:

  • 一个公式 - SEO 增长公式
  • 二个导向 - SEO 的两个导向:用户需求、搜索引擎策略
  • 三个系统 - SEO 数据系统、运营系统和词库系统(正是本文)

这三部曲也是最近述职整理的内容,正好分享出来。一方面是对之前业务和经验的梳理和总结,作为终点,另一方面,也希望希望作为一个起点,进入到下一个阶段:创造性阶段

当然,因为局限性,仍存在较多的问题和不足,希望能够得到指点。

Comments
Write a Comment
  • 1219774050 reply

    谢谢,楠哥分享,抱紧楠哥大腿

  • 1219774050 reply

    关键词语向是指不同语言类型关键词嘛,楠哥

    • @1219774050 是的,我们业务有这个问题,面向不同的语言。

  • 小先生 reply

    写的真好,亚楠兄的系统化思路,令人佩服 ,文章主要阐述的主要是:内容—流量,希望对SEO变现(商业价值化)多涉及一些!

    • @小先生 这方面不是最擅长的,找机会整理下吧。

  • 1325311624 reply

    你这个博客有wordpress的模板吗?

    • @1325311624 不清楚了。底部有设计师的链接。

  • asdf reply

    数据监控系统基本有开源方案可以支持,运营系统、词库系统就得自己撸了