SEO

Python批量挖掘百度下拉框关键词

百度下拉框的关键词,我有个小技巧,**可瞬间提升上百倍的挖掘效率**。

public 百度下拉框的关键词,一直是SEO关键词拓展的利器,只要在搜索框中输入一个关键词,就可以得到一批相关词。我有个小技巧,可瞬间提升上百倍的挖掘效率。并且通过Python实现后,完全可用于大规模关键词的批量挖掘。思路其实很简单,有些朋友也有了解。记得当时跟夜息分享的时候,他一直说666 :)

First Blood

首先,在Chrome的Network中,可以获取到百度下拉框提示的API地址:https://sp0.baidu.com/5a1Fazu8AA54nxGko9WTAnF6hhy/su?wd=黄&sugmode=2&json=1&p=3&sid=1427_21091_21673_22581&req=2&pbs=%E5%BF%AB%E6%89%8B&csor=2&pwd=%E5%BF%AB%E6%89%8B&cb=jQuery11020924966752020363_1498055470768&_=1498055470781

  • 这里的黄山,就是我输入的关键词,可替换为其他任意关键词。
  • 输出的结果,通过简单处理,就是json格式。

具体代码实现如下:

def get_sug(word):    url = 'https://sp0.baidu.com/5a1Fazu8AA54nxGko9WTAnF6hhy/su?wd=%s&sugmode=2&json=1&p=3&sid=1427_21091_21673_22581&req=2&pbs=%%E5%%BF%%AB%%E6%%89%%8B&csor=2&pwd=%%E5%%BF%%AB%%E6%%89%%8B&cb=jQuery11020924966752020363_1498055470768&_=1498055470781' % word    r = requests.get(url, verify=False)  # 请求API接口,取消了HTTPS验证    cont = r.content  # 获取返回的内容    res = cont[41: -2].decode('gbk')  # 只取返回结果中json格式一段,并且解码为unicode    res_json = json.loads(res)  # json格式转换    return res_json['s']  # 返回关键词列表print '\n'.join(get_sug('黄山'))

输出为:

黄山天气黄鳝黄山旅游自助攻略黄山旅游黄鳝门黄山毛峰黄鳝女主播黄山山顶住宿攻略黄山市民网黄山旅游攻略

Double Kill

public

这里有个小技巧,就是在关键词后面输入w,会出现跟拼音以w开头的一系列关键词,比如“黄山w”,会出现“黄山温泉”,”黄山玩几天“,“黄山五绝”等关键词(见上截图)。因此,当我们把a~z遍历一遍,会出现更多关键词。

升级后,代码实现如下:

def get_more_sug(word):    all_words = []    for i in 'abcdefghijklmnopqrstuvwxyz':          all_words += get_sug(word+i)  # 遍历字母表 | 利用了上一个函数    return list(set(all_words))  # 去重print '\n'.join(get_more_sug('黄山'))

输入结果为:

黄山红方印多少钱一包黄山区政府网黄山山顶住宿攻略黄山开放时间黄山西海大峡谷黄山ie修复专家黄山免费2017黄山图片黄山到宏村黄山怪石黄山农家乐黄山哪里上山黄山论坛黄山旅游黄山毛峰品牌黄山游记...

Triple Kill

public

将上面的思路延展一下,如果在关键词后输入两个单词,就会出现以这2个字母为拼音开头的一系列关键词,比如“黄山tp”,会出现“黄山天气”,“黄山太平湖”(见截图2)。因此,我们又做了升级。

def get_most_sug(word):    all_words = []    for i in 'abcdefghijklmnopqrstuvwxyz':         for j in 'abcdefghijklmnopqrstuvwxyz':             all_words += get_sug(word+i+j)    return list(set(all_words))  # 去重

然后就出现了更多关键词:

黄山云谷索道在哪黄山开锁黄山城市风情黄山评价黄山能带狗吗黄山露营黄山办理港澳通行证黄山旅游攻略黄山到广东的高铁黄山野生猴谷黄山动车站怎么去黄山脚下黄山古镇黄山酒店黄山太平索道黄山舰黄山自驾游黄山天气预报一周黄山led显示屏报价黄山入口黄山旅游集散中心黄山阿拉自助游黄山木雕黄山北到汤口镇黄山ppt黄山特点是啥黄山半源黄山屯溪机场到黄山风景区黄山累不累黄山到千岛湖怎么坐车黄山百步云梯黄山人才网黄山旅游要多少黄山敏学教育黄山银钩黄山北站黄山杭徽大酒店黄山各县市区别墅黄山卧虎高尔夫黄山毛峰价格黄山火车站到黄山屏山黄山旺季黄山天都峰黄山茶庄黄山宣传片黄山红方印价格黄山三日游最佳路线黄山的诗句黄山慈光阁索道黄山一般玩几天黄山矿泉水黄山考试网黄山香烟黄山别墅黄山市委党校...

Legendary

这里还有一些技巧和思路拓展:

  • 如果用作批量跑词,还需要简单包装下,比如关键词循环,数据保存等。
  • 实际应用中,字母单循环的性价比更高(也就是Double Kill),速度和词数都比较可观。字母双循环,速度慢,词量也并没有那么高。
  • 百度移动端是另外一个API,搜狗,360,Google也有不同的API,可以作为扩展方式,脚本需自行完成。

Shut Down

  • 最近在玩王者荣耀,所以小标题用了里面的提示,欢迎大神带我~
  • 最近打算给公众号设置一些结构,比如大的品类分为文章、服务;其中文章里是SEO、Python等栏目,服务里有招聘,工具。这样整体结构更清晰一点。
  • 题图是森林,也是一个小生态。最近正在思考互联网的生态和SEO的影响,之后可能会写一篇相关的文章。

评论

暂无评论,来写第一条吧 👇

写下你的评论

邮箱仅用于识别身份,不会公开显示