最近,有些许基友问我,“SEO”这个词的百度指数,自2019年4月之后就开始暴涨,表示非常震惊、激动,是不是表示SEO行业开始回暖了呢?新的SEO就业潮是不是要来了呢?
本渣看后,也非常震惊,汝竟然这般天真无邪
看行业就业趋势,不应该去招聘网站上看嘛,百度指数体现不了就业趋势哇,19年5月SEO岗位招聘数量,同比18年,应该变少了点。
哪怕“SEO招聘”这个词的指数,同比去年,趋势下降的
那“SEO”的百度指数因何而暴涨呢?
本渣感觉,大概率是刷的。
那为什么大概率是刷的呢?
因为刷指数的特征较为明显。
比如,用户搜索行为的改变,会在所有搜索引擎中体现,搜索趋势大致是一样的。所以搜狗的SEO指数是怎么个情况?
比如,用户搜索行为的改变,如果不是涉及地域的关键词,会在大部分城市有所体现?那么有的城市暴涨,有的城市平缓是怎么个情况?
---> 北京,平缓
---> 安徽,暴涨
---> 黑龙江,平缓
---> 湖南,暴涨
等等等,代理IP资源充沛的省份,暴涨明显
待本渣解释一番后,基友又问,为什么要刷SEO的百度指数呢?
我TM怎么知道,又不是我刷的。
瞎猜一下,除了测试刷指数程序的有效性,剩下可能是为了做排名
那么“百度指数”跟“排名”有什么关系?
为了阐述这个问题,需要先了解几个概念:搜索需求,前置搜索词,跳出搜索词,搜索词,搜索实体
比如用户先搜索“书包网”,在搜索“第二书包网”,在搜索“华为P30 Pro”,其中:
1)“书包网”是“第二书包网”的前置搜索词,且实体一致,都为“书包网”
实体为一类名词的集合,比如机械实体:“挖掘机、装载机、货车、吊车”等,艺人类实体:“刘德华、梁朝伟”,职位类实体:“SEO、PHP、产品经理”
实体由搜索引擎定义,外界是干预不了的
2)“第二书包网”为“华为P30 Pro”的前置搜索词,但两个Query不属于同一个实体,所以“第二书包网”为跳出搜索词。
可以理解为,该用户在“第二书包网”这个Query的搜索结果中,已经解决了自己的搜索需求,所以换了一个实体(华为P30)来搜索,跳出上一个实体(书包网)
3)“书包网”作为一个实体,如果日均搜索量比较多,一般有N个后置搜索词,比如“第一书包网”、“第二书包网”、“第三书包网”....
每个后置搜索词,有不同的搜索占比,比如搜索“书包网”的用户中,40%的用户再次搜索了“第一书包网”,20%的用户再次搜索了“第二书包网”....
比如上面这个搜索占比,“第一书包网”最能体现“书包网”这个词的搜索意图
所以,
网页A排在“第一书包网”的百度*页,但在“第二书包网”中无排名
网页B排在“第二书包网”的百度*页,但在“第一书包网”中无排名
请问:网页A与网页B,哪个更容易获得“书包网”的*页排名?
必然是网页A啦
所以,网页在后置搜索词(就需求占比较多的那几个)中的排名表现,影响该网页在前置搜索词的排名。本渣个人认为,这个影响程度,大于外链、大于模板、大于内容,次于域名
这个结论,是根据百度关于网页相关排序的几个专利内容,推导而来,专利链接发到知识星球中了
那么回到主题,如果想搞“书包网”的排名,但是太难了,怎么办?那就先搞这个词后置搜索词的排名,后置搜索词的排名上来,主词就好搞了。
依靠大量长尾带动大词排名,也是这个原理,但铺大量长尾词,只能大站来搞,小站没那么多页面,就只能依靠做搜索占比top1-top3的后置搜索词排名,来带动大词排名
这就有个问题,如果top1-top3的后置搜索词,排名也做不上去怎么办?比如这些词竞争本来就大,或者新域名底子差...
所以就自己造一个“后置搜索词”,比如程序控制,先搜索“书包网”,在搜索“gogo闯书包网”,把“gogo闯书包网”的搜索占比,刷到top3以内
网页Title包含“gogo闯书包网”,这样这个词很容易排到*页,因为这个词没有其他人做,是刷出来的。当“gogo闯书包网”这个词排到*页后,“书包网”这个词的搜索结果,至少会展现你的网页,一般比较靠前,比如前3页。
这个结论有证明过吗?有的,至少16年的时候证明过了。当时除了搞站群海量铺关键词外,也有拿500-1000/rmb档次(有点PR、有点SR、有点外链)的老域名做几个大词,比如:da香蕉导行、cao溜社区、jiu久热、hen狠撸这种词,you know that ......
竞争太牛逼了,搞不上了咋办?
刷一堆后置搜索词,比如“da香蕉导行gogochuang”、“cao溜社区gogochuang”......当然网页标题也会把“gogochuang”加上
刷的结果,下拉框有出现带“gogochuang”的词,部分Query的相关搜索推荐中,也会出现带“gogochuang”的词
起量的时候,有50%的域名,都在*页,持续2个月左右。排名到*页当天,购买域名的钱就捞回来了
那么为啥只持续2个月呢?
1)擦边词,百度会定期清除的,之前刷的全被删除,下拉框不在出现了
2)百度规则变化太快,刷后置搜索词的程序失效了,死活刷不出来
3)技能树不在此。
之前在公司做SEO,基本都是大站,工作内容围绕“大批量整合数据(批量造页面、批量改页面、批量调链接...)”
后来做站群,还是批量。每天上10万数据不够,那就上20万,20万不够,那就上30万,清风算法以后,采集直接上不收录了,那就都批量改下标题在上。还不行,那就批量处理采集内容(按段落拆分数据后在随机拼接、随机插入百度无法识别的特殊字符、段落间随机插入七牛中预存的图片.....)然后在上
所以核心工作,都是“怼”,解决的是爬虫、web性能、关键词挖掘、数据处理这种批处理问题。
所以录制的SEO教程,到现在尚未涉及SEO算法方面,一直在说“性能”方面,就是这个原因。因为本渣对算法方面其实没怎么研究过,比如快排,原理能猜个大概,但细节完全不知道,“后置搜索词”排名影响“前置搜索词”排名这个细节,可能在快排中有应用,都在讲底子好的网站好刷,这个底子好,可能指的就是要刷的每个目标词的后置搜索词的*页排名占比,占比越高,则底子越好,则目标词越容易刷上去
由此看,小站做SEO不能像大站一样,爱站导出一批词简单过滤下就直接怼上去,得把靠谱的后置搜索词找出来,再布局到网页中,至少title得有
那么后置搜索词从哪找?
相关搜索、下拉框、百度指数需求图谱
本渣认为,论与前置关键词的相关程度而言,百度指数需求图谱 > 下拉框 > 相关搜索
因为需求图谱中的关键词相关性强弱都给标记上了,百度自己给的数据,你有理由不信?
下拉框,是基于当前Query的一个后续扩展,根据用户已经输入的文字检查匹配的高热度query,返回query补全后的完整query
相关搜索,是搜索引擎里query分析变换的一部分, 用户的query请求发送后,引擎会根据这个query做字符变换、纠错、截断等基础处理,然后会扩展该query,扩展方式有很多,比如地域扩展(小吃-->北京小吃),关系扩展(seo-->seo教程),相关实体(seo-->sem)...
扩展后的所以query组成query队列,最好会从多个结果队列中组合选出最优结果(每个词的历史点击率、访问量等因素综合排序,还要考虑稳定性,比如几个随机时间段内,点击率忽上忽下的,就比点击率一直比较高的,排序上要靠后)返回用户
相关搜索中推荐的词,存在强相关和弱相关,比如关系扩展比地域扩展和实体扩展,更具相关性。把强相关的词做到*页,影响前置关键词的排名
之前请求百度,响应的资源里,有个json文件包含相关搜索词和一堆参数,有个参数代表该推荐词与当前Query是强相关还是弱相关,value为1代表强相关,value为0代表若相关,现在这个json找不到了
相关搜索和下拉框的推荐逻辑,在百度的专利文档中也能找到,专利搜索中发布人定位“百度”,检索词为“推荐”,能找到一堆标题为“一种XX推荐的装置”的专利
当然百度系的推荐包含很多种,搜索结果右侧推荐、下拉推荐、相关推荐、广告推荐、信息流推荐、app push推荐、凤巢关键词推荐........得找一阵
免责声明:本站所有内容及图片均采集来源于网络,并无商业使用,如若侵权请联系删除。