SEO工具行业如何以及为何应该制定技术标准

作者:门信描

<p>SEO技术空间可以从技术标准的建立中获益巨大Google自身规范的实现在我们的工具中是不一致的,并且可以让经验较少的SEO认为他们的网站比他们的网站更好,就像W3C在周围聚集一样1994年协议标准的定义和1998年的Web标准项目(WaSP)标准化编码实践,我们轮到我们按下我们的软件并为接下来的事情做好准备如果你听过这个就停止我12月4日,我收到了来自DeepCrawl的电子邮件,告诉我我的帐户已经没有信用但是没有任何意义,因为我的计费周期刚刚重启几天 - 而且,坦率地说,我们之前并没有真正使用过该工具十月,正如你在下面的屏幕截图中看到的那样,我仍然应该有一百万个积分登录,我记得我现在更喜欢其他工具注意竞争对手的进步像On-Pageorg和Botify最近几个月所做的那样,我发现自己对我当前的订阅感到恼火</p><p>我仍有帐户的唯一原因是因为历史客户数据被锁定在平台中当然,您可以导出各种CSV,但那又怎样</p><p>没有简单的方法可以将我的历史数据从Deep Crawl移动到On-Page或Botify那是因为SEO工具行业没有技术标准每个工具都有一种截然不同的方法来处理它们的抓取方式和方式,以及如何存储数据并最终导出作为搜索引擎优化从业者,我们所做的很多工作是在我们能够完成分析之前将这些数据标准化为这些不同来源(也就是说,除非你把所有工具都展示给你的表面价值)许多其他学科要求你做同样的事情,比如市场研究,但是你忽略了这些事实只是不同的工具以不同的方式存储相同的数据就平台之间的迁移而言,它只是企业像Searchmetrics,Linkdex,SEOClarity,Conductor和BrightEdge这样的级别提供商,它们之间有相互迁移的系统</p><p>然而,这仍然需要定制数据导入才能实现这一目标</p><p>尝试有一些非盈利的管理机构,设置标准特定的网络,我们有五个主要的管理机构:但是没有这种方式的SEO软件的管理机构这意味着SEO工具本质上是营销的Internet Explorer技术,决定他们将支持和不支持哪些标准和功能 - 似乎有时候,不考虑更大的景观苛刻,但是如果你深入研究某些工具,你会发现他们经常不考虑谷歌的情景已经发布了明确的指导方针所以这些工具可能无法提供网站为什么(或没有)执行的完整图片</p><p>例如,Google指定JavaScript适用于页面的移动版和桌面版之间的重定向,而且没有SEO工具可以识别出,无论最近的302和301争论如何,同样的规范说你应该使用302s来实现这些类型的重定向没有足够智能的工具来确定返回302的页面应该返回302尽管谷歌将根据它们做出决定,但对HTTP头的评论也不一致一般来说,当一个组织或一组组织聚在一起决定这些标准时,就会出现标准的发展</p><p>该标准最终被认为是可行的,软件公司在实施过程中向前发展,用户倾向于倾向于这个标准并用他们的钱包投票那么是什么阻止了SEO工具行业聚集在一起并发布技术标准</p><p>一些事情......标准的建立有利于SEO社区,以及我们工作的客户和网站对工具提供商本身没有任何好处,因为它将要求他们进行不在其路线图内的更改(或由于任何其他原因而决定反对的技术变化)由于平台之间的移动容易,它也使它们失去客户最终,SEO工具的技术标准的价值归结为更好的功能,更好的用户体验和鼓励围绕创意功能展开更多竞争 但更具体地说,它有助于实现以下目标:那么标准化过程从何处开始呢</p><p>为了满足这些需求,SEO工具需要跨平台保持一致吗</p><p>当然,这是有争议的,但这里有我的建议:理想情况下,对于如何将空间中的所有不同链接指标相互转换将有一个共同的理解这里的技术挂起是双重的,每个提供商已经使用了自己的估计,然后偏离了原始的PageRank算法,他们自己的专有公式,这些公式不是公开的</p><p>他们每个都抓取网络的不同部分</p><p>如果所有链接提供商都要爬行,第一个问题变得无关紧要共同抓取并公布结果数据共享抓取的主页公共抓取是一个公共档案,其最新版本包含1720亿页任何人都可以下载和处理它作为网络分析的手段(过去,我领导的项目,我们使用的共同爬行作为提取影响者数据和识别断开链接机会的语料库但我离题了)如果Moz,Majestic和Ahrefs公开处理共同爬行,他们都可以提供彼此的指标,或者更现实地,用户可以将Ahrefs和Majestic指标转换为更广泛理解的Moz指标本身有一点需要注意的是,Moz现在为Common Crawl提供种子URL列表,我不清楚是否可以创建一个我怀疑不会对研究产生偏见,因为所有链接索引仅限于在这种情况下仅抓取公共抓取网址虽然这种开放链接指标的想法很可能是一个梦想,但更为现实和有价值的是建立一个所有链接索引必须提供的一组新的提供者不可知的指标当然,它们都给我们链接根域的数量和链接的总数,但是新的质量度量可以在您去除所有数据集之后将所有数据集绑定在一起链接将使集体数据更加可用Google的爬行功能已经走过了漫长的道路除了尖叫青蛙,据我所知,所有搜索引擎优化工具仍然以他们总是拥有全部的方式爬行搜索引擎优化工具基于下载HTML而不渲染页面执行分析到目前为止,当Google可以渲染整个页面并根据初始JavaScript转换做出决策时,很难相信您的SEO工具报告的内容根据网关规范,抓取工具将需要向您提供您希望如何抓取的选项,而不仅仅是让您指定您的用户代理</p><p>除此之外,这些抓取工具还需要使用Headless Chromium或无头QTWebkit(PhantomJS)</p><p>文本驱动的抓取工具,旨在更贴近地模仿Google的体验无论爬网提供什么,都应该指定一个标准,即所有抓取提供商都按照标准顺序提供列</p><p>它们应该以相同的格式导出,可能称为CDF文件这将定义需要包含在这些出口中的最小规格以及按什么顺序排列</p><p>但是,我们会这样做d不想限制工具提供商提供更多东西的能力,因此导出文件确实可以包含其他数据列而是,所有工具都需要导入到某个列</p><p>就个人而言,我认为我们需要重新考虑排名行业排名报告了一个在野外并不存在的背景,忽略了特定的用户环境搜索的未来越来越多地关注那些特定的用户环境以及它们如何显着影响结果事实上,我建议排名应该如此开放,免费提供给所有人由于谷歌不会提供这一点,因此需要一群人才能实现这一目标我们都是通过提高搜索量的手段窃取谷歌的排名;每个工具都有自己的方法如果有一个集中的数据存储,通过分布式手段或每个人都可以访问的复杂僵尸网络来提取排名,从而允许任何人访问完整的SERP数据,该怎么办</p><p>然后,工具提供商将面临挑战,提供增强功能,使数据更有价值STAT用于提供Codex,它提供超过200,000个关键字的免费排名我相信这是朝着理想方向迈出的重要一步 我也相信STAT是一个很好的例子,一个公司可以增强数据,并允许你进一步定制这些增强功能STAT界面[点击放大]尽管如此,我希望看到所有提供商的排名跟踪的最低规格帐户:尽管谷歌几年前从字符串转向事物,但仍有人通过关键字密度和H1标签定位镜头检查搜索谷歌宣布实体分析是他们开始理解查询的地方下图说明了他们如何接近这个问题在这个例子中,他们打破了“当天使队赢得世界大赛时谁是美国总统</p><p>”的问题,进入美国总统天使和世界大赛的实体,然后系统地提高他们对这些概念的理解,直到他们能够将他们联系起来</p><p>关系和解决问题搜索引擎优化工具并不是一贯的内容分析的复杂程度NLP,TF * IDF和LDA工具都有取代了关键字密度的概念,但是大多数抓取工具都没有在页面检查中权衡这些方法爬行工具的最低规格应该是它提取实体并计算主题建模分数在TF的情况下发生这种情况的主要障碍* IDF是排名的可用性,因为计算需要审查其他排名文档,但公开排名计划可以支持这项工作自然,这些是我的意见,换句话说,这篇文章可能被误解为我的功能请求列表对于搜索引擎优化工具行业而言,这正是它应该不是的事情相反,这应该是一个合作的努力,以空间中最优秀和最聪明的人为基础建立一个随着现代搜索引擎优化的需求和搜索引擎不断变化的能力而增长的标准</p><p>工具提供商可以聚集在一起开发标准,就像搜索引擎聚集在一起开发Schemaorg一样</p><p>但是,缺乏va对于工具提供商而言,这种可能性不大也许一群代理商或搜索行业媒体可以聚在一起并实现这一目标这些人更客观,并且对这些公司本身没有既得利益或者有人可以开始这样看看所有这些都说,我已经创建了一个名为Gateway规范的草案,遵循与GitHub上的W3C HTML规范类似的格式尽管在选择Git来管理它时存在一些障碍,但我已经决定开始这是更好的方式这种类型的规范需要深入讨论,GitHub提供了这样做的设施要参与,你需要分叉存储库,进行任何编辑或添加文档,然后提交拉取请求这里列出所有这些步骤请提交您的拉取请求,让标准派对开始!本文中表达的观点是客座作者的观点,....