共计 3169 个字符,预计需要花费 8 分钟才能阅读完成。
这几日我已经逐步完成了我的博客的重新搭建, 熟悉了Markdown的写作流程, 对主题也进行了一些修改, 甚至自学了一下PHP😂. 慢慢的我开始关注起了我的网站在搜索引擎中的索引量…
前提声明我没有学习过任何SEO的知识以下内容只是我在建站过程中的一些探索心得, 我的博客文章并不多, 但基本所有都是原创文章. 但我不是那么的在意访问人数有多少, 只是觉得要是别人遇到的问题我刚好遇到过爬了坑要是别人能在搜索引擎上很快的搜索到我的解决方案, 是不是一切都那么的简单加轻松愉快啦…😊 so 探索吧.
以下优化经验来自于谷歌搜索参考文档
检查已经被搜索引擎索引的页面
在所有搜索引擎中可以在搜索框使用 site:{你的域名}
如 site:nenufm.com
查看当前网站已经被索引的页面. site:
查询是一个搜索运算符,您可以使用它请求来自运算符中指定的特定网域、网址或网址前缀的搜索结果。当然基本所有搜索引擎都会有一个站长后台, 你在这里搜索它也会提示你, 你是否是这个网站的站长,让你进入站长后台进行管理… 站长后台的坑我之后再说.
问题思考
在搜索结果中我发现以下几个在我想法之外的问题.
搜索结果界面包含隐私政策页面
我搜索了以下每个网站都有隐私政策页面, WordPress
也会生成一个/privacy-policy
页面, 这是大概是每个网站所必须要求的界面吧. 但是我不希望它出现在我网站搜索结果里面. 我设想了一个场景比如在百度上有人搜索 留声与视
这个关键词出现了一个结果 隐私政策 - 留声与视
我觉得稍微有那么一点诡异.
搜索结果包含分类,标签页面
我不太清楚是因为我的网站文章内容太少,还是我写作的时候喜欢打标签,分类,在我搜索本站的搜索结果中我看到了搜索结果靠后的大量本站的标签页.我认为…🤣 至少现在我觉得, 分类或者标签都是用来用户在站点里面查找同类文章用的, 在搜索结果中往往不太适合. 更多的我希望用户是直接搜索到我博客的具体文章, 而不是搜索了之后跳转到一个拥有很多文章的分类或者是标签. 或许分类确实有用, 等之后文章多起来了我或许会希望它出现在搜索结果中.但现在暂时不用.
搜索优化
对于以上问题我开始的想法是在 robots.txt
直接屏蔽掉有关路径. 但我在谷歌搜索文档中看到以下提示警告
google search docs robots: robots.txt 文件规定了搜索引擎抓取工具可以访问您网站上的哪些网址。 此文件主要用于避免您的网站收到过多请求;它并不是一种阻止 Google 抓取某个网页的机制。若想阻止 Google 访问某个网页,请使用 noindex 禁止将其编入索引,或使用密码保护该网页。
似乎 robots.txt
里面所屏蔽的是直接让搜索引擎不去理解这个目录下面的所有内容, 属于非常强烈激烈的声明, Google的意思robots.txt
更像是在爬虫阶段就直接禁止了, 爬虫就会直接中断爬取对应地址的链接. 数据没有进入搜索引擎进行分析. 例如如果我直接在 robots.txt
屏蔽了 /privacy-policy
路径的访问搜索引擎会认为我的网站没有隐私政策页面. 而我希望的只是它不显示在搜索结果里面而已.
这是我原始的 robots.txt
User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
Disallow: /wp-includes/
Disallow: /wp-content/plugins/
Disallow: /wp-content/themes/
Sitemap: https://nenufm.com/sitemap.xml
在文档中我看到这么一段描述
资源文件: 如果您认为在加载网页时跳过诸如不重要的图片、脚本或样式文件之类的资源不会对网页造成太大影响,您可以使用 robots.txt 文件屏蔽此类资源。不过,如果缺少此类资源会导致 Google 抓取工具更难解读网页,请勿屏蔽此类资源,否则 Google 将无法有效分析有赖于此类资源的网页。
我暂时性的认为在 robots.txt
中屏蔽 主题和插件里面的内容或许不是一个很好的方案. 最后我将robots.txt
文件修改为了这个样子, 只屏蔽了 WordPress
的后台页面.
User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
Sitemap: https://nenufm.com/sitemap.xml
建议的优化方案
在 google search docs block-indexing章节中搜索引擎更建议使用 noindex
方案, 其中支持在文档头里面添加 <meta name="robots" content="noindex" />
或者在http响应头里添加X-Robots-Tag: noindex
, 在响应头里添加个人觉得过于复杂. 最后我在分类,标签页中都添加了如下代码. 阻止搜索引擎索引.
<!doctype html>
<html>
<head>
...
<meta name="robots" content="noindex" />
...
</head>
</html>
<meta name="robots" content="noindex, nofollow" />
对于隐私页面我在原本我在网上拷贝的备案填写信息中发现了一些配置在 google search docs qualify-outbound-links
<!-- 备案页面声明 希望 Google 不跟踪您网站上的出站链接,或不从您的网站上抓取链接页-->
<a href="https://beian.miit.gov.cn" target="_blank" rel="nofollow noopener">蜀ICP备16022835号-1</a>
<!-- noindex 不索引当前页面, nofollow 不索引出站链接 -->
<a href="https://nenufm.com/privacy-policy" target="_blank" rel="noindex, nofollow">隐私政策</a>
对于整个文档我也修改优化了一下 添加了 lang="zh"
声明中文页面, 主打一个别人也有我也要有的原则.😂 印象中好像在哪里看到过对于全球化搜索引擎页面最好声明语言类型.
<!doctype html>
<html lang="zh">
...
</html>
总结
本文讨论搜索引擎优化(SEO)探究个人建站在搜索引擎优化方面的一些问题, 参考搜索文档谈谈我自己对网站搜索优化的一些见解. 在过程中学习site,robots,meta noindex 相关技巧对网站进行配置. 之前我安装过 Yoast SEO
, All in One SEO
等插件我觉得好像似乎这些插件把 SEO
这个问题给搞复杂了在文档中 Google 也讨论过这个问题. 搜索引擎优化也有它比较适合匹配的点. 但是在小型建站中个人觉得没必要使用那么复杂的优化手段, 比如 在SEO插件中非常看重的关键字标签也就是页面中的 meta keywords
节点, 在搜索引擎的文档中明确说明了只读取标题以及meta description
描述,keywords
是毫无作用的.
当然以上只是我个人看法, 也只是参考了一些文档提出一些见解. 刚开始建立网站对于搜索引擎的优化我依旧在学习阶段. 这篇文章我会慢慢更新总结. 本站优化搜索总的目的只有一个要是别人能在搜索引擎上很快的搜索到我的解决方案, 那么愿一切从未如此简单有趣.😸
修改 (2023-10-30 17:06:26)
以上我最开始接触 SEO 时的想法, 现在我已经安装上了 All in One SEO
原因无它. 貌似对于SEO来说keywords
或许不重要, <meta name="robots" content="noindex" />
很重要. 站点地图也很重要. 还在摸索中之后我会再写文章研究一下这个过程.