不同于在各大博客平台上写博客,部署在 Github 上的博客想要在搜索引擎上被搜索到还是需要做一些工作。因为 GitHub 屏蔽了百度的爬虫,导致百度无法抓取 GitHub 上的内容,所以这里只介绍在 Google 上做 SEO 的方法。
基础
验证网站所有权
在 Google Search Console - 所有权 中进行所有权验证。推荐使用 HTML 文件 方式验证:
- 将提供的 HTML 文件放在博客文件夹的
source
目录下s - 在博客的配置文件中添加
skip_render: googleacxxxxxxxxxxxxxx.html
跳过该验证文件的渲染
提交站点地图
生成站点地图
npm install --save hexo-generator-sitemap
此时使用 hexo g
后就会在 public
文件夹下生成 sitemap.xml
文件。
提交站点地图
在 Google Search Console - 站点地图 中添加新的站点地图,在输入栏中输入 sitemap.xml
然后提交。接下来就等待 Google 自动爬取博客内容就可以了。
进阶
请求编入索引
虽然搜索引擎会自动根据站点地图爬取网页内容,但是如果你的网站权重不高的话这个过程可能会比较久。如果你希望 Google 立即收录你的网页,可以直接在 Google Search Console 上方输入你想被收录的网页,然后点击请求编入索引,等待片刻你的网页就可以被 Google 搜索到了。
修改文章链接
Hexo 默认的文章链接形式为 https://username.github.io/year/month/day/title
,这种多级 URL 形式对于搜索引擎而言并不友好,可以在博客配置文件中将 permalink
修改成 :year-:month-:day-:title/
,这样文章链接就变成了 username.github.io/year-month-day-title
。
也可以使用 hexo-abbrlink
插件为每篇文章生成较短的链接,如 https://username.github.io/a38bdc21.html
。
npm install --save hexo-abbrlink
需要在博客配置文件配置:
# permalink: :title/
permalink: :abbrlink.html
abbrlink:
alg: crc32 # 算法:crc16(default) and crc32
rep: hex # 进制:dec(default) and hex
添加 nofollow 标签
一般博客中都会引用一些其他链接,为了防止搜索引擎抓取这些链接而导致分散网站权重,需要为这些站外链接设置 nofollow 标签,可以使用 hexo-autonofollow
插件自动完成这一个步骤。
npm install --save hexo-autonofollow
需要在博客配置文件配置:
nofollow:
enable: true
添加 robots.txt
robots.txt 是一种存放于网站根目录下的 ASCII 编码的文本文件,它通常告诉网络搜索引擎的漫游器(又称网络蜘蛛),此网站中的哪些内容是不应被搜索引擎的漫游器获取的,哪些是可以被漫游器获取的。
robots.txt 是一个协议,而不是一个命令。robots.txt 是搜索引擎中访问网站的时候要查看的第一个文件。robots.txt 文件告诉蜘蛛程序在服务器上什么文件是可以被查看的。
当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在 robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。
在博客的 source
文件夹下新建 robots.txt
文件,内容如下:
User-agent: *
Allow: /
Allow: /archives/
Allow: /tags/
Allow: /categories/
Allow: /about/
Disallow: /js/
Disallow: /css/
Disallow: /fonts/
Disallow: /vendor/
Disallow: /styles/
Sitemap: https://zh0ngtian.tech/sitemap.xml
参考
使用 Github Pages 和 Hexo 搭建个人博客(进阶篇)
转载:https://blog.csdn.net/yztzy0018/article/details/106230895