SEO祥子博客

深圳SEO顾问|SEO专家|深圳SEO优化|搜索引擎优化SEO|网站SEO数据分析|SEO外包服务。

收藏:WINDOWS批量删除海量指定大小的文件

祥子博客用的Windows Server,博客运行几年后产生了海量的小文件缓存内容(大约有400万左右缓存文件)。经测试,祥子用以下这句批量删除指定大小(小于1K)的文件,实测有效:for /r "K:\76" %i in (*) do @(if %~zi lss 1024 del /f "%i") 。

Phthon Django框架WEB开发:一个菜鸟的入门心得

花了两个月,Python Django学习告一段落,而纯粹基于python Django框架全手工开发的网站明天就能上线了(虽然只是个辣鸡网站)。在django web开发的学习路上,踩过很多坑,不过终于完成开发了,而我的“足球粉丝网”明天即将上线。

非科班出身,我自学过ASP、PHP、Python,而学习Python之路是其中最令我有满足感,最令我快乐的学习过程。基于非常强大的库调用,使用Django框架开发网站效率非常之高,而数据采集模块更令人着迷。

Python也有机会成为未来互联网开发的大方向之一。前车之鉴,在此分享我在学习Python Django框架中踩过的坑和以实用的入门文档,希望能帮到想用Django做数据采集和WEB开发的朋友(附我收藏的所有实用文档和避坑宝典)。

原创:django配置根目录访问静态文件favicon.ico 返回状态要200不要302

一般前端开发者都不会在意favico.com放在什么目录,是否经历了跳转。但是,对一名SEO专家来说,祥子不希望页面请求不能有任何跳转。所以,就有了下面这个办法:Django使用HttpResponse返回图片并显示。这可能是django项目把静态文件放在根目录,能正常访问并返回200状态的唯一方法。根目录访问favicon.ico并返回200状态的使用实例:

favicon.py:

from django.http import HttpResponse

g_resources.DistributionNotFound: The pytz distribution was not found and is required by Django

最近正在学Python WEB开发,刚装好Python,PyCharm,Django。准备入手正式学习,在创建第一个django项目时需要先行初始化。在输入初始化指令时报错:pkg_resources.DistributionNotFound: The 'pytz' distribution was not found and is required by Django。

初始化Django项目:django-admin startproject HelloWorld

一文看懂robots怎么写:蜘蛛协议robots.txt写法实例详解

robots.txt是SEO同行们在制定一个网站优化方案时需要首要考虑的一个问题,任何网站进行SEO优化前,你需要首先写一个非常规范的robots.txt。robots怎么写,这几乎是你制定SEO优化方案、提升你网站SEO表现最具性价比的工作,没有之一。robots.txt是什么?robots.txt(统一小写)是一种存放于网站根目录下的ASCII编码的文本文件(其实UTF-8也没任何问题),它通常告诉网络搜索引擎的漫游器(又称网络蜘蛛),此网站中的哪些内容是不应被搜索引擎的漫游器获取的,哪些是可以被漫游器获取的。因为一些系统中的URL是大小写敏感的,所以robots.txt的文件名应统一为小写。robots.txt应放置于网站的根目录下。如果想单独定义搜索引擎的漫游器访问子目录时的行为,那么可以将自定的设置合并到根目录下的robots.txt,或者使用robots元数据(Metadata,又称元数据)。


Robots协议

SEO常识:不同HTTP返回码搜索引擎如何处理

HTTP常见返回状态表现在用户端通常是网页能打开、网不能访问。页反馈在搜索引擎的蜘蛛程序则会表现在具体的状态码,如我们通常知道的:200表示正常访问、301为永久重定向、302临时重定向、404页面无法访问、501服务器故障 等等。那么,搜索引擎蜘蛛发起访问时,对于不同的HTTP返回状态是如何处理呢?2xx(200访问成功):HTTP 结果代码,表示成功的“有条件地允许”抓取结果。3xx(访问被重定向):一般情况下,系统会跟踪重定向,直到发现有效的结果(或确认出现循环)。我们会跟踪有限次数的重定向(适用于 HTTP/1.0 的 RFC 1945 最多允许 5 次重定向),然后便会停止,并将其处理为 404 错误。我们并未定义如何处理指向禁止网址的 robots.txt 重定向,并且不建议用户这么做。同样,我们也未定义如何根据返回 2xx 的 HTML 内容处理 robots.txt 文件的逻辑重定向(框架、JavaScript 或元刷新型重定向),并且不建议用户这么做。

【谷歌蜘蛛名称大全】绝对不仅仅只是你知道的Googlebot

正如所有国内SEO所知,百度蜘蛛名称叫作BaiduSpider,而谷歌蜘蛛名称叫作GoogleBot。但是不限于此,谷歌不同产品的抓取UA(User-Agent)是不一样的。可以理解为每个产品都是独立项目在运行。当然,它们的名称也可能是一样,比如谷歌PC版蜘蛛和移动端蜘蛛的名称都是Googlebot。以下为谷歌所有产品抓取工具的蜘蛛名称(谷歌官方称之为:用户代理令牌或产品令牌)与User-Agent(完整的用户代理字符串)。

PHP正则表达式匹配所有中文汉字内容

大多数SEO一般不会用到正则表达式,除了在为网站写伪静态规时。不过,如果你的网站要自动处理大量内容,可能最简单正则使用尚无法满足你的需要。今天,祥子在测试内容抓取并是进行文字处理时,需要过滤所有带有汉字的行,所以就有了这个:匹配所有带有中文字符的行(即有汉字的行 ),实测正确的正则表达式为:(.*)[^\x00-\xff](.*)。另外几句常用正式分享:

SEO行业

2019年四大SEO行业趋势

1、语音搜索;2、品牌打造和转化;3、用户体验;4、网站安全。

SEO全国

SEO(Search Engine Optimization):

SEO汉译为搜索引擎优化。是一种方式:利用搜索引擎的规则提高网站在有关搜索引擎内的自然排名。目的是:为网站提供生态式的自我营销解决方案,让其在行业内占据领先地位,获得品牌收益;SEO包含站外SEO和站内SEO两方面;为了从搜索引擎中获得更多的免费流量,从网站结构、内容建设方案、用户互动传播、页面等角度进行合理规划,还会使搜索引擎中显示的网站相关信息对用户来说更具有吸引力。
«123456789101112131415»
最近发表
本月最热文章
最新留言
控制面板
Tags列表

Powered By Z-Blog 2.1 Phoenix Build 130128

SEO祥子博客: 是一个分享SEO经验,关注搜索引擎算法、网站分析、WEB趋势、建站与运营的博客。是一个值得搞网站的人关注的原创SEO博客。
深圳SEO祥子是深圳知名的深圳SEO技术顾问与搜索引擎优化SEO专家,曾任职于日IP超十万级体育网站的SEO技术总监。祥子深圳SEO博客目前专注百度与谷歌搜索引擎优化SEO技术研究。作为一名专注技术流的SEO专家祥子很忙的,没有时间承接深圳SEO外包项目与各种SEO顾问服务。深圳祥子SEO博客是一个分享SEO技术、SEO优化技巧、SEO数据分析技术的SEO博客。SEO全国 SEO行业
导航: 1 50 150 250 350 450 550 650 750 850 950 1050 1150 1250 1350 1450 1550 1650 1750 1850 1950 2050 2150 2250 2350 2425
| QQ:50208986 | SEO祥子 在G+订阅 RSS 2.0粤ICP备15051338号-1

友情链接

  • 免费培训
  • SEO博客