有关网站URl的静态化处理分析
大家都知道,随着asp,php,asp.net,jsp等语言的迅速普及,网站进入了动态化阶段。早期,纯html网页的网站一去不复返了,现在的网站都有自己的数据库可以动态添加内容,前台的URL大都也具有了用"?"和"&"组成的一系列参数。虽然随着搜索引擎技术的提供,对URL参数的处理越来越好,但是毫无疑问,静态化的URL更适合百度蜘蛛的胃口,因为URL中参数过多很有可能让搜索引擎进入死循环而无法跳出,造成百度蜘蛛对抓取网页的极度反感。
静态化处理有效的解决了URL对搜索引擎友善的问题。比如newsmore.asp?id=248这样的链接,如果写成newsmore-248.html,便会显得非常的简洁,而且对搜索引擎更加的友善。静态化处理大体分为两种,分别是真静态和伪静态。还是按照上面的例子,真静态意味着,服务器上真实的产生了newsmore-248.html这个文件,用户访问时直接访问的是这个文件。真静态的好处是,不用每次访问这个页面都需要数据库读出信息,对数据库来说减少了操作次数,打开速度更快。但是频繁生产html真实的文件,加大了服务器的占用空间和硬盘操作,但是随着硬件性能的提高,这方面的顾虑正在变得不那么重要。
还有一种静态化的手段是伪静态处理。这个技术需要服务器支持,如果不支持的话就没有办法进行操作。伪静态的本质实际上就是URL转发而已。就像上面的例子,用户单击链接看到的是newsmore-248.html这个URL,但是这个URL并不真实存在啊,只是鼠标点击这个URL后,URL转发机制让这个过程看起来是执行html文件,实际上执行的是newsmore.asp?id=248这个动态文件。所以说,每次执行,对数据库的访问和平时访问动态文件是没有区别的。只是百度蜘蛛看到的是html静态文件,对用户和搜搜引擎更友好而已。但是对服务器,数据库和系统而言,对性能没有任何的改善。
电脑访问:有关网站URl的静态化处理分析