sitemap详解(什么是sitemap)

       一般,有两种类型的Sitemap:
1、通常按部分列出您网站网页的HTML网页,以帮助用户查找所需要的信息;
2、以XML的形式存在,即XML Sitemap,通常Sitemap的第一个字母为大写。
那么Sitemap到底有何用处(这是我们最为关心的问题)?
Sitemap是为了方便让我们站长或者网站管理员通知搜索引擎抓取我们网站哪些可供抓取的网页。
制作Sitemap,并提交给搜索引擎可以使网站的内容尽可能快的被收录,包括那些隐藏比较深的页面。这是一种网站与搜索引擎对话的好方式。
这里值得注意的是:使用 Sitemap并不能保证网页会包含在搜索引擎中,但可向搜索引擎提供一些提示以便它们更有效地抓取网站。
   或许大多数站长跟网站运营者都不是技术出身,因此这里有必要提一下的是上文说到的XML格式,想进一步了解的人可以通过这里XML详细介绍了解。  
我们来看看谷歌是如何教大家用Sitemap的:
如果网站属于下列情况,那么 Sitemap 会特别实用:
· 网站含动态内容。
· 网站有不容易被 Googlebot 在抓取过程中发现的页面,如有大量富 AJAX 或 Flash 内容的页面。
· 网站为新网站且指向网站的链接不多。 (Googlebot 会跟随链接从一个网页到另一个网页抓取网络,因此,如果您的网站没有很好地链接,我们可能很难发现它。)
· 网站有大量内容页存档,这些内容页相互没有很好地链接,或根本就没有链接。
您还可以使用 Sitemap 向 Google 提供有关您网页的其他信息,包括:
· 您网站上网页的更改频率。 例如:您可能每日都更新产品页,但每几个月才更新"我的简介"页一次。
· 各网页上次修改的日期。
· 您网站上各网页的相对重要性。 例如:主页的相对重要性为 1.0,类别页的相对重要性为 0.8,而个人博客条目或产品页的相对重要性则为 0.5。这个优先级只是说明特定网址相对于您网站上其他网址的重要性,并不会影响您的网页在搜索结果中的排名。
   谷歌最后补充道:Sitemap是一种常规网络抓取内容的补充,谷歌只是希望能通过Sitemap帮助他们抓取到更多的内容,但不保证Sitemap中的地址都会出现在搜索结果中,并且不会因为提交Sitemap而受到惩罚。
   详细的大家可以参见谷歌网站管理员/站长中心:   http://www.google.cn/support/webmasters/bin/answer.py?answer=40318
按照 sitemaps.org 的规定,Google、Yahoo! 和 Microsoft 在内的众多搜索引擎厂商都采用Sitemap 协议 0.9,该协议是依据创意公用授权-相同方式共享 (Attribution-ShareAlike Creative Commons License) 的条款提供的。
当然谷歌这位老大哥还推出了自己专用的Sitemap格式,如:视频 Sitemap 、移动 Sitemap 、 资讯 Sitemap 、 代码搜索 Sitemap 及 地理 Sitemap。这些的专用的知识,用户如有兴趣了解可以点击上面的链接进去,有详细的介绍。
所谓无规矩不成方圆,几乎各大搜索引擎厂商都遵循Sitemap协议,但是对于百度这位大佬来讲,说他也支持Sitemap并不是很准确的说法。为什么呢?看看百度官方的描述,他们有一个自己的名字——《互联网新闻开放协议》。没转过弯过来的,或者是叫着别扭的朋友,我们就先叫它为Baidu Sitemap吧,或许这样叫对于我们广大站长来讲会更亲切些。呵呵.~~!
百度对这个《互联网新闻开放协议》的描述是这样的(如下):
《互联网新闻开放协议》是百度新闻搜索制定的搜索引擎新闻源收录标准,网站可将发布的新闻内容制作成遵循此开放协议的XML格式的网页(独立于原有的新闻发布形式)供搜索引擎索引。
咋一看,人家百度开放这个协议主要是针对新闻类的,也许有人会觉得这跟我们没有多大关系吧。那么我们先假设这么一个结果,就是你的这个网站通过了百度的这个协议的核查,(因为你的网站肯定也是有新闻的),这样百度就会时常关照下你这个XML信息,那么你觉得你的网站除了新闻类的信息是否有更大的机会被百度爬走呢?应该说网站不管哪部份内容先被搜索引擎认定了、友好了,或多或少会带动整个网站的发展。
当然如果你是一个很懒的垃圾站的站长,连采集回来的内容都懒得伪原创下的话,那建议还是别提交百度的这个Sitemap了。百度较别的搜索引擎要求更为严格些。据说还有可能面临被K的命运。反过来,如果你对你的站有信心,做得足够好,那么提交试试,或许对你的帮助还是挺大的(谁不想得到搜索引擎的青睐啊,呵呵,提外话)。
下面来看看,分析下百度与google等其他搜索引擎关于Sitemap的不同与相同点:
首先又对不想大家的是:由于篇幅的问题,对于Sitemap的XML标签的解释就拉到独立页面去阐述,望见谅。Baidu Sitemap XML详解   google等Sitemap XML详解
相同的是:都是采用XML格式来表述的
不同的是:两者XML标签命名没统一,提交的东西也不一样(废话,提交东西一样的话,那还区分个啥啊,。。。哈)。
谷歌等其他搜索引擎的提交的Sitemap只要告诉他们,需要收录哪些地址即可,其他的就搜索引擎自己完全。
而百度呢,告诉这些后,还要告诉他内容,图片,分类等等。(看起来相当的不智能,不理想,也许他们有人工干涉,呵呵,这是我的猜想……)
谷歌等的Sitemap内容,我们没啥异议,因为太简单了。我们重点看下百度的,这里有一图百度官方的截图:

怎么样,这个XML看起来更像订阅RSS的那个XML,最大的一个特点就是我们必需把文章的内容放置到<text></text>之中。或许这样做,真的方便了百度的后台管理工作,但你想过一个问题没有,这样做,极大地方便了那群靠采集为生的垃圾站的站长们,因为只要知道你这个XML文件,那采集就跟抽根烟那么简单。(能开发经验的人都知道,分析一个XML比分析一个HTML简单上千倍)。

当然这里并不是建议广大站长靠这个去采集别人的文章,建站就要像培养一个儿子一样认真对待,以后才能给你带来源源不断的。文章贵精不贵多,采集不可取。

最后:

Sitemap、互联网新闻开放协议的生成与得交

文件的生成:

网上有许多生成工具,在线的与不在线的,下面列举几个:

http://free-sitemap-generator.whyandhow.org/

http://www.alichaxun.com/sitemap/

http://www.googlechinawebmaster.com/2009/01/sitemap.html

老虎Sitemap生成器

http://www.sitemap-xml.org/

等等很多。

向搜索引擎提交:

GOOGLE:创建一个谷歌账户,登陆,点击进入用户管理中心,然后点击:网站管理员工具。

首先添加你的网址例如http://www.seo0592.com ,添加成功以后,在网址的对应项后面点击添加,打开sitemap的添加页面,选择下拉菜单,选择普通网站地图,下面出现文本表单,在空白表单后面添加sitemap.xml,然后点击提交。

百度:http://news.baidu.com/newsop.html

Yahoo!:http://sitemap.cn.yahoo.com/

……

发表评论?

0 条评论。

发表评论