站长资讯 | 站长常用软件 | 站长工具 | 为奥运祝福!
文章投稿 当前位置:主页>网站运营>网站推广>文章:搜索引擎优化专栏—PDF文件的优化

搜索引擎优化专栏—PDF文件的优化

来源:互联网 作者:站长资讯 发布时间:2007-03-06 阅读次数:  

PDF(Portable Document Format)是Adobe公司开发的电子文件格式,使用工业标准的压缩算法,易于传输和储存,且可在各种操作系统平台中通用,因而成为网络上电子文档发行和数字化信息传播的理想文档格式。目前PDF已发展成为数字化信息的一个事实上的工业标准。

PDF具备许多其它电子文档格式无法相比的种种优点,如可将文字、字型、格式、颜色及独立于设备和分辨率的图形图像等封装在一个文件中,亦可包含超链、声音和动态影像等电子信息,并逐渐成为出版业中的新宠。越来越多的电子书籍、产品说明、技术文档等都开始使用PDF格式。

迄今为止,大多数主流搜索引擎都能支持对PDF格式文件的信息检索,但在搜索引擎的排名算法中PDF文件还没有HTML文件那么得宠,不过既然搜索引擎已然熟悉到PDF的使用普及性,相信这一状况会逐渐得到改善。

熟悉到这一点,对网站上所提供的PDF格式的电子图书、产品说明或技术文档等信息资料进行适当的优化,无疑是从搜索引擎那里争取更多访问量的一条出路。

1. PDF文件的优化

在将文件转换成PDF文件前,我们可先进行下面这样一些优化:

A. 内容的优化

假如使用的是象MS WORD这样的文字处理软件,则可在文件转换成PDF格式前对内容进行适当优化,优化步骤与普通的HTML文件基本相同:诸如在标题和内容中适当包含要害词,丰富内容的相关性,对标题使用H1、H2、H3格式,内容中重要部分以粗体或大字号显示,等等。完成优化后再把文件转换为PDF格式,然后放到网站的相应内容下供搜索引擎检索。

B. 文件属性的优化

Adobe Acrobat6.0版提供了两个地方供用户自行设置文件属性,我们可利用这一点对对文件属性进行相关性优化:



由于上述两种途径有一些相同设置区域,所以我们有必要了解一下PDF文件是如何存储这些数据的。这一点也能更好地帮助我们猜测搜索引擎如何读取这些数据。



2.两组要害词重要性分析

可以看出,上述两种途径虽然在标题、作者、文章描述这些地方相通,但在要害词上却各自独立,互不影响。那么,哪种要害词最可能得到搜索引擎的关注呢?



按照这种形式看来,搜索引擎更有可能抓取的是“文件属性说明”下的要害词区域中的信息。所以我们建议在这个区域上列出网站最主要的相关要害词。

3.这些信息在搜索引擎中发挥的作用

对于Google和雅虎这两大搜索引擎来说,对于搜索结果中出现的PDF文件列表,Google用PDF文件属性中的“标题”内容作为列表标题。雅虎原来是用PDF正文中出现的最大字号的内容作为标题,但从最近收录的一些PDF文件来看,它也开始采用和Google相同的做法。至于描述,这两大搜索引擎均未使用“文件属性”中的描述/主题信息,而是从正文中随机抽取内容来组成各自特色的描述内容。

从这一点看起来,对PDF文件属性中的“标题”和正文的优化是必不可少的。至于要害词和描述,虽然Google会象对待HTML中的要害词和描述一样忽略掉这两项内容,但目前对雅虎来说还是有效的。

4.PDF的优化意义

我们有理由相信,PDF信息在搜索引擎检索上存在的缺陷只是一个时间问题。随着搜索引擎的搜索功能愈来愈强大,也许不久以后它们就能够象检索HTML文件一样实现对PDF全文信息的检索。另外一方面,Adobe公司可能也会审时度势,开发出相应的补丁程序来弥补这一缺陷,进而改善PDF格式对搜索引擎的友好性。相信不久以后的将来,PDF这个印刷业的新宠儿必将在搜索引擎优化中占据一席之地。亲爱的朋友们,你们预备好了吗?




文章地址:   http://www.xinasp.com/html/wangzhanyunying/wangzhantuiguang/20070306/5491.shtml
tag: 优化 文件 专栏 搜索引擎
    评论加载中…
关于站点 - 广告服务 - 联系我们 - 版权隐私 - 免责声明 - 成员列表
© CopyRight 2002-2008, XINASP.COM, Inc. All Rights Reserved 客服QQ:762264 MAIL:QESY#163.COM
浙ICP备06014044号