1、 建议把与网站主题相关的文字呈现在首页,以便抓取课程相关关键词;(根据广度优先
原则)
2、 增加外链,以便使搜索引擎通过外部网站发现我们的网站; 3、 利用搜索引擎提供的网站登录入口,向搜索引擎提交网站域名; 4、 文章至少有30%部分为原创,并且分布均匀; 5、 文件不得过大,否则搜索引擎可能会放弃索引; 6、 关键词尽量选用常规的、被词典收录的词;
7、 将网站经常更新的部分固定在相对稳定的位置,以便实现增量抓取; 8、 将页面按照类别或性质分类,可提高实时性,增强页面抓取的灵活性。
【页面分析】
1、 增加关键字匹配度(需要包含关键字,并且出现一定次数); 2、 密度适中;
3、 增加分布值(第一段和最后一段出现关键字);
4、 通过利用不同的HTML标签去标准页面中需要突出的内容,以增加标签权重值;
5、 页面相关性计算公式W(relevance)=W(match相关性)+W(density密度值)+W(position
分布值)+W(tag标签权重值); 6、 页面权重值(page)=页面相关性值(relevance)+链接权重值(link)+用户行为得分(user); 7、 增加外链,外链的权重值高于内链。
【关键字】
1、 了解用户搜索相对频繁的关键字,并添加到网站;
2、 可通过站长工具查询关键字密度,随时检查其合理程度;(关键字密度在6%-8%较为合
理);
3、 利用辅关键字增加主关键字词频,进行补充说明,还可避免主关键字堆砌;
4、 让主关键字优先出现在标题及描述内容的最前面(搜索引擎是由上至下=由左向右进行
搜索的);
5、 在网页正文中,相对重要的是网页的最顶部和最底部,即接近标签
和的位置;
6、 在网页中,左上区域的关键字词频要比右下区域大;
7、 选择符合用户搜索习惯的关键字,否则页面相关性会大大降低;
8、 通过加粗、斜体颜色等权重标签突出关键字的重要性,提高页面相关性;
9、 Google PR值是衡量页面权重的重要指标,可以反映网站结构、页面结构的合理性、内
外部链接的数量及质量。还可通过百度权重查询,系数越高,权重越高。
【URL优化】
1、 命名:与页面内容相关
2、 要想使用关键字的汉字形式对URL进行命名,则要求Web服务器支持以中文名称访问
相应的目录或文件;
3、 拼音形式的URL比汉字形式的更受重视;
4、 英文命名形式中,组成词组的单词之间必须使用分隔符; 5、 URL中横杠“-”、空格符“%20”都当作空格符号处理; 6、 横杠比空格“ ”及下划线“_”都好;
7、 反斜杠“/”只能作为URL中目录之间或者目录与文件名之间的分隔符,而不能作为名称; 8、 URL越短,得到的权重越高;
9、 域名使用时间越久、过期时间越晚,则权重越高;
10、 使用子域名的方式比主域名+目录的方式更具优势,得到的权重更高; 11、 避免URL重定向(Page74)。
【代码优化】
1、 清理垃圾代码(常见的有空格、默认属性、注释语句、空语句等); 2、 短标签替换长标签;
3、 改变CSS的调用方式,避免使用CSS为重要内容定义样式; 4、 CSS页面头部调用:把需要使用的CSS样式内容直接放置在页面的头部(
区域);
5、 使用DIV+CSS方式制作页面,既可以防止垃圾代码的产生,也可以减少重复代码; 6、 JavaScript代码冗长,执行效率远低于HTML,目前搜索引擎并不节气JavaScript生成的
页面或内容;
7、 JavaScript外部调用(把JavaScript内容存放到一个JavaScript文件里,再在页面中进行
调用)既不占用页面重要的位置,又可以精简大量代码,加快页面显示速度;
8、 表格优化:让表格之间保持独立,即把所有的小表格及内容从大表格中抽离出来,页面
内容就会分散到小表格中,代码量就会大大减小;
9、 一个页面的体积保持在100KB左右对于搜索引擎最为友好;
10、 搜索引擎更加重视页面中前100KB的页面,也就是说,如果网站上部分的页面保持在
100KB左右,被搜索引擎收录的机会就会增加。
【title、关键字优化】
1、 在title中,主关键字的词频并非越高越好,而是出现在3次以内比较合理,每个辅关
键字出现1次比较好;
2、 Title的分隔符中,竖杠>空格>逗号>不存在分隔符;
3、 若页面中辅关键字较多,则应删除辅关键字中的某些部分,如
手机论坛
4、 在description中,主关键字出现5次左右、每个辅关键字出现1次比较合理。
【图片优化】
1、 使用与图片内容相关的关键字作为图片名称; 2、 用alt属性简单地描述图片里的产品;
3、 如果图片色彩复杂,那么JPG格式可以节省空间,如色彩单调,则GIF格式节省空间; 4、 用Image Optimizer压缩图片比PS更好。
【网页结构】
1、 页面中各个区域的重要性关系:左上>右上>左>右>左下>右下; 2、 隐藏层是指通过移动鼠标或点击相应区域才能显示的内容,目前所有搜索引擎都能识别
隐藏层中的内容;
3、 隐藏层内容调用方式主要有内部调用(把隐藏层内容放在当前页面,当触发相应事件时,
就直接从当前页面中进行调用并显示)和外部调用(把隐藏层内容放到外部文件里,只有当时间出发后才调用并显示)。
4、 内部调用会大大增加页面的体积,加长页面加载时间,不管对搜索引擎还是用户都是不
友好的。此外,如果用JavaScript调用内容,则这部分内容对于绝大多数搜索引擎都是不可见的。
5、 外部调用可在页面有限的空间里展示更多重要的内容,还不会改变当前页面体积,可是
搜索引擎会对外部调用的内容进行单独处理,且内容加载速度很慢,影响用户体验。 6、 使用隐藏层时,应把相对重要的内容放到默认显示层,次要内容放在隐藏层。与页面不
相关的隐藏层内容最好通过外部或JavaScript进行调用;
7、 搜索引擎并不重视Flash文档,因此在进行页面优化时可通过对页面的标题、描述及关
键字标签内容进行调整,或在同一页面中增加与主题相关的内容;
8、 由Frame框架构建的页面叫框架页面,由于它是独立的,因此可以把重复的内容固定
在同一位置上,这样,当用户发出新页面的访问请求时,只需返回变化的部分即可; 9、 对于框架页面,搜索引擎在抓取时会先分析主页面,并从中提取子页面的URL,再根据
这些URL抓取到子页面,即搜索引擎对框架页面中的主、子页面是单独抓取的; 10、 对于某些不支持框架页面的浏览器,打开框架页面后看不到任何有价值的信息,此时
可以通过设置 11、 搜索引擎在对框架页面进行分析时,会对