New Document

The Neurotic Fishbowl
切词技术——中文搜索的核心
yangyun 发表于 2005-12-16 20:41:00

切词技术——中文搜索的核心

有个真实的笑话,某人为寻一大师墨宝而软磨硬泡,大师终拗不过,赠字一幅,曰“不可随处小便”,尴尬之时,亏一才子将字切拆,重新组合成“小处不可随便”,某人大喜。通过这个故事,我们可以感到中文的博大精深,估计全世界也没有这么有复杂多变的文字了。所以,中文“搜索引擎”要面对网上庞大的中文信息,除了具有英文“搜索引擎”的特征之外,还需要一些特别的功能,这就是切词技术。
中文搜索引擎重要的是具有中文信息的“切词”功能。西文单词之间用空格分隔,很方便计算机的检索,而中文的字词则不能简单地进行分隔,因此检索起来很麻烦。这个问题的解决需要很高的技术实力。否则会给用户造成很大的麻烦。一般有两种处理方法,一个是完全单汉字全文检索,即将网页中的每一个汉字都录入索引库,而将用户的检索提问根据单汉字匹配的原则去进行检索。此法虽然能够保持有很高的查全率,但由于中文中存在歧义的地方很多,基于字的检索很容易返回一些跟用户输入无关的结果。
另一种是根据一定的原则和方法来对文章进行自动“切词”,然后按词建库,将用户的检索结果按词汇匹配来进行查询,这种处理方法拥有较高的查询命中率,但对“切词”技术的要求极高,中国搜索在这方面具有很强的技术实力。要做好切词,技术是一方面,更重要的是对中文甚至中国文化的深刻理解,没有深厚的中文文化基础是不可能做好中文搜索引擎的,这一点中国搜索比国外的公司(比如GOOGLE)具备先天优势。  

现代常用搜索有:中国搜索(www.zhongsou.com)
                搜狐(www.sohu.com)
                狗狗(www.google.com)
                百度(www.baidu.com.cn)
别看搜索引擎使用起来非常简单,但其后台技术却极为复杂。目前主流搜索引擎都是基于全文检索技术——即根据用户的关键字给出相匹配的网页,所以各搜索引擎的系统结构基本相同,现在就以中搜的搜索引擎为例,简单地把搜索引擎的基本原理做一说明。
搜索引擎大致可分两大循环系统——检索系统和网页抓取系统(非标准名称),网页抓取系统主要作用是收集互联网中的网页数据并存储在数据库中,而检索系统主要是根据网民的要求把储存在数据库中的相关网页提供给用户。
图片详细示例:screen.width-500)this.style.width=screen.width-500;" border=0>


 


灰鸽子的运行原理
yangyun 发表于 2005-12-4 9:01:00

真郁闷,刚才不小心被网页木马给伤着了。看了一下,是灰鸽子。搞了半个来小时才清理干净,也顺便把手动查杀的方法放上来吧......

 

灰鸽子的运行原理

     灰鸽子木马分两部分:客户端和服务端。攻击者操纵着客户端,利用客户端配置生成出一个服务端程序。服务端文件的名字默认为G_Server.exe。G_Server.exe运行后将自己拷贝到Windows目录下(98/xp下为系统盘的windows目录,2k/NT下为系统盘的Winnt目录),然后再从体内释放G_Server.dll和G_Server_Hook.dll到windows目录下。G_Server.exe、G_Server.dll和G_Server_Hook.dll三个文件相互配合组成了灰鸽子服务端,有些灰鸽子会多释放出一个名为G_ServerKey.dll的文件用来记录键盘操作。注意,G_Server.exe这个名称并不固定,它是可以定制的,比如当定制服务端文件名为A.exe时,生成的文件就是A.exe、A.dll和A_Hook.dll。

     Windows目录下的G_Server.exe文件将自己注册成服务(9X系统写注册表启动项),每次开机都能自动运行,运行后启动G_Server.dll和G_Server_Hook.dll并自动退出。G_Server.dll文件实现后门功能,与控制端客户端进行通信;G_Server_Hook.dll则通过拦截API调用来隐藏病毒。因此,中毒后,我们看不到病毒文件,也看不到病毒注册的服务项。随着灰鸽子服务端文件的设置不同,G_Server_Hook.dll有时候附在Explorer.exe的进程空间中,有时候则是附在所有进程中。

灰鸽子的手工检测

     由于灰鸽子拦截了API调用,在正常模式下木马程序文件和它注册的服务项均被隐藏,也就是说你即使设置了"显示所有隐藏文件"也看不到它们。此外,灰鸽子服务端的文件名也是可以自定义的,这都给手工检测带来了一定的困难。
 
     但是,通过仔细观察我们发现,对于灰鸽子的检测仍然是有规律可循的。从上面的运行原理分析可以看出,无论自定义的服务器端文件名是什么,一般都会在操作系统的安装目录下生成一个以"_hook.dll"结尾的文件。通过这一点,我们可以较为准确手工检测出灰鸽子木马。

     由于正常模式下灰鸽子会隐藏自身,因此检测灰鸽子的操作一定要在安全模式下进行。进入安全模式的方法是:启动计算机,在系统进入Windows启动画面前,按下F8键(或者在启动计算机时按住Ctrl键不放),在出现的启动选项菜单中,选择"Safe Mode"或"安全模式"。

    1、由于灰鸽子的文件本身具有隐藏属性,因此要设置Windows显示所有文件。打开"我的电脑",选择菜单"工具"—》"文件夹选项",点击"查看",取消"隐藏受保护的操作系统文件"前的对勾,并在"隐藏文件和文件夹"项中选择"显示所有文件和文件夹",然后点击"确定"。
    2、打开Windows的"搜索文件",文件名称输入"_hook.dll",搜索位置选择Windows的安装目录(默认98/xp为C:\windows,2k/NT为C:\Winnt)。 

    3、经过搜索,我们在Windows目录(不包含子目录)下发现了一个名为Game_Hook.dll的文件。

    4、根据灰鸽子原理分析我们知道,如果Game_Hook.DLL是灰鸽子的文件,则在操作系统安装目录下还会有Game.exe和Game.dll文件。打开Windows目录,果然有这两个文件,同时还有一个用于记录键盘操作的GameKey.dll文件。

     经过这几步操作我们基本就可以确定这些文件是灰鸽子木马了,下面就可以进行手动清除。

 

灰鸽子的手工清除

     经过上面的分析,清除灰鸽子就很容易了。清除灰鸽子仍然要在安全模式下操作,主要有两步:1、清除灰鸽子的服务;2删除灰鸽子程序文件。

    注意:为防止误操作,清除前一定要做好备份。

    一、清除灰鸽子的服务

    2000/XP系统:

    1、打开注册表编辑器(点击"开始"-》"运行",输入"Regedit.exe",确定。),打开 HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services注册表项。

    2、点击菜单"编辑"->"查找","查找目标"输入"G_Server.exe",点击确定,我们就可以找到灰鸽子的服务项。

    3、删除整个G_Server项。

    98/me系统:

     在9X下,灰鸽子启动项只有一个,因此清除更为简单。运行注册表编辑器,打开HKEY_CURRENT_USER\Software\Microsoft\Windows\CurrentVersion\Run项,我们立即看到名为G_Server.exe的一项,将G_Server.exe项删除即可。

    二、删除灰鸽子程序文件

     删除灰鸽子程序文件非常简单,只需要在安全模式下删除Windows目录下的G_Server.exe、G_Server.dll、G_Server_Hook.dll以及G_Serverkey.dll文件,然后重新启动计算机。至此,灰鸽子已经被清除干净。


 


[未分类]一搜排名优化技巧
yangyun 发表于 2005-11-9 17:18:00

 

笔者总结一下以下经验

网站流量 [重要程序 ★★★★★ ]
网站标题 [重要程序 ★★★★★ ]
关键字密度 [重要程度 ★★★★ ]
meta [重要程度 ★★★ ]
关键字链接 [重要程度 ★★★ ]
alt [重要程度 ★★★ ]

总结以上,网站建设是一个重要的环境,网页最好是 1、图+alt产品注释||+文字说明,2、关键字链接,3、标题和mete,4、导航最好是文字导航,突出重点设计,做到网站导航清晰。这样的网站一般都在yisou中有个好的排名。

注:yisou=中文雅虎搜索=3721搜索(3721推广除外)


 


[未分类]网赚100天经验总结
yangyun 发表于 2005-11-6 18:38:00

网赚100天经验总结---四年后再次落伍第一贴(lb)

引子:今天终于落伍了,这是个什么时代!!人家要大搞“保鲜”,我要“落伍”竟这么难,呵呵!

大约在4年前吧,在落伍有个帐号,那段时间到处找免费空间,就找上落伍了,后来忙于其他事情,一段时间没有上落伍,竟忘了id, 晕倒。只好从新人开始。谢谢鱼,从今天开始又落伍了,特花2个小时写下此文向各位大大,小小请教。







一. 网赚100天辛苦历程

99年就开始做站了,时断时停,一直没有考虑网赚。现在想想,应该在做站的一开始考虑网赚。money第一,money有了,香车会有的,美女会有的,面包牛奶也会有的,各位说是不是。

一开始,到im286.com,chinaz.com论坛,四处翻贴子,看看别人的经验。先做Google Adsense。全部做英文广告,每次点击大概有0.2usd, 最高日点出1000usd,可惜,很快,只是高兴了几天,帐号就被k. 收到被k的信时,第一次100多usd支票已经在托收了,心想会不会回票呢. 想不到过了一个半月,银行mm来电话了……帐号被k后,就不再做Google Adsense了。总结经验,google 收入是高,但要能收到,支付周期太长,不能花大力气在这上面,绝对不能一棵树上呆死,否则有可能到时喝西北风去。

于是不做google,开始做国内广告。开始寻找国内的广告联盟。最后主要选择chinavb宽带联盟来做。为什么选chinavb? 感觉chinavb业务比较多,是个比较大的公司,可能比较正规些吧。边做边总结经验,改善网站,开始每天有7个左右,后来国庆前到了日100个左右。国庆后移动整顿,chinavb的移动通道也停了。没有办法,只好再找其他广告联盟,做过彩信,点击,弹窗,引导。这样,100天左右的时间,以电影为主做各种广告,收入总算还勉强过得去。











二. 做过的几个广告联盟点评

chinavb宽带联盟

做过几个月,感觉还可以。每周付款比较准时。客服还还不错。我主要用它的性福全屏代码。



eqifa

扣量严重,对站长不太负责。 在国庆期间放了他三天的酷猴宽频,10万ip竟没有一个量,实在是天大的笑话,即使移动停了也不可能这样的。问了几个客服,没有一点说法。eqifa也有chinavb的宽频。不在chinavb直接做,而在eqifa做二级联盟的话会被扣掉不少量,做过的站长可能知道。

eqifa的优点在于声称周付,10元起付,能吸引一些小鸟及不知情的鸟。反正我是不再做了。

另外,eqifa代码速度比较慢。同时放几个联盟的代码,总是它最后出来。速度慢无非是硬件配置和带宽,说到底是舍不得money,这样的联盟,没有做过,想想也怕。



网微

国庆后chinavb移动停了,eqifa很垃圾,然后做过几个二级,三级的宽带联盟。 我也是现在才知道那些是二级,三级,而不是一级联盟。这些经验都是用money加上时间换来的,宝贵啊。再后来就做网微。感觉网微本身还是不错的联盟,人家欧阳客服做得也不错。网微的缺点在于各项广告分开算,每项要到100才能支付。或许有些广告一试不行,以后就不再做了,那站长就损失了。另外,网微也不大会推销自己。

我主要做网微的九州,觉得在量上不亚于原来做的chinavb(可能这也和后来技巧上的改进有关).不过九州的移动不稳定。时停时开的。网微的点击,引导,弹窗等都做过,有些不怎么样,当然这不能全怪网微,如果数据是广告主返回给联盟,广告主有问题就话,肯定不好做。最好的办法是请教客服,免得自己一个个去试。网微的客服很不错,他会向你推荐哪一个容易上量的。

做过网微的弹窗,3元/1000ip, 能弹统计系统ip数的1半左右,那个广告主肯定有得赚了,我的全是高质量ip, 而且我故意不在页面放同性质点击广告,以免影响弹窗广告主的效益。



智易

有帐号,看各位大侠的贴子,都说结算慢,暂不做。



亚交

正在做,还没有看到报表



七彩谷

试过几万ip, 没有数据,没有再做。



金山

在做剑侠2,聊胜于无吧。



yahoo

做yahoo邮箱和新闻等。新闻虽然价格低,但一天至少几千次的点击,算下来不比邮箱差。



Google Adsense

准备过阵子继续做,反正广告位空着,死马当活马,不作蔽,k不k随它去。如果不被k, Google Adsense肯定是最好的点击广告。



太极链

在网微刚开始做,看看还过得去吧.



领克特

有做的计划。











三. 做广告联盟几个技巧

1. 尽量不做二级联盟,三级联盟。

比如电影联盟,10元一个提成以下的,有很多是二级联盟,三级联盟。这些联盟可能只有一个人,或两三个人在做,有些联盟界面上只有手机,连固话都没有。 还有一个特点,二级联盟的页面都大同小异。你去做二级联盟,或三级联盟,鬼才相信不扣量。据说扣40%还不算太离谱,还算是有良心的。

我原来做过eqifa的乐乐图铃,后来发现乐乐自己有联盟,就直接在乐乐做了。对于乐乐来说,eqifa相当于二级联盟。

2. 突出重点

比如,我做的广告都是以***为主。如电影,一般注册一个提成10元,做点击要点多少次才点得出来!! 现在移动在整顿,有时移动停了,做***的效果会比较差。但总的下来,还是***为主,点击,引导,弹窗等为辅。关于这点,还要视不同的站点而定。

3. 帮助文字非常重要

“懒”是人的天性。人在本质上都懒得思考,懒得动作。认识到这点,我们在做广告时,就要给广告加些适当的文字说明,帮助人家思考嘛,得帮人处且帮人,“好人”肯定有“好报”的。这点非常重要,很多做seo的在做流量上非常勤奋,甚至一天能做几十个垃圾网站。图王说,流量要细分,要让流量真正发挥价值。确实,一方面,要做流量,另外,要让流量的价值最大化,两方面不能偏废。

关于这条,运用之妙存于一心。改进广告帮助文字,给广告加一些说明,可能让同样流量发挥原来两倍甚至以上的价值,做spam多累啊。









四. 关于建站的思考

1. 做什么样的站好? 站长最关心的,最经常问起的可能就是这句话?这是一个永远没有标准答案的问题。每个人的资源不同,眼光不同,执行力不同,势必最适合做的网站也不同。

2. 做长远战略规划还是近期投机 如果投机做短线,不要内容,广告就是内容,这样短期效果最好。但长远做,就要考虑提供丰富内容,提供各种服务来加强粘性,并要加强更新。

3. 网民究竟有多菜——对网民群体的认识。 hao123的成功给许多网络精英上了一堂课,每天有许多人在搜索引擎中打hao123.cn(注意是cn)去找这个看来超简单的网站。不禁要问要问,你真能从hao123的成功中悟到了什么吗?当夜赶制一个网址站,算是领悟吗?这个话题很深,慢慢探讨.

 


CC攻击的思路及防范方法(zt)
yangyun 发表于 2005-10-27 9:45:00

CC攻击的思路及防范方法(zt)

适合读者:DDOS研究员、各大站长、网络管理员

前置知识:ASP基本阅读能力

蝴蝶:前段时间上海一家游戏娱乐公司的网站遭到了基于页面请求的DDOS分布式拒绝服务攻击,网站陷入完全瘫痪状态,并被黑客的匿名信勒索,金额高达10万元,而在勒索过程中,这群黑客还表示会对腾讯QQ等网站下手,随后QQ“服务器维护”几天。12月5号的时候,全球BitTorrent服务器也受到了很强烈的DDOS攻击,一度陷入瘫痪。
……

 


[未分类]收妥贷记和立即贷记两种方式
yangyun 发表于 2005-10-16 8:15:00

招商银行的收费最低为50,最高1000

有收妥贷记和立即贷记两种方式

  招商银行有两种托收方式可供您选择:

立即贷记:是招商银行与国外托收行签订托收协议,约定托收行在收到托收票据的一两个工作日内,先行垫款,贷记招商银行帐,然后向付款人收取款项。一旦付款人拒付,托收行对招商银行行使追索权。招商银行收到托收行的款项后,也立即贷记您的账户,同时也对您保留追索权。此托收方式的特点是收款快、费用低,但存在被追索的风险,较适用于要素齐全、付款人信誉优良的合格票据。
收妥贷记:是国外托收行收到付款人付款后方贷记招商银行帐,招商银行据以贷记您的账户。此方式的特点是收款时间长、费用较高,但款项为最终收妥,不存在被追索的风险。

 


[未分类]robots.txt和Robots META标签
yangyun 发表于 2005-10-12 10:51:00

 

我们知道,搜索引擎都有自己的“搜索机器人”(ROBOTS),并通过这些ROBOTS在网络上沿着网页上的链接(一般是httpsrc链接)不断抓取资料建立自己的数据库。

对于网站管理者和内容提供者来说,有时候会有一些站点内容,不希望被ROBOTS抓取而公开。为了解决这个问题,ROBOTS开发界提供了两个办法:一个是robots.txt,另一个是The Robots META标签。  

一、    robots.txt

1、 什么是robots.txt

robots.txt是一个纯文本文件,通过在这个文件中声明该网站中不想被robots访问的部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定的内容。

当一个搜索机器人访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果找到,搜索机器人就会按照该文件中的内容来确定访问的范围,如果该文件不存在,那么搜索机器人就沿着链接抓取。

robots.txt必须放置在一个站点的根目录下,而且文件名必须全部小写。

网站 URL

相应的 robots.txt URL

http://www.w3.org/

http://www.w3.org/robots.txt

http://www.w3.org:80/

http://www.w3.org:80/robots.txt

http://www.w3.org:1234/

http://www.w3.org:1234/robots.txt

http://w3.org/

http://w3.org/robots.txt

2、 robots.txt的语法

"robots.txt"文件包含一条或更多的记录,这些记录通过空行分开(以CR,CR/NL, or NL作为结束符),每一条记录的格式如下所示:

    "<field>:<optionalspace><value><optionalspace>"

在该文件中可以使用#进行注解,具体使用方法和UNIX中的惯例一样。该文件中的记录通常以一行或多行User-agent开始,后面加上若干Disallow,详细情况如下:

User-agent:

该项的值用于描述搜索引擎robot的名字,在"robots.txt"文件中,如果有多条User-agent记录说明有多个robot会受到该协议的限制,对该文件来说,至少要有一条User-agent记录。如果该项的值设为*,则该协议对任何机器人均有效,在"robots.txt"文件中, "User-agent*"这样的记录只能有一条。

Disallow :

该项的值用于描述不希望被访问到的一个URL,这个URL可以是一条完整的路径,也可以是部分的,任何以Disallow 开头的URL均不会被robot访问到。例如"Disallow: /help"/help.html /help/index.html都不允许搜索引擎访问,而"Disallow: /help/"则允许robot访问/help.html,而不能访问/help/index.html

任何一条Disallow记录为空,说明该网站的所有部分都允许被访问,在"/robots.txt"文件中,至少要有一条Disallow记录。如果 "/robots.txt"是一个空文件,则对于所有的搜索引擎robot,该网站都是开放的。

下面是一些robots.txt基本的用法:

l         禁止所有搜索引擎访问网站的任何部分:
User-agent: *
Disallow: /

l         允许所有的robot访问
User-agent: *
Disallow:
或者也可以建一个空文件 "/robots.txt" file

l         禁止所有搜索引擎访问网站的几个部分(下例中的cgi-bintmpprivate目录)
User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /private/

l         禁止某个搜索引擎的访问(下例中的BadBot
User-agent: BadBot
Disallow: /

l         只允许某个搜索引擎的访问(下例中的WebCrawler
User-agent: WebCrawler
Disallow:

User-agent: *
Disallow: /

3、  常见搜索引擎机器人Robots名字

名称                     搜索引擎

Baiduspider            http://www.baidu.com

Scooter              http://www.altavista.com

ia_archiver             http://www.alexa.com

Googlebot           http://www.google.com

FAST-WebCrawler http://www.alltheweb.com

Slurp                  http://www.inktomi.com

MSNBOT            http://search.msn.com

4、 robots.txt举例

下面是一些著名站点的robots.txt

http://www.cnn.com/robots.txt

http://www.google.com/robots.txt

http://www.ibm.com/robots.txt

http://www.sun.com/robots.txt

http://www.eachnet.com/robots.txt

5、 常见robots.txt错误

l         颠倒了顺序:
错误写成
User-agent: *
Disallow: GoogleBot

正确的应该是:
User-agent: GoogleBot
Disallow: *

l         把多个禁止命令放在一行中:
例如,错误地写成
Disallow: /css/ /cgi-bin/ /images/

正确的应该是
Disallow: /css/
Disallow: /cgi-bin/
Disallow: /images/

l         行前有大量空格
例如写成
        Disallow: /cgi-bin/
尽管在标准没有谈到这个,但是这种方式很容易出问题。

l         404重定向到另外一个页面:
Robot访问很多没有设置robots.txt文件的站点时,会被自动404重定向到另外一个Html页面。这时Robot常常会以处理robots.txt文件的方式处理这个Html页面文件。虽然一般这样没有什么问题,但是最好能放一个空白的robots.txt文件在站点根目录下。

l         采用大写。例如
USER-AGENT: EXCITE
DISALLOW:
虽然标准是没有大小写的,但是目录和文件名应该小写:
user-agent:GoogleBot
disallow:

l         语法中只有Disallow,没有Allow
错误的写法是:
User-agent: Baiduspider      
Disallow: /john/
allow: /jane/

l         忘记了斜杠/
错误的写做:
User-agent: Baiduspider      
Disallow: css

正确的应该是
User-agent: Baiduspider      
Disallow: /css/

下面一个小工具专门检查robots.txt文件的有效性:

http://www.searchengineworld.com/cgi-bin/robotcheck.cgi

二、          Robots META标签

1什么是Robots META标签

Robots.txt文件主要是限制整个站点或者目录的搜索引擎访问情况,而Robots META标签则主要是针对一个个具体的页面。和其他的META标签(如使用的语言、页面的描述、关键词等)一样,Robots META标签也是放在页面的<head></head>中,专门用来告诉搜索引擎ROBOTS如何抓取该页的内容。具体的形式类似(见黑体部分):

<html>

<head>

<title>时代营销--网络营销专业门户</title>

<meta name="Robots" content="index,follow">

<meta http-equiv="Content-Type" CONTENT="text/html; charset=gb2312">

<meta name="keywords" content="营销… ">

<meta name="description" content="时代营销网是…">

<link rel="stylesheet" href="/public/css.css" type="text/css">

</head>

<body>

</body>

</html>

2Robots META标签的写法:

Robots META标签中没有大小写之分,name=”Robots”表示所有的搜索引擎,可以针对某个具体搜索引擎写为name=”BaiduSpider”content部分有四个指令选项:indexnoindexfollownofollow,指令间以“,”分隔。

INDEX 指令告诉搜索机器人抓取该页面;

FOLLOW 指令表示搜索机器人可以沿着该页面上的链接继续抓取下去;

Robots Meta标签的缺省值是INDEXFOLLOW,只有inktomi除外,对于它,缺省值是INDEX,NOFOLLOW

这样,一共有四种组合:

<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">

<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">

<META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW">

<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">

其中

<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">可以写成

<META NAME="ROBOTS" CONTENT="ALL">

<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">可以写成

<META NAME="ROBOTS" CONTENT="NONE"> 

需要注意的是:上述的robots.txtRobots META标签限制搜索引擎机器人(ROBOTS)抓取站点内容的办法只是一种规则,需要搜索引擎机器人的配合才行,并不是每个ROBOTS都遵守的。

目前看来,绝大多数的搜索引擎机器人都遵守robots.txt的规则,而对于Robots META标签,目前支持的并不多,但是正在逐渐增加,如著名搜索引擎GOOGLE就完全支持,而且GOOGLE还增加了一个指令“archive”,可以限制GOOGLE是否保留网页快照。例如:

<META NAME="googlebot" CONTENT="index,follow,noarchive">

表示抓取该站点中页面并沿着页面中链接抓取,但是不在GOOLGE上保留该页面的网页快照。

 


[未分类]控制百度收录的数量的一个meta
yangyun 发表于 2005-10-12 10:47:00

<meta name="BaiduSpider" content="index, follow">
<meta name="googlebot" content="noindex, nofollow">

 


[未分类]亲爱的你怎么不在我身边
yangyun 发表于 2005-10-9 11:12:00

这里的空气很新鲜
这里的小吃很特别
这里的latte 不像水
这里的夜景很有感觉
在一万英尺的天边
在有港口view的房间
在讨价还价的商店
在凌晨喧闹的三四点
可是亲爱的你怎么不在我身边
我们有多少时间能浪费
电话再甜美传真再安慰
也不足以应付不能拥抱你的遥远
我的亲爱的你怎么不在我身边
一个人过一天像过一年
海的那一边乌云一整片
我很想为了你快乐一点
可是亲爱的你怎么不在身边
在一万英尺的天边
在有港口view的房间
在讨价还价的商店
在凌晨喧闹的三四点
可是亲爱的你怎么不在我身边
我们有多少时间能浪费
电话再甜美传真再安慰
也不足以应付不能拥抱你的遥远
我的亲爱的你怎么不在我身边
一个人过一天像过一年
海的那一边乌云一整片
我很想为了你快乐一点
可是亲爱的你怎么不在我身边


 


如何开启xp2000的iis fso
yangyun 发表于 2005-10-9 9:08:00

主要是Scripting.FileSystemObject (FSO 文本文件读写)被关闭了,开启FSO功能即可,在“运行”中执行regsvr32 scrrun.dll

 


首页 上一页 下一页 尾页 页次:1/15页  10篇日志/页 转到:

 
 



The Neurotic Fishbowl

.: 公告


Bloginess

<<  < 2005 - 12 >  >>
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

.: 我的分类(专题)


In the Bowl

.: 最新日志


.: 最新回复


The Fishkeeper



Text Me

.: 留言板


Other Fish in the Sea

.: 链接

处理 SSI 文件时出错




Powered by Oblog.