Archive for 10月, 2008
如何用命令行查看DNS和开放端口
NSLOOKUP查看DNS
nslookup
Default Server: www.murray.cn
Address: 202.99.160.68
>server 202.99.41.2 则将DNS改为了41.2
> www.murray.com
Server: ns.hesjptt.net.cn
Address: 202.99.160.68
Non-authoritative answer:
Name: www.murray.com
Address: 202.99.160.212
nbtstat探测对方对方计算机名,所在的组、域及当前用户名
nbtstat -a 192.168.10.146
netstat -a 显示出计算机当前所开放的所有端口
netstat -s -e 比较详细的显示你的网络资料,包括TCP、UDP、ICMP 和 IP的统计等
探测arp绑定(动态和静态)列表,显示所有连接了我的计算机,显示对方IP和MAC地址
arp -a
搜索引擎技术研究之技术组成
一个搜索引擎主要包括搜索器、索引器、检索器和用户接口等
搜索器是用于在互联网中漫游,发现和搜集信息。
它常常是一个计算机程序,日夜不停地运行。它要尽可能多、尽可能快地搜集各种类型的新信息,同时因为互联网上的信息更新很快,所以还要定期更新已经搜集过的旧信息,以避免死连接和无效连接。它搜集的信息类型多种多样,包括HTML、XML、Newsgroup文章、FTP文件、字处理文档、多媒体信息。分布式、并行计算技术,使信息发现和更新的速度得到提高。商业搜索引擎的信息发现可以达到每天几百万网页。?
索引器主要用于理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表。?
索引项有客观索引项和内容索引项两种:客观项与文档的语意内容无关,如作者名、URL、更新时间、编码、长度、链接流行度(Link Popularity)等等;内容索引项是用来反映文档内容的,如关键词及其权重、短语、单字等等。内容索引项可以分为单索引项和多索引项(或称短语索引项)两种。单索引项对于英文来讲是英语单词,比较容易提取,因为单词之间有天然的分隔符(空格);对于中文等连续书写的语言,必须进行词语的切分。
索引表一般使用某种形式的倒排表(Inversion List),即由索引项查找相应的文档。索引表也可能要记录索引项在文档中出现的位置,以便检索器计算索引项之间的相邻或接近关系(proximity)。
索引器可以使用集中式索引算法或分布式索引算法。当数据量很大时,必须实现即时索引(Instant Indexing),否则不能够跟上信息量急剧增加的速度。索引算法对索引器的性能(如大规模峰值查询时的响应速度)有很大的影响。一个搜索引擎的有效性在很大程度上取决于索引的质量
检索器的功能是根据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。
检索器常用的信息检索模型有集合理论模型、代数模型、概率模型和混合模型四种。
?
用户接口的作用是输入用户查询、显示查询结果、提供用户相关性反馈机制。
主要的目的是方便用户使用搜索引擎,高效率、多方式地从搜索引擎中得到有效、及时的信息。用户接口的设计和实现使用人机交互的理论和方法,以充分适应人类的思维习惯。
用户输入接口可以分为简单接口和复杂接口两种。简单接口只提供用户输入查询串的文本框;复杂接口可以让用户对查询进行限制,如逻辑运算(与、或、非; 、-)、相近关系(相邻、NEAR)、域名范围(如.edu、.com)、出现位置(如标题、内容)、信息时间、长度等等。目前一些公司和机构正在考虑制定查询选项的标准。
搜索引擎技术研究之机器人搜索引擎工作原理
机器人搜索引擎的工作大致可以分为三个阶段:
第一阶段搜集信息:搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛(spider)的自动搜索机器人程序来连上每一个网页上的超连结。机器人程序根据网页链到其他中的超链接,就象日常生活中所说的“一传十,十传百……”一样,从少数几个网页开始,连到数据库上所有到其他网页的链接。理论上,若网页上有适当的超连结,机器人便可以遍历绝大部分网页。
第二阶段整理信息:搜索引擎整理信息的过程称为“建立索引”。搜索引擎不仅要保存搜集起来的信息,还要将它们按照一定的规则进行编排。这样,搜索引擎根本不用重新翻查它所有保存的信息而迅速找到所要的资料。想象一下,如果信息是不按任何规则地随意堆放在搜索引擎的数据库中,那么它每次找资料都得把整个资料库完全翻查一遍,如此一来再快的计算机系统也没有用。
第三阶段接受查询:用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回资料。搜索引擎每时每刻都要接到来自大量用户的几乎是同时发出的查询,它按照每个用户的要求检查自己的索引,在极短时间内找到用户需要的资料,并返回给用户。目前,搜索引擎返回主要是以网页链接的形式提供的,这些通过这些链接,用户便能到达含有自己所需资料的网页。通常搜索引擎会在这些链接下提供一小段来自这些网页的摘要信息以帮助用户判断此网页是否含有自己需要的内容。
搜索引擎技术研究之分类
搜索引擎系统可以分为三大类
1.目录式搜索引擎:以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服务。该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入、维护量大、信息量少、信息更新不及时。
2.机器人搜索引擎:由一个称为蜘蛛(Spider)的机器人程序以某种策略自动地在互联网中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。服务方式是面向网页的全文检索服务。该类搜索引擎的优点是信息量大、更新及时、毋需人工干预,缺点是返回信息过多,有很多无关信息,用户必须从结果中进行筛选。
3.元搜索引擎:这类搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。服务方式为面向网页的全文检索。这类搜索引擎的优点是返回结果的信息量更大、更全,缺点是不能够充分使用所使用搜索引擎的功能,用户需要做更多的筛选。
PHPCMS2008模板系统更新的简单分析
PHPCMS2008版在很多方面都较2007版有了较大进步,其中在操作的人性化方面尤为突出。其实PHPCMS在2007版的时候,我想大家跟我一样用到最多的是他的模板系统,因为我们往往是在运营一个网站,那些功能性的东西,我们关心的很少。只要它好用,用起来顺手就可以了。界面就不一样了,大家用的是同一套CMS,在许多方面都有类似,要想和别人不一样,我们就要在界面上下功夫了。
PHPCMS2007的模板系统已经相当完善,在此我们可以简单的分析一下
1,目录结构
PHPCMS是模块化很细致的系统,分为系统模块和扩展模块两种(我自己起的名字,不知道官方同不同意)。其中PHPCMS和MEMBER是少数的必选和不可更改的模块,他们的模板对应在PHPCMS_ROOT/TEMPLATES/DEFAULT/下的PHPCMS和MEMBER两个文件夹下,其中有根据不用的位置做了不同的区分,很是方便。值得注意的是界面系统的顶部和底部部分即HEADER和FOOTER,也位于PHPCMS这个文件夹中。
可扩展模块则各有不同了,他们是在TEMPLATES/下跟PHPCMS文件夹同级目录中,名字也跟他们名字相对应。我们用的最多的article在这样。这些在PHPCMS的模板教程里都有详细的描述,我就不累述了,现在说重点:由于2008版引入了自定义模型的功能,article这个目录自然消失了,因为已经没有默认article模块的这个说法,那我们要修改文章模块的模板应该去哪里呢?去看看PHPCMS这个目录吧,你会发现这里多了一个show_为前缀的HTML文件,这种类型的文件之前只有在文章和图片这种模块才会有。这就对了,当你在PHPCMS2008增加一个新的自定义模型是,这个PHPCMS系统模块里就需要有一个show_的模板文件与这个模型相对应,这就是2008版模板系统的最大变化。
同样发生目录变化的还有special和search,因为这两个模块的等级已经提高,这是多么可喜的变化。search里面居然还发现了分词,这简直太了解劳苦大众的心声了。
2,模板名称规律
在上面的目录结构介绍中我们其实已经发现了PHPCMS模板系统命名特点。2008的模板命名中,配置文件的命名我越来越喜欢,大家可以看看现在的每个模板的目录,templatenames.php改为name.inc.php,tags_config.php改为tag.inc.php,名字更加符合大家认知规范,偶喜欢。在各个模块的调用tag_类型模板中,又增加了几个新的调用类型,很是方便,先抛砖引玉了,search_index,希望大家指正
根据搜索引擎收录情况看SEO方向
做SEO有段时间了,总是抓不到眉目。自己的博客一直都在更新,有时候一天可以更新10篇左右,但收录情况一直不是很理想。突然有一天我发现,我首推的内容搜索引擎不感兴趣,反而是自己转载的一些文章是百度,google的追捧的对象。
比如我的博客murray.cn和自己的旅游网站www.youtianxia.net在前些天都发布了一些关于上海世博会的新闻,都已经一个月过去了,我自己写的内容上上下下了好几遍,可这几篇貌似不着边的新闻一直赫然在榜。现在终于相信热门关键字的作用了
我建议大家也常去百度和GOOGLE用SITE命令可能看到底自己网站的内容哪个方面更受欢迎,有利于大家更精确的做好SEO优化。
给大家一个简单搜索引擎的命令,这些命令可以直接打入搜索引擎的输入框,很方便
site:www.murray.cn 查询murray.cn的收录情况
line:www.murray.cn 查询murray.cn的反向链接情况
inurl:www.murray.cn 用于查询你地址里面关键字的收录
如何解决HTTP403禁止查看该网页的权限
我的配置环境是win2003,就是配了一个简单的ASP环境,突然把初始也是已经设置为index.asp了,重起IIS
当我通过浏览器访问域名的时候,突然发现403错误
最可能的原因是:
此网站要求您登录。
您可以尝试以下操作:
返回到上一页。
更多信息
此错误(HTTP 403 禁止)意味着 Internet Explorer 可以连接到该网站,但是没有查看该网页的权限。
有关 HTTP 错误的详细信息,请参阅帮助。
一切设置都都很正常,经过自己检查发现原来自己主机绑定的IP没有设
当我把IP绑定好后,403问题解决
错误号:-2147467259错误描述:007~ASP 0104~不允许操作~错误来源:Request对象
原因分析:这个提示是因为没有打开WIN2003的200K数据提交限制引起的。
处理方法:因为在2003下,ASP默认上传的文件大小是200K,即204800!
按以下步骤更改:
1.打开IIS管理器,勾选允许直接编辑配置数据库
2.在服务里关闭iis admin service服务;
3.接着,找到文件c:\windows\system32\inetsrv\metabase.xml,用“记事本”打开该文件,用记事本中的“查找”功能搜索关键词“AspMaxRequestEntityAllowed”,就会找到AspMaxRequestEntityAllowed=204800,是win 2003用于限制最大上传文件大小的,默认是204800即200KB,你可以根据您的具体情况,修改该值,1MB对应1024000,10MB对应10240000,依此类推,设置完该值,保存文件即可。
4.然后重启iis admin service服务
如何实现linux的mysql数据库自动备份
1、创建备份文件夹
#cd /www
#makedir backup
2、编写运行脚本
#vi autobackup
写入以下内容:
filename=`date +%Y%m%d`
mysql_bin_dir/mysqldump –opt dataname -u user -ppassword | gzip >???? /www/mysqlbackup/name$filename.gz
保存退出
说明:
(1)mysql_bin_dir:mysql的bin路径;
(2)dataname:数据库名;
(3)user:数据库用户名;
(4)password:用户密码;
(5)name:自定义备份文件前缀标识。
如上例,将自动备份mysql数据库,并以gzip压缩方式存储,文件名为name20080101.gz的形式。
3、为脚本添加执行权限
#chmod +x autobackup
4、让crontab来完成定期执行的任务
这一步中,Redhat的方法会不一样,后面专门给出。
编辑crontab:
#vi /etc/crontab
在最后一行中加入:
01 5 * * * root /www/autobackup
每天5点运行脚本,也可以修改5为其他指定时间。
Redhat方法:
Redhat的crontab采用按时间调用4个目录(/etc/cron.hourly:每小时;/etc/cron.daily:每天;/etc/cron.weekly:每周;/etc/cron.monthly:每月)中脚本出来运行的方式。
Redhat中只需要将刚才编辑的脚本复制到相应的目录即可。
5、重启crontab
#/etc/rc.d/init.d/crond restart
完成。
【转】JScript运行时错误对照表
JScript运行时错误是指当JScript脚本试图执行一个系统不能运行的动作时导致的错误。当正在运行脚本、计算变量表达式、或者正在动态分配内存时出现JScript运行时错误时。
以下是76个运行时错误
5 800A0005 非法过程调用或参数
6 800A0006 溢出
7 800A0007 内存不足
9 800A0009 下标超界
10 800A000A 此数组被固定或临时锁定
11 800A000B 零除错误
13 800A000D 类型失配
14 800A000E 串空间不足
17 800A0011 不能执行所请求的操作
28 800A001C 栈空间不足
35 800A0023 子过程或函数未找到
48 800A0030 装载DLL出错
51 800A0033 内部出错
52 800A0034 坏文件名或数
53 800A0035 文件未找到
54 800A0036 坏文件模式
55 800A0037 文件已经打开
57 800A0039 设备I/O错误
58 800A003A 文件已经存在
61 800A003D 磁盘空间已满
62 800A003E 输入超出文件尾
67 800A0043 文件太多
68 800A0044 设备不可用
70 800A0046 权限禁用
71 800A0047 磁盘未准备好
74 800A004A 不能用不同的驱动重命名
75 800A004B 路径/文件访问错误
76 [...]

