All in Web

自从12年开始入迷建站技术以来,Wordpress一直是我首选的建站工具。简单易学的PHP脚本语言,可本地部署测试的LAMP架构,丰富的技术社区资源,高度可自定义化的模块化设计,这些都是Wordpress吸引无数入门者的亮点。回首我刚开始折腾时,Wordpress最新的官方模板还是Twenty Ten, 第一次见到“娄琦彬的个人博客”网站标题赫然出现在Twenty Ten的标题一栏,内心激动不已,仿佛悟到了什么真谛。

在 QQ 已经登录的情况下,手动输入网址打开 QQ 邮箱 或者 QQ 空间 等腾讯网站,可以看到网页已经检测到本地 QQ 客户端已经登录,于是用户可以很方便地一键登录网站而不必再输入用户名密码。这实际上是典型的异构系统单点登录 SSO(single-sign-on)技术。网页怎么会知道我登录的 QQ 号码?腾讯是如何实现的呢? …

最近乌云社区里有位童鞋发了一个帖子:http://zone.wooyun.org/content/6103 说一个域名不知道用了什么手法居然绑定了李毅吧的url,既不是301重定向,也不是域名跳转,也不是域名转发。访问www.liyiba.com 这个域名感觉李毅吧仿佛单独成立了一个网站一样!而且这个域名的权重居然涨到了6!现在这个域名利用李毅吧带来的权重和流量已经独立建立论坛赚钱了!每日几十万的IP看的大家眼馋!

他是怎么做到的呢?

很早就对Google的PageRank算法很感兴趣,但一直没有深究,只有个轮廓性的概念。前几天趁团队outing的机会,在动车上看了一些相关的资料(PS:在动车上看看书真是一种享受),趁热打铁,将所看的东西整理成此文。 本文首先会讨论搜索引擎的核心难题,同时讨论早期搜索引擎关于结果页面重要性评价算法的困境,借此引出PageRank产生的背景。第二部分会详细讨论PageRank的思想来源、基础框架,并结合互联网页面拓扑结构讨论PageRank处理Dead Ends及平滑化的方法。第三部分讨论Topic-Sensitive PageRank算法。最后将讨论对PageRank的Spam攻击方法:Spam Farm以及搜索引擎对Spam Farm的防御…