Nov172011
Nutch的工作流程
这两天想弄点东西,需要用到solr和nutch,solr大概了解了,可这nutch怎么就没弄明白呢,到底怎样才能基于他俩去做我想要的东东的?
以下是网上搜到的关于nutch的工作流程:
Crawdb、linkdb
是web link目录,存放url及url的互联关系,作为爬行与重新爬行的依据。
segments
是主目录,存放抓回来的网页。页面内容有bytes[]的raw content 和 parsed text的形式。nutch以广度优先的...阅读全文
抢沙发
Aug232011
好的代码书写习惯很重要
最近真的是忙死了,有套CMS需要完成,而且时间有限,不得不加班加点的。
原本这套CMS已经由其他人完成了一部分,只需要我在这个基础上完成剩余东西,结果我发现这个代码太乱了,书写代码的这个人技术上很棒,但是他的书写代码习惯我可不敢恭维,看着头疼,也许是我自己对自己的书写要求太严格了吧,呵呵。
可是话又说回来了,这种东西不是开发一次就完了,后期难免会有修改的,...阅读全文
Jul132011
May312011
May202011
Apr132011
Apr102011
Apr062011
关于A3000的WM6.5资源
之前研究了一段时间A3000的wm6.5rom,在it168论坛上也发布了几个版本,也比较受大家的支持,后来换机器转战安卓了,因此停止了对A3000的rom的研究。而上传到115网盘的rom经常链接过期,论坛上仍有很多人寻找该rom,现将该rom以及一些相关资源发布到rayfile上,有兴趣的自己研究研究吧!自己动手才会有更大的乐趣!哈哈!最后谢谢大家的支持!
A3000_WM6.5_29002_CHS(12-17) http://www.rayf...阅读全文
Mar062011








