自己的blog已经恢复到一个段落,虽然WP很好玩,有很多东西可以自己把弄,譬如主题,譬如plugins等等,不过太花功夫了,还是慢慢来,不能一步登天啊。
既然老婆大人一直跟我探讨是不是旧的那个.net网址恢复过来她的blog就能访问,其实并非如此。只好继续按照我之前帮自己和Ne恢复的方法,帮老婆部分弄好她的blog先,等.net的网址转移域名成功了之后,再看看做映射之类的事情吧。等转移域名成功已经等了我五天了,一直还没有音讯,虽然DH已经说了起码要7-10天的时间……
自己的blog已经恢复到一个段落,虽然WP很好玩,有很多东西可以自己把弄,譬如主题,譬如plugins等等,不过太花功夫了,还是慢慢来,不能一步登天啊。
既然老婆大人一直跟我探讨是不是旧的那个.net网址恢复过来她的blog就能访问,其实并非如此。只好继续按照我之前帮自己和Ne恢复的方法,帮老婆部分弄好她的blog先,等.net的网址转移域名成功了之后,再看看做映射之类的事情吧。等转移域名成功已经等了我五天了,一直还没有音讯,虽然DH已经说了起码要7-10天的时间……
做的事情,是因为之前用自己Perl程序生成导出备份文件时候,因为单独的blog没有记录分类的信息,结果需要手工的恢复之前几百篇的blog,何等巨大的工作量啊?用来近4个小时就是待在电脑前面逐篇的update他们的categories信息。不过也顺带着不断往回翻开之前自己写过的文字,回忆当时的那份心情。自己blog的恢复工作已经是7788了,不过后面还有老婆的那个blog要弄一下,继续累啊~~
奋战了一个晚上,终于迎来了这一刻,之前在MT上面的blog全部导入到WP里面了!
之前一直在围绕着Berkeley DB的数据文件升级或者导出,其实进入了一个误区。虽然我知道原来的数据版本是在1.85版本上面的,但是放到DH主机上面无论用v3版本还是v4.3版本的db_upgrade,db_dump,db_dump185都没有办法读取到数据库的内容(具体原因真是天晓得了,只好认倒霉)。穷途末路之中,想起老子当年好歹都做过搜索引擎,何不写一个spider去读自己的静态文件,然后在里面抽取出内容数据,在生成到MT导出文件格式的txt文本里面,然后让WP导入呢?
正准备谋划这步,不过写这个spider用Java写确实很麻烦。为什么不用perl这么强大的文本处理呢?全世界不超过10个人知道我曾经写过perl的程序,嘿嘿。不过当然我没有那么笨白手兴家,感谢Google,终于我在MT的论坛上面竟然找到同道中人,详情可以见这里,感谢里面两位大侠anakin513和apakuni无私地提供了程序代码,然后就是我自己利用apakuni的修订版为基础,在上面继续修改以符合我本身的那些archives文件内容的要求。注意:因为我本身的模板是有中文包含在里面,所以对于perl代码里面用中文字符串查找时,perl的文件必须存成UTF-8格式,这个是跟我本身的HTML是UTF-8相对应,否则perl可能匹配不了那些UTF-8编码的中文字。
改好以后将几个html上传到DH的临时目录,然后运行这个perl程序,生成出来的txt能够成功导入到WP里面。那个激动啊!!!接下来将自己1000余个HTML文件全部通过SSH上传到服务器,结果洗完澡出来还没传完(这是我笨,没有在本地打好一个gz包整体上传,分开一个个小文件导致大量的IO消耗,因为太激动,所以笨了)。接下来生成导出的txt文件。半秒不到,强大的DH服务器加perl强大的文本处理能力!生成出来的文件是1.4M多,这个就是我5年的blog心血。(注:生成出来的txt文件其实已经是UTF-8格式的啦)
利用WP的tool上传文件然后import,搞定!但是部分文章因为模板的改变,没有记录具体的category信息,所以需要手工恢复。惨
——今天去移动营业厅交话费,顺道给柜台的小哥吸引去办3G上网卡的服务。预存一定的话费,就办一张3G的SIM卡,送一个3G上网卡。说是卡,但是还是一个小火柴盒一样大。柜台的小哥还很老实,几个品牌跟我分析,哪个速度快但是不稳定,哪个稳定一点,哪个有延长线哪个没有,甚至于哪个质量比较差。呵呵呵,既然如此就顺道拿了一个回家玩一把。反正到时候在机场等飞机或者是某些客户不能上网的地方,就派上用场了。
——比起网上说的那款中兴,我这部新邮的H301虽然样子还可以,但是本身没有自带U盘的功能,所以还是要拿张光盘装驱动和拨号程序,这个比较麻烦。回家装到我的t43上面,信号强度居然只有38%,看来3G基站还是不太够。拨号成功,然后连接到speedtest.net上面测试速度,选择连接到上海测试,用起来速度不算非常稳定,也没有3G说的那么快。看来TD这东西还只是一个聊胜于无的玩意。一不做,二不休,常用三种上网方式只作一次测试的比较:
——已经不止一次在这里探这个事情了,今天上网发现用FF经常有个莫名其妙的跳转,于是打开HttpFox进行跟踪,试了几个访问之后就可以看到其中的一个请求就是类似http://121.32.136.91:4022/logo.jpg?p=1228030371|undefined|1022|1400|32|1050|1400这样的访问路径,无可奈何地在自己路由的防火墙中加入对121.32.136.91(所在地为广州)这个的过滤规则。然后就可以捕获类似的JavaScript脚本了:
test=function(){
var objElement=document.createElement(“iframe”);
var link=”http://121.32.136.91:4022/logo.jpg?p=”;
link += Math.floor((new Date()).getTime()/1000);
link += “|”;
link += navigator.appMinorVersion;
link += “|”;
link += screen.availHeight;
link += “|”;
link += screen.availWidth;
link += “|”;
link += screen.colorDepth;
link += “|”;
link += screen.height;
link += “|”;
link += screen.width;
objElement.setAttribute(“src”,link);
objElement.style.display=”none”;
document.body.appendChild(objElement);
};
window.setInterval(“window.status=’ ‘”,200);
window.setTimeout(‘refresh()’,1000);
test();
——看内容,还好没啥攻击性,不过电信大哥,你找俺做实验,想知道老子的分辨率什么的也麻烦也通知一声吧,反正打电话给10000号的话,那些接线小妹也不晓得你跟她说什么劫持什么路由的了。当然生活在这个可爱的国度,我们顶多就只能在自己手上的路由设几个规则罢了,不过这也够Free的了,起码现在用电信好歹都比那些用X家宽的小区宽带好多了。