Category Archives: PHP

PHP Agile and sharp web tools

infobright安装简要说明,mysql往infobright中按天导数据脚本

一) infobright安装文档:
1)下载infobright并解压到home下
wget http://www.infobright.org/downloads/ice/infobright-3.3.1-x86_64-ice.tar.gz
tar zxvf infobright-3.3.1-x86_64-ice.tar.gz
mv infobright-3.3.1-x86_64 /home/infobright

2)安装infobright,使用3307端口
cd /home/infobright
./install-infobright.sh –datadir=/home/infobright/data –cachedir=/home/infobright/cache –config=/home/infobright/my.cnf –port=3307 –socket=/tmp/mysql3307.sock –user=mysql –group=mysql

3)启动infobright
/home/infobright/bin/mysqld –defaults-file=/home/infobright/my.cnf –basedir=/home/infobright –datadir=/home/infobright/data –user=mysql –log-error=/home/infobright/data/bh.err –pid-file=/home/infobright/data/localhost.pid –socket=/tmp/mysql3307.sock –port=3307

二)crontab按天执行,从mysql中往infobright中导入数据脚本:
#!/bin/sh
enddate=`date  +%m_%d`

/home/mysql/bin/mysql -u admin -p111  –default-character-set=utf8  -S /tmp/mysql.sock -D analytic -e “select * from visitlog where time > date_add(curdate(), interval -1 day) into outfile ‘/home/csv/visitlog_${enddate}.csv’ FIELDS TERMINATED BY ‘,’ ENCLOSED BY ‘\”‘  ESCAPED BY ‘\\\’ LINES TERMINATED BY ‘\n’;”

/home/infobright/bin/mysql -u admin -p111  –default-character-set=utf8  -S /tmp/mysql3307.sock -D analytic –skip-column-names -e “LOAD DATA INFILE ‘/home/csv/visitlog_${enddate}.csv’ INTO TABLE visitlog FIELDS TERMINATED BY ‘,’ ESCAPED BY ‘\\\’ LINES TERMINATED BY ‘\n’;”

PHP官方正式支持 php-fpm

Nginx+php-fpm+ apc 的发烧友们,终于迎来了好消息,在php5.3.3版本,正式增加了对php-fpm 的支持,从此大家再也不用去 http://php-fpm.org/ 上面找补丁了,大大降低了安装成本,增加了稳定性和效率 .

如果你的代码支持php5.3系列版本,并且你是个代码性能或者优化构架的狂热发烧友,那么强烈建议大家测试一下这个组合.

php dev team的这个决定,再次巩固了PHP 做为脚本语言的领袖地位,从另外一个侧面展示了他们对于性能的不懈追求.

下面是本消息的英文原文:

PHP 5.3.3 is released and now bundles PHP-FPM, with all of the new improvements – adaptive process spawning, the new INI file format and include support, basic metrics for reporting, and more. If your code is PHP 5.3 compliant, it is highly recommended that you upgrade to take advantage of the built-in PHP-FPM support now (not to mention mysqlnd and all the other new features.)

我的Psytopic分析结果

Psytopic分析:您的性格类型是“INFJ”(内向+直觉+情感+判断)

寻求思想、关系、物质等之间的意义和联系。希望了解什么能够激励人,对人有很强的洞察力。有责任心,坚持自己的价值观。对于怎样更好的服务大众有清晰的远景。在对于目标的实现过程中有计划而且果断坚定。

INFJ型的人生活在思想的世界里。他们是独立的、有独创性的思想家,具有强烈的感情、坚定的原则和正直的人性。即使面对怀疑,INFJ型的人仍相信自己的看法与决定。他们对自己的评价高于其他的一切,包括流行观点 和存在的权威,这种内在的观念激发着他们的积极性。通常INFJ型的人具有本能的洞察力,能够看到事物更深层的含义。即使他人无法分享他们的热情,但灵感对于他们重要而令人信服。 INFJ型的人忠诚、坚定、富有理想 。他们珍视正直,十分坚定以至达到倔强的地步。因为他们的说服能力,以及对于什么对公共利益最有利有清楚的看法,所以 INFJ型的人会成为伟大的领导者。由于他们的贡献,他们通常会受到尊重或敬佩。因为珍视友谊 和和睦,INFJ型的人喜欢说服别人,使之相信他们的观点是正确的。通过运用嘉许和赞扬,而不是争吵和威胁,他们赢得了他人的合作。他们愿意毫无保留地激励同伴,避免争吵。通常INFJ型的人是深思熟虑的决策者,他 们觉得问题使人兴奋,在行动之前他们通常要仔细地考虑。他们喜欢每次全神贯注于一件事情,这会造成一段时期的专心致志。满怀热情与同情心,INFJ型的人强烈地渴望为他人的幸福做贡献。他们注意其他人的情感和利 益,能够很好地处理复杂的人。INFJ型的人本身具有深厚复杂的性格,既敏感又热切。他们内向,很难被人了解,但是愿意同自己信任的人分享内在的自我。他们往往有一个交往深厚、持久的小规模的朋友圈,在合适的氛 围中能产生充分的个人热情和激情。

您适合的领域有:咨询、教育、科研等领域 文化、艺术、设计等

摇篮网(yaolan.com)站内搜索优化实践(一)

Yaolan.com现在是国内领先的母婴类网站,我们的使命是面向全球年轻父母,提供从母亲怀孕到孩子六岁期间权威的怀孕生养全方位的专业知识、最新产品服务咨询,为用户提供一流的内容,摇篮网自1998年在硅谷成立以来,一直致力于降低用户获取有价值信息的门槛,而站内搜索,无疑是实现这个目标的最有效的工具。

现有搜索简介 (search.yaolan.com)

摇篮网现有的搜索引擎,是我们基于lucene开源项目,自己研发的,目前支持了yaolan最重要的基础服务搜索,包括bbs,问答产品,空间产品,相册产品,用户,知识类产品的全文检索需求。支持了标签聚合页的信息聚合需求,支持了相关好友推荐的需求,支持了SEO弹层相关内容推荐的需求,支持了文章最终页相关内容的需求。

站内搜索的另外一个功能是站内信息挖掘,用户搜索行为分析,我们通过对用户搜索行为的记录,分析用户查询最多的关键词以及我们的搜索结果输出情况,通过观察跳出率,可以分析用户到底是不满意我们的搜索结果,还是我们根本没有相关的内容给用户。如果是后者,可以作为我们内容团队选题的关键参考因素。如果是前者,那是我们的算法需要优化。

本次优化会涉及到以下方面的问题

  1. 现状分析,Google Analytic,这个大家都知道,网站优化的必备工具。通过Ga了解现状的运营数据。4QSurvey,在线的用户调查工具,经过4Qsurvey,我们用户目前碰到的最大的问题是,很难找到自己需要的内容。这个问题,本身就是个复杂问题,比如是因为搜索结果不够相关?还是yaolan缺乏相关的内容,亦或是用户的使用习惯,选择了错误的关键词。这些都需要细致的饿分析。进而制定下一步的优化策略。同时,我们还详细分析站内搜索的Traffice source,用户从搜索结果点击出去以后的行为情况。
  2. 产品形态优化,这个具体的工作方法,还是要依赖 step 1 的结果。我们会采用A/B测试 ,尝试不同的表现形式,这里会依赖Google的工具Google website optimizer 。工作到这个阶段以后,我会有后续的Blog跟大家share优化实施的结果。
  3. 搜索算法的优化,新的权重模型的需求收集,设计。站内搜索最大的优势,就是他能够跟产品的运营模型深入绑定,比如在社区搜素搜索中,用户会很关注针对网友的搜索,针对精华帖的搜索,针对时间的排序。而在我们的知识类的搜索,能够广泛的匹配相关的问题,对用户也是非常重要的能力。因此针对不同产品的逻辑定制化,是提升站内搜索易用性的重要手段。另外也是我一直想做的,就是调整lucene的针对文章长短的权重设定,默认lucene会对短文章给予高的权重(TF/IDF)统计模型会占优,但是显然这个逻辑有些问题,在这次优化中,我们会尝试解决这个问题。

目前我在yaolan.com 负责了多项产品,我们人力资源暂时有限,因此这项优化,会持续很长的时间,这个项目的最新进展,体会,我会随时跟大家Share.