mysql django utf8乱码的解决办法 十月 3rd, 2010
1.查看数据库字符集是否是utf8
mysql>show variables like 'collation_%';
mysql>show variables like 'character_set_%';
如果不是则在/etc/my.cnf 中的[mysqld] 和[client] 添加
default-character-set = utf8
如果是从rpm或者src安装mysql,则文件/etc/my.cnf可能不存在,需要找到my-medium.cnf 然后执行cp /usr/local/share/mysql/my-medium.cnf /etc/my.cnf
重新启动数据库
2.查看是否用utf8建表,例如表stock_stock
mysql> show create table stock_stock \G
如果不是,重新建表
3.如果是用python写数据库,创建连接的时候加上参数charset和use_unicode
conn=MySQLdb.connect(host = 'localhost', user = 'test', passwd = 'test', db = 'test', charset='utf8', use_unicode=False)
4.如果用mysql命令行连数据库,则加上命令行参数 --default-character-set=utf8, 即
mysql --default-character-set=utf8
sed的常见用法和模式空间 九月 30th, 2010
“模式空间”是sed的核心概念
sed的常见用法
sed 's/a/b/g' test.txt 将所有a 都替换成b
sed -n '3p' test.txt 打印第3行
sed '/^\s*$/d' tmp.txt 删除空行
sed 'n;d;' tmp.txt 删除偶数行
sed '{N;s/\n/ /;}' 将相邻两行合成一行
数学之美笔记 九月 27th, 2010
熵: 用来度量信息
-(p1*logp1 + p2*log p2+ p3*logp3 +...)
用TF*IDF确定查询的相关性
TF: 关键词在某文档中出现的频率/某文档的词数
IDF:log( 文档总数/含有关键词的文档数)
相关性:TF*IDF
IDF是个关键概念,用IDF可以降低 “的”等无用词的相关性
推荐calendar.vim和sugersync 九月 23rd, 2010
cygwin用vim编辑utf-8文件 九月 19th, 2010
vim 不用做任何配置
export LC_ALL=zh_CN.UTF-8
就搞定了
zh_CN.UTF-8这三个字段的意思是说中文,在中国,用UTF-8
环境变量优先级LC_ALL > LC_* > LANG
所以只用设置LC_ALL就搞定了一切
cygwin下配置django开发环境 九月 19th, 2010
从源码安装mysql
如果报错readline/readline.h:70:29: sys/ttydefaults.h: No such file or directory
解决办法是
安装readline
make distclean
./configure --without-readline
make
make install
mysql 启动不起来,看了下日志,发现是由于缺少系统表, 运行了mysql_install_db,创建系统表
发现几个有用的mysql东东
mysql.user表
flush privileges
mysql_install_db
mysql_secure_installation
python的easy_install也挺爽的,但是前提是要知道库的名字。
开发环境下pil库就是用easy_install方式安装的
重新启用本blog 九月 16th, 2010
大宅门换人 九月 12th, 2010
第二部和第一部的差距真是太大了,nnd,电视剧火了,大家就都要来插队。香秀,黄爷,敬业,田木,这都换的是啥,差距太大了,愤怒。。。。
推荐雅虎邮箱里的记事本功能 八月 31st, 2010
google doc有时候用不了,用用这个也挺好,甚至有更好,更简单更方便。