`
文章列表

pig

pig load 默认应该都是 chararray
Java语言内部的char是使用unicode编码,UTF-16,所以都是两字节。getBytes后,实际上是转换成指定的编码字符集。不指定时,一般用本地字符集,通常是GBK、ACSII等,在这些字符集中,英文都是单字节的,所以会出现这样的问题。

hadoop

hadoop下输入文件路径 1,/xx/xx/* 如果后面还有下一级别的路径是可以递归包含的    /xx/xx 这个不会做任何递归,直接打开/xx/xx,因为是目录,所以会失败
MSG_NOSIGNAL linux下当连接断开,还发数据的时候,不仅send()的返回值会有反映,而且还会像系统发送一个异常消息,如果不作处理,系统会出 BrokePipe,程序会退出。为此,send()函数的最后一个参数可以设MSG_NOSIGNAL,禁止send()函数向系统发送异常消息。 在服务端sleep时,由于客户端断线,将导致send失败。由于使用了MSG_NOSIGNAL标志,程序不会直接DOWN掉,但那个nowait显然没有起到应有的作用,它会一直阻塞。 通过查看ACE源码(ACE.cpp)可以看到,这个值其实是相对于当前时间的长度,send和recv函数里会对这个值加上 ...
非常非常牛逼的问题 在解码urlencode的时候,如果涉及到多种编码,需要现在urllib.unquote之前,就转化成str类型,不要把unicode类型放到urllib.unquote这个函数中 s.decode 这里不光是解码,而且是把str转化成unicode对象 u.encode 如下: key=key.decode("gbk").encode("utf-8")         在Unicode中:汉字“字”对应的数字是23383。在Unicode中,我们有很多方式将数字23383表示成程序中的数据,包括:UTF-8、UTF-16、U ...

linux 配置

1.开机启动时自动运行程序 Linux加载后, 它将初始化硬件和设备驱动, 然后运行第一个进程init。init根据配置文件继续引导过程,启动其它进程。通常情况下,修改放置 在 /etc/rc或 /etc/rc.d 或 /etc/rc?.d 目录下的脚本文件,可以使init自动启动其它程序。例如:编辑 /etc /rc.d/rc.local 文件,在文件最末加上一行“xinit”或“startx”,可以在开机启动后直接进入X-Window。 2.登录时自动运行程序 用户登录时,bash首先自动执行系统管理员建立的全局登录script :/ect/profile。然后bash在用户起始 ...

CURL 开发笔记

常见error no,保存在curl.h CURLE_COULDNT_CONNECT,         /* 7 */ CURLE_OPERATION_TIMEOUTED,     /* 28 - the timeout time was reached */ CURLE_GOT_NOTHING,             /* 52 - when this is a specific error */ reference http://www.cnblogs.com/xwblog/archive/2011/11/09/2243080.html
<p>昨天办了两件错误的事情:</p> <p> </p> <p>1,把antispam流程整理了一下,发给了leader(是我主动发的,不是leader向我要的)。我本意只是想梳理一下流程,但由于在组会前发给leader,被拿到组会上讨论了一番。写的东西本身价值不大,而且写的也不好。</p> <p>总结:不要把这么琐碎的东西发给leader,他没必要关心。改善一下例会发言的水准。</p> <p> </p> <p>2,被一个很自以为是的产品干预了我们技术的工作。她一副 ...

工作经验

 
不要再c程序里,用变量声明数组大小~~~~!!!!! 即使gcc可以编过

samba

 
http://www.linuxsir.org/main/node/158
Python里的string 和 unicode http://ldl.wisplus.net/2010/09/05/python%E9%87%8C%E7%9A%84string-%E5%92%8C-unicode/
我使用的是SecureCRT5.5SecureCR下的文件传输协议有ASCII、Xmodem、Zmodem文件传输协议文件传输是数据交换的主要形式。在进行文件传输时,为使文件能被正确识别和传送,我们需要在两台计算机之间建立统一的传输协议。这个协议包括了文件的识别、传送的起止时间、错误的判断与纠正等内容。常见的传输协议有以下几种: ASCII:这是最快的传输协议,但只能传送文本文件。 Xmodem:这种古老的传输协议速度较慢,但由于使用了CRC错误侦测方法,传输的准确率可高达99.6%。 Ymodem:这是Xmodem的改良版,使用了1024位区段传送,速度比Xmodem要快。 Zmodem:Zm ...

OGNL

  |--request | |--application | context map---|--OgnlValueStack(root) [ user, action, OgnlUtil, ... ] | |--session | ...

CSS学习(未完)

    博客分类:
  • CSS
居中一个DIV,margin:0px auto;(这个只是水平居中,垂直居中比这个复杂,而且兼容性不佳) 一个DIV,不指定folat,无论宽度,直接填充整行,多余的空间留白。(不确定理解是否正确) background所作用的区域是内容和padding区域,所以有背景图片或背景色的时候两者就不同了:调整padding背景的范围会变,而调整margin则不会。  未完
【大师注】首先感谢水木网友lai的总结,转载中修改了一些过时部分,特此转载如下:    最近补了一下课。首先企业和学生申报户口的大概流程是这样的:    1,企业申报指标:单位申报本年度的户口指标。各区申报指标截止时间不同,基本走人事局的在12月前就完成指标申报工作。    2,企业进京指标的审核和公布:人事部门审批单位申报的指标。人事局的基本都在当年的3月份公布企业获得的指标数量,也有很牛的企业会更早的;人事部的会更晚一些,会严格控制数量。需要注意:指标的多少基本只跟公司的规模、行业、性质、纳税以及往年的情况等等方面有关,跟学生材料没有丝毫关系。    3,单位正式申报学 ...
Global site tag (gtag.js) - Google Analytics