近几日遇到采集某网页的时候大部分网页OK,少部分网页出现乱码的问题,调试了几日,终于发现了是含有一些非法字符造成的..特此记录1.在正常情况下..可以用importchardetthischarset=chardet.detect(strs)["encoding"]来获取该文件或页面的编码方式或直接抓取页面的charset=xxxx来获取2.遇到内容中有特殊字符时指定的编码一样会造成乱码..即内容中非法字符造成的,可以采用编码忽略非法字符的方式来处理.st
系统 2019-09-27 17:38:01 2092
1、要点(1)在C语言中没有字符串,只有字符,在python中的字符串hello,在C语言中是以字符数组在内存存放['h','e','l','l','o'],如果对字符串修改,则是在内存中新开辟了一段空间进行存放。字符串特性:一旦修改,需要重新创建。例:"hello"+"ni"+"hao"内存中:['h','e','l','l','o']+['n','i']+['h','a','o']万恶的“+”,“+”号越多,在内存中多次重复创建,浪费空间。C语言需要手
系统 2019-09-27 17:37:41 2092
今天QQ交流群里有人问了这题,就是鼠标在一幅矩形图片上点击,以矩形的对角线为界,如何知道点击的是矩形的左半部分还是右半部分.想了一下,也跟群里人讨论了一下,如下图:假设鼠标在矩形上任意点的一点的坐标是(95,130),那么只要计算对角线上的那一点(?,130),把?算出来了再比较与95的大小即可知道点击的是图片的左边还是右边!鼠标点击一幅矩形图片,以矩形对角线为界算出是点了左边还是右边!
系统 2019-08-29 23:40:56 2092
摘要:这本书看了一段时间,一直没有上手,今天刚才北京回来,新的项目需要提供一个原型,感觉比较适合ROR的开发方式,决定把《AgileWebDevelopmentwithRails》中的例子,走一遍,看一下开发的效果。阅读全文Duiker2007-03-1316:44发表评论AgileWebDevelopmentwithRails读书笔记(一)
系统 2019-08-29 23:36:56 2092
CruiseControl简介:CruiseControl是一个持续测试(CIContinuousIntegration)的服务器CI服务器。它已经用了有五年多了,在许多方面,CruiseControl服务器已经成为持续集成实践的同义词。CruiseControl是一种持续集成过程的框架,包括了邮件通知,ant和各种源码控制工具的插件。并提供web接口,用于查看当前和以前的build的结果。CruiseControl安装CruiseControl可以在Li
系统 2019-08-29 23:10:53 2092
欢迎点击此处订阅本Blog
系统 2019-08-29 22:35:17 2092
总结:服务器程序编写:①调用ServerSocket(intport)创建一个服务器端套接字,并绑定到指定端口上;②调用accept(),监听连接请求,如果客户端请求连接,则接受连接,返回通信套接字。③调用Socket类的getOutputStream()和getInputStream获取输出流和输入流,开始网络数据的发送和接收。④最后关闭通信套接字。客户端程序编写:①调用Socket()创建一个流套接字,并连接到服务器端;②调用Socket类的getOu
系统 2019-08-29 22:31:35 2092
如果您喜欢这些文章,欢迎点击此处订阅本Blog
方法一故障描述:编辑Word文档的过程中,程序非法关闭,重新打开也是如此。即使重新安装了Office2003,在启动Word2003后仍然出现了异常情况。双击Word文档后,程序弹出出错对话框,其中显示“正在处理的信息有可能丢失,MicrosoftOfficeWord可以尝试为您恢复……”并询问用户是否发送错误报告,在点击了“不发送”按钮后,Word将开始恢复当前文档。恢复完毕后,程序将询问用户上次启动失败,是否以安全模式启动Word。在此,如果选择“否”
系统 2019-08-12 09:26:41 2092
针对zgpswh在串口使用上的一些难题,总结个人在前一阶段的理解,比较片面,不对的地方请高手指正。1、LPC2000系列芯片的串口的接收模块包括接收缓冲寄存器和移位寄存器。接收的数据进入移位寄存器后经移位处理并行传入缓冲寄存器,事实上,UART的FIFO是一个硬件环形的缓冲队列,物理上不可寻址,不可见,仅U0RBR这个FIFO出口可见。U0RBR就是接收FIFO的第一位。FIFO的长度是可设的,也叫触发点,低于这个长度的字符串不会引起中断,但在实际应用中,
系统 2019-08-12 09:26:40 2092