挖井

类库大魔王的挖井日记

挖一口属于自己的井


Go语言Unmarshal GBK编码的XML

昨天在写微信公众号文章的爬虫,中间需要解析一段GBK编码的XML,结果发现Go语言自带的encoding/xml包默认是不支持除UTF-8以外其他编码的。在网上随便搜了搜,能看到代码的方法不是过时的就是不能work的,最后还是看到比较官方的一个包可以解决这个问题,代码如下:

import "code.google.com/p/go.net/html/charset"
 
ad := &models.ArticleDocument{}
d := xml.NewDecoder(bytes.NewReader([]byte(xmldoc)))
d.CharsetReader = func(s string, r io.Reader) (io.Reader, error) {
        return charset.NewReader(r, s)
    }
d.Decode(ad)

本文地址:

https://minidump.info/blog/2014/09/unmarshal-gbk-xml/

上一篇

重构IPC协议

到今天为止,IPC协议的重构也进行了一部分,效果不错。原本每秒一次的查询是否有新命令,现在使用阻塞式的查询,有新命令会立即到达,可以立即执行,原本一条新增instance的命令要大概3秒才能得到回应执行完毕,现在基本上下发命令就立即能得到回应了。同时删除instance命令也由原来的平均0.5...…

Job 全文阅读
下一篇

istkani在App Store于八月份成功卖出两份

昨天收到Apple AppStore的邮件,是八月份的Financial report,原来八月份居然卖出了两份istkani,真是太让我意外了。本来自五月份上架以来,除了兑换码送出几十份以外,我就没怎么指望能把它卖出去的,虽然也有过一些升级的计划,增加新特性以及提升UI设计等等,不过后来还是...…

Shareware 全文阅读