golang字符、字符串的那些事儿

2012-05-25 17:07  3686人阅读  评论 (0)
Tags: golanggo

通过下边的代码可以看出,r实质是int32,占用4个字节,值是25105;s是string,占用3个字节,值是e68891.

推断r应该是unicode编码的,s是utf8编码的.

package main

import(
    "fmt"
)

func main() {
    r := '我' 
    fmt.Printf("%t\n", r)
    // %!t(int32=25105)

    s := "我"
    fmt.Printf("%t, %d %x\n", s, len(s), s)
    // %!t(string=我) 3 e68891

    fmt.Printf("%b\n", int32(r))
    // 110001000010001
    // 0000 0000 0000 0000 0110 0010 0001 0001

    for _, b := range []byte(s) {
        fmt.Printf("%b\n", b)
    }
    // 11100110
    // 10001000
    // 10010001
}

现在打印出二进制的值进行比较,整理如下:

0000 0000 0000 0000 0110 0010 0001 0001 // r
 1110 0110 1000 1000 1001 0001 // s

然后转换s转换为r,也就是utf8转换为unicode

1110 0110 1000 1000 1001 0001 // s
0110   00 1000   01 0001 // s utf8 -> unicode
0000 0000 0110 0010 0001 0001 // s utf8 -> unicode
0000 0000 0000 0000 0110 0010 0001 0001 // r

转换成功 得出结论 r是unicode编码 s是utf8 编码

golang和java一样 字符是unicode编码 字符串是utf8编码

底层这些东东一定要弄明白,不然会经常害人的.

豫ICP备09035262号-1