本文系第十五篇Golang语言学习教程
什么是字符串
Go 语言中的字符串是一个字节切片. 把内容放在双引号之间, 就可以创建一个字符串.
package main
import "fmt"
func main() {
name := "hello world"
fmt.Println(name)
}
程序输出:hello world
Go 中字符串是兼容 Unicode 编码的, 并且使用 UTF-8 进行编码.
单独获取字符串的每一个字节
由于字符串是字节切片, 所以可以获取字符串的每一个字节.
package main
import "fmt"
func printbytes(s string) { //定义函数
for i := 0; i < len(s); i++ { //len(s) 返回字符串中字符的数量
fmt.Printf( "%x ", s[i]) //%x 指定打印字符串的16进制编码
}
}
func printchars(s string) {
for i := 0; i< len(s); i++ {
fmt.Printf("%c ", s[i]) //%c 指定打印字符串的字符
}
}
func main() {
name := "hello world"
printbytes(name)
fmt.Println("\n")
printchars(name)
}
上面程序中, len(s) 用于返回字符串的字符数量, %x 指定打印字符串的16进制编码, %c 用于指定打印字符串的数量.
以上程序输出为:
68 65 6c 6c 6f 20 77 6f 72 6c 64
h e l l o w o r l d
上面的程序获取字符串的每一个字符,虽然看起来是合法的,但却有一个严重的 bug。让我拆解这个代码来看看我们做错了什么。
package main
import "fmt"
func printbytes(s string) { //定义函数
for i := 0; i < len(s); i++ { //len(s) 返回字符串中字符的数量
fmt.Printf( "%x ", s[i]) //%x 指定打印字符串的16进制编码
}
}
func printchars(s string) {
for i := 0; i< len(s); i++ {
fmt.Printf("%c ", s[i]) //%c 指定打印字符串的字符
}
}
func main() {
name := "hello world"
printbytes(name)
fmt.Println("\n")
printchars(name)
name = "Señor"
fmt.Println("\n")
printchars(name)
}
以上程序中,我们尝试输出 Señor 的字符,但却输出了错误的 S e à ± o r。 为什么程序分割 Hello World
时表现完美,但分割 Señor
就出现了错误呢?这是因为 ñ
的 Unicode 代码点(Code Point)是 U+00F1
。它的 UTF-8 编码占用了 c3 和 b1 两个字节。它的 UTF-8 编码占用了两个字节 c3 和 b1。而我们打印字符时,却假定每个字符的编码只会占用一个字节,这是错误的。在 UTF-8 编码中,一个代码点可能会占用超过一个字节的空间。那么我们该怎么办呢?rune 能帮我们解决这个难题。
rune
rune 是 Go 语言的内建类型,它也是 int32 的别称。在 Go 语言中,rune 表示一个代码点。代码点无论占用多少个字节,都可以用一个 rune 来表示。让我们修改一下上面的程序,用 rune 来打印字符。
package main
import "fmt"
func printbytes(s string) { //定义函数
for i := 0; i < len(s); i++ { //len(s) 返回字符串中字符的数量
fmt.Printf( "%x ", s[i]) //%x 指定打印字符串的16进制编码
}
}
func printchars(s string) {
runes := []rune(s) //字符串被转化为一个 rune 切片
for i := 0; i< len(s); i++ {
fmt.Printf("%c ", runes[i]) //%c 指定打印字符串的字符
}
}
func main() {
name := "hello world"
printbytes(name)
fmt.Println("\n")
printchars(name)
name = "Señor"
fmt.Println("\n")
printchars(name)
}
以上程序中, 将字符串转化为一个 rune 的切片.
程序输出为:
68 65 6c 6c 6f 20 77 6f 72 6c 64
h e l l o w o r l d
S e ñ o r
字符串是不可变的
Go中的字符串是不可变的, 一旦创建无法更改:
package main
import (
"fmt"
)
func mutate(s string)string {
s[0] = 'a'//any valid unicode character within single quote is a rune
return s
}
func main() {
h := "hello"
fmt.Println(mutate(h))
}
以上程序中想要把 h 的第一个字符变成 a, 却报错:main.go:8: cannot assign to s[0]
, 由此可以看出,字符串不允许修改.
为了修改字符串,可以把字符串转化为一个 rune 切片。然后这个切片可以进行任何想要的改变,然后再转化为一个字符串。
package main
import (
"fmt"
)
func mutate(s []rune) string {
s[0] = 'a'
return string(s)
}
func main() {
h := "hello"
fmt.Println(mutate([]rune(h)))
}
以上程序中, 函数 mutate 接收到一个 rune 切片的传入, 将第一个字符更改为 a , 然后转换为字符串输出. 所以以上程序输出为: aello
以上为学习Golang 字符串篇