成人午夜视频全免费观看高清-秋霞福利视频一区二区三区-国产精品久久久久电影小说-亚洲不卡区三一区三区一区

go語(yǔ)言中多字節(jié)字符 int占幾個(gè)字節(jié)

Go中字符串的遍歷

首先說(shuō)一下go中的字符串類(lèi)型:

創(chuàng)新互聯(lián)主要從事網(wǎng)站設(shè)計(jì)制作、網(wǎng)站設(shè)計(jì)、網(wǎng)頁(yè)設(shè)計(jì)、企業(yè)做網(wǎng)站、公司建網(wǎng)站等業(yè)務(wù)。立足成都服務(wù)鐵西,十余年網(wǎng)站建設(shè)經(jīng)驗(yàn),價(jià)格優(yōu)惠、服務(wù)專(zhuān)業(yè),歡迎來(lái)電咨詢(xún)建站服務(wù):18980820575

字符串就是一串固定長(zhǎng)度的字符連接起來(lái)的字符序列。Go的字符串是由單個(gè)字節(jié)連接起來(lái)的。Go語(yǔ)言的字符串的字節(jié)使用UTF-8編碼標(biāo)識(shí)Unicode文本。

下面介紹字符串的三種遍歷方式,根據(jù)實(shí)際情況選擇即可。

該遍歷方式==缺點(diǎn)==:遍歷是按照字節(jié)遍歷,因此如果有中文等非英文字符,就會(huì)出現(xiàn)亂碼,比如要遍歷"abc北京"這個(gè)字符串,效果如下:

可見(jiàn)這不是我們想要的效果,根據(jù)utf-8中文編碼規(guī)則,我們要str[3]str[4]str[5]三個(gè)字節(jié)合起來(lái)組成“北”字及 str[6]str[7]str[8]合起來(lái)組成“京”字。由此引出下面第二種遍歷方法。

該方式是按照字符遍歷的,所以不會(huì)出現(xiàn)亂碼,如下:

運(yùn)行結(jié)果:

從圖中可以看到第二個(gè)漢子“京”的開(kāi)始下標(biāo)是6,直接跳過(guò)了4和5,可見(jiàn)確實(shí)依照utf8編碼方式將三個(gè)字節(jié)組合成了一個(gè)漢字,str[3]-str[5]組合成“北”字,str[6]-str[8]組合成了“京”字。

由于下標(biāo)的不確定性,所以引出了下面的遍歷方式。

1 可以先將字符串轉(zhuǎn)成 []rune 切片

2 再用常規(guī)方法進(jìn)行遍歷

運(yùn)行效果:

由此可見(jiàn)下標(biāo)是按1遞增的,沒(méi)有產(chǎn)生跳躍現(xiàn)象。

golang獲取到string和直接賦值strimg不一樣

1、 string的定義

Golang中的string的定義在reflect包下的value.go中,定義如下:

StringHeader 是字符串的運(yùn)行時(shí)表示,其中包含了兩個(gè)字段,分別是指向數(shù)據(jù)數(shù)組的指針和數(shù)組的長(zhǎng)度。

// StringHeader is the runtime representation of a string.

// It cannot be used safely or portably and its representation may

// change in a later release.

// Moreover, the Data field is not sufficient to guarantee the data

// it references will not be garbage collected, so programs must keep

// a separate, correctly typed pointer to the underlying data.

type StringHeader struct {

Data uintptr

Len int

}

1

2

3

4

5

6

7

8

9

10

1

2

3

4

5

6

7

8

9

10

2、string不可變

Golang中的字符串是不可變的,不能通過(guò)索引下標(biāo)的方式修改字符串中的數(shù)據(jù):

在這里插入圖片描述

運(yùn)行代碼,可以看到編譯器報(bào)錯(cuò),string是不可變的

在這里插入圖片描述

但是能不能進(jìn)行一些騷操作來(lái)改變?cè)氐闹的兀?/p>

package main

import (

"fmt"

"reflect"

"unsafe"

)

func main() {

a := "hello,world"

b := a[6:]

bptr := (*reflect.StringHeader) (unsafe.Pointer(b))

fmt.Println(a)

fmt.Println(b)

*(*byte)(unsafe.Pointer(bptr.Data)) = '.'

fmt.Println(a)

fmt.Println(b)

}

// 運(yùn)行結(jié)果

hello,world

world

unexpected fault address 0x49d7e3

fatal error: fault

[signal 0xc0000005 code=0x1 addr=0x49d7e3 pc=0x4779fa]

goroutine 1 [running]:

runtime.throw(0x49c948, 0x5)

C:/Program Files/Go/src/runtime/panic.go:1117 +0x79 fp=0xc0000dbe90 sp=0xc0000dbe60 pc=0x405fd9

runtime.sigpanic()

C:/Program Files/Go/src/runtime/signal_windows.go:245 +0x2d6 fp=0xc0000dbee8 sp=0xc0000dbe90 pc=0x4189f6

main.main()

F:/go_workspace/src/code/string_test/main.go:20 +0x13a fp=0xc0000dbf88 sp=0xc0000dbee8 pc=0x4779fa

runtime.main()

C:/Program Files/Go/src/runtime/proc.go:225 +0x256 fp=0xc0000dbfe0 sp=0xc0000dbf88 pc=0x4087f6

runtime.goexit()

C:/Program Files/Go/src/runtime/asm_amd64.s:1371 +0x1 fp=0xc0000dbfe8 sp=0xc0000dbfe0 pc=0x435da1

Process finished with the exit code 2

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

在上面的代碼中,因?yàn)樵趃o語(yǔ)言中不能進(jìn)行指針的加減運(yùn)算,因此取切片,讓b的Data指針指向’,'所在的位置。然后把"hello,world"中的逗號(hào)改為點(diǎn),但是發(fā)現(xiàn)還是不行,程序直接崩潰了??磥?lái)go語(yǔ)言中的指針得到了大大的限制,設(shè)計(jì)者并不想讓程序員過(guò)度使用指針來(lái)寫(xiě)出一些不安全的代碼。

3、使用string給另一個(gè)string賦值

Golang中的字符串的賦值并不是拷貝底層的字符串?dāng)?shù)組,而是數(shù)組指針和長(zhǎng)度字段的拷貝。例如:當(dāng)我們定義了一個(gè)字符串 a := “hello,world” 然后定義了 b := a 底層所做的操作只是創(chuàng)建了兩個(gè)StringHeader的結(jié)構(gòu)體,它們的Data字段都指向同一段數(shù)據(jù),如下圖:

在這里插入圖片描述

我們可以利用代碼來(lái)證實(shí)這一點(diǎn):

package main

import (

"fmt"

"reflect"

"unsafe"

)

func main() {

a := "hello,world"

b := a

fmt.Println(a)

fmt.Println(b)

aptr := (*reflect.StringHeader) (unsafe.Pointer(a))

bptr := (*reflect.StringHeader) (unsafe.Pointer(b))

fmt.Println("a ptr:", unsafe.Pointer(aptr.Data))

fmt.Println("b ptr:", unsafe.Pointer(bptr.Data))

}

// 運(yùn)行結(jié)果

hello, world

hello, world

a ptr: 0x6bdb76

b ptr: 0x6bdb76

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

在上面的代碼中,將a和b轉(zhuǎn)換為StringHeader類(lèi)型的指針,然后分別打印出,a和b的Data指針的值,發(fā)現(xiàn)是相同的

那么如果對(duì)a做切片賦值給b呢?

func main() {

a := "hello,world"

b := a[6:]

fmt.Println(a)

fmt.Println(b)

aptr := (*reflect.StringHeader) (unsafe.Pointer(a))

bptr := (*reflect.StringHeader) (unsafe.Pointer(b))

fmt.Println("a ptr:", unsafe.Pointer(aptr.Data))

fmt.Println("b ptr:", unsafe.Pointer(bptr.Data))

}

// 運(yùn)行結(jié)果

hello,world

world

a ptr: 0xd4d849

b ptr: 0xd4d84f

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

0xd4d849 - 0xd4d84f = 0x000006

顯然,也沒(méi)有分配新的數(shù)組并拷貝數(shù)據(jù),而是將原字符數(shù)組的指針的偏移賦給了b的StringHeader的Data

4、string重新賦值

如果對(duì)一個(gè)已經(jīng)賦值的字符串重新賦值,也不會(huì)修改原內(nèi)存空間,而是申請(qǐng)了新的內(nèi)存空間,對(duì)其賦值,并指向新的內(nèi)存空間。如下圖:

在這里插入圖片描述

也可以使用代碼來(lái)證實(shí)一下:

package main

import (

"fmt"

"reflect"

"unsafe"

)

func main() {

a := "hello,world"

aptr := (*reflect.StringHeader) (unsafe.Pointer(a))

fmt.Println("a ptr:", unsafe.Pointer(aptr.Data))

fmt.Println("a len", aptr.Len)

a = "hello,golang"

newAPtr := (*reflect.StringHeader) (unsafe.Pointer(a))

fmt.Println("b ptr:", unsafe.Pointer(newAPtr.Data))

fmt.Println("b len:", newAPtr.Len)

}

// 運(yùn)行結(jié)果

a ptr: 0x3ed7f4

a len 11

b ptr: 0x3edb2c

b len: 12

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

文章知識(shí)點(diǎn)與官方知識(shí)檔案匹配

Go技能樹(shù)九陰真經(jīng)字符串

2043 人正在系統(tǒng)學(xué)習(xí)中

點(diǎn)擊閱讀全文

打開(kāi)CSDN APP,看更多技術(shù)內(nèi)容

Golang底層原理剖析之string類(lèi)型與字符編碼_cheems~的博客_g...

string類(lèi)型 string結(jié)構(gòu) go語(yǔ)言中默認(rèn)使用的是UTF-8編碼 string由兩部分組成,一部分是指向字符串起始地址的指針,另一部分是字節(jié)個(gè)數(shù)len注意不是字符個(gè)數(shù),是字節(jié)個(gè)數(shù)!這個(gè)數(shù)據(jù)類(lèi)型占用16B空間,指向字符串起始地址的指針和存在字節(jié)個(gè)數(shù)的整...

繼續(xù)訪問(wèn)

...底層系列二(基礎(chǔ))_GoGo在努力的博客_golang string底層

1、 string的定義 Golang中的string的定義在reflect包下的value.go中,定義如下: StringHeader 是字符串的運(yùn)行時(shí)表示,其中包含了兩個(gè)字段,分別是指向數(shù)據(jù)數(shù)組的指針和數(shù)組的長(zhǎng)度。 // StringHeader is the runtime representation of a...

繼續(xù)訪問(wèn)

最新發(fā)布 Golang: []string 和 ...string

… 參數(shù)語(yǔ)法形成了可變參數(shù)的參數(shù)。它將接受零個(gè)或多個(gè)string參數(shù),并將它們作為切片引用

繼續(xù)訪問(wèn)

常用的Golang字符串(string)操作

文章目錄Golang中常用的字符串操作一、標(biāo)準(zhǔn)庫(kù)相關(guān)的Package二、常用字符串操作判斷是否為空字符串 正文 Golang中常用的字符串操作 一、標(biāo)準(zhǔn)庫(kù)相關(guān)的Package 二、常用字符串操作 判斷是否為空字符串 思路:直接判斷是否等于""空字符串,由于golang中字符串不能為nil,且為值類(lèi)型,所以直接與空字符串比較即可 舉例: str := "" if str == ""{...

繼續(xù)訪問(wèn)

golang中的string_xiaodongdonga的博客_golang ...string

golang中的string 在golang中,string其實(shí)是個(gè)結(jié)構(gòu)體,如圖 ,在這個(gè)結(jié)構(gòu)體中有兩個(gè)值,一個(gè)是指向字符數(shù)組的指針str,另一個(gè)是這個(gè)字符串的長(zhǎng)度len。 另外在golang中用的是UFT8邊長(zhǎng)編碼,里面字母是用一個(gè)字節(jié),西方的文字使用兩個(gè)字節(jié),...

繼續(xù)訪問(wèn)

Golang中對(duì)字符串string的相關(guān)操作_Codex_97的博客_go 字符...

golang中擁有string的內(nèi)置類(lèi)型,可以使用與普通slice類(lèi)型相似的性質(zhì)。 1.簡(jiǎn)介 strings包提供了很多操作字符串的簡(jiǎn)單函數(shù),通常一般的字符串操作都可以在這個(gè)包中找到。 strconv 包提供了基本數(shù)據(jù)類(lèi)型和字符串之間的轉(zhuǎn)換。在Go 中,沒(méi)有隱式...

繼續(xù)訪問(wèn)

go-string-set:一種在GoLang中創(chuàng)建字符串集的方法

概述 通過(guò)字符串設(shè)置方法。 用法 go get github.com/wojnosystems/go-string-set package main import ( "github.com/wojnosystems/go-string-set/string_set" "strings" ) func main () { myPeople := string_set . New () myPeople . Add ( "Bob" ) myPeople . Add ( "Jane" ) myPeople . Add ( "Gary" ) myPeople . Add ( "Bob" ) if myPeople . Exists ( "Bob" ) { // Bob exists in myPeople, so this code block execute

Golang:strings包和字符串操作

strings包 string類(lèi)型值是不可變的,如果想要獲得一個(gè)不一樣的字符串,就只能基于原字符串進(jìn)行剪裁,拼接等操作,然后將得到的新字符串存放到一塊聯(lián)系內(nèi)存中。 string值包含了指向底層字節(jié)數(shù)組頭部的指針值,以及該字節(jié)數(shù)組的長(zhǎng)度。在string值上做切片,就相當(dāng)于在其底層字節(jié)數(shù)組做切片。 而字符串拼接時(shí)(使用+),會(huì)把所有被拼接的字符串依次拷貝到一個(gè)嶄新且足夠大的連續(xù)內(nèi)存空間中,并把持有新...

繼續(xù)訪問(wèn)

golang中的strings.SplitN_盼盼編程的博客_strings.splitn

golang中的字符串操作strings.SplitN package main import ( "fmt" "strings" ) //golang字符串操作 func main(){ s := "hello world hello world" //str := "wo" //以str為分隔符,將s切分成多個(gè)子串,結(jié)果中**不包含*...

繼續(xù)訪問(wèn)

Golang_String常用操作_itzhuzhu.的博客_golang strings

func main() { var x string = "ITzhuzhu" var y string = "itzhuzhu" fmt.Println(strings.EqualFold(x, y)) //true fmt.Println(x == y) //false } 1 2 3 4 5 6 返回子串在字符串第一次出現(xiàn)的索引,如果沒(méi)有則...

繼續(xù)訪問(wèn)

Golang類(lèi)型的String()方法

作用 用于定制fmt.Println(x)、fmt.Printf("%v", x)、fmt.Print(x)時(shí)輸出的內(nèi)容。 示例 package main import "fmt" type Couple struct { Husband string Wife string } func (self Couple) String() string { return "(husband:" + self.Husband + ", wife:" + self.Wife +

繼續(xù)訪問(wèn)

golang的string

golang中的string是不可變的字節(jié)序列,零值是空字符串,默認(rèn)是UTF-8編碼。 golang中使用字符串最需要注意的是,golang中的字符串是字節(jié)序列,string == []byte,由于一個(gè)字符占用的字節(jié)數(shù)不確定,所以無(wú)法通過(guò)下標(biāo)[i]的方式穩(wěn)定地獲取對(duì)應(yīng)位置的字符。 也就意味著字符串的第i個(gè)字節(jié),不一定就是第i個(gè)字符,原因請(qǐng)參考 unicode與UTF-8 文字符號(hào)在golang中被稱(chēng)為rune,發(fā)音為/ru:n/,意思是符號(hào)。由于utf-8最多使用4個(gè)字節(jié)來(lái)編碼,所以rune類(lèi)型是int3

繼續(xù)訪問(wèn)

golang中的strings.Trim_盼盼編程的博客_strings.trim

golang中的字符串操作strings.Trim package main import ( "fmt" "strings" ) //golang字符串操作 func main(){ s := "Hello world hello world" str := "world" //var s = []string{"11","22","33"} //刪除s首尾...

繼續(xù)訪問(wèn)

Golang 字符串

Go語(yǔ)言的代碼是由Unicode字符組成的,它們都必須由Unicode編碼規(guī)范中的UTF-8編碼格式進(jìn)行編碼并存儲(chǔ),Unicode編碼規(guī)范中的編碼格式定義的是字符與字節(jié)序列之間的轉(zhuǎn)換方式。其中的UTF-8是一種可變寬的編碼方案,它會(huì)用一個(gè)或多個(gè)字節(jié)的二進(jìn)制數(shù)來(lái)表示某個(gè)字符,最多使用四個(gè)字節(jié)。Go語(yǔ)言中的一個(gè)string類(lèi)型值會(huì)由若干個(gè)Unicode字符組成,每個(gè)Unicode字符都可以由一個(gè)rune類(lèi)型的值來(lái)承載。stringforrange。...

繼續(xù)訪問(wèn)

golang字符串[]string(slice)去重

1、現(xiàn)實(shí)代碼 // []string 去重 func RemoveDuplicate(list []string) []string { // 這個(gè)排序很關(guān)鍵 sort.Strings(list) i := 0 var newlist = []string{""} for j := 0; j len(list); j++ { if strings.Compare(newlist[i], list[j]) == -1 { newlist = append(newlist, lis

繼續(xù)訪問(wèn)

深入理解golang string

golang string string的定義 // string is the set of all strings of 8-bit bytes, conventionally but not // necessarily representing UTF-8-encoded text. A string may be empty, but // not nil. Values of string type are immutable. type string string string里存儲(chǔ)的是字符

繼續(xù)訪問(wèn)

golang中string包

對(duì)于基本類(lèi)型來(lái)說(shuō),字符串所需要執(zhí)行的操作會(huì)比較復(fù)雜,所以一般語(yǔ)言都會(huì)額外封裝一些方法用于處理字符串,go語(yǔ)言標(biāo)準(zhǔn)庫(kù)中也存在這樣一個(gè)名為strings的庫(kù) 包含判斷,判斷一個(gè)字符中是否有相應(yīng)的某個(gè)子字符串是經(jīng)常遇到的一種字符串操作,再go語(yǔ)言中可以使用strings包中的兩個(gè)方法判斷 ...

繼續(xù)訪問(wèn)

golang中的strings.TrimLeft

golang中的字符串操作strings.TrimLeft package main import ( "fmt" "strings" ) //golang字符串操作 func main(){ s := "Hello world hello world" str := "Hello" //var s = []string{"11","22","33"} //刪除s頭部連續(xù)的包含在str中的字符串 .

繼續(xù)訪問(wèn)

golang入門(mén)time與string轉(zhuǎn)換, time加減時(shí)間, 兩個(gè)時(shí)間差

package mainimport ( "fmt" "time")var timeLayoutStr = "2006-01-02 15:04:05" //go中的時(shí)間格式化必須是這個(gè)時(shí)間//var timeLayoutStr = 2006/01/02 03:04:05 //合法, 格式可以改變//var timeLayoutStr = 2019/01/02 15:04:05 /...

繼續(xù)訪問(wèn)

Golang——string

1.string結(jié)構(gòu)體底層 由兩部分組成:指向底層[ ]byte數(shù)組的指針;長(zhǎng)度(類(lèi)似切片結(jié)構(gòu)體) 2.相同的string常量不會(huì)重復(fù)存儲(chǔ) //由s1、s2的指針指向一塊相同的只讀內(nèi)存,這段內(nèi)存以u(píng)tf-8編碼存放hello數(shù)組 s1 := "hello" s2 := "hello" 3.string常量會(huì)在編譯期分配到只讀段,對(duì)應(yīng)數(shù)據(jù)地址不可寫(xiě)入,故string不支持修改。 要修改必須轉(zhuǎn)[]byte,string和[]byte轉(zhuǎn)換,會(huì)將這段只讀內(nèi)存的數(shù)據(jù)復(fù)制到堆/棧上。 //wrong s := "he

繼續(xù)訪問(wèn)

熱門(mén)推薦 golang -----------字符串(rune,string,type)

一、內(nèi)存布局 字符串在Go語(yǔ)言?xún)?nèi)存模型中用一個(gè)2字長(zhǎng)的數(shù)據(jù)結(jié)構(gòu)表示。它包含一個(gè)指向字符串存儲(chǔ)數(shù)據(jù)的指針和一個(gè)長(zhǎng)度數(shù)據(jù)。因?yàn)閟tring類(lèi)型是不可變的,對(duì)于多字符串共享同一個(gè)存儲(chǔ)數(shù)據(jù)是安全的。切分操作str[i:j]會(huì)得到一個(gè)新的2字長(zhǎng)結(jié)構(gòu),一個(gè)可能不同的但仍指向同一個(gè)字節(jié)序列(即上文說(shuō)的存儲(chǔ)數(shù)據(jù))的指針和長(zhǎng)度數(shù)據(jù)。這意味著字符串切分可以在不涉及內(nèi)存分配或復(fù)制操作。這使得字符串切分的效率等同于...

繼續(xù)訪問(wèn)

Golang string 常用方法

strings.Compare(p1, p2) 判斷p1是否大于p2,大于:1,小于:-1,等于:0。2.strings.LastIndex(p1,p2) p2在p1中最后一次出現(xiàn)的位置,未出現(xiàn)返回-1。1.strings.Replace(p1,p2,p3,n) 將p1中的p2替換成p3,最多替換n個(gè)。1.strings.Index(p1,p2) p2在p1中第一次出現(xiàn)的位置,未出現(xiàn)返回-1。2.strings.ReplaceAll(p1,p2,p3) 將p1中的所有p2替換成p3。

繼續(xù)訪問(wèn)

golang中的字符串

在go中rune是一個(gè)unicode編碼點(diǎn)。 我們都知道UTF-8將字符編碼為1-4個(gè)字節(jié),比如我們常用的漢字,UTF-8編碼為3個(gè)字節(jié)。所以rune也是int32的別名。

繼續(xù)訪問(wèn)

golang之字符串

Go語(yǔ)言的字符有兩種類(lèi)型: 一種是byte型,或者叫uint8類(lèi)型,代表了ASCII碼的一個(gè)字符。 一種是rune類(lèi)型,或者叫int32類(lèi)型,代表一個(gè)UTF-8字符,當(dāng)需要處理中文、日文等unicode字符時(shí),則需要用到rune類(lèi)型。 ...

繼續(xù)訪問(wèn)

Golang的 string 類(lèi)型

一點(diǎn)睛 字符串就是一串固定長(zhǎng)度的字符連接起來(lái)的字符序列。Go 的字符串是由單個(gè)字節(jié)連接起來(lái)的。Go語(yǔ)言的字符串的字節(jié)使用 UTF-8 編碼標(biāo)識(shí) Unicode 文本。 二 string 使用注意事項(xiàng)和細(xì)節(jié) 1 Go 語(yǔ)言的字符串的字節(jié)使用 UTF-8 編碼標(biāo)識(shí) Unicode 文本,這樣 Golang 統(tǒng)一使用 UTF-8 編碼,中文亂碼問(wèn)題不會(huì)再困擾程序員。 2 字符串一旦賦值了,字符串就不能修改了,在 Go 中字符串是不可變的。 3 字符串的兩種表示形式。 a 雙引號(hào)——會(huì)識(shí)別轉(zhuǎn)義字符 .

繼續(xù)訪問(wèn)

Golang Strings 官方包常用方法,學(xué)會(huì)這些夠用了

1.判斷是否以某字符串打頭/結(jié)尾 2.字符串分割 3.返回子串索引 4.字符串連接 5.字符串轉(zhuǎn)化為大小寫(xiě) 6.統(tǒng)計(jì)某個(gè)字符在字符串出現(xiàn)的次數(shù) 7.判斷字符串的包含關(guān)系 8.字符串替換

golang unicode/utf8源碼分析

包 utf-8 實(shí)現(xiàn)的功能和常量用于文章utf8編碼,包含runes和utf8字節(jié)序列的轉(zhuǎn)換功能.在unicode中,一個(gè)中文占兩個(gè)字節(jié),utf-8中一個(gè)中文占三個(gè)字節(jié),golang默認(rèn)的編碼是utf-8編碼,因此默認(rèn)一個(gè)中文占三個(gè)字節(jié),但是golang中的字符串底層實(shí)際上是一個(gè)byte數(shù)組.

Output:

RuneSelf該值的字節(jié)碼值為128,在判斷是否是常規(guī)的ascii碼是使用。hicb字節(jié)碼值為191. FF 的對(duì)應(yīng)的字節(jié)碼為255。

計(jì)算字符串中的rune數(shù)量,原理:首先取出字符串的碼值,然后判斷是不是個(gè)小于128的,如果是小于則直接continue.rune個(gè)數(shù)++.

如果是個(gè)十六進(jìn)制f1.的則是無(wú)效字符,直接continue.rune個(gè)數(shù)++,也就是說(shuō)一個(gè)無(wú)效的字符也當(dāng)成一個(gè)字長(zhǎng)為1的rune.如果字符的碼值在first列表中的值和7按位的結(jié)果為其字長(zhǎng),比如上面示例中的 鋼 。其字長(zhǎng)為三位,第一位的值為 233 .二進(jìn)制形式為 11101001 ;與7按位與后的值為0.從acceptRanges中取出的結(jié)果為{locb, hicb}。也就是標(biāo)識(shí) ox80 到 0xbf 之間的值。而結(jié)果n也就是直接size+3跳過(guò)3個(gè)字節(jié)后,rune個(gè)數(shù)++。其他函數(shù)的處理流程差不多,不再過(guò)多敘述。

示例:

ValidString返回值表明參數(shù)字符串是否是一個(gè)合法的可utf8編碼的字符串。

RuneCount返回參數(shù)中包含的rune數(shù)量,第一個(gè)例子中將 utf8.RuneCountInString ,改成該方法調(diào)用,返回的結(jié)果相同。錯(cuò)誤的和短的被當(dāng)成一個(gè)長(zhǎng)一字節(jié)的rune.單個(gè)字符 H 就表示一個(gè)長(zhǎng)度為1字節(jié)的rune.

該函數(shù)標(biāo)識(shí)參數(shù)是否以一個(gè)可編碼的rune開(kāi)頭,上面的例子中,因?yàn)樽址且砸粋€(gè)ascii碼值在0-127內(nèi)的字符開(kāi)頭,所以在執(zhí)行

first[p[0]] 時(shí),取到的是 p[0] 是72,在first列表中,127之前的值都相同都為 0xF0 ,十進(jìn)制標(biāo)識(shí)為240,與7按位與后值為0,所以,直接返回 true .

和FullRune類(lèi)似,只是參數(shù)為字符串形式

go語(yǔ)言怎么修改字符串中的某一個(gè)字符?

go語(yǔ)言的字符串是UTF-8編碼的、不可改變的字節(jié)序列。

要修改字符串,只能以原串為基礎(chǔ),創(chuàng)建一個(gè)新串。下面的圖中是一個(gè)參考示例,提供了以原串為藍(lán)本,創(chuàng)建新串的兩種方法。

代碼

輸出

分享名稱(chēng):go語(yǔ)言中多字節(jié)字符 int占幾個(gè)字節(jié)
網(wǎng)頁(yè)地址:http://jinyejixie.com/article24/ddogice.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站改版、虛擬主機(jī)、電子商務(wù)網(wǎng)站維護(hù)、外貿(mào)建站、網(wǎng)站策劃

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶(hù)投稿、用戶(hù)轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話(huà):028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

成都app開(kāi)發(fā)公司
建德市| 叙永县| 武义县| 衡东县| 寿宁县| 余干县| 恭城| 子洲县| 张家界市| 庄河市| 翁牛特旗| 韩城市| 柘荣县| 梧州市| 呼和浩特市| 油尖旺区| 武威市| 侯马市| 萍乡市| 新干县| 白玉县| 双牌县| 扶沟县| 建湖县| 新干县| 安平县| 离岛区| 蒙山县| 邓州市| 大安市| 大安市| 金昌市| 高密市| 靖江市| 彭水| 台东县| 韩城市| 阿鲁科尔沁旗| 杭锦旗| 尤溪县| 武功县|