操作字符串離不開字符串的拼接,但是Go中string是只讀類型,大量字符串的拼接會造成性能問題。
10年積累的成都網(wǎng)站制作、網(wǎng)站建設經(jīng)驗,可以快速應對客戶對網(wǎng)站的新想法和需求。提供各種問題對應的解決方案。讓選擇我們的客戶得到更好、更有力的網(wǎng)絡服務。我雖然不認識你,你也不認識我。但先網(wǎng)站設計后付款的網(wǎng)站建設流程,更有溪湖免費網(wǎng)站建設讓你可以放心的選擇與我們合作。
拼接字符串,無外乎四種方式,采用“+”,“fmt.Sprintf()”,"bytes.Buffer","strings.Builder"
上面我們創(chuàng)建10萬字符串拼接的測試,可以發(fā)現(xiàn)"bytes.Buffer","strings.Builder"的性能最好,約是“+”的1000倍級別。
這是由于string是不可修改的,所以在使用“+”進行拼接字符串,每次都會產(chǎn)生申請空間,拼接,復制等操作,數(shù)據(jù)量大的情況下非常消耗資源和性能。而采用Buffer等方式,都是預先計算拼接字符串數(shù)組的總長度(如果可以知道長度),申請空間,底層是slice數(shù)組,可以以append的形式向后進行追加。最后在轉換為字符串。這申請了不斷申請空間的操作,也減少了空間的使用和拷貝的次數(shù),自然性能也高不少。
bytes.buffer是一個緩沖byte類型的緩沖器存放著都是byte
是一個變長的 buffer,具有 Read 和Write 方法。 Buffer 的 零值 是一個 空的 buffer,但是可以使用,底層就是一個 []byte, 字節(jié)切片。
向Buffer中寫數(shù)據(jù),可以看出Buffer中有個Grow函數(shù)用于對切片進行擴容。
從Buffer中讀取數(shù)據(jù)
strings.Builder的方法和bytes.Buffer的方法的命名幾乎一致。
但實現(xiàn)并不一致,Builder的Write方法直接將字符拼接slice數(shù)組后。
其沒有提供read方法,但提供了strings.Reader方式
Reader 結構:
Buffer:
Builder:
可以看出Buffer和Builder底層都是采用[]byte數(shù)組進行裝載數(shù)據(jù)。
先來說說Buffer:
創(chuàng)建好Buffer是一個empty的,off 用于指向讀寫的尾部。
在寫的時候,先判斷當前寫入字符串長度是否大于Buffer的容量,如果大于就調(diào)用grow進行擴容,擴容申請的長度為當前寫入字符串的長度。如果當前寫入字符串長度小于最小字節(jié)長度64,直接創(chuàng)建64長度的[]byte數(shù)組。如果申請的長度小于二分之一總容量減去當前字符總長度,說明存在很大一部分被使用但已讀,可以將未讀的數(shù)據(jù)滑動到數(shù)組頭。如果容量不足,擴展2*c + n 。
其String()方法就是將字節(jié)數(shù)組強轉為string
Builder是如何實現(xiàn)的。
Builder采用append的方式向字節(jié)數(shù)組后添加字符串。
從上面可以看出,[]byte的內(nèi)存大小也是以倍數(shù)進行申請的,初始大小為 0,第一次為大于當前申請的最大 2 的指數(shù),不夠進行翻倍.
可以看出如果舊容量小于1024進行翻倍,否則擴展四分之一。(2048 byte 后,申請策略的調(diào)整)。
其次String()方法與Buffer的string方法也有明顯區(qū)別。Buffer的string是一種強轉,我們知道在強轉的時候是需要進行申請空間,并拷貝的。而Builder只是指針的轉換。
這里我們解析一下 *(*string)(unsafe.Pointer(b.buf)) 這個語句的意思。
先來了解下unsafe.Pointer 的用法。
也就是說,unsafe.Pointer 可以轉換為任意類型,那么意味著,通過unsafe.Pointer媒介,程序繞過類型系統(tǒng),進行地址轉換而不是拷貝。
即*A = Pointer = *B
就像上面例子一樣,將字節(jié)數(shù)組轉為unsafe.Pointer類型,再轉為string類型,s和b中內(nèi)容一樣,修改b,s也變了,說明b和s是同一個地址。但是對s重新賦值后,意味著s的地址指向了“WORLD”,它們所使用的內(nèi)存空間不同了,所以s改變后,b并不會改變。
所以他們的區(qū)別就在于 bytes.Buffer 是重新申請了一塊空間,存放生成的string變量, 而strings.Builder直接將底層的[]byte轉換成了string類型返回了回來,去掉了申請空間的操作。
package main
import "fmt"
var arr [2]int //申明一個數(shù)組
func main() {
arr[0] = 1 //數(shù)組賦值
fmt.Println(arr)
arrtest := [3]int{1, 2, 3} //數(shù)組的另一種申明方式
fmt.Println(arrtest)
a := [...]int{1, 2} //[...]自動識別數(shù)組的長度
fmt.Println(a)
fmt.Println(len(a))//輸出數(shù)組的長度
}
下邊是slice的申明和使用其實這就是一種動態(tài)的數(shù)組
復制代碼 代碼如下:
package main
import "fmt"
func main() {
d := []int{1, 2, 3} //申明一個slice這個是動態(tài)的數(shù)組,沒有長度
fmt.Println(d)
var q, w []int
q = d[0:1] //可以定取得上邊的長度
w = d[1:3]
d = append(d, 2) //向其中添加元素
fmt.Println(d)
fmt.Println(q, w)
}
1、 string的定義
Golang中的string的定義在reflect包下的value.go中,定義如下:
StringHeader 是字符串的運行時表示,其中包含了兩個字段,分別是指向數(shù)據(jù)數(shù)組的指針和數(shù)組的長度。
// StringHeader is the runtime representation of a string.
// It cannot be used safely or portably and its representation may
// change in a later release.
// Moreover, the Data field is not sufficient to guarantee the data
// it references will not be garbage collected, so programs must keep
// a separate, correctly typed pointer to the underlying data.
type StringHeader struct {
Data uintptr
Len int
}
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
2、string不可變
Golang中的字符串是不可變的,不能通過索引下標的方式修改字符串中的數(shù)據(jù):
在這里插入圖片描述
運行代碼,可以看到編譯器報錯,string是不可變的
在這里插入圖片描述
但是能不能進行一些騷操作來改變元素的值呢?
package main
import (
"fmt"
"reflect"
"unsafe"
)
func main() {
a := "hello,world"
b := a[6:]
bptr := (*reflect.StringHeader) (unsafe.Pointer(b))
fmt.Println(a)
fmt.Println(b)
*(*byte)(unsafe.Pointer(bptr.Data)) = '.'
fmt.Println(a)
fmt.Println(b)
}
// 運行結果
hello,world
world
unexpected fault address 0x49d7e3
fatal error: fault
[signal 0xc0000005 code=0x1 addr=0x49d7e3 pc=0x4779fa]
goroutine 1 [running]:
runtime.throw(0x49c948, 0x5)
C:/Program Files/Go/src/runtime/panic.go:1117 +0x79 fp=0xc0000dbe90 sp=0xc0000dbe60 pc=0x405fd9
runtime.sigpanic()
C:/Program Files/Go/src/runtime/signal_windows.go:245 +0x2d6 fp=0xc0000dbee8 sp=0xc0000dbe90 pc=0x4189f6
main.main()
F:/go_workspace/src/code/string_test/main.go:20 +0x13a fp=0xc0000dbf88 sp=0xc0000dbee8 pc=0x4779fa
runtime.main()
C:/Program Files/Go/src/runtime/proc.go:225 +0x256 fp=0xc0000dbfe0 sp=0xc0000dbf88 pc=0x4087f6
runtime.goexit()
C:/Program Files/Go/src/runtime/asm_amd64.s:1371 +0x1 fp=0xc0000dbfe8 sp=0xc0000dbfe0 pc=0x435da1
Process finished with the exit code 2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
在上面的代碼中,因為在go語言中不能進行指針的加減運算,因此取切片,讓b的Data指針指向’,'所在的位置。然后把"hello,world"中的逗號改為點,但是發(fā)現(xiàn)還是不行,程序直接崩潰了??磥韌o語言中的指針得到了大大的限制,設計者并不想讓程序員過度使用指針來寫出一些不安全的代碼。
3、使用string給另一個string賦值
Golang中的字符串的賦值并不是拷貝底層的字符串數(shù)組,而是數(shù)組指針和長度字段的拷貝。例如:當我們定義了一個字符串 a := “hello,world” 然后定義了 b := a 底層所做的操作只是創(chuàng)建了兩個StringHeader的結構體,它們的Data字段都指向同一段數(shù)據(jù),如下圖:
在這里插入圖片描述
我們可以利用代碼來證實這一點:
package main
import (
"fmt"
"reflect"
"unsafe"
)
func main() {
a := "hello,world"
b := a
fmt.Println(a)
fmt.Println(b)
aptr := (*reflect.StringHeader) (unsafe.Pointer(a))
bptr := (*reflect.StringHeader) (unsafe.Pointer(b))
fmt.Println("a ptr:", unsafe.Pointer(aptr.Data))
fmt.Println("b ptr:", unsafe.Pointer(bptr.Data))
}
// 運行結果
hello, world
hello, world
a ptr: 0x6bdb76
b ptr: 0x6bdb76
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
在上面的代碼中,將a和b轉換為StringHeader類型的指針,然后分別打印出,a和b的Data指針的值,發(fā)現(xiàn)是相同的
那么如果對a做切片賦值給b呢?
func main() {
a := "hello,world"
b := a[6:]
fmt.Println(a)
fmt.Println(b)
aptr := (*reflect.StringHeader) (unsafe.Pointer(a))
bptr := (*reflect.StringHeader) (unsafe.Pointer(b))
fmt.Println("a ptr:", unsafe.Pointer(aptr.Data))
fmt.Println("b ptr:", unsafe.Pointer(bptr.Data))
}
// 運行結果
hello,world
world
a ptr: 0xd4d849
b ptr: 0xd4d84f
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
0xd4d849 - 0xd4d84f = 0x000006
顯然,也沒有分配新的數(shù)組并拷貝數(shù)據(jù),而是將原字符數(shù)組的指針的偏移賦給了b的StringHeader的Data
4、string重新賦值
如果對一個已經(jīng)賦值的字符串重新賦值,也不會修改原內(nèi)存空間,而是申請了新的內(nèi)存空間,對其賦值,并指向新的內(nèi)存空間。如下圖:
在這里插入圖片描述
也可以使用代碼來證實一下:
package main
import (
"fmt"
"reflect"
"unsafe"
)
func main() {
a := "hello,world"
aptr := (*reflect.StringHeader) (unsafe.Pointer(a))
fmt.Println("a ptr:", unsafe.Pointer(aptr.Data))
fmt.Println("a len", aptr.Len)
a = "hello,golang"
newAPtr := (*reflect.StringHeader) (unsafe.Pointer(a))
fmt.Println("b ptr:", unsafe.Pointer(newAPtr.Data))
fmt.Println("b len:", newAPtr.Len)
}
// 運行結果
a ptr: 0x3ed7f4
a len 11
b ptr: 0x3edb2c
b len: 12
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
文章知識點與官方知識檔案匹配
Go技能樹九陰真經(jīng)字符串
2043 人正在系統(tǒng)學習中
點擊閱讀全文
打開CSDN APP,看更多技術內(nèi)容
Golang底層原理剖析之string類型與字符編碼_cheems~的博客_g...
string類型 string結構 go語言中默認使用的是UTF-8編碼 string由兩部分組成,一部分是指向字符串起始地址的指針,另一部分是字節(jié)個數(shù)len注意不是字符個數(shù),是字節(jié)個數(shù)!這個數(shù)據(jù)類型占用16B空間,指向字符串起始地址的指針和存在字節(jié)個數(shù)的整...
繼續(xù)訪問
...底層系列二(基礎)_GoGo在努力的博客_golang string底層
1、 string的定義 Golang中的string的定義在reflect包下的value.go中,定義如下: StringHeader 是字符串的運行時表示,其中包含了兩個字段,分別是指向數(shù)據(jù)數(shù)組的指針和數(shù)組的長度。 // StringHeader is the runtime representation of a...
繼續(xù)訪問
最新發(fā)布 Golang: []string 和 ...string
… 參數(shù)語法形成了可變參數(shù)的參數(shù)。它將接受零個或多個string參數(shù),并將它們作為切片引用
繼續(xù)訪問
常用的Golang字符串(string)操作
文章目錄Golang中常用的字符串操作一、標準庫相關的Package二、常用字符串操作判斷是否為空字符串 正文 Golang中常用的字符串操作 一、標準庫相關的Package 二、常用字符串操作 判斷是否為空字符串 思路:直接判斷是否等于""空字符串,由于golang中字符串不能為nil,且為值類型,所以直接與空字符串比較即可 舉例: str := "" if str == ""{...
繼續(xù)訪問
golang中的string_xiaodongdonga的博客_golang ...string
golang中的string 在golang中,string其實是個結構體,如圖 ,在這個結構體中有兩個值,一個是指向字符數(shù)組的指針str,另一個是這個字符串的長度len。 另外在golang中用的是UFT8邊長編碼,里面字母是用一個字節(jié),西方的文字使用兩個字節(jié),...
繼續(xù)訪問
Golang中對字符串string的相關操作_Codex_97的博客_go 字符...
golang中擁有string的內(nèi)置類型,可以使用與普通slice類型相似的性質(zhì)。 1.簡介 strings包提供了很多操作字符串的簡單函數(shù),通常一般的字符串操作都可以在這個包中找到。 strconv 包提供了基本數(shù)據(jù)類型和字符串之間的轉換。在Go 中,沒有隱式...
繼續(xù)訪問
go-string-set:一種在GoLang中創(chuàng)建字符串集的方法
概述 通過字符串設置方法。 用法 go get github.com/wojnosystems/go-string-set package main import ( "github.com/wojnosystems/go-string-set/string_set" "strings" ) func main () { myPeople := string_set . New () myPeople . Add ( "Bob" ) myPeople . Add ( "Jane" ) myPeople . Add ( "Gary" ) myPeople . Add ( "Bob" ) if myPeople . Exists ( "Bob" ) { // Bob exists in myPeople, so this code block execute
Golang:strings包和字符串操作
strings包 string類型值是不可變的,如果想要獲得一個不一樣的字符串,就只能基于原字符串進行剪裁,拼接等操作,然后將得到的新字符串存放到一塊聯(lián)系內(nèi)存中。 string值包含了指向底層字節(jié)數(shù)組頭部的指針值,以及該字節(jié)數(shù)組的長度。在string值上做切片,就相當于在其底層字節(jié)數(shù)組做切片。 而字符串拼接時(使用+),會把所有被拼接的字符串依次拷貝到一個嶄新且足夠大的連續(xù)內(nèi)存空間中,并把持有新...
繼續(xù)訪問
golang中的strings.SplitN_盼盼編程的博客_strings.splitn
golang中的字符串操作strings.SplitN package main import ( "fmt" "strings" ) //golang字符串操作 func main(){ s := "hello world hello world" //str := "wo" //以str為分隔符,將s切分成多個子串,結果中**不包含*...
繼續(xù)訪問
Golang_String常用操作_itzhuzhu.的博客_golang strings
func main() { var x string = "ITzhuzhu" var y string = "itzhuzhu" fmt.Println(strings.EqualFold(x, y)) //true fmt.Println(x == y) //false } 1 2 3 4 5 6 返回子串在字符串第一次出現(xiàn)的索引,如果沒有則...
繼續(xù)訪問
Golang類型的String()方法
作用 用于定制fmt.Println(x)、fmt.Printf("%v", x)、fmt.Print(x)時輸出的內(nèi)容。 示例 package main import "fmt" type Couple struct { Husband string Wife string } func (self Couple) String() string { return "(husband:" + self.Husband + ", wife:" + self.Wife +
繼續(xù)訪問
golang的string
golang中的string是不可變的字節(jié)序列,零值是空字符串,默認是UTF-8編碼。 golang中使用字符串最需要注意的是,golang中的字符串是字節(jié)序列,string == []byte,由于一個字符占用的字節(jié)數(shù)不確定,所以無法通過下標[i]的方式穩(wěn)定地獲取對應位置的字符。 也就意味著字符串的第i個字節(jié),不一定就是第i個字符,原因請參考 unicode與UTF-8 文字符號在golang中被稱為rune,發(fā)音為/ru:n/,意思是符號。由于utf-8最多使用4個字節(jié)來編碼,所以rune類型是int3
繼續(xù)訪問
golang中的strings.Trim_盼盼編程的博客_strings.trim
golang中的字符串操作strings.Trim package main import ( "fmt" "strings" ) //golang字符串操作 func main(){ s := "Hello world hello world" str := "world" //var s = []string{"11","22","33"} //刪除s首尾...
繼續(xù)訪問
Golang 字符串
Go語言的代碼是由Unicode字符組成的,它們都必須由Unicode編碼規(guī)范中的UTF-8編碼格式進行編碼并存儲,Unicode編碼規(guī)范中的編碼格式定義的是字符與字節(jié)序列之間的轉換方式。其中的UTF-8是一種可變寬的編碼方案,它會用一個或多個字節(jié)的二進制數(shù)來表示某個字符,最多使用四個字節(jié)。Go語言中的一個string類型值會由若干個Unicode字符組成,每個Unicode字符都可以由一個rune類型的值來承載。stringforrange。...
繼續(xù)訪問
golang字符串[]string(slice)去重
1、現(xiàn)實代碼 // []string 去重 func RemoveDuplicate(list []string) []string { // 這個排序很關鍵 sort.Strings(list) i := 0 var newlist = []string{""} for j := 0; j len(list); j++ { if strings.Compare(newlist[i], list[j]) == -1 { newlist = append(newlist, lis
繼續(xù)訪問
深入理解golang string
golang string string的定義 // string is the set of all strings of 8-bit bytes, conventionally but not // necessarily representing UTF-8-encoded text. A string may be empty, but // not nil. Values of string type are immutable. type string string string里存儲的是字符
繼續(xù)訪問
golang中string包
對于基本類型來說,字符串所需要執(zhí)行的操作會比較復雜,所以一般語言都會額外封裝一些方法用于處理字符串,go語言標準庫中也存在這樣一個名為strings的庫 包含判斷,判斷一個字符中是否有相應的某個子字符串是經(jīng)常遇到的一種字符串操作,再go語言中可以使用strings包中的兩個方法判斷 ...
繼續(xù)訪問
golang中的strings.TrimLeft
golang中的字符串操作strings.TrimLeft package main import ( "fmt" "strings" ) //golang字符串操作 func main(){ s := "Hello world hello world" str := "Hello" //var s = []string{"11","22","33"} //刪除s頭部連續(xù)的包含在str中的字符串 .
繼續(xù)訪問
golang入門time與string轉換, time加減時間, 兩個時間差
package mainimport ( "fmt" "time")var timeLayoutStr = "2006-01-02 15:04:05" //go中的時間格式化必須是這個時間//var timeLayoutStr = 2006/01/02 03:04:05 //合法, 格式可以改變//var timeLayoutStr = 2019/01/02 15:04:05 /...
繼續(xù)訪問
Golang——string
1.string結構體底層 由兩部分組成:指向底層[ ]byte數(shù)組的指針;長度(類似切片結構體) 2.相同的string常量不會重復存儲 //由s1、s2的指針指向一塊相同的只讀內(nèi)存,這段內(nèi)存以utf-8編碼存放hello數(shù)組 s1 := "hello" s2 := "hello" 3.string常量會在編譯期分配到只讀段,對應數(shù)據(jù)地址不可寫入,故string不支持修改。 要修改必須轉[]byte,string和[]byte轉換,會將這段只讀內(nèi)存的數(shù)據(jù)復制到堆/棧上。 //wrong s := "he
繼續(xù)訪問
熱門推薦 golang -----------字符串(rune,string,type)
一、內(nèi)存布局 字符串在Go語言內(nèi)存模型中用一個2字長的數(shù)據(jù)結構表示。它包含一個指向字符串存儲數(shù)據(jù)的指針和一個長度數(shù)據(jù)。因為string類型是不可變的,對于多字符串共享同一個存儲數(shù)據(jù)是安全的。切分操作str[i:j]會得到一個新的2字長結構,一個可能不同的但仍指向同一個字節(jié)序列(即上文說的存儲數(shù)據(jù))的指針和長度數(shù)據(jù)。這意味著字符串切分可以在不涉及內(nèi)存分配或復制操作。這使得字符串切分的效率等同于...
繼續(xù)訪問
Golang string 常用方法
strings.Compare(p1, p2) 判斷p1是否大于p2,大于:1,小于:-1,等于:0。2.strings.LastIndex(p1,p2) p2在p1中最后一次出現(xiàn)的位置,未出現(xiàn)返回-1。1.strings.Replace(p1,p2,p3,n) 將p1中的p2替換成p3,最多替換n個。1.strings.Index(p1,p2) p2在p1中第一次出現(xiàn)的位置,未出現(xiàn)返回-1。2.strings.ReplaceAll(p1,p2,p3) 將p1中的所有p2替換成p3。
繼續(xù)訪問
golang中的字符串
在go中rune是一個unicode編碼點。 我們都知道UTF-8將字符編碼為1-4個字節(jié),比如我們常用的漢字,UTF-8編碼為3個字節(jié)。所以rune也是int32的別名。
繼續(xù)訪問
golang之字符串
Go語言的字符有兩種類型: 一種是byte型,或者叫uint8類型,代表了ASCII碼的一個字符。 一種是rune類型,或者叫int32類型,代表一個UTF-8字符,當需要處理中文、日文等unicode字符時,則需要用到rune類型。 ...
繼續(xù)訪問
Golang的 string 類型
一點睛 字符串就是一串固定長度的字符連接起來的字符序列。Go 的字符串是由單個字節(jié)連接起來的。Go語言的字符串的字節(jié)使用 UTF-8 編碼標識 Unicode 文本。 二 string 使用注意事項和細節(jié) 1 Go 語言的字符串的字節(jié)使用 UTF-8 編碼標識 Unicode 文本,這樣 Golang 統(tǒng)一使用 UTF-8 編碼,中文亂碼問題不會再困擾程序員。 2 字符串一旦賦值了,字符串就不能修改了,在 Go 中字符串是不可變的。 3 字符串的兩種表示形式。 a 雙引號——會識別轉義字符 .
繼續(xù)訪問
Golang Strings 官方包常用方法,學會這些夠用了
1.判斷是否以某字符串打頭/結尾 2.字符串分割 3.返回子串索引 4.字符串連接 5.字符串轉化為大小寫 6.統(tǒng)計某個字符在字符串出現(xiàn)的次數(shù) 7.判斷字符串的包含關系 8.字符串替換
新聞標題:go語言訪問string go語言訪問mysql
文章起源:http://jinyejixie.com/article42/doscshc.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供手機網(wǎng)站建設、品牌網(wǎng)站建設、建站公司、網(wǎng)站策劃、軟件開發(fā)、標簽優(yōu)化
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉載內(nèi)容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)