go基础库之将字符串分解为单词

2019-05-24 go基础库 go 评论字数统计: 1054字阅读时长: 3分

将字符串分解为单词可能很棘手。首先，确定单词是什么，以及分隔符是什么，以及是否有任何空格或任何其他字符。做出这些决定后，你可以从strings包中选择适当的功能。

将字符串分解为单词

Golang 版本

1.12.1

前言

实现

创建文件whitespace.go，代码如下：

package main

import (
	"fmt"
	"strings"
)

const refString = "Mary had a little lamb"

func main() {

	words := strings.Fields(refString)
	for idx, word := range words {
		fmt.Printf("Word %d is: %s\n", idx, word)
	}

}

$ go run whitespace.go
单词 0 是: Mary
单词 1 是: had
单词 2 是: a
单词 3 是: little
单词 4 是: lamb

创建文件anyother.go，代码如下：

package main

import (
	"fmt"
	"strings"
)

const refString = "Mary_had a little_lamb"

func main() {

	words := strings.Split(refString, "_")
	for idx, word := range words {
		fmt.Printf("单词 %d 是: %s\n", idx, word)
	}

}

$ go run anyother.go
单词 0 是: Mary
单词 1 是: had a little
单词 2 是: lamb

创建文件specfunction.go，代码如下：

package main

import (
	"fmt"
	"strings"
)

const refString = "Mary*had,a%little_lamb"

func main() {

	// 为字符串中的每个符文调用splitFunc。如果符文等于“*％,_”中的任何字符，则拆分refString
	splitFunc := func(r rune) bool {
		return strings.ContainsRune("*%,_", r)
	}

	words := strings.FieldsFunc(refString, splitFunc)
	for idx, word := range words {
		fmt.Printf("单词 %d 是: %s\n", idx, word)
	}

}

$ go run specfunction.go
单词 0 是: Mary
单词 1 是: had
单词 2 是: a
单词 3 是: little
单词 4 是: lamb

创建文件regex.go，代码如下：

package main

import (
"fmt"
"regexp"
)

const refString = "Mary*had,a%little_lamb"

func main() {

	words := regexp.MustCompile("[*,%_]{1}").Split(refString, -1)
	for idx, word := range words {
		fmt.Printf("单词 %d 是: %s\n", idx, word)
	}

}

$ go run regex.go
单词 0 是: Mary
单词 1 是: had
单词 2 是: a
单词 3 是: little
单词 4 是: lamb

原理

将字符串分割成单词的最简单形式是将任何空格作为分隔符。其中空格由unicode包中的IsSpace函数定义:

‘\t’, ‘\n’, ‘\v’, ‘\f’, ‘\r’, ’ ‘, U+0085 (NEL), U+00A0 (NBSP).

如前所述，string包的Fields函数可用于空格字符分割句子。步骤1涵盖了第一个简单的案例。

如果需要其他分隔符，则使用Split函数。在步骤2中讨论了用另一个分隔符进行分割。请注意，字符串中的空格被省略了。

如果需要一个更复杂的函数来决定是否在给定的位置拆分字符串，FieldsFunc可以为你提供帮助。该函数的一个参数是使用给定字符串的符文并返回true(如果该字符串在该点应该分割)的函数。这个选项包含在步骤3中。

正则表达式是示例中提到的最后一个选项。Regexp包的Regexp结构体包含Split方法，其工作方式与您所期望的一样。它将字符串分割到匹配组的位置。此方法在步骤4中使用。

延伸

该strings包还提供各种SplitXXX功能，可以帮助你实现更具体的任务。

本文链接: https://www.ganymedenil.com/2019/05/24/go-standard-library-by-decompose-a-string-into-words.html
版权声明：本博客所有文章除特别声明外，均采用 CC BY 4.0 CN协议许可协议。转载请注明出处

Ganymede NilDeveloper

喜欢新事物，关注后端动态，对新的技术有追求；喜欢 coding。