Go进阶(9): For Range 性能研究

2019-09-26 21:33 528人阅读评论(0)

遍历数组，map集合，Slice切片等，Go提供比较好用的For Range方式。range是一个关键字，表示范围，和for配合使用可以迭代数组,map等集合。用法简洁，而且map、channel等也都是用for range的方式，所以在编码中我们使用for range进行循环迭代是最多的。对于这种最常使用的迭代，尤其是和for i=0;i<N;i++对比，性能怎么样？需要深入了解。

1. 基本用法

package main
import "fmt"
func main() {
    ages:=map[string]int{"张三":15,"李四":20,"王武":36}
    for name,age:=range ages{
        fmt.Println(name,age)
    }
}

>> 张三 15
>> 李四 20
>> 王武 36

在使用for range迭代map的时候，返回的第一个变量是key,第二个变量是value.需要注意的是，for range map返回的K-V键值对顺序是不固定的，是随机的.

2. 与常规的for循环进行对比

比如对于 Slice 切片，我们有两种迭代方式：一种是常规的for i:=0;i<N;i++的方式；一种是for range的方式，下面我们看看两种迭代的性能。

func ForSlice(s []string) {
    len := len(s)
    for i := 0; i < len; i++ {
        _, _ = i, s[i]
    }
}
 
func RangeForSlice(s []string) {
    for i, v := range s {
        _, _ = i, v
    }
}

为了测试，写了这两种循环迭代 Slice 切片的函数，从实现上看，他们的逻辑是一样的，保证我们可以在同样的情况下测试。

import "testing"
 
const N  =  1000
 
func initSlice() []string{
    s:=make([]string,N)
    for i:=0;i<N;i++{
        s[i]="www.flysnow.org"
    }
    return s;
}
 
func BenchmarkForSlice(b *testing.B) {
    s:=initSlice()
 
    b.ResetTimer()
    for i:=0; i<b.N;i++  {
        ForSlice(s)
    }
}
 
func BenchmarkRangeForSlice(b *testing.B) {
    s:=initSlice()
 
    b.ResetTimer()
    for i:=0; i<b.N;i++  {
        RangeForSlice(s)
    }
}

这事Bench基准测试的用例，都是在相同的情况下，模拟长度为1000的 Slice 切片的遍历。然后我们运行go test -bench=. -run=NONE 查看性能测试结果。


BenchmarkForSlice-4              5000000    287 ns/op
BenchmarkRangeForSlice-4         3000000    509 ns/op

从性能测试可以看到，常规的for循环，要比for range的性能高出近一倍，到这里相信大家已经知道了原因，没错，因为for range每次是对循环元素的拷贝，所以集合内的预算越复杂，性能越差，而反观常规的for循环，它获取集合内元素是通过s[i]，这种索引指针引用的方式，要比拷贝性能要高的多。

既然是元素拷贝的问题，我们迭代 Slice 切片的目的也是为了获取元素，那么我们换一种方式实现for range：

func RangeForSlice(s []string) {
    for i, _ := range s {
        _, _ = i, s[i]
    }
}

现在，我们再次进行 Benchmark 性能测试,看看效果。

BenchmarkForSlice-4              5000000    280 ns/op
BenchmarkRangeForSlice-4         5000000    277 ns/op

恩，和我们想的一样，性能上来了，和常规的for循环持平了。原因就是我们通过_舍弃了元素的复制，然后通过s[i]获取迭代的元素，既提高了性能，又达到了目的。

3. map的遍历只能使用range

对于Map来说，我们并不能使用for i:=0;i<N;i++的方式，当然如果你有全部的key元素列表除外，所以大部分情况下我们都是使用for range的方式。

func RangeForMap1(m map[int]string) {
    for k, v := range m {
        _, _ = k, v
    }
}
 
const N = 1000
 
func initMap() map[int]string {
    m := make(map[int]string, N)
    for i := 0; i < N; i++ {
        m[i] = fmt.Sprint("www.flysnow.org",i)
    }
    return m
}
 
func BenchmarkRangeForMap1(b *testing.B) {
    m:=initMap()
 
    b.ResetTimer()
    for i := 0; i < b.N; i++ {
        RangeForMap1(m)
    }
}

BenchmarkForSlice-8              5000000    298 ns/op
BenchmarkRangeForSlice-8         3000000    475 ns/op
BenchmarkRangeForMap1-8           100000    14531 ns/op

相比 Slice 来说，Map的遍历的性能更差，可以说是惨不忍睹。好，我们开始下优化，思路也是减少值得拷贝。测试中的RangeForSlice也慢的原因是我把RangeForSlice还原成了值得拷贝，以便于对比性能。

func RangeForMap2(m map[int]string) {
    for k, _ := range m {
        _, _ = k, m[k]
    }
}
 
func BenchmarkRangeForMap2(b *testing.B) {
    m := initMap()
 
    b.ResetTimer()
    for i := 0; i < b.N; i++ {
        RangeForMap2(m)
    }
}


BenchmarkForSlice-8              5000000               298 ns/op
BenchmarkRangeForSlice-8         3000000               475 ns/op
BenchmarkRangeForMap1-8           100000             14531 ns/op
BenchmarkRangeForMap2-8           100000             23199 ns/op

额，是不是发现点不对，方法BenchmarkRangeForMap2的性能明显下降了，这个可以从每次操作的耗时看出来(虽然性能测试秒执行的次数还是一样)。和我们上面测试的Slice不一样，这次不止没有提升，反而下降了。

继续修改Map2函数的实现为：

func RangeForMap2(m map[int]Person) {
    for  range m {
    }
}

什么都不做，只迭代，再次运行性能测试。


BenchmarkForSlice-8              5000000               301 ns/op
BenchmarkRangeForSlice-8         3000000               478 ns/op
BenchmarkRangeForMap1-8           100000             14822 ns/op
BenchmarkRangeForMap2-8           100000             14215 ns/op

这件事说明，这不仅仅是值拷贝的消耗。

4. for range原理

https://github.com/golang/gofrontend

对于Slice,Map等各有具体不同的编译实现,我们先看看for range slice的具体实现：

  // The loop we generate:
  //   for_temp := range
  //   len_temp := len(for_temp)
  //   for index_temp = 0; index_temp < len_temp; index_temp++ {
  //           value_temp = for_temp[index_temp]
  //           index = index_temp
  //           value = value_temp
  //           original body
  //   }

先是对要遍历的 Slice 做一个拷贝，获取长度大小，然后使用常规for循环进行遍历，并且返回值的拷贝。

for range map的具体实现：

  // The loop we generate:
  //   var hiter map_iteration_struct
  //   for mapiterinit(type, range, &hiter); hiter.key != nil; mapiternext(&hiter) {
  //           index_temp = *hiter.key
  //           value_temp = *hiter.val
  //           index = index_temp
  //           value = value_temp
  //           original body
  //   }

也是先对map进行了初始化，因为map是*hashmap，所以这里其实是一个*hashmap指针的拷贝。

因此，for range的slice是可以优化的，而map几乎是不可能的。

转载：https://blog.csdn.net/shenziheng1/article/details/101108204

查看评论

小言_互联网的博客

小言_互联网的博客

个人资料

文章分类

文章存档

阅读排行

评论排行

推荐文章

Go进阶(9): For Range 性能研究

1. 基本用法

2. 与常规的for循环进行对比

3. map的遍历只能使用range

4. for range原理

* 以上用户言论只代表其个人观点，不代表本网站的观点或立场