小言_互联网的博客

JDK8 NIO.Buffer源码解析 深入理解clear flip rewind compact

420人阅读  评论(0)

前言

在NIO体系中,Buffer至关重要,因为我们通过Buffer和Channel打交道,事实上我们永远无法和Channel直接打交道,只能通过Buffer作为媒介。如果把Channel比喻为蕴含着数据的矿山,那么Buffer就是用来装数据的矿车,我们只能把矿车送进矿车,并期待矿车回来时能塞满了来自矿山的数据,却不能直接进去挖矿。

成员

  • A buffer’s capacity is the number of elements it contains. The capacity of a buffer is never negative and never changes.
  • A buffer’s position is the index of the next element to be read or written. A buffer’s position is never negative and is never greater than its limit.
  • A buffer’s limit is the index of the first element that should not be read or written. A buffer’s limit is never negative and is never greater than its capacity.
  • capacity代表不可能索引。即最大索引加一,capacity永远不变。
  • position代表即将读取或写入的元素的索引。所以初始化时position为0,因为即将读取或写入0号元素;当读取或写入了最后一个元素后,position就应该等于capacity了。
  • limit代表着读取或写入的限制,即不可以读取或写入位于limit索引的元素。当position已经增加到了limit,此时再读取或写入是不可以的。
  • 实际上我们可以操作(读取或写入)的范围就是position<= range < limit,即[ position, limit )左闭右开。
  • 必须保持0 <= mark <= position <= limit <= capacity


如图,初始状态时:mark为-1,position为0,capacity为最大索引+1(虚线框代表这是一个不存在的元素,capacity写在里面代表capacity永远不变,相对的,其他三个成员是可变的,所以是箭头表示),limit等于capacity。

传输数据

Buffer的子类用来传输数据的方法有get和put,但这些方法分为两个种类:

  • 相对操作。根据position成员来读取或写入数据,并且之后会根据读取写入的数据量来增加position。相对操作里,get操作可能抛出BufferUnderflowException;put操作可能抛出BufferOverflowException。
  • 绝对操作。不根据position成员,而是根据该方法的一个参数作为索引,然后根据这个索引get或put,不会改变position。可能抛出IndexOutOfBoundsException。

mark和reset

  • 上面还有一个成员mark没讲,它是用来标记位置的。当mark被调用时,position成员会赋值给mark成员;当reset函数被调用时,mark成员会赋值给position成员(一般情况下,position肯定是往后移动了)。
  • 但注意,肯定会保持不变关系0 <= mark <= position <= limit <= capacity。所以,当position或limit成员变得比mark成员还小的时候,mark会恢复默认。

深入理解clear flip rewind compact

前面也讲了,Buffer的索引只有一套,但我们却需要用来这套索引来进行读取或写入两种动作。既然只有一套索引(position和limit),那么肯定读模式下的索引,你再去写肯定是不对的;同样,写模式下的索引,你再去读肯定也是不对的。

  • clear() makes a buffer ready for a new sequence of channel-read or relative put operations: It sets the limit to the capacity and the position to zero.
  • flip() makes a buffer ready for a new sequence of channel-write or relative get operations: It sets the limit to the current position and then sets the position to zero.
  • rewind() makes a buffer ready for re-reading the data that it already contains: It leaves the limit unchanged and sets the position to zero.

clear和flip

上面三句api文档原话先不解释,先看里面提到的关键词:

  • channel-read or relative put operations。相对的put操作,肯定是往Buffer里放东西,然后索引增加;对channel的读操作,从channel里读出东西,再往Buffer里面放,然后索引增加。其实这就是对Buffer的写模式,既然要往Buffer写入数据,那就应该把position变成最小,limit变成最大,以便一次内获得最多的数据。所以在写模式进行之前,需要调用clear()。简单的说,写模式之前告诉别人Buffer的可写范围,别人不用管范围内是否已有数据,直接覆盖就好。在写模式的进行中,position会逐渐变大,但position不一定会到达limit,即不一定会写满数据,所以:写入数据的范围就是[0,position)
    public final Buffer clear() {
        position = 0;  // position变成最小
        limit = capacity;  // limit变成最大
        mark = -1;
        return this;
    }
  • channel-write or relative get operations。相对的get操作,从Buffer中读出数据,然后索引增加;对channel的写操作,即把Buffer里的数据,写入到channel里,然后索引增加。其实这就是对Buffer的读模式,既然要进行读模式,说明之前肯定执行过写模式好让Buffer塞好数据,上一条说了写入数据的范围是[0,position),所以在执行读模式之前,就应该把position赋值给limit,再把position置为0,这样,从position到limit的范围肯定就和之前执行写模式的写入数据的范围一样了。所以在执行读模式之前,需要调用flip()。这个也很好理解,既然是读模式,你肯定得把可读范围告诉人家啊,毕竟可读范围以外都是无效数据啊。
    public final Buffer flip() {
        limit = position;  // 把position赋值给limit
        position = 0;  // 再把position置为0
        mark = -1;
        return this;
    }


讲一下单词的意义吧:

  • clear的意思是清空,实际函数逻辑也是恢复初始状态。
  • clip的意思是翻转,从上图第二个状态到第三个状态也可以看出,且把position和limit两个指针当作整体,可以看出:一个指针的位置根本没有变化,另一个指针的位置从capacity变成0,这不就是翻转嘛。

rewind

  • re-reading the data。之前已经执行过读模式了,然后想再次读取数据,所以需要恢复到读模式之前的该有的状态,所以只需要把position归零,limit保持不变。所以,之前执行过读模式,想要再次从头读取数据,需要在第二次读模式之前调用rewind()。这样,调用rewind后,position和limit的位置,就和第一次读模式之前调用flip后的位置一样。
    public final Buffer rewind() {
        position = 0;  // position归零
        // limit保持不变
        mark = -1; 
        return this;
    }


讲一下单词的意义吧:rewind的意思是倒带,实际函数逻辑也只是把position恢复初始,这完全符合该函数的作用:为了第二次执行读模式,这不就是倒带嘛。

compact

既然这三个方法都讲了,还是提前讲一下compact方法吧:

  • 大家一定觉得clear方法有点太暴力了,因为它为了能够接下来进行写模式,把所有成员都恢复默认了。假设调用clear方法之前,进行了读模式,但却没有读完所有可读数据,在调用clear方法后,这些数据你再也无法去获得了,因为用来记录剩余可读数据的索引成员都被恢复默认了。
  • 如果有一种更温柔的方法,那么它的方法实现应该是:把剩余可读数据拷贝到Buffer的开头,然后把position设置为剩余可读数据的个数,把limit设置为capacity(还是为了可以在写模式中获取最多的数据)。这个方法正是compact方法。
  • 所以,在写模式之前,如果不用管剩余可读数据,那么调用clear();如果还需要剩余可读数据,那么调用compact()
//HeapByteBuffer.java
    public ByteBuffer compact() {
        System.arraycopy(hb, ix(position()), hb, ix(0), remaining());  // 剩余可读数据拷贝到Buffer的开头
        position(remaining());  // position设置为剩余可读数据的个数
        limit(capacity());  // 把limit设置为capacity
        discardMark();
        return this;
    }


如图,蓝色块为已读数据,绿色块为未读数据(剩余可读数据)。
讲一下单词的意义吧:compact的意思是压实,实际上也是把剩余可读数据压实到Buffer的前面去了。

抽象方法

  • public abstract boolean isReadOnly()。每个Buffer都是可读,但不一定是可写的。不可写的,那么就是只读的。
  • public abstract boolean hasArray()。一个Buffer它可以是由一个数组作为支撑的,即Buffer拥有一个数组成员作为数据来源。
  • public abstract Object array()。如果该Buffer是依靠数组的(the array that backs this buffer),那么就返回该数组。
  • public abstract int arrayOffset()。假设该Buffer是依靠数组的,但Buffer的第一个元素不一定在数组开头,所以该函数返回数组的偏移。
  • public abstract boolean isDirect()。该Buffer是不是直接的。

具体实现方法

相对的get操作,用到的方法

    final int nextGetIndex() {                          // package-private
        if (position >= limit)
            throw new BufferUnderflowException();
        return position++;
    }

    final int nextGetIndex(int nb) {                    // package-private
        if (limit - position < nb)
            throw new BufferUnderflowException();
        int p = position;
        position += nb;
        return p;
    }
  • 它们都是包的访问权限,只有一个包或者子类才能访问。这两个方法结束后,都会增加position。
  • 第一个方法是要相对地get到1个元素,所以索引加1。
  • 第二个方法是要相对地get到nb个元素,所以索引加nb。limit - position是剩余可get元素的个数,所以需要检查。
  • 两个方法都是返回position增加前的原position,比较原position才是get的起点。

相对的put操作,用到的方法

    final int nextPutIndex() {                          // package-private
        if (position >= limit)
            throw new BufferOverflowException();
        return position++;
    }

    final int nextPutIndex(int nb) {                    // package-private
        if (limit - position < nb)
            throw new BufferOverflowException();
        int p = position;
        position += nb;
        return p;
    }

分析类似。

绝对的get/put操作,用到的方法

    final int checkIndex(int i) {                       // package-private
        if ((i < 0) || (i >= limit))
            throw new IndexOutOfBoundsException();
        return i;
    }

    final int checkIndex(int i, int nb) {               // package-private
        if ((i < 0) || (nb > limit - i))
            throw new IndexOutOfBoundsException();
        return i;
    }

分析类似。两个方法都是从参数i开始get/put元素,第二个方法需要连续get/put nb个元素,所以需要检查当前可操作元素个数limit - i

其他方法

    static void checkBounds(int off, int len, int size) { // package-private
        if ((off | len | (off + len) | (size - (off + len))) < 0)
            throw new IndexOutOfBoundsException();
    }
  • 此静态方法用来检查边界。
  • 小于0是因为算出来的数字的符号位bit是1,所以会小于。
  • 括号里面有四个数字,且是用|与起来的,这四个数字只要有一个数字的符号位bit为1,算出来的数字就会小于0(因为|与的作用)。分别分析四种情况:
    • off小于0.
    • len小于0.
    • 虽然off len二者都不小于0,但是加起来后溢出,导致符号位bit为1.
    • off + len相当于limit,即第一个不应该操作的元素;size相当于capacity。当limit大于capacity时,肯定是错的啊。

链式操作

由于很多方法都return this,且他们的返回值类型都为Buffer,所以我们可以实现一些链式操作,可能会有用吧。

b.flip();
b.position(23);
b.limit(42);
//可以替换为下面这句
b.flip().position(23).limit(42);

转载:https://blog.csdn.net/anlian523/article/details/104321830
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场