Java中的ArrayList的初始容量和容量分配

一，ArrayList容量变化：

List接口的大小可变数组的实现。实现了所有可选列表操作，并允许包括 null 在内的所有元素。

ArrayList继承于List接口，除继承过来的方法外，还提供一些方法来操作内部用来存储列表的数组的大小。

每个ArrayList实例都有一个容量。该容量是指用来存储列表元素的数组的大小。它总是至少等于列表的大小。随着向ArrayList中不断添加元素，其容量也自动增长。并未指定增长策略的细节，因为这不只是添加元素会带来分摊固定时间开销那样简单。

ArrayList是经常会被用到的，一般情况下，使用的时候会像这样进行声明：

List arrayList = new ArrayList();

如果像上面这样使用默认的构造方法，初始容量被设置为10。

当ArrayList中的元素超过10个以后，会重新分配内存空间，使数组的大小增长到16。
可以通过调试看到动态增长的数量变化：10->16->25->38->58->88->...

也可以使用下面的方式进行声明：

List arrayList = new ArrayList(4);

将ArrayList的默认容量设置为4。

当ArrayList中的元素超过4个以后，会重新分配内存空间，使数组的大小增长到7。
可以通过调试看到动态增长的数量变化：4->7->11->17->26->...

那么容量变化的规则是什么呢？

请看下面的公式：
((旧容量 * 3) / 2) + 1
注：这点与C#语言是不同的，C#当中的算法很简单，是翻倍。

一旦容量发生变化，就要带来额外的内存开销，和时间上的开销。
所以，在已经知道容量大小的情况下，推荐使用下面方式进行声明：

List arrayList = new ArrayList(CAPACITY_SIZE);

即指定默认容量大小的方式。

二，探索ArrayList——自动改变size真相

ArrayList的列表对象实质上是存储在一个引用型数组里的，有人认为该数组有“自动增长机制”可以自动改变size大小。

正式地说，该数组是无法改变大小的，实际上它只是改变了该引用型数组的指向而已。

下面，让我们来看看java是怎样实现ArrayList类的。

1）ArrayList类的实质

ArrayList底层采用Object类型的数组实现，当使用不带参数的构造方法生成ArrayList对象时，
实际上会在底层生成一个长度为10的Object类型数组。

首先，ArrayList定义了一个私有的未被序列化的数组elementData，用来存储ArrayList的对象列表（注意只定义未初始）：

private transient Object[] elementData;

其次，以指定初始容量（Capacity）或把指定的Collection转换为引用型数组后，实例化elementData数组；

如果没有指定，则预置初始容量为10进行实例化。

把私有数组预先实例化，然后通过copyOf方法覆盖原数组，是实现自动改变ArrayList的大小(size)的关键。

ArrayList的构造方法源码如下：

// 用指定的初始容量构造一个空列表。
public ArrayList(int initialCapacity){
    super();
    if(initialCapacity< 0)
        throw new IllegalArgumentException("Illegal Capacity: "+initialCapacity);
    this.elementData=new Object[initialCapacity];//属性指向新建长度为初始容量的临时数组
}
// 使用初始容量10构造一个空列表
public ArrayList(){
    this(10);
}

/*构造包含利用collection的迭代器按顺序返回的指定collection元素的列表
 *@param c 集合，它的元素被用来放入列表t
 *@throws NullPointerException 如果指定集合为 null
 */
public ArrayList(Collection<?extends E> c){
    elementData=c.toArray();//用Collection初始化数组elementData
    size=elementData.length;
    if(elementData.getClass()!=Object[].class)
        elementData=Arrays.copyOf(elementData,size,Object[].class);
}

三，ArrayList——自动改变size机制

为了实现自动改变size这一机制，java引进了Capacity和size概念，以区别数组的length。

为了保证用户增加新的列表对象，java设置了最小容量（minCapacity），通常情况上，它大于列表对象的数目，所以Capactiy虽然就是底层数组的长度（length），但是对于最终用户来讲，它是无意义的。

而size存储着列表对象的数量，才是最终用户所需要的。为了防止用户错误修改，这一属性被设置为privae的，不过可以通过size()获取。

下面，对ArrayList的初始以及其列表对象的增加和删除等三种情况下的size自动改变机制进行分析。

1、初始Capacity和size值。

从上面给出的ArrayList构造方法源码中，我们不难看出Capacity初始值（initialCapacity）可以由用户直接指定，或由用户指定的Collection集合存储的对象数目确定，如果没有指定，系统默认为10。

而size的被声明为int型变量，默认为0，当用户指定Collection创建ArrayList时，size值等于
initialCapacity。

2、add()方法

该方法的源码如下：

public boolean add(E e) {
     ensureCapacityInternal(size + 1);
     elementData[size++] = e;//添加对象时，自增size
     return true;
}

方法中调用的ensureCapacityInternal主要用来调整容量，修改elementData数组的指向。其中涉及到3个方法的调用，其核心在于grow方法：

private void ensureCapacityInternal(int minCapacity) {
     modCount++;//定义于ArrayList的父类AbstractList，用于存储结构修改次数
     // overflow-conscious code
     if (minCapacity - elementData.length > 0)
       grow(minCapacity);
}

private void grow(int minCapacity) {
    // overflow-conscious code
      int oldCapacity = elementData.length;
      int newCapacity = oldCapacity + (oldCapacity >> 1);//新容量扩大到原容量的1.5倍，右移一位相关于原数值除以2。
      if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
            if (newCapacity - MAX_ARRAY_SIZE > 0)
                  newCapacity = hugeCapacity(minCapacity);
      // minCapacity is usually close to size, so this is a win:
      elementData = Arrays.copyOf(elementData, newCapacity);
}

private static int hugeCapacity(int minCapacity) {
  if (minCapacity < 0) // overflow
     throw new OutOfMemoryError();
	//MAX_ARRAY_SIZE和Integer.MAX_VALUE为常量，详细请参阅下面的注解
  return (minCapacity > MAX_ARRAY_SIZE) ?Integer.MAX_VALUE :MAX_ARRAY_SIZE;
}

通过以上代码，我们可知java自动增加ArrayList大小的思路是：

向ArrayList添加对象时，原对象数目加1如果大于原底层数组长度，则以适当长度新
建一个原数组的拷贝，并修改原数组，指向这个新建数组。

原数组自动抛弃（java垃圾回收机制会自动回收）。

size则在向数组添加对象，自增1。

注解：

//定义于该类的常量，用来分配数组的size最大值。一些 VMs在数组里保留字头，试图分配更大数组时可能导致OutOfMemoryError:被请求数组的
size超出VM界限。

private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

//在java.lang.Integer类中常量MIN_VALUE、MAX_VALUE如下：
public static final int   MIN_VALUE = 0x80000000;//整型取值区间下界：－2147483648

public static final int   MAX_VALUE = 0x7fffffff;//整型取值区间上界：2147483647

//在java.util.AbstractList中modCount定义如下：
protected transient int modCount = 0;

3、remove()方法

该重构方法其一源码如下（其它的就不累述了）：

public E remove(int index) {
      rangeCheck(index);
      modCount++;
      E oldValue = elementData(index);
      int numMoved = size - index - 1;
      if (numMoved > 0)
            //将后面的列表对象前移
            System.arraycopy(elementData, index + 1, elementData, index,numMoved);
      // 数组前移一位，size自减，空出来的位置置null，具体的对象的销毁由Junk收集器负责
      elementData[--size] = null; 
      return oldValue;
}

//边界检查
private void rangeCheck(int index) {
    if (index < 0 || index >= this.size)
        throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}

//获取指定index所在位置的对象
E elementData(int index) {
    return (E) elementData[index];
}

通过remove()源码的学习，我们不难看出，其改变ArrayList大小的核心与add()方法相似，都是同数组拷贝。

另外，如果确有必要，用户也可以指定ArrayList实例的容量，可以有效的降低时间成本。它是通过调用ensureCapacityInternal来实现的，源代码如下：

public void ensureCapacity(int minCapacity) {
    if (minCapacity > 0)
        ensureCapacityInternal(minCapacity);
}

//因为size为private的，java给出方法来访问它：
public int size() {
    checkForComodification();
    return this.size;
}

综上所述，在用户向ArrayList追加对象时，Java总是要先计算容量（Capacity）是否适当，若容量不足则把原数组拷贝到以指定容量为长度创建的新数组内，并对原数组变量重新赋值，指向新数组。

在这同时，size进行自增1。

在删除对象时，先使用拷贝方法把指定index后面的对象前移1位（如果
有的话），然后把空出来的位置置为null，交给Junk收集器销毁，size自减1，即完成了。