C++STL之vector的使用和实现

x33g5p2x  于2021-11-16 转载在 C/C++  
字(20.1k)|赞(0)|评价(0)|浏览(245)

vector

什么是vector?

  1. vector是表示可变大小数组的序列容器。
  2. 就像数组一样,vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行访问,和数组一样高效。但是又不像数组,它的大小是可以动态改变的,而且它的大小会被容器自动处理。
  3. 本质讲,vector使用动态分配数组来存储它的元素。当新元素插入时候,这个数组需要被重新分配大小为了增加存储空间。其做法是,分配一个新的数组,然后将全部元素移到这个数组。就时间而言,这是一个相对代价高的任务,因为每当一个新的元素加入到容器的时候,vector并不会每次都重新分配大小。
  4. vector分配空间策略:vector会分配一些额外的空间以适应可能的增长,因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何,重新分配都应该是对数增长的间隔大小,以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。
  5. 因此,vector占用了更多的存储空间,为了获得管理存储空间的能力,并且以一种有效的方式动态增长。
  6. 与其它动态序列容器相比(deques, lists and forward_lists), vector在访问元素的时候更加高效,在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作,效率更低。比起lists和forward_lists统一的迭代器和引用更好。

vector的使用

我们首先来看一下vector文档中的成员函数:vector文档

构造函数

  • vector():创建一个空vector
  • vector(size_type n, const value_type& val = value_type()):创建一个vector,元素个数为n,且值为val
  • vector(const vector& x):拷贝构造函数
  • vector(InputIterator first, InputIterator last):复制[first,last)区间内另一个数组的元素到vector中
#include<iostream>
#include<vector>
int main()
{
    std::vector<int> v1;//创建一个空vector
    std::vector<int> v2(4,100);//创建一个vector,元素个数为4,且值为100
    std::vector<int> v3(v2.begin(),v2.end());//复制[v2,v2+5)区间内另一个数组的元素到vector中
    std::vector<int> v4(v3);//拷贝构造函数
    return 0;
}

传迭代器进行构造:

vector<int> v2(v1.begin(),v1.end());

如果不想要v1的第一个和最后一个,可以这样写:

vector<int> v2(++v1.begin(),--v1.end());

可以看到迭代器构造函数是一个模板函数,所以不一定只用vector的迭代器,也可以用其他容器迭代器初始化,只要数据类型匹配(*iterator对象的类型跟vector中存的数据类型是一致的):

string s("hello world");
vector<char> v3(s.begin(),s.end());

迭代器进行初始化模板函数实际是这样实现的:

temolate<class InputIterator>
vector(InputIterator first,InputIterator last)
{
    while(first != last)
    {
        push_back(*first);
        ++first;
    }
}

我们定义下面两个对象有没有差别?

string s("111111");
vector<char> vc(6,'1');//调用构造函数

能不能用vc替代s?

不能,vector里面给char,虽然它们底层都是数组中存char类型数据,但是还是不一样的,s对象中指向的空间结尾有\0,string的很多操作是独有的,比如+=字符串等等

vector成员函数的使用

上面知道了vector类对象如何初始化,那么我们想要遍历该对象该怎么遍历呢?

首先使用push_back尾插进去数据,遍历方法:

1、下标+[]

2、迭代器遍历

3、范围for遍历

#include<iostream>
#include<vector>
using namespace std;
void test_vector()
{
    vector<int> v;
    //使用push_back尾插数据
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    
    //遍历vector
    //1、下标+[]
    for(size_t i =0;i<v.size(),i++)
    {
        v[i]-=1;
        cout<<v[i]<<" ";
    }
    cout<<endl;
    //2、迭代器
    vector<int>::iterator it = v.begin();
    while(it!=v.end())
    {
        *it += 1;
        cout<<*it<<" ";
        ++it;
    }
    cout<<endl;
    
    //范围for
    for(auto e:v)
    {
        cout<< e <<" ";
    }
    cout<<endl;
}
int main()
{
    test_vector();
    return 0;
}

我们还可以利用反向迭代器进行反向遍历:

void test_vector()
{
    vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    //反向迭代器进行遍历
    vector<int>::reverse_iterator rit = v.rbegin();
    while(rit!=v.rend())
    {
        cout<<*rit<<" ";
        ++rit;
    }
    cout<<endl;
}

这里的rit不是原生指针,而是被封装的类对象,重载operator才能实现rit时,倒着走。

max_size

返回vector可以容纳的最大元素数。实际中并没有什么意义

void test_vextor3()
{
    vector<int> v;
    cout<<v.max_size()<<endl;//没什么意义
    v.reserve(10);//开空间,改变容量
}

reserve

如果n大于当前对象的容量,该函数将使容器的容量增加至少n个数据。其他情况容量不会改变

好多人在reserve改变容量后会这样去访问数据:

for(size_t i =0;i<10;i++)
{
    v[i]=i;//error
}

这样是错误的,operator[]会检查_size,会造成越界报错

正确的访问方式:

for(size_t i =0;i<10;i++)
{
    v[i]=push_back(i);//正确
}

resize

改变这个vector对象的长度为n,如果n小于当前vector的长度,则将当前值缩短到第n个数据,删除第n个以外的数据。如果n大于当前vector对象长度,延长该vector对象长度,并在最后插入指定内容直到达到的延长后的长度n。如果指定值, 用该值来初始化,否则,他们初始化为匿名对象。

v.resize(20);//开空间+初始化

assign

分配新的内容给vector,代替它当前的内容,并且修改它的大小。可以看到assign函数的参数可以是迭代器,也可以是val个数和val

void test_vector4()
{
    int a[]={1,2,3,4,5};
    vector<int> v;
    v.assign(a,a+4);
    //v.assign(3,4);//这样可以分配3个4给v
    for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
}

需要注意的是迭代器传值时的区间是左闭右开

也可以这样分配内容:

v.assign(3,4);

insert

void test_vector5()
{
    int a[]={1,2,3,4,5};
    vector<int> v(a,a+5);
    //头插
    v.insert(v.begin(),0);
    for(auto e:v)
    {
        cout<< e <<" ";
    }
    cout<<endl;
}

那么我们假设想在2的前面插入呢?我们想一想我们肯定先需要找到2这个元素,才能在它前面插入元素,而我们发现vector当中没有find函数,但是在算法里面有一个find函数模板以提供使用:

find函数参数是迭代器区间以及需要找到的val值,返回的是这段区间第一次发现的元素的迭代器,如果没有发现则返回的是last,我们想要在2之前插入元素:

void test_vector5()
{
    int a[] = { 1,2,3,4,5 };
	vector<int> v(a, a + 5);
    vector<int>::iterator pos = find(v.begin(),v.end(),2);
    if(pos!= v.end())
    {
        v.insert(pos,20);
    }
    for(auto e:v)
    {
        cout<< e <<" ";
    }
    cout<<endl;
}

在算法模块还有一个函数便于我们使用:sort函数

void test_vector6()
{
    int a[] = { 1,2,3,4,5 };
	vector<int> v(a, a + 5);
    //默认排升序
    sort(v.begin(),v.end());
}

它默认是排升序,但是我们还可以进行排降序,需要加一个参数:

//排降序 -- 关于greater<int>是一个仿函数类
sort(v.begin(),v.end(),greater<int>())

这里我们不深讲解这个参数,重点讲解vector

我们还可以用sort对数组进行排序:

void test_vector6()
{
    //指向数组的空间的指针是天然的迭代器
    int a1[]={30,1,13,23,42};
    sort(a1,a1+5);//也可以对数组排序
    for(auto e:a1)
    {
        cout<< e <<" ";
    }
    cout<<endl;
}

指向数组的空间的指针是天然的迭代器,故也是可以对数组进行排序的

erase

void test_vector5()
{
    int a[]={1,2,3,4,5};
    vector<int> v(a,a+5);
    //头插
    v.erase(v.begin());
    
    //删除2
    //没有find,在算法里面有一个find函数模板以提供使用
    vector<int>::iterator pos = find(v.begin(),v.end(),2);
    if(pos!= v.end())
    {
        v.erase(pos);
    }
}

vector的数据还可以是vector,类似于二维数组,我们来看一道题:

杨辉三角
核心思想:找出杨辉三角的规律,发现每一行头尾都是1,中间第[j]个数等于上一行[j-1]+[j]

class Solution
{
public:
    vector<vector<int>> generate(int numRows)
    {
        vector<vector<int>> vv;
        //开辟杨辉三角的空间
        vv.resize(numRowd);
        for(size_t i = 0;i<vv.size();i++)
        {
            vv[i].resize(i+1,0);//第一行一个数据,第二行二个...第五行五个
            //每一行第一个和最后一个初始化为1
            //vv[i].front() = 1;
            vv[i][0] = 1;
            vv[i][vv[i].size()-1]] = 1;
        }
        for(size_t i =0;i<vv.size();++i)
        {
            for(size_t j=0;j<vv[i].size();++j)
            {
                if(vv[i][j]==0)
                {
                    vv[i][j] = vv[i-1][j]+vv[i-1][j-1];
                }
            }
        }
        return vv;
    } 
};

vector的模拟实现

模拟实现的目的是为了学习它的一些细节和核心框架,我们模拟实现时将vector分装在一个命名空间中,防止与std中的vector冲突,首先vector是模板,所以我们需要将vector写成模板的样子:

namespace ZSB
{
    template<class T>
    class vector
    {
    public:
        //...
    private:
        //...
    };
}

那么我们的成员变量有些什么呢?

private:
    iterator _start;
    iterator _finish;
    iterator _endofstorage;

_start, _finish,_endofstorage;这三个变量都分别代表什么意思呢?_start指向数据的头,_finish指向数据结束的下一个位置,_endofstorage指向容量结束的下一个位置。iterator又是什么呢?是迭代器,在vector中的迭代器其实也是指针,只是将他typedef了:

迭代器和const迭代器的模拟实现

typedef T* iterator;
typedef const T* const_iterator;

iterator begin()
{
    return _start;
}
iterator end()
{
    return _finish;
}
const_iterator begin()const
{
    return _start;
}
const_iterator end()const
{
    return _finish;
}

可以看到vector当中的迭代器也是相当于指针,只是将指针typedef了

无参构造函数的模拟实现

vector()
     :_start(nullptr)
     , _finish(nullptr)
     , _endofstorage(nullptr)
{}

将三个成员变量初始化为nullptr

size、capacity、empty成员函数的模拟实现

size_t size()const
{
    return _finish - _start;
}
size_t capacity()const
{
    return _endofstorage - _start;
}
bool empty()
{
    return _start == _finish;
}

_start指向数据的头,_finish指向数据结束的下一个位置,_endofstorage指向容量结束的下一个位置,finish减去start就是size,endofstorage减去start就是capacity,判断是否为空,只需知道start是否等于finish即可

operator[]模拟实现

T& operator[](size_t i)
{
    assert(i >= 0 && i < size());
    return _start[i];
}
const T& operator[](size_t i)const
{
    assert(i >= 0 && i < size());
    return _start[i];
}

operator[]和const修饰的operator[]模拟实现

reserve模拟实现

//开空间
void reserve(size_t n)
{
    if (n > capacity())
    {
        size_t sz = size();//以防_start被改,size计算错误。保存size
        T* tmp = new T[n];
        if(_start)
        {
            memcpy(tmp, _start, sizeof(T) * size());
        	delete[] _start;
        }
        _start = tmp;
        _finish = _start + sz;
        //_finish = _start+size();//error,因为_start已经被修改,size计算错误了
        _endofstorage = _start + n;
    }
}

当reserve的参数n大于容量时,则需要扩容,这里需要注意的是我们需要先将size保存下来以便后面更新成员变量,然后再进行开空间然后拷贝,拷贝完成需要更新成员变量

这里不能使用memcpy进行拷贝,原因是什么我们放在最后面说明。

resize模拟实现

void resize(size_t n, const T& val = T())
{
    if(n>size())
    {
        //判断容量是否够
        if(n>capacity())
        {
            //不够需要增容
            reserve(n);
        }
        else
        {
            //容量够,需要改变_finish,并且进行新增数据的初始化
            while(_finish<n)
            {
                *_finish = val;
                _finish++;
            }
        }
    }
    else
    {
        _finish =_start + n;
    }
}

首先判断resize参数n是否大于size,大于size的话再判断容量是否够,不够需要增容,够的话需要改变_finish,并且对新增数据初始化,n小于size的话,直接改变_finish即可

push_back模拟实现

void push_back(const T& x)
{
     if (_finish == _endofstorage)
     {
     	 size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
         reserve(newcapacity);
     }
	  //new时初始化过了,可以直接复制
      *_finish = x;
      ++_finish;
}

注意需要判断是否需要增容

pop_back模拟实现

void pop_back()
{
     assert(!empty(*this));
     --_finish;
}

注意删除前需要该对象不为空

迭代器失效问题

void test_vector1()
{
    std::vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    std::vector<int>::iterator pos = find(v.begin(), v.end(), 2);
    if (pos != v.end())
    {
        //找到了
        v.insert(pos, 20);
    }
    //在insert以后pos可能就失效了,insert增容导致的,如果insert没有增容,pos还是指向原来的位置,访问没报错,那么我们依旧认为pos失效了,这里失效是指的是pos的意义变了,pos指向的不是原来的值了
    cout << *pos << endl;
    *pos = 100;
}

上面这段代码在解引用pos时会进行报错:

是怎么引起的呢?看下图解释:

  • 由于insert扩容,导致pos失效,pos指向的空间释放,pos本质是一个野指针
  • insert插入数据,就算没有扩容,我们也认为pos失效了,因为pos的意义变了,不再指向原来的数据

调试验证:

因为增容,重新开辟了一块空间,而pos还指向的是原来空间的地址,该空间已经释放,就出现野指针的问题

上面是vs版本下的验证,不同编译器可能检查处理机制不一样,我们再在Linux平台下进行验证:

#include<vector>
#include<iostream>
#include<stdio.h>
#include<algorithm>
using namespace std;
void test_vector1()
{
    std::vector<int> v;
    v.reserve(4);
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    std::vector<int>::iterator pos = find(v.begin(), v.end(), 2);
    if (pos != v.end())
    {
        //找到了
        printf("%p\n",v.begin());
        v.insert(pos, 20);
    }
    //在insert以后pos可能就失效了,insert增容导致的,如果insert没有增容,pos还是指向原来的位置,访问没报错,那么我们依旧认为pos失效了,这里失效是指的是pos的意义变了,pos指向的不是原来的值了
        
    printf("%p\n",v.begin());
    cout << *pos << endl;
    *pos = 100;
}
int main()
{
        test_vector1();
        return 0;
}

我们经过验证,Linux平台gcc编译器下并不会报错,我们分别打印增容前和增容后的v.begin(),发现两次的地址并不一样,说明确实进行了增容

那我们提前将空间开好,那么insert里面不进行增容,那么编译的情况是怎么样的呢?我们来验证一下:

vs版本:

可以看到它依旧会报错

Linux下g++编译器:

Linux平台下依旧不会报错,可以看到他这次并没有增容,并且它打印的是插入的数据

erase也会引起迭代器失效:

void test_vector3()
{
    std::vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);

    std::vector<int>::iterator pos = find(v.begin(), v.end(), 2);
    if (pos != v.end())
    {
        //找到了
        v.erase(pos);
    }
    cout << *pos << endl;
    *pos = 100;
    //erase导致pos失效了,pos没有野指针,只是意义变了,但是vs版本进行了强制检查,都不能访问,同样的代码在Linux当中g++下不会报错,说明两个环境的检查机制不一样
//但是无论编译器是否报错,erase(pos)以后,我们都认为pos失效了,失效了以后不要*pos访问,可能会出问题
}

我们在vs版本下验证此代码:

vs版本下虽然pos没有野指针,pos只是意义变了,但是vs版本下进行了强制检查,不能进行访问。

我们用同样的代码在Linux平台下验证:

可以看到Linux下不会报错,会正常运行,但是无论编译器是否报错,erase(pos)以后,我们都认为pos失效了,失效了以后不要*pos访问,可能会出问题

我们看一个极端的情况:要求删除v中的所有偶数

void test_vector4()
{
    ZSB::vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    //要求删除v中所有偶数
    ZSB::vector<int>::iterator it = v.begin();
    while (it != v.end())
    {
        if (*it % 2 == 0)
        {
            v.erase(it);
        }
        ++it;
    }
}

Linux平台下运行结果:

可以看到发生了段错误,请看如下解释:

VS版本下会直接在it越界时会报错:

void test_vector4()
{
    std::vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(3);
    v.push_back(4);
    v.push_back(5);
    
    //要求删除v中所有偶数
    std::vector<int>::iterator it = v.begin();
    while (it != v.end())
    {
        if (*it % 2 == 0)
        {
            v.erase(it);
        }
        ++it;
    }
}

Linux下的运行结果:

可以看到正常运行了,为什么会正常运行呢?

而相同的代码会在vs下会报错:

所以说不同平台的检查机制不一样

在Linux中并且代码会出现逻辑性错误,无法完成删除偶数,看下面例子:

void test_vector4()
{
    std::vector<int> v;
    v.push_back(1);
    v.push_back(2);
    v.push_back(2);
    v.push_back(4);
    v.push_back(5);
    
    //要求删除v中所有偶数
    std::vector<int>::iterator it = v.begin();
    while (it != v.end())
    {
        if (*it % 2 == 0)
        {
            v.erase(it);
        }
        ++it;
    }
    for(auto e:v)
    {
            cout<<e<<endl;
    }
    cout<<endl;
}

2并没有被删除,为什么呢?

结论:

insert和erase后的迭代器都失效了,不要去访问,否则会出现意想不到的结果

那么库里面的insert和erase是怎么实现的呢?

insert的模拟实现

可以看到insert返回的是迭代器:

它返回一个指向新插入的第一个元素,那么insert我们可以这样写:

iterator insert(iterator pos,const T& x)
{
    assert(pos >= _start && pos <= _finish);
    if(_finish == _endofstorage)
    {
        //容量不够进行扩容
        size_t len = pos-_start;
        size_t newcapacity = capacity()==0?4:capacity()*2;
        reserve(newcapacity);
        
        pos = _start + len;
    }
    //挪动数据
    iterator end = _finish-1;
    while(end >= pos)
    {
        *(end+1) = *(end);
        --end;
    }
    *pos = x;
    ++_finish;
    return pos;
}

首先我们需要断言,因为需要在正确的位置插入;然后insert时如果容量不够了的话我们需要首先增容,,需要注意的是防止pos失效,我们需要在增容后将pos更新指向新空间对应原空间的那个pos位置,那么怎么才能知道那个位置呢?所以我们需要先将pos相对于_start的位置保存下来,增容完成后将pos更新,即pos=_start+len,然后从最后一个数据开始往后挪动数据,挪动完成后将x放在pos位置处,++_finish,然后返回pos,此时的pos位置就是插入元素的第一个位置

erase的模拟实现

可以看到erase也是返回一个迭代器,它返回删除的那个元素的下一个元素:

iterator erase(iterator pos)
{
    assert(pos >= _start && pos < _finish);
    iterator it = pos+1;
    while(it!=_finish)
    {
        *(it-1) = *it;
        it++;
    }
    --_finish;
    return pos;//返回删除位置的下一个位置
}

有些编译器版本删除元素可能考虑缩容,但是我们这里模拟实现erase不考虑缩容,所以这里挪动数据就行,最后返回pos,此时pos位置的元素就是删除位置的下一个位置

此时就可以复用push_back和pop_back:

void push_back(const T& x)
{
    insert(_finish,x);
}
void pop_back()
{
    erase(_finish-1);
}

析构函数

~vector()
{
    delete[] _start;
    _start = _finish = _endofstorage = nullptr;
}

delete时,需要加[],因为销毁的是一段连续的空间

拷贝构造函数

我们不写相当于用的是默认的拷贝构造,默认的拷贝构造是浅拷贝,所以我们需要写深拷贝:

深拷贝传统写法
//v2(v1)
//1、传统写法
vector(const vector<T>& v)
{
    //先开辟和v相同大小的空间
    _start = new T[v.capacity()];
    //拷贝
    memcpy(_start,v._start,sizeof(T)*v.size());
    //更新finish和endofstorage
    _finish = _start+v.size();
    _endofstorage = _start + v.capacity;
}
vector<int> v2(v1);
for(auto e:v2)
{
    cout<<e<<" "<<endl;
}
cout<<endl;

传统深拷贝方法二:

vector(const vector<T>& v)
    :_start(nullptr)
    :_finish(nullptr)
    :_endofstorage(nullptr)
{
    reserve(v.capacity());//复用reserve和push_back
    for(const auto& e:v)//e是string类型时引用接收减少拷贝构造 
    {
        push_back(e);
    }
}

上面这种还是传统写法,只不过是复用reserve和push_back,进行复用就不用我们自己去开空间了

深拷贝现代写法

现代写法怎么写呢?现代写法是自己不开空间,让别人开好空间初始化完,然后自己再和别人开的空间交换,这里其实就是利用vector的一个通过迭代器构造函数来构造tmp对象,传参传被拷贝对象的迭代器即可,然后将this指向的对象和tmp对象交换,因为这里用到了迭代器构造函数与交换函数,所以我们首先模拟实现一下迭代器构造函数与交换函数:

迭代器构造函数与swap函数模拟实现

//类模板的成员函数,还可以再定义模板参数
template <class InputIterator>
//迭代器构造函数
//这是个模板函数,任意类型的迭代器都可以,比如string
vector(InputIterator first,InputIterator last)
    :_start(nullptr)
    :_finish(nullptr)
    :_endofstorage(nullptr)
{
    while(first != last)
    {
        push_back(*first);
        ++first;
    }
}
//v1.swap(tmp)
void swap(vector<T>& v)
{
    std::swap(_start,v._start);
    std::swap(_finish,v._finish);
    std::swap(_finish,v._finish); 
}

需要注意的是迭代器构造函数是个模板函数,任意类型的迭代器都可以,比如string的迭代器

这时就可以写深拷贝的现代写法了:

//现代写法
//v2(v1)
vector(const vector<T>& v)
    :_start(nullptr)
    :_finish(nullptr)
    :_endofstorage(nullptr)
{
    //利用tmp开空间,在string里是传v1._str来构造tmp
    vector<T> tmp(v.begin(),v.end());
    this->swap(tmp);
}

注意需要将_start,_finish,_endofstorage初始化为空,因为临时对象tmp在函数调用结束后会销毁,如果不初始化,它们都是随机值,delete时会出错。

赋值重载

那么赋值重载呢?我们想将一个对象赋值给另一个对象呢?

v1 = v4;

我们知道赋值重载不写会用编译器默认生成的,而此时也会出现浅拷贝问题,所以我们要写深拷贝的赋值重载函数:

赋值重载的传统写法
//传统写法
vector<T>& operator=(const vector<T>& v)
{
    if(this!=&v)
    {
        //先清理原内容
        delete[] _start;
        _start = _finish = _endofstorage = nullptr;
        //开辟空间
    	reverse(v.capacity);
        for(auto& e: v)//e是string类型时引用接收减少拷贝构造 
        {
            push_back(e);
        }
    }
    return *this;
}

先清理原内容,然后再开辟空间,最后进行插入数据

赋值重载的现代写法
//现代写法
//比如v1=v2
vector<T>& operator=(vector<T> v)//值传递
{
    swap(v);
    return *this;
    //结束会释放局部变量v,v指向的空间现在其实就是this之前指向的空间,刚刚好这块空间要释放
}

通过值传递,用v2拷贝构造局部变量v,然后将this指向的对象和v交换,释放原空间的工作交给了函数调用结束,结束会销毁局部变量v,v指向的空间其实就是this之前指向的空间,刚刚好这块空间要释放

memcpy带来的浅拷贝问题

我们看下面代码:

void test_vector9()
{
    vector<string> v;
    v.reserve(4);
    v.push_back("11111");
    v.push_back("11111");
    v.push_back("11111");
    v.push_back("11111");
    v.push_back("11111");//这里要增容会出问题
    
    for(auto e:v)
    {
        cout<<e<<" ";
    }
    cout<<endl;
}

上面的代码你运行时会正常运行,但是你通过调试会发现在函数出口处会引发一个错误:

增容会出问题,因为增容会调用reserve,数据类型是int不会出问题,但是string就会有问题,问题出在memcpy

问题图解:

所以说memcpy导致了更深层次浅拷贝问题:vector<string>

如何解决呢?

for(size_t i = 0;i<sz;++i)
{
    //如果T是string
    //这里调用的就是string的赋值重载,string的赋值重载完成的是深拷贝
    tmp[i] = _start[i];
}

总结:

T是int,doublde等内置类型时可以用memcpy,当T是string时,不能用memcpy

因为拷贝构造传统写法那里也用到了memcpy,所以也需要改,如下:

拷贝构造传统写法修正:

//v2(v1)
//1、传统写法
vector(const vector<T>& v)
{
    //先开辟和v相同大小的空间
    _start = new T[v.capacity()];
    //拷贝
    //memcpy(_start,v._start,sizeof(T)*v.size());//error
    for(size_t i = 0;i<sz;++i)
    {
        //如果T是string
        //这里调用的就是string的赋值重载,string的赋值重载完成的是深拷贝
        _start[i] = v._start[i];
    }
    //更新finish和endofstorage
    _finish = _start+v.size();
    _endofstorage = _start + v.capacity;
}

reserve修正:

//开空间
void reserve(size_t n)
{
    if (n > capacity())
    {
        size_t sz = size();//以防_start被改,size计算错误。保存size
        T* tmp = new T[n];
        for(size_t i = 0;i<sz;++i)
        {
            //如果T是string
            //这里调用的就是string的赋值重载,string的赋值重载完成的是深拷贝
            tmp[i] = _start[i];
        }
        _start = tmp;
        _finish = _start + sz;
        //_finish = _start+size();//error,因为_start已经被修改,size计算错误了
        _endofstorage = _start + n;
    }
}

完整的vector模拟实现的类:

#include<iostream>
#include<assert.h>
#include<vector>
using namespace std;

namespace ZSB
{
    template<class T>
    class vector
    {
    public:
        typedef T* iterator;
        typedef const T* const_iterator;

        iterator begin()
        {
            return _start;
        }
        iterator end()
        {
            return _finish;
        }
        const_iterator begin()const
        {
            return _start;
        }
        const_iterator end()const
        {
            return _finish;
        }
        vector()
            :_start(nullptr)
            , _finish(nullptr)
            , _endofstorage(nullptr)
        {}
        //类模板的成员函数,还可以再定义模板参数
        template <class InputIterator>
        //迭代器构造函数
        //这是个模板函数,任意类型的迭代器都可以,比如string
        vector(InputIterator first,InputIterator last)
            :_start(nullptr)
            :_finish(nullptr)
            :_endofstorage(nullptr)
        {
            while(first != last)
            {
                push_back(*first);
                ++first;
            }
        }
         //拷贝构造
        vector(const vector<T>& v)
            :_start(nullptr)
            :_finish(nullptr)
            :_endofstorage(nullptr)
        {
            reserve(v.capacity());//复用reserve和push_back
            for(const auto& e:v)//e是string类型时引用接收减少拷贝构造 
            {
                push_back(e);
            }
        }
        //赋值重载现代写法
        //比如v1=v2
        vector<T>& operator=(vector<T> v)//值传递
        {
            swap(v);
            return *this;
            //结束会释放局部变量v,v指向的空间现在其实就是this之前指向的空间,刚刚好这块空间要释放
        }
        
        size_t size()const
        {
            return _finish - _start;
        }
        size_t capacity()const
        {
            return _endofstorage - _start;
        }
        bool empty()
        {
            return _start == _finish;
        }
        T& operator[](size_t i)
        {
            assert(i >= 0 && i < size());
            return _start[i];
        }
        const T& operator[](size_t i)const
        {
            assert(i >= 0 && i < size());
            return _start[i];
        }
        //v1.swap(tmp)
        void swap(vector<T>& v)
        {
            std::swap(_start,v._start);
            std::swap(_finish,v._finish);
            std::swap(_finish,v._finish); 
        }
        //开空间
        void reserve(size_t n)
        {
            if (n > capacity())
            {
                size_t sz = size();//以防_start被改,size计算错误。保存size
                T* tmp = new T[n];
                /*if(_start) { memcpy(tmp, _start, sizeof(T) * size()); delete[] _start; }*/
                for(size_t i = 0;i<sz;++i)
                {
                    //如果T是string
                    //这里调用的就是string的赋值重载,string的赋值重载完成的是深拷贝
                    tmp[i] = _start[i];
                }
                _start = tmp;
                _finish = _start + sz;
                //_finish = _start+size();//error,因为_start已经被修改,size计算错误了
                _endofstorage = _start + n;
            }
        }
        //开空间+初始化
        void resize(size_t n, const T& val = T())
        {
            if (n > size())
            {
                if (n > capacity())
                {
                    reserve(n);
                }
                while (_finish < _start + n)
                {
                    *_finish = val;
                    ++_finish;
                }
                /*for(iterator i=_finish;i<n;i++) { } _finish = n;*/
            }
            else
            {
                _finish = _start + n;
            }
        }
        void push_back(const T& x)
        {
            if (_finish == _endofstorage)
            {
                size_t newcapacity = capacity() == 0 ? 4 : capacity() * 2;
                reserve(newcapacity);
            }
            //new时初始化过了,可以直接复制
            *_finish = x;
            ++_finish;
        }
        void pop_back()
        {
            assert(!empty(*this));
            --_finish;
        }
        iterator insert(iterator pos,const T& x)
        {
            assert(pos >= _start && pos <= _finish);
            if(_finish == _endofstorage)
            {
                //容量不够进行扩容
                size_t len = pos-_start;
                size_t newcapacity = capacity()==0?4:capacity()*2;
                reserve(newcapacity);

                pos = _start + len;
            }
            //挪动数据
            iterator end = _finish-1;
            while(end >= pos)
            {
                *(end+1) = *(end);
                --end;
            }
            *pos = x;
            ++_finish;
            return pos;
        }
        iterator erase(iterator pos)
        {
            assert(pos >= _start && pos < _finish);
            iterator it = pos+1;
            while(it!=_finish)
            {
                *(it-1) = *it;
                it++;
            }
            --_finish;
            return pos;//返回删除位置的下一个位置
        }
       
    private:
        iterator _start;
        iterator _finish;
        iterator _endofstorage;
    };
    
    void print(const vector<int>& v)
    {
        vector<int>::const_iterator it = v.begin();
        while (it != v.end())
        {
            cout << *it << " " << endl;
            ++it;
        }
        cout << endl;

        //范围for
        for (auto e : v)
        {
            cout << e << " ";
        }
        cout << endl;
        for (size_t i = 0; i < v.size(); i++)
        {
            cout << v[i] << " ";
        }
        cout << endl;
    }
    void test_vector1()
    {
        vector<int> v;
        v.push_back(1);
        v.push_back(2);
        v.push_back(3);
        v.push_back(4);
        vector<int>::iterator it = v.begin();
        while (it != v.end())
        {
            cout << *it << " " << endl;
            ++it;
        }
        cout << endl;

        //范围for
        for (auto e : v)
        {
            cout << e << " ";
        }
        cout << endl;
        for (size_t i = 0; i < v.size(); i++)
        {
            cout << v[i] << " ";
        }
        cout << endl;
    }
    void test_vector2()
    {
        vector<string> v;
        string s("hello");
        v.push_back(s);
        v.push_back(string("hello"));//自动隐式转换

        v.push_back("hello");
        v.push_back("hello");
        v.push_back("hello");
        v.push_back("hello");
        for (auto e : v)
        {
            cout << e << " ";
        }
        cout << endl;
    }
}
//迭代器失效问题
//类似于野指针问题
namespace std
{
    void test_vector1()
    {
        std::vector<int> v;
        v.push_back(1);
        v.push_back(2);
        v.push_back(3);
        v.push_back(4);
        std::vector<int>::iterator pos = find(v.begin(), v.end(), 2);
        if (pos != v.end())
        {
            //找到了
            v.insert(pos, 20);
        }
        //在insert以后pos可能就失效了,insert增容导致的,如果insert没有增容,pos还是指向原来的位置,访问没报错,那么我们依旧认为pos失效了,这里失效是指的是pos的意义变了,pos指向的不是原来的值了
        cout << *pos << endl;
        *pos = 100;
    }

    void test_vector2()
    {
        std::vector<int> v;
        v.reserve(6);
        v.push_back(1);
        v.push_back(2);
        v.push_back(3);
        v.push_back(4);
        std::vector<int>::iterator pos = find(v.begin(), v.end(), 2);
        if (pos != v.end())
        {
            //找到了
            v.insert(pos, 20);
        }
        //在insert以后pos可能就失效了,insert增容导致的,如果insert没有增容,pos还是指向原来的位置,访问没报错,那么我们依旧认为pos失效了,这里失效是指的是pos的意义变了,pos指向的不是原来的值了
        cout << *pos << endl;
        *pos = 100;
    }

    void test_vector3()
    {
        std::vector<int> v;
        v.push_back(1);
        v.push_back(2);
        v.push_back(3);
        v.push_back(4);

        std::vector<int>::iterator pos = find(v.begin(), v.end(), 2);
        if (pos != v.end())
        {
            //找到了
            v.erase(pos);
        }
        cout << *pos << endl;
        *pos = 100;
        //erase导致pos失效了,pos没有野指针,只是意义变了,但是vs版本进行了强制检查,都不能访问,同样的代码在Linux当中g++下不会报错,说明两个环境的检查机制不一样
//但是无论编译器是否报错,erase(pos)以后,我们都认为pos失效了,失效了以后不要*pos访问,可能会出问题
    }
    void test_vector4()
    {
        ZSB::vector<int> v;
        v.push_back(1);
        v.push_back(2);
        v.push_back(3);
        v.push_back(4);
        //要求删除v中所有偶数
        ZSB::vector<int>::iterator it = v.begin();
        while (it != v.end())
        {
            if (*it % 2 == 0)
            {
                v.erase(it);
            }
            ++it;
        }
    }
}
int main()
{
    test_vector1();
    return 0;
}

相关文章