0%

C++ STL简介

本文转自: https://www.zybuluo.com/comzyh/note/138935

参考网站

推荐大家去这些网站查询自己需要的东西

STL中有很多好用的容器和算法,非常好用。
简单介绍一下

  • vector 向量(可以理解成可变长数组)
  • utility (pair)
  • algorithm (sort)
  • queue 队列 (queue,priority_queue)
  • list (链表)
  • map (key-value映射)
  • bitset (用int各位表示的数组)

C++ 模板简单介绍

我们来看看 cplusplus 上对 vector 的介绍

template < class T, class Alloc = allocator > class vector; // generic template

1
2
3
4
vector<int> arr; 
queue<int> q;
vector<pair<int,int> > ponints; // 注意那个空格
map<string,int> reflect;

使用typedef 可以缩短代码长度,但是会降低可读性

1
2
typedef pair<int,int> pii;
vector<pii> points;

iterator迭代器

迭代器是C++的重要组成部分,但是这里不细讲,只是很多STL容器的方法都返回迭代器,不对迭代器有些了解是不行的
比如遍历一个 vector,可以这么做

1
2
3
vector<int> n;
for(vector<int>:: it=n.begin();it!=n.end();it++)
cout << *it << endl;

访问 iterator 指向的内容可以直接用 *it 访问,如果访问其成员的话,也可以用 -> 访问

1
2
3
vector<pair<int,int> > points;
forvector<pair<int,int> >::iterator = n.begin();it != n.end();it++)
cout << "x: " << it->first << "y: " << (*it).second << endl;

当然,我们平常是不会这么遍历数组的,这里只是演示下 iterator 的用法

vector

vector 是C++中最常用的数据结构,相当于可变长数组,效率和使用数组没有明显差别
cpluscplus 上对 vector 的介绍

常见用法,建立邻接表样例

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
#include <iostream>
#include <vector>
const int MAXN = 100;
vector<int> tab[MAXN+1];
int main()
{
cin >> N >> M;
for (int i=1;i<=N;i++)
tab[i].clear();
for (int i = 0;i<M;i++)
{
int a,b;
cin >> a >> b;
tab[a].push_back(b);
}
}

我们来看一看上面发生了什么

声明: vector<int> arrary ;声明了一个 vector ,而 vector<int> tab[101] 则声明了一个 vector 的数组,访问5点能引出的第0条边使用 tab[5][0] 就可以了
tab[i].clear 是将一个 vector 清空。 这一句在这个程序里是没有用的,但是很多题目需要多组输入输出,上一个Case的邻接表没有清空是要死得很惨的。
tab[a].push_back(b)vector tab[a] 最后添加一个元素,值为 b 如何使用这张邻接表呢

遍历a点所有连接的点

1
2
3
vecotr<int> tab[100]
for (int i = 0;i<tab[a].size();i++)
cout << tab[a][i] << endl;

注意坑

1
2
for (int i = 0;i <= tab[a].size()-1;i++)
cout << endl;

这样是有可能会跪掉的,因为 vectorsize() 返回的是一个 size_t 也就是 unsigned int ,即32位无符号数 类型,这样如果 vector 为空的话,size() 返回 0,然而32位无符号数 0 - 1 = 4294967295,这样会导致访问越界然后开心的RE掉

其他重要的成员

  • vector::resize() 如果你想立即得到一个长度为100的数组而不想一个一个push_bakc进去的话,直接 xxx.resize(100) 就好了
  • vector::begin() 返回首个元素的迭代器
  • vector::end() 返回终止位置的迭代器,注意并非指向最后一个元素,而是比最后一个元素还要往后一个元素的位置

pair

使用 pair 需要 #include <utility>

pair 代表的是数据对,可以用来表示二维坐标(x,y),图中的边之类的东西,pair 的两个分量类型可以不同,像下面这样。

1
2
3
typedef pair<int,int> point; //藐视一个点
typedef pair<string,int> name_and_id_pair; // 学生姓名和学号
typedef pair<int,double> id_to_height pair; // 学生学号和身高

如何制造 pair

常用的方式有构造函数法和make_pair

1
2
3
4
pair<int,int> point1 = make_pair(1,1);
pair<double,double> point2 = make_pair(2.0,3.0);
pair<int,int> point3 = pair<int,int>(1.0,2.0);
pair<int,int> point4 = make_pair(1.0,2.0); // 这句会编译失败,因为make出来的是pair<double,double> 却赋值给了pair<int,int>

如何使用 pair

pair 有两个主要成员 firstsecond,类型分别和为 pairUV 的类型

1
2
3
pair<int, double> yz = make_pair(1, 179.99999);
cout << yz.first << ":" << yz.second << endl;
cout << sizeof(yz.first) << " " << sizeof(yz.second) << endl;

输出

1:179.999
4 8

sort 的姿势

cplusplus 上关于 srot 的页面
sortSTL 里面一个非常重要的算法函数,排序效率非常高,几乎在任何时候都不会需要手敲,所以,需要排序的时候,用 sort 吧!

std::sort 需要 #include <algorithm>

基本排序姿势

第一种用法原型如下,传入两个 RandomAccessIterator,对 [first,last) 区间的元素进行排序,注意区间左闭右开,也就是传入的 last 迭代器指向的位置不会参与排序

1
2
template <class RandomAccessIterator>
void sort (RandomAccessIterator first, RandomAccessIterator last);

int 数组从大到小排序
因为指针也是 RandomAccessIterator 的一种,所以 sort 直接传入指针就好了

1
2
3
const int N = 1000;
int arr[N];
sort(arr , arr + N); // 注意arr + N 指向的位置已经越界,但是sort传入的last参数就是指向最后一个元素后的一个位置

排序vector

vector 直接能返回迭代器,很方便

1
2
vector<int> array;
sort(array.begin(), array.end());

从大到小排序

我们来看看 sort 的第二个原型

1
2
template <class RandomAccessIterator, class Compare>
void sort (RandomAccessIterator first, RandomAccessIterator last, Compare comp);

这里出现了第三个参数 Compare comp comp 是一个比较器,可以有很多种玩法
如果我们想从大到小排序,把 greater 比较器传给sort 就行了

1
2
vector<double> height;
sort(height.begin(), begin.end(), greater<double>());

注意:比较器的使用方法,比较器 std::greater 是一个使用模板的结构体

参见 cplusplusstd::greater 的介绍

greater 的原型为 template <class T> struct greater;

我们需要传入的实际上是是一个 greater 类型的变量,所以需要调用 greater 的构造函数,最后写成 greater<double>()

排序 pair

排序 pair 非常容易,直接 sort 的时候默认以 first 为第一关键字,second 为第二关键字排序

比如我们要对一系列事件已开始时间为第一关键字,结束时间为第二关键字排序

1
2
vector<pair<int,int> > events;
sort(events.begin(),events.end());

搞定~

对自定义结构体进行排序(重载运算符方案)

我们只需要重载结构体的 < 运算符即可

例如,对事件以开始时间排序

1
2
3
4
5
6
7
8
9
10
struct T_event
{
int begin_at, end_at;
bool operator <(const T_event &other)const
{
return begin < other.begin;
}
};
vector<T_event> events;
sort(events.begin(),events.end());

注意:比较重载运算符的两处 const,和引用 &const T_event &other 防止比较函数对 other 进行修改,第二个 const 是限制比较函数不得修改所在的结构体的成员。如果不加这两个 const 限定就会爆满屏幕的编译错误。而比较的时候,另一个变量必须以引用方式 & 传递

双(多)关键字排序

比如我们要对一个结构体 vector 排序,要求很复杂,首先按照 a 降序,然后按照 c 升序,再按照 b 降序,而且 cdouble 值,排序的时候认为如果两个结构体的 c 下去正一样就算 c 一样,怎么搞?

1
2
3
4
5
6
7
8
9
10
11
12
13
struct Three_key
{
int a, b;
double c;
bool opeartor < (const Three_key &other)const
{
if (a != other.a)
return a > other.a;
if ((int)c != (int)other.c)
return (int)c < (int)other.c;
return b > other.b;
}
};

这样就可以了;

使用比较函数排序

有的时候我们需要对一个数组进行多次排序,每次排序标准还不一样,怎么搞?

比如坐标,第一次按照X坐标升序排序,搞点什么,然后再按照Y坐标降序排序,那么可以这样写

1
2
3
4
5
6
7
8
9
10
11
12
vector<pair<int,int> > points;
bool cmp_x_inc(const pair<int,int> &p1, const pair<int,int> &p2)
{
return p1.first < p2.first;
}
bool cmp_y_dec(const pair<int,int> &p1, const pair<int,int> &p2)
{
return p1.second < p2.second;
}
sort(points.begin(),points.end(),cmp_x_inc);//X 升序
//do something...
sort(points.begin(),points.end(),cmp_y_dec);//Y 降序

向sort传入比较函数的函数指针就可以了~

对字符串排序(使用结构体,不推荐)

首先定义结构体

1
2
3
4
5
6
7
8
9
10
11
#include <cstdio> // strcmp 函数在这里
struct T_String
{
char str[10000];
bool operator < (const T_String &s)
{
return strcmp(str,s.str) < 0;
}
};
vector<T_String> strs;
sort(strs.begin(),strs.end());

这种方法虽然简单,但是有很多缺陷,比如

  • 因为字符串存储在结构体中,造成结构体很大,交换结构体的开销很大
  • 不能对常量字符串排序
  • 一般不推荐使用

*对字符串排序(使用 char 数组)**

由于交换字符串开销很大,但是字符串本身是不会改变的,我们并不需要交换字符串本身,最终只需要能顺字典序访问所有字符串就行了,那么,可以对每个字符串建立一个指针,然后采用上面的比较函数方法对指针进行排序即可。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
#include <iostream>
#include <cstdio>
#include <algorithm>
#include <cstring>
#include <vector>
using namespace std;
int N = 0;
char strs[1000][1000];
vector<char *> strs_sorted;
bool char_ptr_cmp(const char *a, const char *b)
{
return strcmp(a,b) < 0;
}
int main()
{
while (scanf("%s", strs[N++]) != EOF);
for (int i = 0; i < N; i++)
strs_sorted.push_back(strs[i]);
sort(strs_sorted.begin(), strs_sorted.end(), char_ptr_cmp);
printf("sorted strs are:\n");
for (vector<char*>::iterator it = strs_sorted.begin(); it != strs_sorted.end(); it++)
printf("%s\n", *it);
return 0;
}

(拓展) 使用自定义比较器(伪函数)

如果我们定义了一个结构体,里面有一个长度为10的int数组

1
2
3
4
5
struct T_arr
{
int arr[10];
};
vector<T_arr> array;

我们需要对 array 进行 10 次排序,每次分别以其中一个下标 (arr[0],arr[1],...) 为关键字进行排序,怎么办?

写10个比较函数?听起来好靠谱的样子~~ 才怪!

还记得我们刚才提到的 greater 吗, std::greater 是一个结构体,我们来看看他的实现

1
2
3
template <class T> struct greater : binary_function <T,T,bool> {
bool operator() (const T& x, const T& y) const {return x>y;}
};

能够看到,greater 重载了一个奇怪的运算符 ()sort 比较两个值的时候会使用这个运算符来对两个元素进行比较,我们也可以这么写

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
#include <cstdio>
#include <algorithm>
#include <vector>
using namespace std;
struct T_arr
{
int arr[4];
};
vector<T_arr> to_sort;
struct T_arr_cmp
{
int index;
T_arr_cmp(int index): index(index) {} // 构造函数
bool operator ()(const T_arr &a, const T_arr &b)
{
return a.arr[index] < b.arr[index];
}
};
int main()
{
int N;
scanf("%d", &N);
to_sort.resize(N);
for (int i = 0; i < N; i++)
for (int j = 0; j < 4; j++)
scanf("%d", &to_sort[i].arr[j]);
for (int j = 0; j < 4; j++)
{
sort(to_sort.begin(), to_sort.end(), T_arr_cmp(j)); // 传入比较器,以数组的第j位为关键字
printf("the to_sort sort by arr[%d] is:\n", j);
for (int i = 0; i < N; i++)
printf("%4d %4d %4d %4d\n", to_sort[i].arr[0], to_sort[i].arr[1], to_sort[i].arr[2], to_sort[i].arr[3]);
}
return 0;
}

上面的代码 给 sort 函数传入了一个结构体,结构体有一个成员变量 index ,表示用 arr[index] 为关键字进行比较,而这个 index,这个 index 是在结构体构造的时候由构造函数传进去的
相当于

1
2
T_arr_cmp cmp(j);
sort(array.begin(), array.end(), cmp);

可以用下面的数据测试

5
1 2 3 4
2 3 4 1
3 4 1 2
4 1 2 3
1 2 3 4

(拓展)使用lambda函数进行排序(C++11)

每次都要定义一个排序函数太麻烦了有木有!
看代码的时候找比较函数往上滚滚轮都快疯了,还打断思路有木有!!
写比较器好多行好麻烦有木有!!!

然而C++11标准提供了 lambda 函数(匿名函数,现声明现调用),写出的代码就好看多了

参见:Lambda函数(C++11 起)

上面的使用比较器对数组多处排序可以改成这样,注意使用 g++ xxx.cpp -std=c++11 来编译(启用C++11标准)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
#include <cstdio>
#include <algorithm>
#include <vector>
using namespace std;
struct T_arr
{
int arr[4];
};
vector<T_arr> to_sort;
int main()
{
int N;
scanf("%d", &N);
to_sort.resize(N);
for (int i = 0; i < N; i++)
for (int j = 0; j < 4; j++)
scanf("%d", &to_sort[i].arr[j]);
for (int j = 0; j < 4; j++)
{
sort(to_sort.begin(), to_sort.end(), [&j](const T_arr &a, const T_arr &b)->bool
{
return a.arr[j] < b.arr[j];
});
printf("the to_sort sort by arr[%d] is:\n", j);
for (int i = 0; i < N; i++)
printf("%4d %4d %4d %4d\n", to_sort[i].arr[0], to_sort[i].arr[1], to_sort[i].arr[2], to_sort[i].arr[3]);
}
return 0;
}

我们看看cppreference中给出的第一种lambda函数语法

[ capture ] ( params ) mutable exception attribute -> ret { body }

再看看我们在sort最后一个参数写了什么?

1
2
3
4
sort(to_sort.begin(), to_sort.end(), [&j](const T_arr &a, const T_arr &b)->bool
{
return a.arr[j] < b.arr[j];
});

首先我们用 [&j] 捕获了 j ,这样排序函数内部就可以直接使用 lambda 外面的 j 啦,不用构造难用的比较器再传入 index 啦。
剩下的和之前说的使用函数比较没什么区别,只是把函数定义放在调用位置而且没起名而已~

我们再来看看使用指针排序字符串的程序,使用lambda函数可以改成这样

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
sort(strs_sorted.begin(), strs_sorted.end(), [](const char *a, const char *b)->bool
{
return strcmp(a,b) < 0;
});
````
lambda真好用有没有!!!!

### queue

queue 是 `STL` 提供的一个队列类,比手写队列有很多优势

`std::queue` 需要 `#include <queue>`

queue 的主要成员

* `push(const value_type& val)` 向队列压入一个元素
* `pop()` 将队头弹出
* `front()` 取出队头
* `empty()` 判断队列是否为空
简单的演示

```c++
queue<int> q;
q.push(0);
while (!q.empty())
{
int h = q.front();
q.pop();
if (h < 100)
q.push(h+1)
printf("%d\n",h);
}

注意,要及时判断 queueempty(),你只有一次机会,如果队列为空再 pop() 的话之后 empty() 八成是返回 false,因为 size 变成 232−1 了,然后什么奇怪的事情都有可能发生

priority_queue

顾名思义,优先队列,是算法竞赛中的非常重要数据结构,Dijkstra等算法 少不了它。
可以参考
cplusplus中的 priority_queue 和 它的构造函数

priority_queue 的使用方法和 queue 基本一致,和主要区别是 front() 换成了 top() ,因为 priority_queue 使用堆实现的

注意,priority_queue 默认是大根堆,也就是大的元素先出队,想让小的元素先出队则应当给出比较器

重载结构体运算符实现“小根堆”

我们经常会遇到想要所有元素以某种优先方法出队,比如Dijkstra算法中,想要当前距离小的点先出队,我们可以这样做

1
2
3
4
5
6
7
8
9
struct State
{
int point,dis;
bool operator < (const State &s)const
{
return dis > s.dis;
}
};
priority_queue<State> q;

无论你使用怎样的方法,都不能改变 priority_queue 是一个大根堆的事实,我们只是重载了运算符让小的元素比较起来大了而已,事实上,这是算法竞赛中非常常用的一种写法,一般来说足够用了。

(拓展)自定义priority_queue的比较方法

上面那个例子,明明可以用 pair<int,int> 存下来的嘛,如果我强行要使用 pair<int,int> 这种不能重载运算符的怎么办?
或者有的时候我们不能重载某个结构体的 < 运算符怎么办?

我们先来看看 priority_queue 的原型

1
2
template <class T, class Container = vector<T>,
class Compare = less<typename Container::value_type> > class priority_queue;

可以看到,模板参数有三个,不过后面两参数已经有默认值了,如果我们想自定义比较器,那么三个参数都要填。还记得上面 sort 里面讲的比较器(仿函数)嘛,第三个参数填入一个仿函数就好了

1
2
3
4
5
6
7
8
struct pair_cmp
{
bool operator()(const pair<int, int> &a, const pair<int, int> &b)
{
return a.second > b.second;
}
};
priority_queue<pair<int, int>, vector<pair<int, int> >, pair_cmp> q;

set

set 是有序集合,使用 set 需要 #include <set>

set 是使用平衡树实现的,可以在 O(Log(N)) 的时间内完成插入删除修改操作。

set 常用来进行各种判重,比如搜索判重,状态判重等等。

cplusplus上对 set 的介绍

声明一个set

1
set<int> iset;

常用API有:

  • set::insert(val) 插入一个元素

  • set::empty() 判定set是否为空

  • set::clear() 清空set

  • set::size() 取得set大小

  • set::erase() 删除元素(有三只牛股用法)

  • set::find(val) 返回指定元素迭代器,不存在的话返返回end()

  • set::lower_bound(val)

  • set::upperbound(val)

  • set::begin() 返回从左开始的迭代器(从小到大)

  • set::end() 返回

  • set::rbegin,set::rend()

  • set::count(val) 返回set指定val的个数
    显然只能返回1(有)或者0(没有),可以用来判断元素是否存在