使用string时发现了一些坑。
我们知道stl 容器并不是线程安全的,所以在使用它们的过程中往往需要一些同步机制来保证并发场景下的同步更新。
应该踩的坑还是一个不拉的踩了进去,所以还是记录一下吧。
string作为一个容器,随着我们的append 或者 针对string的+ 操作都会让string内部的数据域动态增加,而动态增加的过程则伴随着一些局部指针变量的创建和释放,而当我们并发对同一个string进行操作的时候(测试很明显,写工程项目因为专注于各个模块细节,这一些问题因为代码功底不够,还是没有办法注意到位),就会出现一些double-free 这样的异常问题(double-free 即 对同一个地址释放了两次,第一次对一个地址free的时候这段内存已经还给了操作系统,当第二次访问这个地址则就是非法访问了)。
看看下面这个测试代码,大体逻辑就是多线程从一个已有的string数组中并发将数组中的内容取出编码到一个全局的string里面。
#include #include
#include
#include
#include #include using namespace std;std::vector<std::string> data_vec;
std::string dst;char* EncodeVarint32(char* dst, uint32_t v) { // Operate on characters as unsignedsuint8_t* ptr = reinterpret_cast<uint8_t*>(dst);static const int B = 128;if (v < (1 << 7)) { *(ptr++) = v;} else if (v < (1 << 14)) { *(ptr++) = v | B;*(ptr++) = v >> 7;} else if (v < (1 << 21)) { *(ptr++) = v | B;*(ptr++) = (v >> 7) | B;*(ptr++) = v >> 14;} else if (v < (1 << 28)) { *(ptr++) = v | B;*(ptr++) = (v >> 7) | B;*(ptr++) = (v >> 14) | B;*(ptr++) = v >> 21;} else { *(ptr++) = v | B;*(ptr++) = (v >> 7) | B;*(ptr++) = (v >> 14) | B;*(ptr++) = (v >> 21) | B;*(ptr++) = v >> 28;}return reinterpret_cast<char*>(ptr);
}inline void PutVarint32(std::string* dst, uint32_t v) { char buf[5];char* ptr = EncodeVarint32(buf, v);// If the v is a negative number, we need store the last byte.dst->append(buf, static_cast<size_t>(ptr - buf));
}inline void PutLengthPrefixedSlice(std::string* dst, const std::string& value) { PutVarint32(dst, static_cast<uint32_t>(value.size()));dst->append(value.data(), value.size());
}void EncodeTo(std::string* dst, std::string key) { PutLengthPrefixedSlice(dst, key);
}void EncodeDataVec() { std::cout << "Encode data_vec" << std::endl;for (int i = 0;i < data_vec.size(); i ++) { EncodeTo(&dst, data_vec[i]);}
}void ConstructDataVec() { std::cout << "Construct data_vec" << std::endl;for (int i = 0;i < 10; i++) { data_vec.emplace_back(std::to_string(i));}
}int main(int argc, char* argv[]) { int threads = 1;if (argc == 2) { threads = atoi(argv[1]);}std::cout << "threads : " << threads << std::endl;ConstructDataVec();for (int i = 0;i < threads; i++) { new std::thread(EncodeDataVec);}return 0;
}
当我设置并发数为20的时候,很明显出现如下问题
./concurrent_test 20## 异常问题,大体就是释放了一个不存在的地址
concurrent_test(5008,0x700008738000) malloc: *** error for object 0x7fefab504080: pointer being freed was not allocated
concurrent_test(5008,0x700008738000) malloc: *** set a breakpoint in malloc_error_break to debug
[1] 5008 abort ./concurrent_test 20
lldb一下看看:
lldb ./concurrent_test 20
(lldb) target create "./concurrent_test"
Current executable set to '/Users/zhanghuigui/Desktop/work/source/cpp_practice/data_structure/string/concurrent_test' (x86_64).
(lldb) settings set -- target.run-args "20"
(lldb) r
Process 5828 stopped
* thread #4, stop reason = signal SIGABRTframe #0: 0x00007fff2030c462 libsystem_kernel.dylib`__pthread_kill + 10
libsystem_kernel.dylib`__pthread_kill:
-> 0x7fff2030c462 <+10>: jae 0x7fff2030c46c ; <+20>0x7fff2030c464 <+12>: movq %rax, %rdi0x7fff2030c467 <+15>: jmp 0x7fff203066a1 ; cerror_nocancel0x7fff2030c46c <+20>: retq
(lldb) bt
异常栈的信息如下
core在了grow_by_and_replace
中,这个函数被string::append
函数调用,也就是我们上面测试代码底层的Encode逻辑会调用这个append,然后grow_by_and_replace
就是为了对容器进行扩容。
基本实现代码如下:
我们可以发现在grow_by_and_replace 在实现扩容的逻辑过程中需要分配新的地址空间,将旧的数据拷贝到新的地址,这个过程需要借用临时指针,并且在完成拷贝之后释放老的地址old_p
。
很明显,我们并发append全局string的时候,这里的old_p
的释放并不是线程安全的,两个线程同时append,且都需要进行扩容,则一个扩容完成释放旧指针,但是旧指针还在被另一个线程引用,则第二个线程扩容完成释放旧指针,显然是访问了一个空的地址了。
除了并发问题之外,使用string 不断得append的时候 还会有性能问题,因为append扩容期间 会不断得有数据拷贝,而内存拷贝是很浪费时间的,所以string使用时如果能够预知容量,建议reserve
足够的空间,能够避免动态分配空间造成的性能问题,当然,如果提前reserve的话 也不会有 grow_by_and_replace
这个问题的。
在main
函数中,调用线程逻辑之前增加dst.reserve(10000)
,则并发100线程 跑100轮都不会有问题了。
但是在我们实际的应用过程中想要解决 这个string 并发扩容时造成的内存泄漏问题,我们还需要有其他的办法。
局部构造好之后赋值给一个全局变量std::string
即可:
void EncodeDataVec() { std::cout << "Encode data_vec" << std::endl;std::string tmp_dst;for (int i = 0;i < data_vec.size(); i ++) { EncodeTo(&tmp_dst, data_vec[i]);}dst = std::string(tmp_dst);
}
importjava.security.SecureRandom;importjavax.crypto.Cipher;importjavax.crypto.SecretKey;importjavax.crypto.SecretKeyFactory;importjavax.crypto.spec.DESKeySpec;//结果与DES算...
题目:替换空格 请实现一个函数,把字符串 s 中的每个空格替换成"%20"。 输入:s = "We are happy." 输出:"We%20are%20happy." 限制: 0 <= s 的长度 <= 10000 解题: 时间复杂度:O(n) 空间复杂度:O(n) class Solution { public:s...
在C++11标准库中,string.h已经添加了to_string方法,方便从其他类型(如整形)快速转换成字面值。 例如: for (size_t i = 0; i < texArrSize; i++)RTX_Shader.SetInt(string("TexArr[") + to_string(i) + "]", 7 + i);...
Ubuntu 14.04安装并升级之后,变成楷体字体非常难看,我昨天搞了一晚上,终于理了个头绪,这里整理一下。 经过网上调研,大家的一致看法是,使用开源字体库文泉驿的微黑字体效果比较理想,甚至效果不输windows平台的雅黑字体。下面我打算微黑来美化Ubuntu 14.04. 1.安装文泉驿微黑字体库 sudo aptitude...
经过长期探索,发现一个不需要手动设置线程休眠时间(e.g. std::this_thread::sleep_for(std::chrono::microseconds(1)))的代码: Github: https://github.com/log4cplus/ThreadPool #ifndef THREAD_POOL_H_7e...
nth_element(first,nth,last) first,last 第一个和最后一个迭代器,也可以直接用数组的位置。 nth,要定位的第nn 个元素,能对它进行随机访问. 将第n_thn_th 元素放到它该放的位置上,左边元素都小于它,右边元素都大于它. 测试代码: http://www.cplusplus.com...
c/c++老版本的rand()存在一定的问题,在转换rand随机数的范围,类型或者分布时,常常会引入非随机性。
定义在
jsoncpp 是一个C++ 语言实现的json库,非常方便得支持C++得各种数据类型到json 以及 json到各种数据类型的转化。 一个json 类型的数据如下: {"code" : 10.01,"files" : "","msg" : "","uploadid" : "UP000000" } 这种数据类型方便我们人阅读以...
问题如下: 已知一组数(其中有重复元素),求这组数可以组成的所有子集中,子 集中的各个元素和为整数target的子集,结果中无重复的子集。 例如: nums[] = [10, 1, 2, 7, 6, 1, 5], target = 8 结果为: [[1, 7], [1, 2, 5], [2, 6], [1, 1, 6]] 同样之前有...