std::lexicographical_compare是按字典序判断前序列是否严格小于后序列的布尔函数,返回true仅当前者字典序严格小;要求两左闭右开区间,不检查迭代器有效性,不等价于strcmp或string::operator

std::lexicographical_compare 是什么
它不是“字典序比较函数”,而是「按字典序做小于判断」的算法——返回 true 当且仅当前序列按字典序严格小于后一个序列。别把它当成 strcmp 的替代品,它不返回 -1/0/1,只返回布尔值。
基本用法和常见错误
最常出错的是传入不匹配的迭代器范围,或忽略比较函数签名要求。标准用法需要两个左闭右开区间:
std::vectora = {1, 2, 3}; std::vector b = {1, 2, 4}; bool result = std::lexicographical_compare(a.begin(), a.end(), b.begin(), b.end()); // true
- 必须确保
b的迭代器范围长度 ≥ 0;若b为空但a非空,结果为false(非空序列永远不小于空序列) - 若两个序列完全相同,返回
false(因为不是“小于”,是“严格小于”) - 传入随机访问迭代器时不会报错,但性能无优势;它本质是顺序遍历,和
std::equal类似
自定义比较函数要注意 operator
如果你传入自定义谓词,比如 std::greater,那它就变成“逆字典序”比较。但注意:谓词必须满足严格弱序(strict weak ordering),否则行为未定义:
std::string s1 = "abc";
std::string s2 = "abcd";
// 按 char 的 unsigned 值比较(避免 signed char 负值问题)
bool r = std::lexicographical_compare(
s1.begin(), s1.end(),
s2.begin(), s2.end(),
[](unsigned char a, unsigned char b) { return a < b; }
); // true
- 对
char直接比较可能因平台默认char有符号而引发负值比较错误,务必转成unsigned char - 不能传入捕获 lambda(除非用
std::function包装,但会损失性能);推荐用普通函数对象或无捕获 lambda - 谓词参数顺序固定:
pred(*first1, *first2),不能反着写
和 std::string::operator区别
别为了省事直接替换。三者语义不同:
立即学习“C++免费学习笔记(深入)”;
std::string::operator 是针对std::string的特化实现,内部可能用memcmp加长度判断,但对外表现就是字典序小于-
std::memcmp是 C 函数,按字节比较,遇到\0不停止,也不考虑编码;对std::string使用它是危险的(内部可能有 SSO 缓存,且不保证连续内存) -
std::lexicographical_compare是泛型算法,适用于任意可迭代类型(std::vector、std::array、原始数组等),但不处理nullptr或空指针范围
真正容易被忽略的是:它不检查输入有效性。传入 end 或无效迭代器,行为未定义——这和 std::sort 一样,没人帮你做 debug 断言。










