C++實現(xiàn)高性能轉(zhuǎn)換大小寫算法示例

來源：本站原創(chuàng)|時間：2020-01-10|欄目：C語言|點擊：次

簡述

最近工作中遇到一個需求，是需要將URL中的 query 參數(shù)的key全部轉(zhuǎn)換為小寫或者大寫，鍵值對的數(shù)量有點多，但全部都是英文字母，無需考慮非字母的情況。

實現(xiàn)比較快的做法是使用STL或C標準庫中的轉(zhuǎn)換接口，如下：

#include <string> 
#include <cctype> 
#include <algorithm>
// 字符串中的大寫字符轉(zhuǎn)小寫
std::string strtolower(std::string s)
{
 transform(s.begin(), s.end(), s.begin(), ::tolower);
 return s;
}
// 字符串中的小寫字符轉(zhuǎn)大寫
std::string strtoupper(std::string s)
{
 transform(s.begin(), s.end(), s.begin(), ::toupper);
 return s;
}

這個方法雖然很好，但是效率不是很高。

分析了一下ascii碼的碼值，發(fā)現(xiàn)大小寫字母的ascii碼之間是有規(guī)律的。

原理

英文字母的ASCII碼值表示如下

對比一下其二進制形式

從對比的結(jié)果可以看出， 大寫字母與小寫字母的差別 僅是 一個比特位的不同 。

因為它們的這個規(guī)律，可以寫出下面的轉(zhuǎn)換函數(shù)（如果輸入不是字母，轉(zhuǎn)出的結(jié)果會有錯誤）

可以查看數(shù)字 0-9 的ascii碼值，可以看出它們的第6位都是0，所以轉(zhuǎn)為小寫的算法不會影響數(shù)字的值。

轉(zhuǎn)小寫算法中受到影響的，只有ascii碼二進制表示中第六位為0的部分。其中非字母部分如下表

#include <iostream>
#include <string>
#include <stdint.h>
// 更優(yōu)化
std::string strtoupper(std::string s)
{
 if(s.empty()){return s;}
 size_t len = s.size() + 1;
 size_t alignlen = len + 8 - (len % 8);
 s.resize(alignlen);
 size_t ec = alignlen / 8;
 uint64_t* p8 = (uint64_t*)s.data();
 for(size_t i=0;i<ec;++i){
 p8[i] &= 0xDFDFDFDFDFDFDFDF;
 }
 s.resize(len-1);
 return s;
}
// 未做進一步優(yōu)化
std::string strtolower(std::string s)
{
 size_t len = s.size();
 size_t ec = len /8;
 uint64_t* p8 = (uint64_t*)s.data();
 for(size_t i=0;i<ec;++i){
 p8[i] |= 0x2020202020202020;
 }
 uint8_t* p1 = (uint8_t*)(p8 + ec);
 len %= 8;
 for(size_t i=0;i<len;++i){
 p1[i] |= 0x20;
 }
 return s;
}

性能測試

測試代碼如下：

int main()
{
 //std::cout << "Hello, world!\n";
 for(size_t i=0;i<1000000;++i){
 std::string s = strtoupper("qwertyuiopasdfghjklzxcvbnm````````QWERTYUIOPASDFGHJKLZXCVBNM");
 //std::cout<<s<<std::endl;
 s = strtolower("qwertyuiopasdfghjklzxcvbnm\t\t\t\t\t\t\t\tQWERTYUIOPASDFGHJKLZXCVBNM");
 //std::cout<<s<<std::endl;
 }
 return 0;
}

-- 編譯時候請勿優(yōu)化，否則可能被優(yōu)化掉！ --

測試結(jié)果如下：

使用STL算法

STL算法部分主要由頭文件<algorithm>,<numeric>,<functional>組成。要使用 STL中的算法函數(shù)必須包含頭文件<algorithm>，對于數(shù)值算法須包含<numeric>，<functional>中則定義了一些模板類，用來聲明函數(shù)對象。

STL中算法大致分為四類：

1、非可變序列算法：指不直接修改其所操作的容器內(nèi)容的算法。

2、可變序列算法：指可以修改它們所操作的容器內(nèi)容的算法。

3、排序算法：包括對序列進行排序和合并的算法、搜索算法以及有序序列上的集合操作。

4、數(shù)值算法：對容器內(nèi)容進行數(shù)值計算。

結(jié)果如下

time ./teststl
./teststl 7.88s user 0.03s system 100% cpu 7.904 total

自寫代碼測試結(jié)果如下

time ./test
./test 0.93s user 0.00s system 99% cpu 0.928 total

可以看到，其性能有差異。（應用場景有限）

總結(jié)

以上就是這篇文章的全部內(nèi)容了，希望本文的內(nèi)容對大家的學習或者工作具有一定的參考學習價值，如果有疑問大家可以留言交流，謝謝大家對我們的支持。

上一篇：Opencv基于CamShift算法實現(xiàn)目標跟蹤

欄目：C語言

下一篇：C語言實現(xiàn)Floyd算法

本文標題：C++實現(xiàn)高性能轉(zhuǎn)換大小寫算法示例

本文地址：http://mengdiqiu.com.cn/a1/Cyuyan/1005.html

更多C語言

欧美大屁股bbbbxxxx,狼人大香伊蕉国产www亚洲,男ji大巴进入女人的视频小说,男人把ji大巴放进女人免费视频,免费情侣作爱视频

C語言

C++實現(xiàn)高性能轉(zhuǎn)換大小寫算法示例

您可能感興趣的文章

閱讀排行

本欄相關(guān)

隨機閱讀