C++開發(fā)的Redis數(shù)據(jù)導(dǎo)入工具優(yōu)化
背景
使用C++開發(fā)了一個Redis數(shù)據(jù)導(dǎo)入工具
從oracle中將所有表數(shù)據(jù)導(dǎo)入到redis中;
不是單純的數(shù)據(jù)導(dǎo)入,每條oracle中的原有記錄,需要經(jīng)過業(yè)務(wù)邏輯處理,
并添加索引(redis集合);
工具完成后,性能是個瓶頸;
優(yōu)化效果
使用了2個樣本數(shù)據(jù)測試:
樣本數(shù)據(jù)a表8763 條記錄;
b表940279 條記錄;
優(yōu)化前,a表耗時11.417s;
優(yōu)化后,a表耗時1.883s;
用到的工具
gprof, pstrace,time
使用time工具查看每次執(zhí)行的耗時,分別包含用戶時間和系統(tǒng)時間;
使用pstrace打印實時運行,查詢進(jìn)程主要的系統(tǒng)調(diào)用,發(fā)現(xiàn)耗時點;
使用gprof統(tǒng)計程序的耗時匯總,集中精力優(yōu)化最耗時的地方;
使用簡介:
1.對g++的所有編輯和連接選項都必須要加上-pg(第一天由于沒有在連接處加上-pg選項,導(dǎo)致無法出統(tǒng)計報告);
2.執(zhí)行完程序后,本目錄會產(chǎn)生gmon.out文件;
3.gprof redistool gmou.out > report,生成可讀文件report,打開report集中優(yōu)化最耗時的函數(shù);
優(yōu)化過程
優(yōu)化前11.417s:
time ./redistool im a a.csv
real 0m11.417s
user 0m6.035s
sys 0m4.782s (發(fā)現(xiàn)系統(tǒng)調(diào)用時間過長)
文件內(nèi)存映射
系統(tǒng)調(diào)用時間過長,主要是文件讀寫,初步考慮是讀取文件時,調(diào)用api次數(shù)過于頻繁;
讀取樣本采用的是文件fgets一行行的讀取,采用文件內(nèi)存映射mmap后,可直接使用指針操作整個文件內(nèi)存快;
日志開關(guān)提前
改進(jìn)了文件讀寫后,發(fā)現(xiàn)優(yōu)化效果比較有限(提高了2s左右);fgets是C的文件讀取庫函數(shù),相比系統(tǒng)read(),是帶了緩沖區(qū)了,應(yīng)該不會太慢(網(wǎng)上有人測試,文件內(nèi)存映射相比fgets()能快上一個數(shù)量級,感覺場景應(yīng)該比較特殊);
之后通過pstrace工具發(fā)現(xiàn)log.dat打開次數(shù)過多;原來是調(diào)試日志的開關(guān)寫到了后面,導(dǎo)致 調(diào)試日志都是會打開日志文件open("log.dat");
將日志開關(guān)提前;改進(jìn)后,3.53s
time ./redistool im a a.csv
real 0m3.530s
user 0m2.890s
sys 0m0.212s
vector空間預(yù)先分配
后續(xù)通過gprof分析,某個函數(shù)的vector內(nèi)存分配次數(shù)多,并有不少復(fù)制次數(shù):
改進(jìn)以下這行代碼:
vector <string> vSegment;
使用靜態(tài)vector變量,并預(yù)先分配內(nèi)存:
static vector <string> vSegment;
vSegment.clear();
static int nCount = 0;
if( 0 == nCount)
{
vSegment.reserve(64);
}
++nCount;
優(yōu)化后,提升至2.286s
real 0m2.286s
user 0m1.601s
sys 0m0.222s
同樣,另外一個類中的成員vector也使用預(yù)先分配空間(在構(gòu)造函數(shù)中):
m_vtPipecmd.reserve(256);
優(yōu)化后,提升至2.166s;
real 0m2.166s
user 0m1.396s
sys 0m0.204s
函數(shù)改寫 && 內(nèi)聯(lián)
繼續(xù)執(zhí)行程序,發(fā)現(xiàn)SqToolStrSplitByCh()函數(shù)消耗過大,改寫整個函數(shù)邏輯,并將改寫后的函數(shù)內(nèi)聯(lián):
優(yōu)化后,提升至1.937s
real 0m1.937s
user 0m1.301s
sys 0m0.186s
去除調(diào)試符和優(yōu)化監(jiān)測符號
最后,去掉debug和pg調(diào)試符號后,最終效果為1.883s;
real 0m1.883s
user 0m1.239s
sys 0m0.191s
滿足生產(chǎn)要求
以上最后幾步看似毫秒級的提升,擴大到全表數(shù)據(jù)后,效果就很明顯了;
優(yōu)化后,生產(chǎn)上a表為152w,導(dǎo)入耗時大約326s(~6分鐘);
b表數(shù)據(jù)420w,導(dǎo)入耗時大約1103s(~18分鐘)
以上所述就是本文的全部內(nèi)容了,希望大家能夠喜歡。
上一篇:淺談C++對象組合
欄 目:C語言
本文標(biāo)題:C++開發(fā)的Redis數(shù)據(jù)導(dǎo)入工具優(yōu)化
本文地址:http://mengdiqiu.com.cn/a1/Cyuyan/3024.html
您可能感興趣的文章
- 04-02c語言的正則匹配函數(shù) c語言正則表達(dá)式函數(shù)庫
- 04-02c語言中對數(shù)函數(shù)的表達(dá)式 c語言中對數(shù)怎么表達(dá)
- 04-02c語言沒有round函數(shù) round c語言
- 04-02C語言中怎么打出三角函數(shù) c語言中怎么打出三角函數(shù)的值
- 01-10c語言求1+2+...+n的解決方法
- 01-10求子數(shù)組最大和的解決方法詳解
- 01-10深入理解約瑟夫環(huán)的數(shù)學(xué)優(yōu)化方法
- 01-10深入二叉樹兩個結(jié)點的最低共同父結(jié)點的詳解
- 01-10數(shù)據(jù)結(jié)構(gòu)課程設(shè)計- 解析最少換車次數(shù)的問題詳解
- 01-10c語言 跳臺階問題的解決方法


閱讀排行
本欄相關(guān)
- 04-02c語言函數(shù)調(diào)用后清空內(nèi)存 c語言調(diào)用
- 04-02func函數(shù)+在C語言 func函數(shù)在c語言中
- 04-02c語言的正則匹配函數(shù) c語言正則表達(dá)
- 04-02c語言用函數(shù)寫分段 用c語言表示分段
- 04-02c語言中對數(shù)函數(shù)的表達(dá)式 c語言中對
- 04-02c語言編寫函數(shù)冒泡排序 c語言冒泡排
- 04-02c語言沒有round函數(shù) round c語言
- 04-02c語言分段函數(shù)怎么求 用c語言求分段
- 04-02C語言中怎么打出三角函數(shù) c語言中怎
- 04-02c語言調(diào)用函數(shù)求fibo C語言調(diào)用函數(shù)求
隨機閱讀
- 01-11Mac OSX 打開原生自帶讀寫NTFS功能(圖文
- 08-05織夢dedecms什么時候用欄目交叉功能?
- 01-10delphi制作wav文件的方法
- 01-10使用C語言求解撲克牌的順子及n個骰子
- 08-05dedecms(織夢)副欄目數(shù)量限制代碼修改
- 08-05DEDE織夢data目錄下的sessions文件夾有什
- 01-10SublimeText編譯C開發(fā)環(huán)境設(shè)置
- 04-02jquery與jsp,用jquery
- 01-11ajax實現(xiàn)頁面的局部加載
- 01-10C#中split用法實例總結(jié)