弗雷德里克·布魯克斯(Frederick P. Brooks)博士在他那篇著名的《沒有銀彈——軟件工程中的根本和次要問題》一文中,將軟件項目比作可怕的人狼(werewolves),并大膽地預言十年內(nèi)不會找到特別有效的銀彈,
調(diào)試之劍
。該論文發(fā)表的時間是1986年,如今整整20年過去了,盡管不時有人驚呼找到了神奇的銀彈,但是冷靜的人們很快發(fā)現(xiàn)那只是美好的愿望。如果說軟件工業(yè)中與人狼的戰(zhàn)斗還在持續(xù),那么在這些戰(zhàn)役中一定會有程序員的身影,筆者也是其中的一個。我的編程生涯是從使用匯編語言編寫DOS下的TSR程序開始的。今天DOS操作系統(tǒng)已經(jīng)成為歷史,在那個年代最值得炫耀的TSR技術也早已經(jīng)過時了。十幾年中,OWL、VFW、VDX、ISAPI、Active Movie等技術也被時間淘汰……然而,在這漫長的時間當中,我最看重的是軟件調(diào)試技術。它是十幾年中我學到的最有用、一直受用、而且日久彌新的一項技術。
從軟件工程的角度來講,軟件調(diào)試是軟件工程的一個重要部分,軟件調(diào)試過程出現(xiàn)在軟件工程的各個階段。從最初的可行性分析、原型驗證、到開發(fā)和測試階段、再到發(fā)布后的維護與支持,都有軟件調(diào)試過程的參與。通常認為,一個完整的軟件調(diào)試過程由以下幾個步驟組成:
● 重現(xiàn)故障,通常是在用于調(diào)試的系統(tǒng)上重復導致故障的步驟,使要解決的問題出現(xiàn)在被調(diào)試的系統(tǒng)中。
● 定位根源,即綜合利用各種調(diào)試工具,使用各種調(diào)試手段尋找導致軟件故障的根源(root cause)。通常測試人員報告和描述的是軟件界面或工作行為中所表現(xiàn)出的異常,或者是與軟件需求和功能規(guī)約不符的地方,泛指軟件缺欠(defect)或者故障(failure)。而這些表面的缺欠總是由于一或多個內(nèi)在因素所導致的。這些內(nèi)因要么是代碼的行為錯誤,要么是不行為錯誤(該作而未作)。
● 探索和實現(xiàn)解決方案,即根據(jù)尋找到的故障根源、和資源情況、緊迫程度等要求設計和實現(xiàn)解決方案。
● 驗證方案,在目標環(huán)境中測試方案的有效性,又稱為回歸(regress)測試。如果問題已經(jīng)解決,那么就可以關閉問題。如果沒有解決則回到第3步調(diào)整和修改解決方案。
這些步驟中,定位根源常常是最困難也是最關鍵的步驟,它是軟件調(diào)試過程的核心和靈魂。如果沒有找到故障根源,那么解決方案便很是隔靴搔癢,或者頭痛醫(yī)腳,白白浪費了時間。
對軟件調(diào)試的另一種更通俗的解釋是指使用調(diào)試工具求解各種軟件問題的過程,例如跟蹤軟件的執(zhí)行過程,探索軟件本身或者與其配套的其它軟件或者硬件系統(tǒng)的工作原理等,這些過程的目的有可能是為了去除軟件缺欠,也可能不是。
在了解了軟件調(diào)試技術的基本概念以后,下面我們來看一下支撐軟件調(diào)試技術的幾種基本機制。
● 斷點:即當被調(diào)試程序執(zhí)行到某一空間或時間點時將其中斷到調(diào)試器中。根據(jù)中斷條件分為如下幾種:
○ 代碼斷點:當程序執(zhí)行到指定內(nèi)存地址的代碼時中斷到調(diào)試器。
○ 數(shù)據(jù)斷點:當程序訪問指定內(nèi)存地址的數(shù)據(jù)時中斷到調(diào)試器。
○ I/O斷點:當程序訪問指定I/O地址的端口時中斷到調(diào)試器。
根據(jù)斷點的設置方法,斷點又分為軟件斷點和硬件斷點。軟件斷點通常是通過向指定的代碼位置插入專用的斷點指令來實現(xiàn)的,比如IA32 CPU的INT 3指令(機器碼為0xCC)就是斷點指令。硬件斷點通常是通過設置CPU的調(diào)試寄存器來設置的。IA32 CPU定義了8個調(diào)試寄存器,DR0~DR7,可以最多同時設置4個硬件斷點(對于一個調(diào)試會話)。通過調(diào)試寄存器可以設置以上三種斷點中的任一種,但是通過斷點指令只可以設置代碼斷點。
● 單步跟蹤:即讓應用程序按照某單位一步步執(zhí)行。根據(jù)單位,又分幾種:
○ 每次執(zhí)行一條匯編指令,稱為匯編語言一級的單步跟蹤。設置IA32 CPU標志寄存器的TF(Trap Flag,即陷阱標志位)位,便可以讓CPU每執(zhí)行完一條指令便產(chǎn)生一個調(diào)試異常(INT 1),中斷到調(diào)試器。
○ 每次執(zhí)行源代碼(比匯編語言更高級的程序語言,如C/C++)的一條語句,又稱為源代碼級的單步跟蹤。通常高級語言的單步跟蹤是通過反復設置CPU的陷阱標志位來實現(xiàn)的,如果當前源代碼行還沒有執(zhí)行完,那么調(diào)試器重新設置陷阱標志并讓程序繼續(xù)執(zhí)行,直到該語句結(jié)束(EIP指向另一語句)才中斷給用戶。
○ 每次執(zhí)行一個程序分支,又稱為分支到分支單步跟蹤。設置IA32 CPU的DbgCtl MSR寄存器的BTF(Branch Trap Flag)標志后,便可以啟用分支到分支單步跟蹤。
○ 每次執(zhí)行一個任務(線程),即當一個任務(線程)被調(diào)度執(zhí)行時中斷到調(diào)試器。IA32架構(gòu)所定義的任務狀態(tài)段(TSS)中的T標志為實現(xiàn)這一功能提供了硬件一級的支持,但是很多調(diào)試器還有提供這項功能,
管理資料
《調(diào)試之劍》(http://m.lotusphilosophies.com)。● ;厮荩╯tack backtrace):即通過記錄在棧中的函數(shù)返回地址顯示(追溯)函數(shù)調(diào)用過程。在將返回地址翻譯成函數(shù)名時需要有調(diào)試符號(debug symbol)的支持。大多數(shù)編譯器都支持在編譯時生成調(diào)試符號。微軟的調(diào)試符號服務器(http://msdl.microsoft.com/download/symbols)提供了大多數(shù)Windows系統(tǒng)文件的調(diào)試符號,是調(diào)試和學習Windows操作系統(tǒng)的寶貴資源。
● 調(diào)試信息輸出(debug output/print):即將程序運行的位置、變量狀態(tài)等信息輸出到調(diào)試器、窗口、文件或者其它可以觀察到的地方。這種方法的優(yōu)點是簡單方便、不依賴于調(diào)試器,但也有明顯的缺點,如效率低,安全性差,通常不可以動態(tài)開啟,且難以管理等。在Windows操作系統(tǒng)中,驅(qū)動程序可以使用DbgPrint/DbgPrintEx來輸出調(diào)試信息,應用程序可以調(diào)用OutputDebugString API。
● 日志(log):將程序運行的狀態(tài)信息寫入到特定的文件或者數(shù)據(jù)庫中。Windows操作系統(tǒng)提供了記錄、觀察和管理(刪除和備份)日志的功能。Windows Vista新引入了名為Common Log File System(CLFS.SYS)的內(nèi)核模塊,用于進一步加強日志功能。
● 事件追蹤(event trace):通常用來監(jiān)視頻繁的復雜的軟件過程,滿足普通日志機制難以勝任的需求。比如監(jiān)視大信息量的文件操作、網(wǎng)絡通信等。ETW(Event Trace for Windows)是Windows操作系統(tǒng)內(nèi)建的事件追蹤機制,Windows內(nèi)核本身和很多Windows下的軟件工具(如Bootvis,TCP/IP View)都使用了該機制。
在以上機制中,斷點和單步跟蹤通常必須在有調(diào)試器參與的情況下才能使用。調(diào)試器(software debugger)是綜合提供各種調(diào)試功能的軟件工具。除了處理斷點、單步跟蹤、模塊映射等調(diào)試事件外,調(diào)試器通常還提供如下功能:
● 觀察和編輯被調(diào)試程序的內(nèi)存和數(shù)據(jù),如全局變量、局部變量、以及程序的棧和堆等重要數(shù)據(jù)結(jié)構(gòu)。
● 觀察和反匯編被調(diào)試程序的代碼。
● 顯示線程棧中的函數(shù)調(diào)用信息。
● 管理調(diào)試符號。
● 控制進程和線程,例如將被調(diào)試程序中斷到調(diào)試器中,和恢復其執(zhí)行等。
根據(jù)調(diào)試器所調(diào)試目標程序的工作模式,可以把調(diào)試器分為用戶態(tài)調(diào)試器和內(nèi)核態(tài)調(diào)試器,前者用于調(diào)試用戶態(tài)下的各種程序(應用程序、系統(tǒng)服務、或者用戶態(tài)的DLL模塊),后者用于調(diào)試工作在內(nèi)核模式的程序,如驅(qū)動程序和操作系統(tǒng)的內(nèi)核部分。WinDbg是微軟開發(fā)的一個免費調(diào)試器,它既可以用作用戶態(tài)調(diào)試器,也可以用作內(nèi)核態(tài)調(diào)試器,是調(diào)試Windows操作系統(tǒng)下的各種軟件的一個強有力工具。我?guī)缀趺刻於际褂肳inDbg,它是我的計算機中使用頻率最高的軟件之一。
最后,簡要地描述一下軟件調(diào)試技術的幾個特征。
系統(tǒng)性——很多看似簡單的調(diào)試機制都是依靠系統(tǒng)內(nèi)的多個部件協(xié)同工作而完成的。以軟件斷點為例,CPU提供了指令支持和硬件級的異常機制,操作系統(tǒng)將異常以調(diào)試事件的形式分發(fā)給調(diào)試器,調(diào)試器響應調(diào)試事件并與用戶交互。如果在做源代碼級的調(diào)試,那么調(diào)試器又需要編譯器所產(chǎn)生的調(diào)試符號來幫忙。
全局性——對于一個軟件項目,應該在項目的設計和架構(gòu)階段就制定出全局的調(diào)試支持機制,并貫徹實施。比如,所有模塊都應該使用統(tǒng)一的方法來輸出調(diào)試信息、記錄日志、報告錯誤,并公開統(tǒng)一的接口用做單元測試和故障診斷。這樣不僅可以避免重復工作,而且增加了軟件的可調(diào)適性(debuggability),有利于保證產(chǎn)品的質(zhì)量和進度。
困難性——《C語言編程》一書的作者Brian Kernighan曾經(jīng)說過,“調(diào)試天生就比編寫代碼難上一倍,如果你寫出了最聰明的代碼,那么你的智商就不足以調(diào)試這個代碼。”因為,要調(diào)試一個程序,就必須深刻理解它的工作原理,不僅要知道how和表層的東西,還要知道why和深層次的內(nèi)幕。另外,調(diào)試需要鍥而不舍的探索精神和堅韌的耐力,這也讓很多人望而卻步。
綜上所述,軟件調(diào)試技術是與軟件開發(fā)密不可分的一門技術,其初衷是為了定位和去除軟件故障,但因為調(diào)試技術所具有的對軟件的強大控制力和觀察力,其應用早已延伸到了很多其它領域,比如逆向工程、計算機安全等等。
學習和靈活運用軟件調(diào)試技術,不僅可以提高程序員的工作效率,而且有利于提升對代碼的感知力和控制力,加深對軟件和系統(tǒng)的理解。此外,調(diào)試技術是解決各種軟件難題的一種有效武器。它直擊要害、銳不可擋,相對其它間接方法具有明顯的優(yōu)勢。
軟件有大美,調(diào)試見真功。在尋找銀彈的努力還在繼續(xù)的時候,衷心地希望所有程序員朋友都學會使用調(diào)試這把利劍吧,使用它為你披荊斬棘,幫你探索前進。只要你的這把劍依然鋒利,那你的軟件青春就永遠不老。
來自:http://blog.csdn.net/programmer_editor/archive/2007/03/21/1536200.aspx