How to debugger? (1)

許多人都說:不懂debugger的人,不會寫程式。身為一個會寫程式的程序員,我也是十分同意這句話的。想當初我也是渾渾噩噩的寫了一陣子程式之後,才知道什麼是debugger,之後果然就好像打通任督二脈一樣,突飛猛進。所以說,要會寫程式,一定要會debugger。礙於有許多新手程序員還是不懂什麼叫作debugger,所以就寫了這篇文,對debugger作一個基本的介紹,希望能對大家有所幫忙,可以像我一樣勇猛精進。

首先,由寫一個小小的測試程式開始,慢慢的再進入主題。

#include <iostream>
using namespace std;

int mul2(int a)
{
  return 3 * a;
}

int main(void)
{
  if (20 == mul2(10))
    cout << "debugger讚!\n";
  else
    cout << "奇怪ㄋㄟ\n";

  return 0;
}
下面是程式執行的結果。


真是奇怪ㄋㄟ,應該是要顯示"debugger讚!"才對吧!?這個時候只好來debugger一下下了,看看問題出在那裡。

第一招,小紅點

下小紅點,也就是所謂的下斷點,也有人說中斷,或說breakpoint。在程式裡面放個小紅點,當程式跑到有小紅點的地方的時候就會停下來,這時候我們就抓到機會,可以去檢查看看各個可疑的地方,也可以偷偷竄改一些資料,無所不用其極的就是要把程式裡面的虫抓出來搞定它。

下小紅點的方法有很多種,這裡我可以告訴你四種方法。

  1. __debugbreak();
  2. __asm int 3
  3. __asm _emit 0xCC

以上的方法都是手動在程式裡面放入小紅點,也就是在程式裡面塞進一個0xCC。那到底0xCC是什麼東西。去查一下x86指令集,原來0xCC就是int3。你又要問:什麼是int3?答案是:int3是個中斷,由x86硬體支援,軟體觸發。

當CPU執行指令的時候,如果執行到的指令是0xCC,也就是int3的時候,它會發出一個中斷,也就是interrupt。中斷發生的時候,CPU會暫時停止目前手上的工作,然後跳到事先準備好的中斷處理常式去執行,就跟執行副程式沒什麼二樣。發生int3中斷時,就執行int3handler副程式,發生int21時,就執行int21handler副程式。這些中斷副程式,大多是由BIOS或作業系統提供,要不然就是應用程式提供。像這裡的int3副程式就是由debugger提供,專門用來處理debugger相關程序。

如果你的程式是由一個debugger啟動的,那麼debugger會在你的程式開始執行之前,就已經事先安裝好debugger專用的int3副程式,這樣一來當CPU執行到int3的時候才能作適當的處理。另一方面,如果你的程式不是透過debugger啟動的,也就是說在你的程式啟動前,並沒有什麼人安裝了一個int3副程式,那麼當你的程式一執行到一個0xCC指令時,它就會當場當給你看。

講到這裡再補充一下,當你在debugger你的程式的時候,假如你的程式是除錯版,那你一定會發現到那些未被初始化的變數內容都會是一堆0xCC。當時你一定會對這些變數的內容為什麼都是0xCC感到奇怪,現在學到了debugger第一招之後,終於了解到了這些0xCC可不是隨隨便便放進去的,它們是有特殊用意的。

;

不過正常的情況下,我們都不必自己在程式裡面塞個0xCC。而是在debugger IDE裡面透過F9等方法,在執行裡放小紅點。這時候你會覺得奇怪,在開始debugger前我們的程式都已經編譯完成了,那麼用F9放小紅點的時候,這個0xCC是放到那裡去了?是插入放小紅點的位置呢?還是取代原來那個位置的指令,把它給蓋過去了?答案是後者。當然,debugger也不能那麼霸道。在它放入0xCC之前,會先把原來位置的指令儲存起來,以備在適當的時機再復原回來。

各位,現在重點來了。當CPU執行到一個0xCC指令時,會幹什麼事呢?

當CPU執行到一個0xCC指令時,會觸發一個int3中斷,這時CPU停下手邊工作,跳到int3副程式執行,而這個int3副程式是由debugger提供。所以說,剛剛的問題應該換成:當CPU執行到一個0xCC指令時,debugger會幹什麼事呢?

  1. 首先,debugger會把目前CPU所有的狀態儲存下來。這樣子,當我們對debugger說繼續跑的時候,debugger才能把原來的狀態復原,讓原來的工作能無接縫的繼續進行下去。
  2. 如果現在執行到的這個0xCC指令是我們自己插入到程式裡面去的,那麼debugger就不需要作什麼特別的處理。
  3. 如果這個0xCC指令是因為我們在debugger IDE裡透過像是按了F9等方式放進去的話,因為這個動作會取代原來的指令,所以現在要作的事情就是要把原來的指令還原,再執行原來的指令,這樣整個程式的狀態才會正確。執行動作如下:
    • 將原來的指令寫回原來的位置。
    • 將CPU的狀態設定成單步執行,來執行原來的指令。CPU裡面有一個程式指位器,因為剛剛已經執行了0xCC,而本來應該是要執行原本的指令,所以在把原來指令還原後,還要再把程式指位器退回一步,這樣下次執行時才會執行到原來的指令。當CPU是單步狀態時,每執行一個指令就會觸發一次中斷,而像執行到0xCC時每次才會觸發一次int3中斷。而單步時觸發的中斷是int1,這是硬體中斷。
    • 當執行完原來的指令後,再取消CPU單步模式。控制權又回到了debugger。
  4. 現在控制權在debugger手上,它會一直等待我們的命令,這時候我們就可以為所欲為,觀察變數內容,偷改記憶體內容等等,或再叫debugger繼續跑。
  5. 跳出繼續執行程式前,debugger會先把所有在一開始記錄下來的狀態復原,然後再繼續執行原來的程式。對原來的程式而言,它完全不知道被人動過什麼手腳。

一開始的時候講到有四種方法可以放小紅點,那麼第四種方法呢?

上面講的三種方法是軟體中斷,剩下最後一個方法講的是硬體的中斷。有一組暫存器,透過設定你想要CPU停在那裡它就停在那裡。這是專門給debugger使用的,一般在程式裡頭不會去使用。使用硬體小紅點和軟體小紅點的差別是,用硬體小紅點不用像軟體小紅點那麼麻煩,需要在停下來時,再把原來的指令還原再執行然後再有的沒有的,再加上其它有的沒有的特殊技能。所以對於debugger內部來說,都會優先使用硬體小紅點,只不過硬體小紅點數量有限,當硬體小紅點用完了的時候,就要配合軟體小紅點。

對了,忘了說當硬體小紅點觸發時,和CPU單步執行時一樣會發生一個int1中斷,所以也一樣會跳到int1副程式去執行。

;

現在將游標移動到第11行或if (20 == mul2(10))那一行,然後按下F9放一個小紅點。


接著按下F5開始debugger。你會看到執行到第11行的時候,程式就停下來了,在停下來的那行會有一個箭頭。


現在你知道,按了F9下小紅點,然後再按了F5開始debugger,然後程式在你放的小紅點停下來,這之間發生了什麼事情了。

接下來,第二招要上場了。

留言

張貼留言

這個網誌中的熱門文章

以lex/yacc實作算式計算機

猜數字遊戲 (電腦猜人)

KillSudoku 4顆星精彩數獨詳解 - 鍊技巧