跳到主要內容

How to debugger? (1)

許多人都說:不懂debugger的人,不會寫程式。身為一個會寫程式的程序員,我也是十分同意這句話的。想當初我也是渾渾噩噩的寫了一陣子程式之後,才知道什麼是debugger,之後果然就好像打通任督二脈一樣,突飛猛進。所以說,要會寫程式,一定要會debugger。礙於有許多新手程序員還是不懂什麼叫作debugger,所以就寫了這篇文,對debugger作一個基本的介紹,希望能對大家有所幫忙,可以像我一樣勇猛精進。

首先,由寫一個小小的測試程式開始,慢慢的再進入主題。

#include <iostream>
using namespace std;

int mul2(int a)
{
  return 3 * a;
}

int main(void)
{
  if (20 == mul2(10))
    cout << "debugger讚!\n";
  else
    cout << "奇怪ㄋㄟ\n";

  return 0;
}
下面是程式執行的結果。


真是奇怪ㄋㄟ,應該是要顯示"debugger讚!"才對吧!?這個時候只好來debugger一下下了,看看問題出在那裡。

第一招,小紅點

下小紅點,也就是所謂的下斷點,也有人說中斷,或說breakpoint。在程式裡面放個小紅點,當程式跑到有小紅點的地方的時候就會停下來,這時候我們就抓到機會,可以去檢查看看各個可疑的地方,也可以偷偷竄改一些資料,無所不用其極的就是要把程式裡面的虫抓出來搞定它。

下小紅點的方法有很多種,這裡我可以告訴你四種方法。

  1. __debugbreak();
  2. __asm int 3
  3. __asm _emit 0xCC

以上的方法都是手動在程式裡面放入小紅點,也就是在程式裡面塞進一個0xCC。那到底0xCC是什麼東西。去查一下x86指令集,原來0xCC就是int3。你又要問:什麼是int3?答案是:int3是個中斷,由x86硬體支援,軟體觸發。

當CPU執行指令的時候,如果執行到的指令是0xCC,也就是int3的時候,它會發出一個中斷,也就是interrupt。中斷發生的時候,CPU會暫時停止目前手上的工作,然後跳到事先準備好的中斷處理常式去執行,就跟執行副程式沒什麼二樣。發生int3中斷時,就執行int3handler副程式,發生int21時,就執行int21handler副程式。這些中斷副程式,大多是由BIOS或作業系統提供,要不然就是應用程式提供。像這裡的int3副程式就是由debugger提供,專門用來處理debugger相關程序。

如果你的程式是由一個debugger啟動的,那麼debugger會在你的程式開始執行之前,就已經事先安裝好debugger專用的int3副程式,這樣一來當CPU執行到int3的時候才能作適當的處理。另一方面,如果你的程式不是透過debugger啟動的,也就是說在你的程式啟動前,並沒有什麼人安裝了一個int3副程式,那麼當你的程式一執行到一個0xCC指令時,它就會當場當給你看。

講到這裡再補充一下,當你在debugger你的程式的時候,假如你的程式是除錯版,那你一定會發現到那些未被初始化的變數內容都會是一堆0xCC。當時你一定會對這些變數的內容為什麼都是0xCC感到奇怪,現在學到了debugger第一招之後,終於了解到了這些0xCC可不是隨隨便便放進去的,它們是有特殊用意的。

;

不過正常的情況下,我們都不必自己在程式裡面塞個0xCC。而是在debugger IDE裡面透過F9等方法,在執行裡放小紅點。這時候你會覺得奇怪,在開始debugger前我們的程式都已經編譯完成了,那麼用F9放小紅點的時候,這個0xCC是放到那裡去了?是插入放小紅點的位置呢?還是取代原來那個位置的指令,把它給蓋過去了?答案是後者。當然,debugger也不能那麼霸道。在它放入0xCC之前,會先把原來位置的指令儲存起來,以備在適當的時機再復原回來。

各位,現在重點來了。當CPU執行到一個0xCC指令時,會幹什麼事呢?

當CPU執行到一個0xCC指令時,會觸發一個int3中斷,這時CPU停下手邊工作,跳到int3副程式執行,而這個int3副程式是由debugger提供。所以說,剛剛的問題應該換成:當CPU執行到一個0xCC指令時,debugger會幹什麼事呢?

  1. 首先,debugger會把目前CPU所有的狀態儲存下來。這樣子,當我們對debugger說繼續跑的時候,debugger才能把原來的狀態復原,讓原來的工作能無接縫的繼續進行下去。
  2. 如果現在執行到的這個0xCC指令是我們自己插入到程式裡面去的,那麼debugger就不需要作什麼特別的處理。
  3. 如果這個0xCC指令是因為我們在debugger IDE裡透過像是按了F9等方式放進去的話,因為這個動作會取代原來的指令,所以現在要作的事情就是要把原來的指令還原,再執行原來的指令,這樣整個程式的狀態才會正確。執行動作如下:
    • 將原來的指令寫回原來的位置。
    • 將CPU的狀態設定成單步執行,來執行原來的指令。CPU裡面有一個程式指位器,因為剛剛已經執行了0xCC,而本來應該是要執行原本的指令,所以在把原來指令還原後,還要再把程式指位器退回一步,這樣下次執行時才會執行到原來的指令。當CPU是單步狀態時,每執行一個指令就會觸發一次中斷,而像執行到0xCC時每次才會觸發一次int3中斷。而單步時觸發的中斷是int1,這是硬體中斷。
    • 當執行完原來的指令後,再取消CPU單步模式。控制權又回到了debugger。
  4. 現在控制權在debugger手上,它會一直等待我們的命令,這時候我們就可以為所欲為,觀察變數內容,偷改記憶體內容等等,或再叫debugger繼續跑。
  5. 跳出繼續執行程式前,debugger會先把所有在一開始記錄下來的狀態復原,然後再繼續執行原來的程式。對原來的程式而言,它完全不知道被人動過什麼手腳。

一開始的時候講到有四種方法可以放小紅點,那麼第四種方法呢?

上面講的三種方法是軟體中斷,剩下最後一個方法講的是硬體的中斷。有一組暫存器,透過設定你想要CPU停在那裡它就停在那裡。這是專門給debugger使用的,一般在程式裡頭不會去使用。使用硬體小紅點和軟體小紅點的差別是,用硬體小紅點不用像軟體小紅點那麼麻煩,需要在停下來時,再把原來的指令還原再執行然後再有的沒有的,再加上其它有的沒有的特殊技能。所以對於debugger內部來說,都會優先使用硬體小紅點,只不過硬體小紅點數量有限,當硬體小紅點用完了的時候,就要配合軟體小紅點。

對了,忘了說當硬體小紅點觸發時,和CPU單步執行時一樣會發生一個int1中斷,所以也一樣會跳到int1副程式去執行。

;

現在將游標移動到第11行或if (20 == mul2(10))那一行,然後按下F9放一個小紅點。


接著按下F5開始debugger。你會看到執行到第11行的時候,程式就停下來了,在停下來的那行會有一個箭頭。


現在你知道,按了F9下小紅點,然後再按了F5開始debugger,然後程式在你放的小紅點停下來,這之間發生了什麼事情了。

接下來,第二招要上場了。

留言

張貼留言

這個網誌中的熱門文章

以lex/yacc實作算式計算機

前面我們透過 手工的方式 實作了一個簡易的算式計算機,現在我們要開始使用工具來作同樣的事,比較看看手工和使用工具有什麼不同的差別。首先要介紹的就是lex&yacc。 lex & yacc lex(Lexical Analyzar)及yacc(Yet Another Compiler Compiler)是用來輔助程式設計師製作語法剖析器的程式工具。lex的工作就是幫助我們將輸入的資料文字串流分解成一個個有意義的token,而yacc的工作就是幫我們分析這些token和我們定義的規則作匹配。下圖中所表示的是使用lex及yacc的一般工作流程。 首先看到yacc會讀入一個.y檔案,這裡.y檔案的內容就是我們使用類似(E)BNF語法定義的語法規則,yacc會分析這些語法規則後,幫我們產生可以用來解析這些規則的程式碼,而這個檔案一般名稱預設為y.tab.c,產生的程式碼裡面最重要的一個的函式叫作yyparse。 同yacc類似,lex也會讀入一個.l的檔案,這個檔案裡面定義的是如何從文字流裡解出token的規則,使用的方法是常規表示式(regular expression)。在圖的左側中間我們還可以看到有一個叫作y.tab.h的檔案從yacc產生出來並餵給lex作輸入,這個檔案是yacc根據在讀入的.y檔裡面所定義的token代號所產生出來的一個header,這樣yacc及lex產生出來的程式碼裡面就可以使用共通定義的代碼而不必各寫個的。lex分析過.l檔案後也會產生一個一般預設叫作lex.yy.c的原始碼檔案,裡頭最重要的一個函式叫作yylex。 最後,我們把yacc產生出來的y.tab.c還有lex產生出來的lex.yy.c,以及其它我們自己撰寫的原始碼檔案一起拿來編譯再作連結,最後產生出來的就是一個可以用來解析我們定義的語法的解析器工具。以上是整個lex及yacc的使用流程概觀。 常規表示式 在正式使用lex之前,我們首先來對常規表示法作一個基本的認識。常規表示法是一種用來表示字串樣式(pattern)的中繼語言,就好比前文所介紹的(E)BNF表示式一樣,都是用來描述其它語言的語言,只不過用途不太一樣罷了。 常規表示式使用一些中繼符號(meta-symbol)以及ASCII字元定義字串樣式,以下列出一些常規表示式所使用的符號。 . 表示除了換行字元...

單人撲克牌遊戲 - 蒙地卡羅

新增一個簡單的單人撲克牌遊戲: 蒙地卡羅 ,簡單介紹一下玩法。 下載 事先排列好5x5張牌。 每次移動一張可以配對的牌,並消除這對牌。在上下、左右及斜向相隣的二張牌,只要擁有同樣數字(不計花色),即可配對。 消除二張配對的牌後,剩餘的牌以往左往上的方式補滿空隙,接著在發新牌補滿後面的空格。 重覆步驟2~3,直到沒有牌可以配對及發完所有牌為止。 結果有二種。一個是勝利,成功的消除掉所有牌。另一個是Gameover沒有牌可以再作配對。

猜數字遊戲 (電腦猜人)

前幾天午睡時突然被告知要參加公司內部的程式設計比賽,題目是用C寫一支文字模式的4位數字猜數字遊戲,由使用者來猜電腦的數字。在上星期時其實就已經有公佈了,但我沒有注意到所以是臨時加入,還好這是個簡單的題目,不用花多少時間就可以寫出來。 規則: - 這是一對一比賽,雙方各選擇一4位數字,不讓對方知道。 - 4位數字由數字0至9組成,每位數不得重複。 - 雙方輪流猜對方的數字,直到一方猜中為止。 - A方猜B方的數字後,B方根據A方的猜測回答幾A幾B。 - 一個A表示猜中一個數字且位置正確,一個B表示猜中一個數字但位置不正確。 - 當一方猜中4A0B時即表示猜中對方全部4個數字且位置正確,贏得比賽。 - 例:B的謎底是4208,底下箭頭左測是A的猜測,箭頭右測是B的回答。    1234 ==> 1A1B    5678 ==> 1A0B    2406 ==> 1A2B    ...    4208 ==> 4A0B ; 寫個程式讓玩家來猜電腦的數字不難,不過我從來沒有寫過讓電腦來猜玩家數字的版本,所以花了點時間想想怎麼寫。 研究後歸納出二個點。 1, 使用窮舉法將所有可能數字組合列出。 2, 每次猜測後根據結果排除不可能是答案的組合,重複這個動作直到猜中答案為止。 第1點只是實作問題,第2點概念也很簡單,但要過濾不是答案的組合根據的是什麼?乍看之下沒什麼頭緒,不過想通之後就非常簡單了。 它的基本原理如下:假如謎底是4561,如果猜1524則會得到1A2B。從相反的角度來看,如果謎底是1524,則猜4561時也會得到1A2B的回答。 利用這個方法,每一次猜測一個數字X後,再以這個數字當作答案,來和所有剩下來的候選答案作比對,如果得到的結果(幾A幾B)和數字X是一樣的話,就把這個數字保留下來繼續作為候選答案,否則就過把這個數字過濾掉。下一把,繼續從候選答案裡選一個出來猜,重複上面的動作,直到猜中為止。 ; C++ STL的algorithm裡有個叫作next_permutation的函數,可以用來生成排列。 #include <iostream> #include <algorithm> using namespace std; int main () {   int myints[] = {1,2,3};  ...