跳到主要內容

How to debugger? (1)

許多人都說:不懂debugger的人,不會寫程式。身為一個會寫程式的程序員,我也是十分同意這句話的。想當初我也是渾渾噩噩的寫了一陣子程式之後,才知道什麼是debugger,之後果然就好像打通任督二脈一樣,突飛猛進。所以說,要會寫程式,一定要會debugger。礙於有許多新手程序員還是不懂什麼叫作debugger,所以就寫了這篇文,對debugger作一個基本的介紹,希望能對大家有所幫忙,可以像我一樣勇猛精進。

首先,由寫一個小小的測試程式開始,慢慢的再進入主題。

#include <iostream>
using namespace std;

int mul2(int a)
{
  return 3 * a;
}

int main(void)
{
  if (20 == mul2(10))
    cout << "debugger讚!\n";
  else
    cout << "奇怪ㄋㄟ\n";

  return 0;
}
下面是程式執行的結果。


真是奇怪ㄋㄟ,應該是要顯示"debugger讚!"才對吧!?這個時候只好來debugger一下下了,看看問題出在那裡。

第一招,小紅點

下小紅點,也就是所謂的下斷點,也有人說中斷,或說breakpoint。在程式裡面放個小紅點,當程式跑到有小紅點的地方的時候就會停下來,這時候我們就抓到機會,可以去檢查看看各個可疑的地方,也可以偷偷竄改一些資料,無所不用其極的就是要把程式裡面的虫抓出來搞定它。

下小紅點的方法有很多種,這裡我可以告訴你四種方法。

  1. __debugbreak();
  2. __asm int 3
  3. __asm _emit 0xCC

以上的方法都是手動在程式裡面放入小紅點,也就是在程式裡面塞進一個0xCC。那到底0xCC是什麼東西。去查一下x86指令集,原來0xCC就是int3。你又要問:什麼是int3?答案是:int3是個中斷,由x86硬體支援,軟體觸發。

當CPU執行指令的時候,如果執行到的指令是0xCC,也就是int3的時候,它會發出一個中斷,也就是interrupt。中斷發生的時候,CPU會暫時停止目前手上的工作,然後跳到事先準備好的中斷處理常式去執行,就跟執行副程式沒什麼二樣。發生int3中斷時,就執行int3handler副程式,發生int21時,就執行int21handler副程式。這些中斷副程式,大多是由BIOS或作業系統提供,要不然就是應用程式提供。像這裡的int3副程式就是由debugger提供,專門用來處理debugger相關程序。

如果你的程式是由一個debugger啟動的,那麼debugger會在你的程式開始執行之前,就已經事先安裝好debugger專用的int3副程式,這樣一來當CPU執行到int3的時候才能作適當的處理。另一方面,如果你的程式不是透過debugger啟動的,也就是說在你的程式啟動前,並沒有什麼人安裝了一個int3副程式,那麼當你的程式一執行到一個0xCC指令時,它就會當場當給你看。

講到這裡再補充一下,當你在debugger你的程式的時候,假如你的程式是除錯版,那你一定會發現到那些未被初始化的變數內容都會是一堆0xCC。當時你一定會對這些變數的內容為什麼都是0xCC感到奇怪,現在學到了debugger第一招之後,終於了解到了這些0xCC可不是隨隨便便放進去的,它們是有特殊用意的。

;

不過正常的情況下,我們都不必自己在程式裡面塞個0xCC。而是在debugger IDE裡面透過F9等方法,在執行裡放小紅點。這時候你會覺得奇怪,在開始debugger前我們的程式都已經編譯完成了,那麼用F9放小紅點的時候,這個0xCC是放到那裡去了?是插入放小紅點的位置呢?還是取代原來那個位置的指令,把它給蓋過去了?答案是後者。當然,debugger也不能那麼霸道。在它放入0xCC之前,會先把原來位置的指令儲存起來,以備在適當的時機再復原回來。

各位,現在重點來了。當CPU執行到一個0xCC指令時,會幹什麼事呢?

當CPU執行到一個0xCC指令時,會觸發一個int3中斷,這時CPU停下手邊工作,跳到int3副程式執行,而這個int3副程式是由debugger提供。所以說,剛剛的問題應該換成:當CPU執行到一個0xCC指令時,debugger會幹什麼事呢?

  1. 首先,debugger會把目前CPU所有的狀態儲存下來。這樣子,當我們對debugger說繼續跑的時候,debugger才能把原來的狀態復原,讓原來的工作能無接縫的繼續進行下去。
  2. 如果現在執行到的這個0xCC指令是我們自己插入到程式裡面去的,那麼debugger就不需要作什麼特別的處理。
  3. 如果這個0xCC指令是因為我們在debugger IDE裡透過像是按了F9等方式放進去的話,因為這個動作會取代原來的指令,所以現在要作的事情就是要把原來的指令還原,再執行原來的指令,這樣整個程式的狀態才會正確。執行動作如下:
    • 將原來的指令寫回原來的位置。
    • 將CPU的狀態設定成單步執行,來執行原來的指令。CPU裡面有一個程式指位器,因為剛剛已經執行了0xCC,而本來應該是要執行原本的指令,所以在把原來指令還原後,還要再把程式指位器退回一步,這樣下次執行時才會執行到原來的指令。當CPU是單步狀態時,每執行一個指令就會觸發一次中斷,而像執行到0xCC時每次才會觸發一次int3中斷。而單步時觸發的中斷是int1,這是硬體中斷。
    • 當執行完原來的指令後,再取消CPU單步模式。控制權又回到了debugger。
  4. 現在控制權在debugger手上,它會一直等待我們的命令,這時候我們就可以為所欲為,觀察變數內容,偷改記憶體內容等等,或再叫debugger繼續跑。
  5. 跳出繼續執行程式前,debugger會先把所有在一開始記錄下來的狀態復原,然後再繼續執行原來的程式。對原來的程式而言,它完全不知道被人動過什麼手腳。

一開始的時候講到有四種方法可以放小紅點,那麼第四種方法呢?

上面講的三種方法是軟體中斷,剩下最後一個方法講的是硬體的中斷。有一組暫存器,透過設定你想要CPU停在那裡它就停在那裡。這是專門給debugger使用的,一般在程式裡頭不會去使用。使用硬體小紅點和軟體小紅點的差別是,用硬體小紅點不用像軟體小紅點那麼麻煩,需要在停下來時,再把原來的指令還原再執行然後再有的沒有的,再加上其它有的沒有的特殊技能。所以對於debugger內部來說,都會優先使用硬體小紅點,只不過硬體小紅點數量有限,當硬體小紅點用完了的時候,就要配合軟體小紅點。

對了,忘了說當硬體小紅點觸發時,和CPU單步執行時一樣會發生一個int1中斷,所以也一樣會跳到int1副程式去執行。

;

現在將游標移動到第11行或if (20 == mul2(10))那一行,然後按下F9放一個小紅點。


接著按下F5開始debugger。你會看到執行到第11行的時候,程式就停下來了,在停下來的那行會有一個箭頭。


現在你知道,按了F9下小紅點,然後再按了F5開始debugger,然後程式在你放的小紅點停下來,這之間發生了什麼事情了。

接下來,第二招要上場了。

留言

張貼留言

這個網誌中的熱門文章

猜數字遊戲 (電腦猜人)

前幾天午睡時突然被告知要參加公司內部的程式設計比賽,題目是用C寫一支文字模式的4位數字猜數字遊戲,由使用者來猜電腦的數字。在上星期時其實就已經有公佈了,但我沒有注意到所以是臨時加入,還好這是個簡單的題目,不用花多少時間就可以寫出來。 規則: - 這是一對一比賽,雙方各選擇一4位數字,不讓對方知道。 - 4位數字由數字0至9組成,每位數不得重複。 - 雙方輪流猜對方的數字,直到一方猜中為止。 - A方猜B方的數字後,B方根據A方的猜測回答幾A幾B。 - 一個A表示猜中一個數字且位置正確,一個B表示猜中一個數字但位置不正確。 - 當一方猜中4A0B時即表示猜中對方全部4個數字且位置正確,贏得比賽。 - 例:B的謎底是4208,底下箭頭左測是A的猜測,箭頭右測是B的回答。    1234 ==> 1A1B    5678 ==> 1A0B    2406 ==> 1A2B    ...    4208 ==> 4A0B ; 寫個程式讓玩家來猜電腦的數字不難,不過我從來沒有寫過讓電腦來猜玩家數字的版本,所以花了點時間想想怎麼寫。 研究後歸納出二個點。 1, 使用窮舉法將所有可能數字組合列出。 2, 每次猜測後根據結果排除不可能是答案的組合,重複這個動作直到猜中答案為止。 第1點只是實作問題,第2點概念也很簡單,但要過濾不是答案的組合根據的是什麼?乍看之下沒什麼頭緒,不過想通之後就非常簡單了。 它的基本原理如下:假如謎底是4561,如果猜1524則會得到1A2B。從相反的角度來看,如果謎底是1524,則猜4561時也會得到1A2B的回答。 利用這個方法,每一次猜測一個數字X後,再以這個數字當作答案,來和所有剩下來的候選答案作比對,如果得到的結果(幾A幾B)和數字X是一樣的話,就把這個數字保留下來繼續作為候選答案,否則就過把這個數字過濾掉。下一把,繼續從候選答案裡選一個出來猜,重複上面的動作,直到猜中為止。 ; C++ STL的algorithm裡有個叫作next_permutation的函數,可以用來生成排列。 #include <iostream> #include <algorithm> using namespace std; int main () {   int myints[] = {1,2,3};  ...

KillSudoku 4顆星精彩數獨詳解 - 鍊技巧

這題數獨(sudoku)題目估計為4+顆星,有點難度。解題需要應用多種技巧,過程非常精彩有趣,是個好題。 底下使用 KillSudoku 作詳細圖解。 1,使用基本排除法則,可以簡單填入6個數字。到此為止,開始使用 候選數法 來解題。如下所示,為填入6個數字後的狀態圖。 2,如下圖,使用進階排除法,在第9列和第4行可以先排除幾個候選數。 3,如圖,在第2行有一個 Naked Subset (3,4),可以對3,4候選數作排除。附帶提一下,反過來看在同一行裡面也可以說有另一個Hidden Subset(2,5,8)存在。Naked Subset和Hidden Subset常是一體二面同時存在,只不過對我們來說,Naked Subset是相對比較容易看的出來。 排除第2行的3,4後,又可以對第2列以外的3作排除,如下圖。 4,接著,在第5行又發現了一個 Naked Subset (3,7,8)。 對第5行三個Subset以外的候選數3,7,8作排除後,又接著產生可以對第5行以外的3作排除。 5,這一題解到此為止,開始進入高潮。大部份能解到3顆星題目的人,猜想應該就此卡住。以下開始需要應用更高級的鍊技巧,才能夠繼續進行。 應用X-Chains鍊技巧,可以找到一條由4條強連結組成的鍊,可以排除候選數2。這裡的鍊指的是由2條以上的強連結組成,而所謂的強連結是指在同一行、或同一列或同一個Box裡,由唯二的候選數構成的連結。如上圖中的第9行中,只有二個2,這二個2構成一條強連結。為什麼說這是一條強連結?因為在這條連結的AB二個端點中,肯定會有一個2存在,要麼是A點要麼是B點。鍊技巧就是將多條強連結串連起來作候選數排除的技巧,而X-Chains是高級的鍊技巧裡面的基本技巧。 接上圖,這樣一來就又可以應用基本排除方法,填入3個數字,如下圖所示。 6,接下來就是本題最精彩的部份,以下需要連續找到3條鍊,才能繼續往下解。 7,找出3條鍊後,剩下來的部份就沒什麼特別的了,只需要應用基本法就能把所有剩餘數字填完。

KillSudoku 4顆星精彩數獨 (三) - XY-Chains

這是數獨解題技巧裡面的高級技巧,比X-Chains還再高一點點。會這個技巧的話,就可以解4或5顆星的題目了。 這個用來測試的題目,用 KillSudoku 來解可以解出,中間使用了2次Naked Subset,1次 W-Wings ,1次 X-Chains ,2次 XY-Chains 。所以算起來,這一題應該是有5顆星的題目。 附帶一提,目前找鍊的演算法並沒有去找一條最短的鍊,所以可以看到用 KillSudoku 解的時候,第36的步驟找到一條超長的鍊,這條鍊足足由13條連線構成,要是沒練過的話,絕對頭昏眼花,找不出這樣的鍊來的。 實際上在這個步驟裡,是可以找到另一條更短的鍊。不過目前以先能work,之後有空會再改進演算法的部份。