跳到主要內容

How to debugger? (1)

許多人都說:不懂debugger的人,不會寫程式。身為一個會寫程式的程序員,我也是十分同意這句話的。想當初我也是渾渾噩噩的寫了一陣子程式之後,才知道什麼是debugger,之後果然就好像打通任督二脈一樣,突飛猛進。所以說,要會寫程式,一定要會debugger。礙於有許多新手程序員還是不懂什麼叫作debugger,所以就寫了這篇文,對debugger作一個基本的介紹,希望能對大家有所幫忙,可以像我一樣勇猛精進。

首先,由寫一個小小的測試程式開始,慢慢的再進入主題。

#include <iostream>
using namespace std;

int mul2(int a)
{
  return 3 * a;
}

int main(void)
{
  if (20 == mul2(10))
    cout << "debugger讚!\n";
  else
    cout << "奇怪ㄋㄟ\n";

  return 0;
}
下面是程式執行的結果。


真是奇怪ㄋㄟ,應該是要顯示"debugger讚!"才對吧!?這個時候只好來debugger一下下了,看看問題出在那裡。

第一招,小紅點

下小紅點,也就是所謂的下斷點,也有人說中斷,或說breakpoint。在程式裡面放個小紅點,當程式跑到有小紅點的地方的時候就會停下來,這時候我們就抓到機會,可以去檢查看看各個可疑的地方,也可以偷偷竄改一些資料,無所不用其極的就是要把程式裡面的虫抓出來搞定它。

下小紅點的方法有很多種,這裡我可以告訴你四種方法。

  1. __debugbreak();
  2. __asm int 3
  3. __asm _emit 0xCC

以上的方法都是手動在程式裡面放入小紅點,也就是在程式裡面塞進一個0xCC。那到底0xCC是什麼東西。去查一下x86指令集,原來0xCC就是int3。你又要問:什麼是int3?答案是:int3是個中斷,由x86硬體支援,軟體觸發。

當CPU執行指令的時候,如果執行到的指令是0xCC,也就是int3的時候,它會發出一個中斷,也就是interrupt。中斷發生的時候,CPU會暫時停止目前手上的工作,然後跳到事先準備好的中斷處理常式去執行,就跟執行副程式沒什麼二樣。發生int3中斷時,就執行int3handler副程式,發生int21時,就執行int21handler副程式。這些中斷副程式,大多是由BIOS或作業系統提供,要不然就是應用程式提供。像這裡的int3副程式就是由debugger提供,專門用來處理debugger相關程序。

如果你的程式是由一個debugger啟動的,那麼debugger會在你的程式開始執行之前,就已經事先安裝好debugger專用的int3副程式,這樣一來當CPU執行到int3的時候才能作適當的處理。另一方面,如果你的程式不是透過debugger啟動的,也就是說在你的程式啟動前,並沒有什麼人安裝了一個int3副程式,那麼當你的程式一執行到一個0xCC指令時,它就會當場當給你看。

講到這裡再補充一下,當你在debugger你的程式的時候,假如你的程式是除錯版,那你一定會發現到那些未被初始化的變數內容都會是一堆0xCC。當時你一定會對這些變數的內容為什麼都是0xCC感到奇怪,現在學到了debugger第一招之後,終於了解到了這些0xCC可不是隨隨便便放進去的,它們是有特殊用意的。

;

不過正常的情況下,我們都不必自己在程式裡面塞個0xCC。而是在debugger IDE裡面透過F9等方法,在執行裡放小紅點。這時候你會覺得奇怪,在開始debugger前我們的程式都已經編譯完成了,那麼用F9放小紅點的時候,這個0xCC是放到那裡去了?是插入放小紅點的位置呢?還是取代原來那個位置的指令,把它給蓋過去了?答案是後者。當然,debugger也不能那麼霸道。在它放入0xCC之前,會先把原來位置的指令儲存起來,以備在適當的時機再復原回來。

各位,現在重點來了。當CPU執行到一個0xCC指令時,會幹什麼事呢?

當CPU執行到一個0xCC指令時,會觸發一個int3中斷,這時CPU停下手邊工作,跳到int3副程式執行,而這個int3副程式是由debugger提供。所以說,剛剛的問題應該換成:當CPU執行到一個0xCC指令時,debugger會幹什麼事呢?

  1. 首先,debugger會把目前CPU所有的狀態儲存下來。這樣子,當我們對debugger說繼續跑的時候,debugger才能把原來的狀態復原,讓原來的工作能無接縫的繼續進行下去。
  2. 如果現在執行到的這個0xCC指令是我們自己插入到程式裡面去的,那麼debugger就不需要作什麼特別的處理。
  3. 如果這個0xCC指令是因為我們在debugger IDE裡透過像是按了F9等方式放進去的話,因為這個動作會取代原來的指令,所以現在要作的事情就是要把原來的指令還原,再執行原來的指令,這樣整個程式的狀態才會正確。執行動作如下:
    • 將原來的指令寫回原來的位置。
    • 將CPU的狀態設定成單步執行,來執行原來的指令。CPU裡面有一個程式指位器,因為剛剛已經執行了0xCC,而本來應該是要執行原本的指令,所以在把原來指令還原後,還要再把程式指位器退回一步,這樣下次執行時才會執行到原來的指令。當CPU是單步狀態時,每執行一個指令就會觸發一次中斷,而像執行到0xCC時每次才會觸發一次int3中斷。而單步時觸發的中斷是int1,這是硬體中斷。
    • 當執行完原來的指令後,再取消CPU單步模式。控制權又回到了debugger。
  4. 現在控制權在debugger手上,它會一直等待我們的命令,這時候我們就可以為所欲為,觀察變數內容,偷改記憶體內容等等,或再叫debugger繼續跑。
  5. 跳出繼續執行程式前,debugger會先把所有在一開始記錄下來的狀態復原,然後再繼續執行原來的程式。對原來的程式而言,它完全不知道被人動過什麼手腳。

一開始的時候講到有四種方法可以放小紅點,那麼第四種方法呢?

上面講的三種方法是軟體中斷,剩下最後一個方法講的是硬體的中斷。有一組暫存器,透過設定你想要CPU停在那裡它就停在那裡。這是專門給debugger使用的,一般在程式裡頭不會去使用。使用硬體小紅點和軟體小紅點的差別是,用硬體小紅點不用像軟體小紅點那麼麻煩,需要在停下來時,再把原來的指令還原再執行然後再有的沒有的,再加上其它有的沒有的特殊技能。所以對於debugger內部來說,都會優先使用硬體小紅點,只不過硬體小紅點數量有限,當硬體小紅點用完了的時候,就要配合軟體小紅點。

對了,忘了說當硬體小紅點觸發時,和CPU單步執行時一樣會發生一個int1中斷,所以也一樣會跳到int1副程式去執行。

;

現在將游標移動到第11行或if (20 == mul2(10))那一行,然後按下F9放一個小紅點。


接著按下F5開始debugger。你會看到執行到第11行的時候,程式就停下來了,在停下來的那行會有一個箭頭。


現在你知道,按了F9下小紅點,然後再按了F5開始debugger,然後程式在你放的小紅點停下來,這之間發生了什麼事情了。

接下來,第二招要上場了。

留言

張貼留言

這個網誌中的熱門文章

單人撲克牌遊戲 - 蒙地卡羅

更多可在網頁玩的 單人撲克牌遊戲 ; 新增一個簡單的單人撲克牌遊戲: 蒙地卡羅 ,簡單介紹一下玩法。 下載 事先排列好5x5張牌。 每次移動一張可以配對的牌,並消除這對牌。在上下、左右及斜向相隣的二張牌,只要擁有同樣數字(不計花色),即可配對。 消除二張配對的牌後,剩餘的牌以往左往上的方式補滿空隙,接著在發新牌補滿後面的空格。 重覆步驟2~3,直到沒有牌可以配對及發完所有牌為止。 結果有二種。一個是勝利,成功的消除掉所有牌。另一個是Gameover沒有牌可以再作配對。

以lex/yacc實作算式計算機

前面我們透過 手工的方式 實作了一個簡易的算式計算機,現在我們要開始使用工具來作同樣的事,比較看看手工和使用工具有什麼不同的差別。首先要介紹的就是lex&yacc。 lex & yacc lex(Lexical Analyzar)及yacc(Yet Another Compiler Compiler)是用來輔助程式設計師製作語法剖析器的程式工具。lex的工作就是幫助我們將輸入的資料文字串流分解成一個個有意義的token,而yacc的工作就是幫我們分析這些token和我們定義的規則作匹配。下圖中所表示的是使用lex及yacc的一般工作流程。 首先看到yacc會讀入一個.y檔案,這裡.y檔案的內容就是我們使用類似(E)BNF語法定義的語法規則,yacc會分析這些語法規則後,幫我們產生可以用來解析這些規則的程式碼,而這個檔案一般名稱預設為y.tab.c,產生的程式碼裡面最重要的一個的函式叫作yyparse。 同yacc類似,lex也會讀入一個.l的檔案,這個檔案裡面定義的是如何從文字流裡解出token的規則,使用的方法是常規表示式(regular expression)。在圖的左側中間我們還可以看到有一個叫作y.tab.h的檔案從yacc產生出來並餵給lex作輸入,這個檔案是yacc根據在讀入的.y檔裡面所定義的token代號所產生出來的一個header,這樣yacc及lex產生出來的程式碼裡面就可以使用共通定義的代碼而不必各寫個的。lex分析過.l檔案後也會產生一個一般預設叫作lex.yy.c的原始碼檔案,裡頭最重要的一個函式叫作yylex。 最後,我們把yacc產生出來的y.tab.c還有lex產生出來的lex.yy.c,以及其它我們自己撰寫的原始碼檔案一起拿來編譯再作連結,最後產生出來的就是一個可以用來解析我們定義的語法的解析器工具。以上是整個lex及yacc的使用流程概觀。 常規表示式 在正式使用lex之前,我們首先來對常規表示法作一個基本的認識。常規表示法是一種用來表示字串樣式(pattern)的中繼語言,就好比前文所介紹的(E)BNF表示式一樣,都是用來描述其它語言的語言,只不過用途不太一樣罷了。 常規表示式使用一些中繼符號(meta-symbol)以及ASCII字元定義字串樣式,以下列出一些常規表示式所使用的符號。 . 表示除了換行字元...

窮人的 AI:自動漫畫分鏡切割

  ( 試試看 ) 在手機上看漫畫時,有一個體驗上的問題: 漫畫原本是「整頁設計」 手機最適合的是「一格一格往下滑」 與其強迫使用者縮放、拖曳、放大,更直覺的做法是: 直接把一頁漫畫自動切成多個分鏡,轉成瀑布流閱讀。 這篇文章分享一個不靠深度學習、完全在前端完成的實作方式: 使用 OpenCV.js 做分鏡偵測 輸出 rect list 再用 全畫面 Canvas 把每個分鏡當成一個「閱讀單位」 整個系統可以拆成三層: 漫畫圖片 ↓ 影像處理(找出 rects) ↓ 排序後的 rect list ↓ 全畫面 Canvas 逐格呈現(瀑布流) Step 1:灰階化 漫畫的資訊 90% 都在線條上,顏色反而是干擾。 cv.cvtColor(src, grayImage, cv.COLOR_RGBA2GRAY); 灰階化的好處: 降低維度 對邊緣偵測更穩定 對黑白漫畫特別有效 Step 2:邊緣偵測,抓出「分鏡的邊」 接下來用最經典、也最夠用的 Canny Edge Detection: cv.Canny(grayImage, edges, 50, 150); 在漫畫中,分鏡外框通常就是最明顯的邊界。 Step 3:形態學操作,把破碎邊框「補起來」 真實漫畫的線條並不完美,常常有斷線、陰影、留白。 所以要做一個很重要的步驟:膨脹(Dilation) const kernel = cv.Mat.ones( 5 , 5 , cv.CV_8U); cv.dilate(edges, dilatedEdges, kernel); 直覺理解就是: 把細線「抹粗一點」, 讓本來斷掉的邊界連成封閉區域。 這一步直接決定後面能不能成功抓到「一整格分鏡」。 Step 4:找輪廓,轉成矩形框(rect) 有了封閉區域之後,就可以找輪廓: cv.findContours( dilatedEdges, contours, hierarchy, cv.RETR_EXTERNAL, cv.CHAIN_APPROX_SIMPLE ); 每一個 contour,代表一個「可能的分鏡區塊」。 接著轉成矩形: const rect = cv.boundingRect(contour); rects.push([rect.x, rect.y, rect.widt...