對于不折不扣的匯編新手來說,第一部分中出現(xiàn)的很多概念可能不是很明白,于是我決定寫更多有價值的文章。所以,讓我們開始《我的匯編學習之路》的第二部分的學習。
術語和概念
當我寫了第一篇之后,我從不同的讀者那獲得很多反饋,第一篇中有些部分不明白,這就是本文以及接下來幾篇從一些術語的描述開始的原因。
寄存器(Register):寄存器是處理器內小容量的存儲結構,處理器的主要功能是數(shù)據(jù)處理,處理器可以從內存中獲得數(shù)據(jù),但這是一種低速的操作,這就是為什么處理器為什么要有自己數(shù)據(jù)存儲結構,稱為“寄存器”。
L小端(Little-endian):我們可以假設內存是一個大的數(shù)組,它包含一個字節(jié)一個字節(jié)的數(shù)。每個地址存儲了內存“數(shù)組”中的一個元素,每個元素一個字節(jié)。舉例來說,我們有 4 字節(jié)數(shù):AA 56 AB FF,在小端模式下最低位存放在低地址上:
0 FF
1 AB
2 56
3 AA
這里,0、1、2、3 是內存地址。
大端(Big-endian):大端存儲數(shù)據(jù)與小端相反。所有上面的字節(jié)序在大端模式下是:
0 AA
1 56
2 AB
3 FF
系統(tǒng)調用(Syscall):系統(tǒng)調用是用戶程序要求操作系統(tǒng)為其完成某些工作的一種方式。你可以在這里找到系統(tǒng)調用表。
棧(Stack):處理器中寄存器的個數(shù)非常有限。所以棧是一塊連續(xù)的內存空間,可以通過特殊寄存器如 RSP、SS、RIP 等來尋址。在接下來的文章我會專門深入介紹棧。
段(Section): 每個匯編程序都是由段來組成的,有以下的段:
data —— 用來聲明初始化的數(shù)據(jù)或常量
bss —— 用來聲明未初始化的變量
text —— 用來存放代碼
通用寄存器(General-purpose register): 有 16 個通用寄存器:rax、rbx、rcx、rdx、rbp、rsp、rsi、rdi、r8、r9、r10、r11、r12、r13、r14、r15。
當然這不是與匯編語言有關的全部的術語和概念,如果在接下來的文章中遇到奇怪的不熟悉的詞匯,我們再來解釋這些詞的意思。
數(shù)據(jù)類型
基本的數(shù)據(jù)類型有:字節(jié)(bytes)、字(words)、雙字(doublewords)、四字(duadwords)以及雙四字(double dualwords),它們的長度分別為:8位、2個字節(jié)、4個字節(jié)、8個字節(jié)、16個字節(jié)(128位)。
現(xiàn)在我們只使用整數(shù),所以只看看它的表示。整型有兩種類型:無符號和有符號。無符號整型是一個字節(jié)、字、雙字、四字表示的無符號二進制數(shù),它們能表示的范圍分別為:0~255、0~65,535、0~2^32-1、0~2^64-1。有符號整型是一個字節(jié)、字、雙字、四字表示的有符號的二進制數(shù)。符號位在負數(shù)的時候是置位的,在正數(shù)和0的時候是清零的。整數(shù)能表示的范圍是:1個字節(jié) -128~127,1個字 -32,768~32,767,1個雙字 -2^31~2^31-1,1個四字 -2^63~2^63-1。
段
正如我上面提到的,每個匯編程序都是由段來組成的,它包含數(shù)據(jù)段、代碼段、bss 段。我們先來看看數(shù)據(jù)段,這是主要用來定義初始化的常量。例如:
section .data
num1: equ 100
num2: equ 50
msg: db "Sum is correct", 10
好了,這兒差不多清楚了,三個常量名字分別為 num1、num2 和 msg,值分別是 100、50 和 “Sum is correct”,10 。但是 db 、equ 又是什么呢?實際上,NASM 支持大量偽指令:
DB、DW、DD、DQ、DT、DO、DY 和 DZ —— 用來定義初始化數(shù)據(jù)的。例如:
;; Initialize 4 bytes 1h, 2h, 3h, 4h
db 0x01,0x02,0x03,0x04
;; Initialize word to 0x12 0x34
dw 0x1234
RESB、RESW、RESD、RESQ、REST、RESO、RESY、RESZ —— 用來定義非初始化變量
INCBIN —— 包含外部二進制文件
EQU —— 定義常量,例如:
;; now one is 1
one equ 1
TIMES —— 重復指令或數(shù)據(jù)(下一篇文章中描述)
算術操作
下面是算術操作指令的簡單列表:
ADD —— 整數(shù)加
SUB —— 減
MUL —— 無符號乘
IMUL —— 有符號乘
DIV —— 無符號除
IDIV —— 有符號除
INC —— 自增
DEC —— 自減
NEG —— 取反
本文會用到一些,其它的在接下來的文章有所覆蓋。
控制流
通常編程語言使用 if、case、goto 等等來改變程序的運行順序,當然匯編也可以。這里我們提及到一些。有一個專門用來比較兩個數(shù)大小的 cmp 指令,它被用來接著條件判斷指令來決定是否跳轉。例如:
;; compare rax with 50
cmp rax, 50
cmp 指令僅僅比較兩個數(shù),但是對它們的值沒有影響,也不會根據(jù)比較的結果執(zhí)行任何東西。為了在比較之后執(zhí)行操作,有條件跳轉指令,可以是下面的一個:
JE —— 如果相等
JZ —— 如果為零
JNE —— 如果不相等
JNZ —— 如果不為零
JG —— 如果第一個操作數(shù)比第二個大
JGE —— 如果第一個操作數(shù)比第二個大或者相等
JA —— 與 JG 指令相同,只不過比較的是無符號數(shù)
JAE —— 與 JGE 指令相同,只不過比較的是無符號數(shù)
例如如果我們想寫 C 語言中類似于 if/else 的語句:
if (rax != 50) {
exit();
} else {
right();
}
在匯編中是這樣的:
;; compare rax with 50
cmp rax, 50
;; perform .exit if rax is not equal 50
jne .exit
jmp .right
也有一種無條件跳轉的指令語法:
JMP LABEL
例如:
_start:
;; ....
;; do something and jump to .exit label
;; ....
jmp .exit
.exit:
mov rax, 60
mov rdi, 0
syscall
這里 _start 標簽后有一些代碼,這些代碼會被執(zhí)行到,匯編最后控制轉向到 .exit 標簽處,該標簽后的代碼開始執(zhí)行。
通常無條件跳轉用在循環(huán)中,例如我們有 label 標簽,它后面有一些代碼,代碼執(zhí)行完之后進行條件判斷,如果條件不成立將跳到該段代碼的起始處。循環(huán)將在后面文章中介紹。
示例
我們看個簡單的例子:兩個數(shù)相加,得到它們的和,然后與預定義的一個數(shù)進行比較,如果相等輸出一些東西到屏幕上;如果不等退出。下面是例子的源代碼:
;initialised data section
section .data
; Define constants
num1: equ 100
num2: equ 50
; initialize message
msg: db "Sum is correctn"
section .text
global _start
;; entry point
_start:
; set num1's value to rax
mov rax, num1
; set num2's value to rbx
mov rbx, num2
; get sum of rax and rbx, and store it's value in rax
add rax, rbx
; compare rax and 150
cmp rax, 150
; go to .exit label if rax and 150 are not equal
jne .exit
; go to .rightSum label if rax and 150 are equal
jmp .rightSum
; Print message that sum is correct
.rightSum:
;; write syscall
mov rax, 1
;; file descritor, standard output
mov rdi, 1
;; message address
mov rsi, msg
;; length of message
mov rdx, 15
;; call write syscall
syscall
; exit from program
jmp .exit
; exit procedure
.exit:
; exit syscall
mov rax, 60
; exit code
mov rdi, 0
; call exit syscall
syscall
我們過一下這段代碼。首先在數(shù)據(jù)段定義了三個數(shù):num1、num2 和值為 “Sum is correctn” 的 msg?,F(xiàn)在看到第 14 行,這是程序的入口的地方。我們將 num1 和 num2 的值放到通用寄存器 rax 和 rbx 中,使用 add 指令相加,在 add 指令執(zhí)行完之后,rax 和 rbx 相加之和保存到 rax 中,即現(xiàn)在 num1 和 num2 的和存放在 rax 寄存器中。
好了,我們讓 num1 是 100,num2 是 50,之和是 150,用 cmp 指令比較。在比較完 rax 和 150 之后,檢查比較的結果,如果 rax 和 150 不等,我們跳轉到 .exit 處,如果相等,跳到 .rightSum 標簽處。
接著有兩個標簽:.exit 和 .rightSum。首先將 rax 設置為 60,這是 exit 系統(tǒng)調用號,以及將 rdi 設為 0,這是退出碼。然后,.rightSUm 相當簡單,只是打印出 Sum is corretn,如果你不能理解怎么工作的,看看第一篇文章。
總結
這是 《我的匯編學習之路》 系列文章的第二篇,如果你有任何問題或建議,給我留言。
更多信息請查看IT技術專欄
2025國考·省考課程試聽報名