我的匯編學習之路(2):主要術語和概念
來源:易賢網 閱讀:1566 次 日期:2015-04-02 14:05:30
溫馨提示:易賢網小編為您整理了“我的匯編學習之路(2):主要術語和概念”,方便廣大網友查閱!

對于不折不扣的匯編新手來說,第一部分中出現(xiàn)的很多概念可能不是很明白,于是我決定寫更多有價值的文章。所以,讓我們開始《我的匯編學習之路》的第二部分的學習。

術語和概念

當我寫了第一篇之后,我從不同的讀者那獲得很多反饋,第一篇中有些部分不明白,這就是本文以及接下來幾篇從一些術語的描述開始的原因。

寄存器(Register):寄存器是處理器內小容量的存儲結構,處理器的主要功能是數(shù)據(jù)處理,處理器可以從內存中獲得數(shù)據(jù),但這是一種低速的操作,這就是為什么處理器為什么要有自己數(shù)據(jù)存儲結構,稱為“寄存器”。

L小端(Little-endian):我們可以假設內存是一個大的數(shù)組,它包含一個字節(jié)一個字節(jié)的數(shù)。每個地址存儲了內存“數(shù)組”中的一個元素,每個元素一個字節(jié)。舉例來說,我們有 4 字節(jié)數(shù):AA 56 AB FF,在小端模式下最低位存放在低地址上:

0 FF

1 AB

2 56

3 AA

這里,0、1、2、3 是內存地址。

大端(Big-endian):大端存儲數(shù)據(jù)與小端相反。所有上面的字節(jié)序在大端模式下是:

0 AA

1 56

2 AB

3 FF

系統(tǒng)調用(Syscall):系統(tǒng)調用是用戶程序要求操作系統(tǒng)為其完成某些工作的一種方式。你可以在這里找到系統(tǒng)調用表。

棧(Stack):處理器中寄存器的個數(shù)非常有限。所以棧是一塊連續(xù)的內存空間,可以通過特殊寄存器如 RSP、SS、RIP 等來尋址。在接下來的文章我會專門深入介紹棧。

段(Section): 每個匯編程序都是由段來組成的,有以下的段:

data —— 用來聲明初始化的數(shù)據(jù)或常量

bss —— 用來聲明未初始化的變量

text —— 用來存放代碼

通用寄存器(General-purpose register): 有 16 個通用寄存器:rax、rbx、rcx、rdx、rbp、rsp、rsi、rdi、r8、r9、r10、r11、r12、r13、r14、r15。

當然這不是與匯編語言有關的全部的術語和概念,如果在接下來的文章中遇到奇怪的不熟悉的詞匯,我們再來解釋這些詞的意思。

數(shù)據(jù)類型

基本的數(shù)據(jù)類型有:字節(jié)(bytes)、字(words)、雙字(doublewords)、四字(duadwords)以及雙四字(double dualwords),它們的長度分別為:8位、2個字節(jié)、4個字節(jié)、8個字節(jié)、16個字節(jié)(128位)。

現(xiàn)在我們只使用整數(shù),所以只看看它的表示。整型有兩種類型:無符號和有符號。無符號整型是一個字節(jié)、字、雙字、四字表示的無符號二進制數(shù),它們能表示的范圍分別為:0~255、0~65,535、0~2^32-1、0~2^64-1。有符號整型是一個字節(jié)、字、雙字、四字表示的有符號的二進制數(shù)。符號位在負數(shù)的時候是置位的,在正數(shù)和0的時候是清零的。整數(shù)能表示的范圍是:1個字節(jié) -128~127,1個字 -32,768~32,767,1個雙字 -2^31~2^31-1,1個四字 -2^63~2^63-1。

正如我上面提到的,每個匯編程序都是由段來組成的,它包含數(shù)據(jù)段、代碼段、bss 段。我們先來看看數(shù)據(jù)段,這是主要用來定義初始化的常量。例如:

section .data

num1: equ 100

num2: equ 50

msg: db "Sum is correct", 10

好了,這兒差不多清楚了,三個常量名字分別為 num1、num2 和 msg,值分別是 100、50 和 “Sum is correct”,10 。但是 db 、equ 又是什么呢?實際上,NASM 支持大量偽指令:

DB、DW、DD、DQ、DT、DO、DY 和 DZ —— 用來定義初始化數(shù)據(jù)的。例如:

;; Initialize 4 bytes 1h, 2h, 3h, 4h

db 0x01,0x02,0x03,0x04

;; Initialize word to 0x12 0x34

dw 0x1234

RESB、RESW、RESD、RESQ、REST、RESO、RESY、RESZ —— 用來定義非初始化變量

INCBIN —— 包含外部二進制文件

EQU —— 定義常量,例如:

;; now one is 1

one equ 1

TIMES —— 重復指令或數(shù)據(jù)(下一篇文章中描述)

算術操作

下面是算術操作指令的簡單列表:

ADD —— 整數(shù)加

SUB —— 減

MUL —— 無符號乘

IMUL —— 有符號乘

DIV —— 無符號除

IDIV —— 有符號除

INC —— 自增

DEC —— 自減

NEG —— 取反

本文會用到一些,其它的在接下來的文章有所覆蓋。

控制流

通常編程語言使用 if、case、goto 等等來改變程序的運行順序,當然匯編也可以。這里我們提及到一些。有一個專門用來比較兩個數(shù)大小的 cmp 指令,它被用來接著條件判斷指令來決定是否跳轉。例如:

;; compare rax with 50

cmp rax, 50

cmp 指令僅僅比較兩個數(shù),但是對它們的值沒有影響,也不會根據(jù)比較的結果執(zhí)行任何東西。為了在比較之后執(zhí)行操作,有條件跳轉指令,可以是下面的一個:

JE —— 如果相等

JZ —— 如果為零

JNE —— 如果不相等

JNZ —— 如果不為零

JG —— 如果第一個操作數(shù)比第二個大

JGE —— 如果第一個操作數(shù)比第二個大或者相等

JA —— 與 JG 指令相同,只不過比較的是無符號數(shù)

JAE —— 與 JGE 指令相同,只不過比較的是無符號數(shù)

例如如果我們想寫 C 語言中類似于 if/else 的語句:

if (rax != 50) {

exit();

} else {

right();

}

在匯編中是這樣的:

;; compare rax with 50

cmp rax, 50

;; perform .exit if rax is not equal 50

jne .exit

jmp .right

也有一種無條件跳轉的指令語法:

JMP LABEL

例如:

_start:

;; ....

;; do something and jump to .exit label

;; ....

jmp .exit

.exit:

mov rax, 60

mov rdi, 0

syscall

這里 _start 標簽后有一些代碼,這些代碼會被執(zhí)行到,匯編最后控制轉向到 .exit 標簽處,該標簽后的代碼開始執(zhí)行。

通常無條件跳轉用在循環(huán)中,例如我們有 label 標簽,它后面有一些代碼,代碼執(zhí)行完之后進行條件判斷,如果條件不成立將跳到該段代碼的起始處。循環(huán)將在后面文章中介紹。

示例

我們看個簡單的例子:兩個數(shù)相加,得到它們的和,然后與預定義的一個數(shù)進行比較,如果相等輸出一些東西到屏幕上;如果不等退出。下面是例子的源代碼:

;initialised data section

section .data

; Define constants

num1: equ 100

num2: equ 50

; initialize message

msg: db "Sum is correctn"

section .text

global _start

;; entry point

_start:

; set num1's value to rax

mov rax, num1

; set num2's value to rbx

mov rbx, num2

; get sum of rax and rbx, and store it's value in rax

add rax, rbx

; compare rax and 150

cmp rax, 150

; go to .exit label if rax and 150 are not equal

jne .exit

; go to .rightSum label if rax and 150 are equal

jmp .rightSum

; Print message that sum is correct

.rightSum:

;; write syscall

mov rax, 1

;; file descritor, standard output

mov rdi, 1

;; message address

mov rsi, msg

;; length of message

mov rdx, 15

;; call write syscall

syscall

; exit from program

jmp .exit

; exit procedure

.exit:

; exit syscall

mov rax, 60

; exit code

mov rdi, 0

; call exit syscall

syscall

我們過一下這段代碼。首先在數(shù)據(jù)段定義了三個數(shù):num1、num2 和值為 “Sum is correctn” 的 msg?,F(xiàn)在看到第 14 行,這是程序的入口的地方。我們將 num1 和 num2 的值放到通用寄存器 rax 和 rbx 中,使用 add 指令相加,在 add 指令執(zhí)行完之后,rax 和 rbx 相加之和保存到 rax 中,即現(xiàn)在 num1 和 num2 的和存放在 rax 寄存器中。

好了,我們讓 num1 是 100,num2 是 50,之和是 150,用 cmp 指令比較。在比較完 rax 和 150 之后,檢查比較的結果,如果 rax 和 150 不等,我們跳轉到 .exit 處,如果相等,跳到 .rightSum 標簽處。

接著有兩個標簽:.exit 和 .rightSum。首先將 rax 設置為 60,這是 exit 系統(tǒng)調用號,以及將 rdi 設為 0,這是退出碼。然后,.rightSUm 相當簡單,只是打印出 Sum is corretn,如果你不能理解怎么工作的,看看第一篇文章。

總結

這是 《我的匯編學習之路》 系列文章的第二篇,如果你有任何問題或建議,給我留言。

更多信息請查看IT技術專欄

更多信息請查看技術文章

2025國考·省考課程試聽報名

  • 報班類型
  • 姓名
  • 手機號
  • 驗證碼
關于我們 | 聯(lián)系我們 | 人才招聘 | 網站聲明 | 網站幫助 | 非正式的簡要咨詢 | 簡要咨詢須知 | 加入群交流 | 手機站點 | 投訴建議
工業(yè)和信息化部備案號:滇ICP備2023014141號-1 云南省教育廳備案號:云教ICP備0901021 滇公網安備53010202001879號 人力資源服務許可證:(云)人服證字(2023)第0102001523號
聯(lián)系電話:0871-65099533/13759567129 獲取招聘考試信息及咨詢關注公眾號:hfpxwx
咨詢QQ:526150442(9:00—18:00)版權所有:易賢網