《汇编语言》总结04 —— 更灵活的定位内存地址的方法
(一)and和or指令
and指令:逻辑与指令,按位进行与运算
mov al,01100011B
and al,00111011B
执行后,al=00100011B
作用:通过该指令可将操作对象的相应位设为0,其他位不变。
or指令:逻辑或指令,按位进行或运算
mov al,01100011B
or al,00111011B
执行后:al=011111011B
作用:通过该指令可将操作对象的相应位设为1,其他位不变。
(二)关于ASCII码
世界上有很多编码方案,有一种方案叫做ASCII编码,是在计算机系统中通常被采用的。简单地说,所谓编码方案,就是一套规则,它约定了用什么样的信息来表示现实对象。比如说,在ASCII编码方案中,用61H表示"a",62H表示"b"。一种规则需要人们遵守才有意义。
一个文本编辑过程中,就包含着按照ASCII编码规则进行的编码和解码。在文本编辑过程中,我们按一下键盘的a键,就会在屏幕上看到"a"。这是怎样一个过程呢?我们按下键盘的a键,这个按键的信息被送入计算机,计算机用ASCII码的规则对其进行编码,将其转化为61H存储在内存的指定空间中;文本编辑软件从内存中取出61H,将其送到显卡的显存中;工作在文本模式下的显卡,用ASCII码的规则解释显存中的内容,61H被当作字符"a",显卡驱动显示器,将字符"a"的图像画在屏幕上。
(三)以字符形式给出的数据
我们可以在汇编程序中,用'...'的方式指明数据是以字符的形式给出的,编译器将把它们转化为相对应的ASCII码,如下:
assume cs:code,ds:data
data segment
db 'unIX'
db 'foRK'
data ends
code segment
start:mov al,'a'
mov bl,'b'
mov ax,4c00h
int 21h
code ends
end start
(四)大小写转换问题
assume cs:codesg,ds:datasg
datasg segment
db 'BaSiC'
db 'iNfOrMaTiOn'
datasg ends
codesg segment
start:mov ax,datasg
mov ds,ax ;设置ds指向datasg段
mov bx,0 ;设置(bx)=0,ds:bx指向'BaSiC'的第一个字母
mov cx,5 ;设置循环次数5,因为'BaSiC'有5个字母
s: mov al,[bx] ;将ASCII码从ds:bx所指向的单元中取出
add al,11011111B ;将al中的ASCII码的第5位置为0,变为大写字母
mov [bx],al ;将转变后的ASCII码写回原单元
inc bx ;(bx)加1,ds:bx指向下一个字母
loop s
mov bx,5 ;设置(bx)=5,ds:bx指向'iNfOrMaTiOn'的第一个字母
mov cx,11 ;设置循环次数11,因为'iNfOrMaTiOn'有11个字母
s0: mov al,[bx]
or al,00100000B ;将al中的ASCII码的第5位置为1,变为小写字母
mov [bx],al
inc bx
loop s0
mov ax,4c00h
int 21h
codesg ends
code start
(五)[bx+idata]
在前面总结中,我们用[bx]的方式来指明一个内存单元,还可以用一种更为灵活的方式来指明内存单元:[bx+idata]表示一个内存单元,它的偏移地址为(bx)+idata,比如:
mov ax,[bx+200]
数学化的描述为:(ax)=((ds)*16+(bx)+200)
也可以写为:
mov ax,[200+bx]
mov ax,200[bx]
mov ax,[bx].200
那这种方式有什么用呢?我们可以用[bx+idata]的方式进行数组的处理
assume cs:codesg,ds:datasg
datasg segment
db 'BaSiC'
db 'MinIX'
datasg ends
codesg segment
start:
codesg ends
end start
按照我们原来的方法,用[bx]的方式定位字符串中的字符。代码段如下:
mov ax,datasg
mov ds.ax
mov bx,0
mov cx,5
s:mov al,[bx]
and al,11011111B
mov [bx],al
inc bx
loop s
mov bx,5
mov cx,5
s0:mov al,[bx]
or al,00100000B
mov [bx],al
inc bx
loop s0
现在我们用[bx+idata]对上面的代码进行简化,如下:
mov ax,datasg
mov ds,ax
mov bx,0
mov cx,5
s:mov al,[bx]
and al,11011111B
mov [bx],al
mov al,[5+bx]
or al,00100000B
mov [5+bx],al
inc bx
loop s
但也可以写成下面这种:
mov ax,datasg
mov ds,ax
mov bx,0
mov cx,5
s:mov al,0[bx]
and al,11011111B
mov 0[bx],al
mov al,5[bx]
or al,00100000B
mov 5[bx],al
inc bx
loop s
如果我们用高级语言,比如C语言来描述上述程序,大致如下:
char a[5] = "BaSiC";char b[5] = "MinIX";main(){ int i; i = 0; do { a[i] = a[i] & 0xDF; b[i] = b[i] & 0x20; i++; } while(i < 5);}
C语言:a[i],b[i]
汇编语言:0[bx],5[bx]
(六)SI和DI
si和di是8086CPU中和bx功能相近的寄存器,si和di不能够分成两个8位寄存器来使用
(七)[bx+si]和[bx+di]
[bx+si]和[bx+di]的含义相似,都表示一个内存单元,它的偏移地址为(bx)+(si)
mov ax,[bx+si]
数学化的描述为:(ax)=((ds)*16+(bx)+(si))
也可以写成如下格式:
mov ax,[bx][si]
(八)[bx+si+idata]和[bx+di+idata]
[bx+si+idata]和[bx+di+idata]含义相似,表示一个内存单元,它的偏移地址为(bx)+(si)+idata
mov ax,[bx+si+idata]
数学化的描述为:(ax)=((ds)*16+(bx)+(si)+idata)
该指令也可写成如下格式:
mov ax,[bx+200+si]
mov ax,[200+bx+si]
mov ax,200[bx][si]
mov ax,[bx].200[si]
mov ax,[bx][si].200
(九)不同的寻址方式的灵活应用
[idata]用一个常量来表示地址,可用于直接定位一个内存单元。
[bx]用一个变量来表示内存地址,可用于间接定位一个内存单元。
[bx+idata]用一个变量和一个常量表示内存地址,可在一个起始地址的基础上用变量间接定位一个内存单元。
[bx+si]用两个变量表示地址。
[bx+si+idata]用两个变量和一个常量表示地址。
总结完毕!