字长
字长是全国科学技术名词审定委员会审定、公布的科技类名词术语。
中国,从来就是一个文化底蕴极度丰富的国家,中国的文字,更是凝聚着中国的文化精魂[1]。中国最早出现的和文字相关的文化记忆就是仓颉造字,小小的文字中蕴藏了无限的文化[2],然后就出现了最初的甲骨文。
目录
名词解释
计算机采用二进制编码方式表示数、字符、指令和其它控制信息。计算机在存储、传送或操作时,作为一个单元的一组二进制码称为字,一个字中的二进制位的位数称为字长。
通常称处理字长为8位数据的CPU叫8位CPU,32位CPU就是在同一时间内处理字长为32位的二进制数据。二进制的每一个0或1是组成二进制的最小单位,称为位(bit)。常用的字长为8位、16位、32位和64位。字长为8位的编码称为字节,是计算机中的基本编码单位。
字长与计算机的功能和用途有很大的关系,是计算机的一个重要技术指标。字长直接反映了一台计算机的计算精度,为适应不同的要求及协调运算精度和硬件造价间的关系,大多数计算机均支持变字长运算,即机内可实现半字长、全字长(或单字长)和双倍字长运算。在其他指标相同时,字长越大计算机的处理数据的速度就越快。早期的微机字长一般是8位和16位,386以及更高的处理器大多是32位。市面上的计算机的处理器大部分已达到64位。字长由微处理器对外数据通路的数据总线条数决定。
通俗含义
字长是CPU的主要技术指标之一,指的是CPU一次能并行处理的二进制位数,字长总是8的整数倍,通常PC机的字长为16位(早期),32位,64位。
PC机可以通过编程的方法来处理任意大小的数字,但数字越大,PC机就要花越长的时间来计算。PC机在一次操作中能处理的最大数字是由PC机的字长确定的。
我们先来看一下人脑是如何进行计算的,例如5×6则立即可以得到答案是30,但对于55×66,就不可能立即得到正确的答案,这就是说55或66已走出了人脑的“字长”,这是为了得出结果,就必须把复杂的问题(如55×66)分解成易于处理的问题(如55×66可分解为50×60,50×6,5×60,5×6),然后再综合起来,得出结果。
同样PC机也是这样处理问题的,一台16位字长的PC机,可以直接处理2的16次方(65536)之内的数字,对于超过65536的数字就需要分解的方法来处理。32位pc机比16位机优越的原因就在于它在一次操作中能处理的数字大,32位字长的PC机能直接处理的数字高达40亿(2的32次方),能处理的的数字越大,则操作的次数就越少,从而系统的效率也就越高。
CPU大多是64位的,但大多都以32位字长运行,都没能展示它的字长的优越性,因为它必须与64位软件(如64位的操作系统等)相辅相成,也就是说,字长受软件系统的制约,例如,在32位软件系统中64位字长的CPU只能当32位用。
固定字长与可变字长
每一个储存位置都可以由其地址找到。但是每一储存位置的长度( length)尚未指定。
在某些计算机中,每一储存位置是由固定的位数所组成的。每当计算机涉及到某一个储存位置时,即表示它要引用此一固定长度的位置,亦称为一个“字” ( word ) 。像此种型态的组织,我们称之为固定字长( fixed word length)或可定址字( word-address-able)。例如典型的迷你计算机,一个字长为16个位。
另一些计算机,它的每个地址所引用是一个位元组或一个字。这种计算机,我们称之为可定址字( character-ddressable )或可定址位元组( byte-addresable )。右图所示即为此种储存体,因为这10个位元组的每一个位元组,皆可个别设定一个位址。
至于可定址字元的计算机,经常被称为可变字长( variable word length )的机器。
我们之所以称之“可变字长” ,乃是因为只要利用一个计算机已有的指令(如" add"或"move " ),它就可以去处理字数目为可变的字。但对固定字长的计算机而言,它所处理的字数目是由指合本身所指定的。
右图所示为固定字长与可变字长储存体组织的比较。每字可存4个字元的固定字长组织。注意此种组织中,虽然是每4个字元形成一组,且可赋予一个地址,但是每个个别的字元却不能赋予位址。可定址字元或可变字长的组织中,计算机可将其中每一个字赋予一个位址。
在图b中,假设要取出其中前5个字(即字母SANTA)时,需要分别引用5个位址。但实际上,并不需要如此。因为有一种可变字长指令,可让你一次就取出一组的字。在指令中,你只要第一个字元的位址,然后再指定一共要取出几个字元即可。
例如,在图b ,一个读取字母SANTA的指令,只要指定第一个字元的位址( 001 )及所要读取的字数(5) ,则此5个字元即可被读出。
可变字长组织其主要优点为储存体的使用效率高;即,只需使用与字数一样的位置即可储存该组字(注:如果想储存SANTA这一组字,只需使用5个位置即可)。然而,固定字长的组织可能会有浪费内存空间的现象。
双倍字长
双倍字长是指计算机内部参与运算的数的位数。它决定着计算机内部寄存器、ALU和数据总线的位数,直接影响着机器的硬件规模和造价。双倍字长直接反映了一台计算机的计算精度,为适应不同的要求及协调运算精度和硬件造价间的关系,大多数计算机均支持变字长运算,即机内可实现半字长、全字长(或单字长)和双倍字长运算。
微型机的字长通常为4位、8位、16位和32位,64位字长的高性能微型计算机也已推出。
双倍字长对计算机计算精度的影响:
4位字长:2^4=16;16位字长:2^16=65536=64K
32位字长:2^32=4,294,967,296=4G;64位字长:2^64≈1.8445×10^19
数据总线DB用于传送数据信息。数据总线是双向三态形式的总线,即他既可以把CPU的数据传送到存储器或I/O接口等其它部件,也可以将其它部件的数据传送到CPU。数据总线的位数是微型计算机的一个重要指标,通常与微处理的字长相一致。例如Intel8086微处理器字长16位,其数据总线宽度也是16位。需要指出的是,数据的含义是广义的,它可以是真正的数据,也可以指令代码或状态信息,有时甚至是一个控制信息,因此,在实际工作中,数据总线上传送的并不一定仅仅是真正意义上的数据。
地址总线AB是专门用来传送地址的,由于地址只能从CPU传向外部存储器或I/O端口,所以地址总线总是单向三态的,这与数据总线不同。地址总线的位数决定了CPU可直接寻址的内存空间大小,比如8位微机的地址总线为16位,则其最大可寻址空间为2^16=64KB,16位微型机的地址总线为20位,其可寻址空间为2^20=1MB。一般来说,若地址总线为n位,则可寻址空间为2^(n-10)千字节。
控制总线CB用来传送控制信号和时序信号。控制信号中,有的是微处理器送往存储器和I/O接口电路的,如读/写信号,片选信号、中断响应信号等;也有是其它部件反馈给CPU的,比如:中断申请信号、复位信号、总线请求信号、限备就绪信号等。因此,控制总线的传送方向由具体控制信号而定,一般是双向的,控制总线的位数要根据系统的实际控制需要而定。实际上控制总线的具体情况主要取决于CPU。
参考文献
- ↑ 中国汉字魅力无穷,搜狐,2022-11-20
- ↑ 诗酒趁年华 | 品中国文字 悟千年精魂,搜狐,2019-12-13