数据的位级表示

常数	常数2	结果	运算时的类型
0	0U	==	unsigned
-1	0	<	signed
-1	0U	>	unsigned
214748647	-214748647-1	>	signed
214748647U	-214748647-1	<	unsigned
-1	-2	>	signed
(unsigned)-1	-2	>	unsigned
214748647	214748648U	<	unsigned
214748647	(int)214748648U	>	signed

扩展和截断

将低字长的整数转换为高字长的整数称为扩展，无符号数在前面填0，而有符号数在前面填1。

将高字长的整数转换为低字长的整数称为截断，直接抛弃前面的位就可以了，再对结果进行重新解释。

加减乘除

无符号整数的相加

按位相加，将溢出的数位直接忽略。或者用更加数学化的语言：

$s = U A d d_{w} (u, v) = (u + v) m o d 2^{w}$

有符号整数的相加

与无符号整数的加法在位级表现上是一致的，仍然是按位相加，并且忽略溢出的部分。也就是说，运行下面给一段C代码：

int s, t, u, v;
s = (int) ((unsigned)u + (unsigned)v);
t = u + v;

在运行之后的结果是s == t。

在有符号整数相加的溢出中，如果结果大于等于 $2^{w - 1}$ ，那么发生负溢出，结果是一个负数，如果结果小于 $- 2^{w - 1}$ ，那么发生正溢出，结果是一个负数。

整数的乘法

存储w位的整数的乘法需要 $2^{w}$ 位的空间。在实际的计算过程中，仍然是忽略掉所有溢出的数位，在数学上就是：

$U M u l t_{w} (u, v) = (u \times v) m o d 2^{w}$

有符号数和无符号上乘法在细节上可能存在一定的差异，但是最后计算结果的低位是一致的。

在实现乘以2的幂时，我们可以通过移位操作来实现，也就是说u << k得出的结果就是 $u \times 2^{k}$ ，这个结论对于无符号整数和有符号整数都是成立的。而且对于现代的处理器来说，移位和加法操作远快于乘法操作，因此在计算乘法时，编译器会尽量优化为移位和加法操作来完成。

在无符号整数除以2的幂时，我们可以采用逻辑右移来实现，也就是说x >> k就是 $⌊ u / 2^{k} ⌋$ 。在有符号整数除以2的幂时，我们可以采用算术右移来实现，也即x >> k就是 $⌊ u / 2^{k} ⌋$ ，但是当结果是负数时，我们希望计算机能向靠近0的方向舍入，也就是向上舍入。于是我们可以进行修正： $(x + 2^{k} - 1) / 2^{k}$ ，通过加上一个整数来使结果”看上去“像是向上取整的。

求负数

对整数求负数，可以通过-x = ~x + 1来实现。但是这个运算存在两个特例，0和 $T_{min}$ ，这两个数求负数的结果都是它自己。

位与内存，指针和字符串

面向字节的内存组织

程序通过地址来访问内存，我们可以将内存视为一个超级大的字节数组。同时，对于每一个不同的进程，操作系统都提供了一个独立的内存空间供程序使用。

任何计算机都有一个指定的字长，通常这个数值指定了int类型和地址的字节长度。现在的大部分计算机都是64位的，也就是说这些计算机采用8字节作为字长。现在的计算机大多都是同时支持32位和64位的，这样在32位时代时编写的程序在64位的计算机上也可以正常的运行。

下面的这张表给出在在不同字长的计算机和x86-64架构计算机上不同数据类型的典型字长。

C语言中的类型名称	32位典型值	64位典型值	x86-64架构下的大小
char	1	1	1
short	2	2	2
int	4	4	4
long	4	8	8
float	4	4	4
double	8	8	8
pointer	4	8	8

字节顺序

在内存中储存数据时，显然不可能所有的数据都只占据一个字长的空间。当数据占用了多个字长的空间时，字节的顺序就显得尤为重要。

字节的顺序存在着下面两种情况：

大端法
小端法

需要指出的是，大端法和小端法并没有任何性能或者其他方面的差异，仅是计算机设计者在设计时的偏好。

就像是从大头打破鸡蛋还是从小头打破鸡蛋，这是《格列佛游记》中的一个故事，大端法和小端法的英文名称也是来自于这个典故。

我们可以编写一个C函数来打印一个数据的每个字节：

typedef unsigned char* pointer;
void show_bytes(pointer start, size_tlen)
{
    size_t i;
    for (i= 0; i< len; i++)
        printf(”%p\t0x%.2x\n",start+i, start[i]);
    printf("\n");
}

字符串的表示

在C语言中，字符串的表示都是一个字符的数组，每个字符都通过ASCII的方式进行编码。通过每一个字符串都需要是空终止的，也就是说最后一个字符是0。

这里的0不是字符'0'，而是数值0

浮点数的表示

分数的位级表示

仍然采用一种加权的思想，给每一个二进制位赋予一个权重，对于小数点右边的位数，我们将它们赋给2的负数次方幂的权值。在这种表示方法下，我们可以表示这样的有理数：

$k = - j \sum i b_{K} \times 2^{k}$

给出一个例子：

值	表示
5.75	$101.1 1_{2}$	$4 + 1 + \frac{1}{2} + \frac{1}{4}$
2.875	$10.11 1_{2}$	$2 + \frac{1}{2} + \frac{1}{4} + \frac{1}{8}$

但是这种表示方式具有一定的缺陷：

只有符合 $\frac{x}{2 ^{k}}$ 公式的数值可以被精准的表示，其他的分数会被表示为无限循环小数。
小数点的位置时固定的，在表示特别大和特别小的数上时十分困难

IEEE浮点数标准

IEEE 754标准

这个标准具有许多的优点：

这个1985年确定的标准几乎被大多数的CPU所支持
在处理涉入、上溢和下溢上十分的巧妙

浮点数的表示

这个标准通过这样一个数学公式表示小数：

$(- 1)^{s} M 2^{E}$

符号位s确定这个浮点数是正数还是负数
位数M表示一个位于[1.0,2.0)之间的小数
阶码E表示一个2的一个幂

在计算机中，使用MSB准确编码符号位，使用frac近似编码位数，使用exp近似编码阶码。一般有着两种不同的字长来编码浮点数，长度分别为32位和64位，分别被称为单精度浮点数和双精度浮点数。

float-encoding

在编码的长度指定之后，通过exp值的不同，被编码的值可以被分为三种不同的情况：

exp每一位上都是0，称为非规格化的编码。此时上述数学公式中的E为 $1 - bia s$ ，这个bias是一个偏置值，这个偏置值和exp的位数有关，如果exp有着k位，那么 $bia s = 2^{k - 1} - 1$ 。
- 如果frac全为0，通过符号位的不同，我们就可以得到两个0，+0和-0
- 如果frac不全为0，我们可以表示那些十分接近于0的值
exp中既有1又有0，称为规格化的编码。此时exp的值等于上述数学公式中的阶码加上偏置值E+bias。

例如现在有一个小数15213.0，则有 $1521 3_{10} = 1110110110110 1_{2} = 1.110110110110 1_{2} \times 2^{13}$ ，于是表示这个数的浮点数的frac部分是11011011011010000000000，exp部分就是 $13 + 2^{7} - 1 = 13 + 127 = 140 = 1000110 0_{2}$ ，于是这个数的浮点形式就是：
exp中全部都是1，称为特殊编码。这种编码方式下还有这两种不同形式：
- 当frac全为0时，表示无穷大或者无穷下
- 当frac不全为0时，表示NaN，即不是一个数，这个值常出现在一些非法操作的结果中。

在设计时，将规格化和非规格化分开的目的是从非规格化的数转化为规格化数时，位级表示是平滑的（抽象拉满）。具体如何平滑见下图：

C语言中的浮点数

C语言中实现了两种字长的浮点数，4字节的float和8字节的double。

C语言中float，double和int之间的类型转换比较复杂，介绍如下：

在这三个类型之间相互转换回改变位级表示
double/float 转换为int：
- 分数的部分会被直接忽略
- 会向趋近于0的方向圆整
- 如果是发生了溢出或者NaN，一般是转换为 $T_{M in}$
int转换为double
- 准确的转换
int转换为float
- 将按照指定的舍入模式舍入
具体是个啥模式没说

为了帮助理解，给出下列例子：

布尔表达式	正误
`x == (int)(float)x`	错误
`x == (int)(double)x`	正确
`f == (float)(double)f`	正确
`d==(double)(float)d`	错误
`f == -(-f)`	正确
`2/3==2/3.0`	错误
`d < 0.0 -> (d*2) < 0.0`	正确
`d > f -> -f > -d`	正确
`d * d >= 0.0`	正确
`(d + f)-d==f`	错误

Ricardo's Wiki

数据的位级表示

数据的表示

Bits

字节的编码

其他数据类型

位级运算

布尔代数

C语言中的位级运算

同C语言中逻辑操作的比较

移位运算

左移

右移

整数

有符号整数和无符号整数的表示

表示范围

类型转换和强制类型转换

扩展和截断

加减乘除

无符号整数的相加

有符号整数的相加

整数的乘法

求负数

位与内存，指针和字符串

面向字节的内存组织

字节顺序

字符串的表示

浮点数的表示

分数的位级表示

IEEE浮点数标准

IEEE 754标准

浮点数的表示

C语言中的浮点数