跳至主要內容

01. 位运算知识

ITCharge大约 14 分钟

位运算知识

1. 位运算简介

1.1 位运算与二进制简介

位运算(Bit Operation):在计算机内部,数是以「二进制(Binary)」的形式来进行存储。位运算就是直接对数的二进制进行计算操作,在程序中使用位运算进行操作,会大大提高程序的性能。

在学习二进制数的位运算之前,我们先来了解一下什么叫做「二进制数」。

二进制数(Binary):由 0011 两个数码来表示的数。二进制数中每一个 00 或每一个 11 都称为一个「位(Bit)」。

我们通常使用的十进制数有 090 \sim 91010 个数字,进位规则是「满十进一」。例如:

  1. 7(10)+2(10)=9(10)7_{(10)} + 2_{(10)} = 9_{(10)}7(10)7_{(10)} 加上 2(10)2_{(10)} 等于 9(10)9_{(10)}
  2. 9(10)+2(10)=11(10)9_{(10)} + 2_{(10)} = 11_{(10)}9(10)9_{(10)} 加上 2(10)2_{(10)} 之后个位大于等于 1010,符合「满十进一」,结果等于 11(10)11_{(10)}

而在二进制数中,我们只有 0011 两个数码,它的进位规则是「逢二进一」。例如:

  1. 1(2)+0(2)=1(2)1_{(2)} + 0_{(2)} = 1_{(2)}1(2)1_{(2)} 加上 0(2)0_{(2)} 等于 1(2)1_{(2)}
  2. 1(2)+1(2)=10(2)1_{(2)} + 1_{(2)} = 10_{(2)}1(2)1_{(2)} 加上 1(2)1_{(2)},大于等于 22,符合「逢二进一」,结果等于 10(2)10_{(2)}
  3. 10(2)+1(2)=11(2)10_{(2)} + 1_{(2)} = 11_{(2)}

1.2 二进制数的转换

1.2.1 二进制转十进制数

在十进制数中,数字 2749(10)2749_{(10)} 可以理解为 2×1000+7×100+4×10+912 \times 1000 + 7 \times 100 + 4 \times 10 + 9 * 1,相当于 2×103+7×102+4×101+9×1002 \times 10^3 + 7 \times 10^2 + 4 \times 10^1 + 9 \times 10^0,即 2000+700+40+9=2749(10)2000 + 700 + 40 + 9 = 2749_{(10)}

同理,在二进制数中,01101010(2)01101010_{(2)} 可以看作为 (0×27)+(1×26)+(1×25)+(0×24)+(1×23)+(0×22)+(1×21)+(0×20)(0 \times 2^7) + (1 \times 2^6) + (1 \times 2^5) + (0 \times 2^4) + (1 \times 2^3) + (0 \times 2^2) + (1 \times 2^1) + (0 \times 2^0),即 0+64+32+0+8+0+2+0=106(10)0 + 64 + 32 + 0 + 8 + 0 + 2 + 0 = 106_{(10)}

我们可以通过这样的方式,将一个二进制数转为十进制数。

1.2.2 十进制转二进制数

十进制数转二进制数的方法是:除二取余,逆序排列法

我们以十进制数中的 106(10)106_{(10)} 为例。

106÷2=53(余 0)53÷2=26(余 1)26÷2=13(余 0)13÷2=6(余 1)6÷2=3(余 0)3÷2=1(余 1)1÷2=0(余 1)0÷2=0(余 0)\begin{aligned} 106 \div 2 = 53 & \text{(余 0)} \cr 53 \div 2 = 26 & \text{(余 1)} \cr 26 \div 2 = 13 & \text{(余 0)} \cr 13 \div 2 = 6 & \text{(余 1)} \cr 6 \div 2 = 3 & \text{(余 0)} \cr 3 \div 2 = 1 & \text{(余 1)} \cr 1 \div 2 = 0 & \text{(余 1)} \cr 0 \div 2 = 0 & \text{(余 0)} \end{aligned}

我们反向遍历每次计算的余数,依次是 0011110011001100,即 01101010(2)01101010_{(2)}

2. 位运算基础操作

在二进制的基础上,我们可以对二进制数进行相应的位运算。基本的位运算共有 66 种,分别是:「按位与运算」、「按位或运算」、「按位异或运算」、「取反运算」、「左移运算」、「右移运算」。

这里的「按位与运算」、「按位或运算」、「按位异或运算」、「左移运算」、「右移运算」是双目运算。

  • 「按位与运算」、「按位或运算」、「按位异或运算」是将两个整数作为二进制数,对二进制数表示中的每一位(即二进位)逐一进行相应运算,即双目运算。
  • 「左移运算」、「右移运算」是将左侧整数作为二进制数,将右侧整数作为移动位数,然后对左侧二进制数的全部位进行移位运算,每次移动一位,总共移动右侧整数次位,也是双目运算。

而「取反运算」是单目运算,是对一个整数的二进制数进行的位运算。

我们先来看下这 66 种位运算的规则,再来进行详细讲解。

运算符描述规则
|按位或运算符只要对应的两个二进位有一个为 11 时,结果位就为 11
&按位与运算符只有对应的两个二进位都为 11 时,结果位才为 11
<<左移运算符将二进制数的各个二进位全部左移若干位。<< 右侧数字指定了移动位数,高位丢弃,低位补 00
>>右移运算符对二进制数的各个二进位全部右移若干位。>> 右侧数字指定了移动位数,低位丢弃,高位补 00
^按位异或运算符对应的两个二进位相异时,结果位为 11,二进位相同时则结果位为 00
~取反运算符对二进制数的每个二进位取反,使数字 11 变为 0000 变为 11

2.1 按位与运算

按位与运算(AND):按位与运算符为 &。其功能是对两个二进制数的每一个二进位进行与运算。

  • 按位与运算规则:只有对应的两个二进位都为 11 时,结果位才为 11

    • 1 & 1 = 1

    • 1 & 0 = 0

    • 0 & 1 = 0

    • 0 & 0 = 0

举个例子,对二进制数 01111100(2)01111100_{(2)}00111110(2)00111110_{(2)} 进行按位与运算,结果为 00111100(2)00111100_{(2)},如图所示:

2.2 按位或运算

按位或运算(OR):按位或运算符为 |。其功能对两个二进制数的每一个二进位进行或运算。

  • 按位或运算规则:只要对应的两个二进位有一个为 11 时,结果位就为 11
    • 1 | 1 = 1
    • 1 | 0 = 1
    • 0 | 1 = 1
    • 0 | 0 = 0

举个例子,对二进制数 01001010(2)01001010_{(2)}01011011(2)01011011_{(2)} 进行按位或运算,结果为 01011011(2)01011011_{(2)},如图所示:

2.3 按位异或运算

按位异或运算(XOR):按位异或运算符为 ^。其功能是对两个二进制数的每一个二进位进行异或运算。

  • 按位异或运算规则:对应的两个二进位相异时,结果位为 11,二进位相同时则结果位为 00

  • 0 ^ 0 = 0

  • 1 ^ 0 = 1

  • 0 ^ 1 = 1

  • 1 ^ 1 = 0

举个例子,对二进制数 01001010(2)01001010_{(2)}01000101(2)01000101_{(2)} 进行按位异或运算,结果为 00001111(2)00001111_{(2)},如图所示:

2.4 取反运算

取反运算(NOT):取反运算符为 ~。其功能是对一个二进制数的每一个二进位进行取反运算。

  • 取反运算规则:使数字 11 变为 0000 变为 11
    • ~0 = 1
    • ~1 = 0

举个例子,对二进制数 01101010(2)01101010_{(2)} 进行取反运算,结果如图所示:

2.5 左移运算和右移运算

左移运算(SHL): 左移运算符为 <<。其功能是对一个二进制数的各个二进位全部左移若干位(高位丢弃,低位补 00)。

举个例子,对二进制数 01101010(2)01101010_{(2)} 进行左移 11 位运算,结果为 11010100(2)11010100_{(2)},如图所示:

右移运算(SHR): 右移运算符为 >>。其功能是对一个二进制数的各个二进位全部右移若干位(低位丢弃,高位补 00)。

举个例子,对二进制数 01101010(2)01101010_{(2)} 进行右移 11 位运算,结果为 00110101(2)00110101_{(2)},如图所示:

3. 位运算的应用

3.1 位运算的常用操作

3.1.1 判断整数奇偶

一个整数,只要是偶数,其对应二进制数的末尾一定为 00;只要是奇数,其对应二进制数的末尾一定为 11。所以,我们通过与 11 进行按位与运算,即可判断某个数是奇数还是偶数。

  1. (x & 1) == 0 为偶数。
  2. (x & 1) == 1 为奇数。

3.1.2 二进制数选取指定位

如果我们想要从一个二进制数 XX 中取出某几位,使取出位置上的二进位保留原值,其余位置为 00,则可以使用另一个二进制数 YY,使该二进制数上对应取出位置为 11,其余位置为 00。然后令两个数进行按位与运算(X & Y),即可得到想要的数。

举个例子,比如我们要取二进制数 X=01101010(2)X = 01101010_{(2)} 的末尾 44 位,则只需将 X=01101010(2)X = 01101010_{(2)}Y=00001111(2)Y = 00001111_{(2)} (末尾 44 位为 11,其余位为 00) 进行按位与运算,即 01101010 & 00001111 == 00001010。其结果 0000101000001010 就是我们想要的数(即二进制数 01101010(2)01101010_{(2)} 的末尾 44 位)。

3.1.3 将指定位设置为 11

如果我们想要把一个二进制数 XX 中的某几位设置为 11,其余位置保留原值,则可以使用另一个二进制数 YY,使得该二进制上对应选取位置为 11,其余位置为 00。然后令两个数进行按位或运算(X | Y),即可得到想要的数。

举个例子,比如我们想要将二进制数 X=01101010(2)X = 01101010_{(2)} 的末尾 44 位设置为 11,其余位置保留原值,则只需将 X=01101010(2)X = 01101010_{(2)}Y=00001111(2)Y = 00001111_{(2)}(末尾 44 位为 11,其余位为 00)进行按位或运算,即 01101010 | 00001111 = 01101111。其结果 0110111101101111 就是我们想要的数(即将二进制数 01101010(2)01101010_{(2)} 的末尾 44 位设置为 11,其余位置保留原值)。

3.1.4 反转指定位

如果我们想要把一个二进制数 XX 的某几位进行反转,则可以使用另一个二进制数 YY,使得该二进制上对应选取位置为 11,其余位置为 00。然后令两个数进行按位异或运算(X ^ Y),即可得到想要的数。

举个例子,比如想要将二进制数 X=01101010(2)X = 01101010_{(2)} 的末尾 44 位进行反转,则只需将 X=01101010(2)X = 01101010_{(2)}Y=00001111(2)Y = 00001111_{(2)}(末尾 44 位为 11,其余位为 00)进行按位异或运算,即 01101010 ^ 00001111 = 01100101。其结果 0110010101100101 就是我们想要的数(即将二进制数 X=01101010(2)X = 01101010_{(2)} 的末尾 44 位进行反转)。

3.1.5 交换两个数

通过按位异或运算可以实现交换两个数的目的(只能用于交换两个整数)。

a, b = 10, 20
a ^= b
b ^= a
a ^= b
print(a, b)

3.1.6 将二进制最右侧为 11 的二进位改为 00

如果我们想要将一个二进制数 XX 最右侧为 11 的二进制位改为 00,则只需通过 X & (X - 1) 的操作即可完成。

比如 X=01101100(2)X = 01101100_{(2)}X1=01101011(2)X - 1 = 01101011_{(2)},则 X & (X - 1) == 01101100 & 01101011 == 01101000,结果为 01101000(2)01101000_{(2)}(即将 XX 最右侧为 11 的二进制为改为 00)。

3.1.7 计算二进制中二进位为 11 的个数

从 3.1.6 中得知,通过 X & (X - 1) 我们可以将二进制 XX 最右侧为 11 的二进制位改为 00,那么如果我们不断通过 X & (X - 1) 操作,最终将二进制 XX 变为 00,并统计执行次数,则可以得到二进制中二进位为 11 的个数。

具体代码如下:

class Solution:
    def hammingWeight(self, n: int) -> int:
        cnt = 0
        while n:
            n = n & (n - 1)
            cnt += 1
        return cnt

3.1.8 判断某数是否为 22 的幂次方

通过判断 X & (X - 1) == 0 是否成立,即可判断 XX 是否为 22 的幂次方。

这是因为:

  1. 凡是 22 的幂次方,其二进制数的某一高位为 11,并且仅此高位为 11,其余位都为 00。比如:4(10)=00000100(2)4_{(10)} = 00000100_{(2)}8(10)=00001000(2)8_{(10)} = 00001000_{(2)}
  2. 不是 22 的幂次方,其二进制数存在多个值为 11 的位。比如:510=00000101(2)5_{10} = 00000101_{(2)}610=00000110(2)6_{10} = 00000110_{(2)}

接下来我们使用 X & (X - 1) 操作,将原数对应二进制数最右侧为 11 的二进位改为 00 之后,得到新值:

  1. 如果原数是 22 的幂次方,则通过 X & (X - 1) 操作之后,新值所有位都为 00,值为 00
  2. 如果该数不是 22 的幂次方,则通过 X & (X - 1) 操作之后,新值仍存在不为 00 的位,值肯定不为 00

所以我们可以通过是否为 00 即可判断该数是否为 22 的幂次方。

3.2 位运算的常用操作总结

功 能位运算示例
从右边开始,把最后一个 11 改写成 00x & (x - 1)100101000 -> 100100000
去掉右边起第一个 11 的左边x & (x ^ (x - 1))x & (-x)100101000 -> 1000
去掉最后一位x >> 1101101 -> 10110
取右数第 kkx >> (k - 1) & 11101101 -> 1, k = 4
取末尾 33x & 71101101 -> 101
取末尾 kkx & 151101101 -> 1101, k = 4
只保留右边连续的 11(x ^ (x + 1)) >> 1100101111 -> 1111
右数第 kk 位取反x ^ (1 << (k - 1))101001 -> 101101, k = 3
在最后加一个 00x << 1101101 -> 1011010
在最后加一个 11(x << 1) + 1101101 -> 1011011
把右数第 kk 位变成 00x & ~(1 << (k - 1))101101 -> 101001, k = 3
把右数第 kk 位变成 11x | (1 << (k - 1))101001 -> 101101, k = 3
把右边起第一个 00 变成 11x | (x + 1)100101111 -> 100111111
把右边连续的 00 变成 11x | (x - 1)11011000 -> 11011111
把右边连续的 11 变成 00x & (x + 1)100101111 -> 100100000
把最后一位变成 00x | 1 - 1101101 -> 101100
把最后一位变成 11x | 1101100 -> 101101
把末尾 kk 位变成 11x | (1 << k - 1)101001 -> 101111, k = 4
最后一位取反x ^ 1101101 -> 101100
末尾 kk 位取反x ^ (1 << k - 1)101001 -> 100110, k = 4

3.3 二进制枚举子集

除了上面的这些常见操作,我们经常常使用二进制数第 1n1 \sim n 位上 0011 的状态来表示一个由 1n1 \sim n 组成的集合。也就是说通过二进制来枚举子集。

3.3.1 二进制枚举子集简介

先来介绍一下「子集」的概念。

  • 子集:如果集合 AA 的任意一个元素都是集合 SS 的元素,则称集合 AA 是集合 SS 的子集。可以记为 ASA \in S

有时候我们会遇到这样的问题:给定一个集合 SS,枚举其所有可能的子集。

枚举子集的方法有很多,这里介绍一种简单有效的枚举方法:「二进制枚举子集算法」。

对于一个元素个数为 nn 的集合 SS 来说,每一个位置上的元素都有选取和未选取两种状态。我们可以用数字 11 来表示选取该元素,用数字 00 来表示不选取该元素。

那么我们就可以用一个长度为 nn 的二进制数来表示集合 SS 或者表示 SS 的子集。其中二进制的每一个二进位都对应了集合中某一个元素的选取状态。对于集合中第 ii 个元素来说,二进制对应位置上的 11 代表该元素被选取,00 代表该元素未被选取。

举个例子,比如长度为 55 的集合 S={5,4,3,2,1}S = \lbrace 5, 4, 3, 2, 1 \rbrace,我们可以用一个长度为 55 的二进制数来表示该集合。

比如二进制数 11111(2)11111_{(2)} 就表示选取集合的第 11 位、第 22 位、第 33 位、第 44 位、第 55 位元素,也就是集合 {5,4,3,2,1}\lbrace 5, 4, 3, 2, 1 \rbrace,即集合 SS 本身。如下表所示:

集合 S 中元素位置54321
二进位对应值11111
对应选取状态选取选取选取选取选取

再比如二进制数 10101(2)10101_{(2)} 就表示选取集合的第 11 位、第 33 位、第 55 位元素,也就是集合 {5,3,1}\lbrace 5, 3, 1 \rbrace。如下表所示:

集合 S 中元素位置54321
二进位对应值10101
对应选取状态选取未选取选取未选取选取

再比如二进制数 01001(2)01001_{(2)} 就表示选取集合的第 11 位、第 44 位元素,也就是集合 {4,1}\lbrace 4, 1 \rbrace。如下标所示:

集合 S 中元素位置54321
二进位对应值01001
对应选取状态未选取选取未选取未选取选取

通过上面的例子我们可以得到启发:对于长度为 55 的集合 SS 来说,我们只需要从 000001111100000 \sim 11111 枚举一次(对应十进制为 02510 \sim 2^5 - 1)即可得到长度为 55 的集合 SS 的所有子集。

我们将上面的例子拓展到长度为 nn 的集合 SS。可以总结为:

  • 对于长度为 nn 的集合 SS 来说,只需要枚举 02n10 \sim 2^n - 1(共 2n2^n 种情况),即可得到集合 SS 的所有子集。

3.3.2 二进制枚举子集代码

class Solution:
    def subsets(self, S):                   # 返回集合 S 的所有子集
        n = len(S)                          # n 为集合 S 的元素个数
        sub_sets = []                       # sub_sets 用于保存所有子集
        for i in range(1 << n):             # 枚举 0 ~ 2^n - 1
            sub_set = []                    # sub_set 用于保存当前子集
            for j in range(n):              # 枚举第 i 位元素
                if i >> j & 1:              # 如果第 i 为元素对应二进位删改为 1,则表示选取该元素
                    sub_set.append(S[j])    # 将选取的元素加入到子集 sub_set 中
            sub_sets.append(sub_set)        # 将子集 sub_set 加入到所有子集数组 sub_sets 中
        return sub_sets                     # 返回所有子集

参考资料