导读:[ 点击 👉 关注「 全栈工程师修炼指南」公众号 ].设为「⭐️ 星标 」带你从基础入门 到 全栈实践 再到 放弃学习 !.涉及 网络安全运维、应用开发、物联网IOT、学习路径 、个人感悟 等知识分享。.希望各位看友多多支持【关注、点赞、评论、收藏、投币】,助力每一个梦想。.【W
[ 点击 👉 关注「 全栈工程师修炼指南」公众号 ]
设为「⭐️ 星标 」带你从基础入门 到 全栈实践 再到 放弃学习 !
涉及 网络安全运维、应用开发、物联网IOT、学习路径 、个人感悟 等知识分享。
希望各位看友多多支持【关注、点赞、评论、收藏、投币】,助力每一个梦想。
【WeiyiGeek Blog’s - 花开堪折直须折,莫待无花空折枝 】
作者主页: 【 https://weiyigeek.top 】
博客地址: 【 https://blog.weiyigeek.top 】
作者答疑学习交流群:欢迎各位志同道合的朋友一起学习交流【点击 👉 加入交流群】, 或者关注公众号回复【学习交流群】。
目录
描述:该部分包括第2 、3 和4 章,我们分别进行如下学习。
第2 章讨论了数字系统,数量如何能使用符号来表示。
第3 章讨论了不同的数据如何存储在计算机中。
第4 章讨论了一些基本的算术运算与位(逻辑)运算。
原文地址: https://mp.weixin.qq.com/s/XmsELA7atGCwDnfIP5yMtw
描述:计算机是一个可编程的数据处理机器,在进行数据的存储学习前需要理解数据的特性。
如今,数据以不同形式出现,如数字、文本、音频、图像和视频,而在计算机中常常使用多媒体
来定义包含它们。
在其计算机内部数据都是采用统一的数据表示法转换后存入计算机中(无需辨别它们表示的是何种数据类型
),当数据需要从计算机输出时在还原回来,此种通用格式称为位模式
。
位流
,通常长度为8的位模式被称为1字节,例如 16个位组成的位模式 1000 1010 1111 1111
(需要16个电子开关)。描述: 在存储到计算机内存中之前,数字被转换到二进制系统,对于整数的转换还是非常简单,而对于小数点,计算机使用两种不同的表示方法即定点
(把数字作为整数存储——没有小数部分)
和 浮点 (把数字作为实数存储——带有小数部分)
。
本节讲解的重点,从计算机中有无符号位数的表示和存储、整数以及实数的表示和存储、到原码、反码、补码的介绍计算。
寄存器的位数反映无符号数的表示范围
8 位 = 2^8 = 1111 1111 (二进制) = 0 ~ 255
16 位 = 2^16 = 1111 1111 1111 1111 (二进制) = 0 ~ 65535
符号表示格式:
真值数:带符号的数,即带“+”或“-”符号的数为真值。
机器数:符号数字化的数, 即用0,1这种表示正负的数称为机器数。
例如:下表中带符号的数与符号数字化的数分别对应,利用符号加绝对值表示法.
带符号的数 | 符号数字化的数 |
---|---|
+ 0.1011 | 0(.)1011 |
- 0.1011 | 1(.)1011 |
+ 1100 | 0 1100(.) |
- 1100 | 1 1100(.) |
温馨提示:从上之中我们可以看到计算机中是如何存储负数的,在其值的最高位为符号标志位,其余的为数值位。
整数是完整的数字(即没有小数部分),通常使用定点表示法(此种表示法中,小数点是假定的,但并不存储
)存储在内存中,整数可以被当作小数点位置固定的数字,小数点固定在最右边。
为了更有效地利用计算机内存,无符号和有符号的整数在计算机中存储方式是不同的,即分为下面三种方法
无符号表示法: 其只包括零和正数的非负整数,它的范围介于0到无穷大之间,该方法可以提高存储的效率。
例如,将 7 存储在 8 位存储单元中,使用符号表示法
(7)10 = (111)2 = 0000 1111 (左边加5位0)
2.译解无符号整数: 即输出设备译解内存中位模式的位串并转换为一个十进制的无符号整数,可安装二进制转换为十进制步骤进行即可。
3.溢出问题:存储单元的位的数量有限制,可以表达整数范围是有限的,例如,在n位存储单元中可以存储的无符号整数仅为0到2^n-1,如果 20 = (10100)2 只保留4位存储单元的情况下,其结果为 0100 ,因为丢掉了左边的位,整数显示为 4 而不是20。
4.无符号整数的应用:
计数:当我们计数时,不需要负数。可以从1 (有时0)开始增长。
寻址:有些计算机语言,在一个存储单元中存储了另一个存储单元的地址。地址都是从0 (存储器的第一个字节)开始到整个存储器的总字节数的正数,在这里同样也不需要用到负数。因此无符号整数可以轻松地完成这个工作。
存储其他数据类型:我们后面将谈到的其他数据类型(文本、图像、音频和视频)是以位模式存储的,可以翻译为无符号整数。
符号加绝对值表示法: 在存储整数中该方法并不常用,但该格式用于在计算机中存储部分实数,用符号加绝对值格式存储一个整数,需要用1
个二进制位表示符号(0 表示正,1 表示负), 意味着在一个8 位存储单元中,可以仅用7
位表示数字的绝对值(不带符号)。因此,最大的正数值仅是无符号最大数的一半。在n位单元可存储的数字范围是 -(2^(n-1)-1)
至
+(2^(n-1)-1)
.
例如,使用符号加绝对值表示法将+28与-28分别存储在8位存储单元中。
+28 = + (11100)2 = 0001 1100
-28 = - (11100)2 = 1000 1100
例如,当使用4位内存单元存储一个用符号加绝对值表示法的整数时出现的正负两种溢出,当我们试图存储一个比7大的正整数时,出现正溢出。
模拟信号,例如,音频
。实数是带有整数部分和小数部分的数字,对于小数点的处理计算机适用定点和浮点
两种不同的表示方法。
定点表示法:
小数点按约定方式标出,但是尽管固定小数点的表示法(定点)可用于表示实数,但结果不一定精确或达不到需要的精度,所以带有很大的整数部分或很小的小数部分的实数不应该用定点表示法存储
。
例如,在十进制系统中,假定我们用一种小数点右边2个数码,左边14个数码,总共16个数码的定点表示法。那么如果试图表示十进制数1.002 34,该系统的实数精度就会受损,该系统会把这个数字存储为1.00.
浮点表示法: 用于维持正确度或精度的解决方法,其允许小数点浮动,即可以在小数点的左右有不同数量的数码,此种方法极大地增加了可存储的实数范围,所以该方法适用于表示带有很大的整数部分或很小的小数部分的实数。
在浮点表示法中,无论十进制还是二进制,一个数字都由3部分组成,即 符号、位移量、定点数
三部分。
在称作科学计数法(浮点表示法)的表示法中, 定点部分在小数点左边只有1 个数码而且位移量是10 的幂次。
例如,使用科学计数法表示十进制数 7 425 000 000 000 000 000 000
# 左边保留一位整数,将小数点移动到7后。
十进制数:+ 7 425 000 000 000 000 000 000
科学计数法:7.425 x 10^21 (或者 +4.425E21)
例如,使用科学计数法表示数字 -0.000 000 000 000 023 2
# 同样,此处将小数点移动到首个数码2后。
十进制数: - 0.000 000 000 000 023 2
科学计数法: - 2.32 x 10^-14 (或者 - 2.32E-14)
例如,使用浮点格式(浮点表示法)表示数字-(0.00000000000000101)
2
# 同样,小数左边只留一个非零数码,注意指数作为负的二进制数存储在计算机中。
二进制数:-(0.0 0000 0000 0000 0101)2
科学计数法: - 1.01 x 2^-14
规范化 :为了统一表示法固定部分,科学计数法(用于十进制)和浮点表示法(用于二进制)都在小数点左边适用唯一非零(0)数码。
例如,十进制系统中的数码可能是1~9,而二进制系统中该数码是1。即
十进制: ± d.xxxxxxxxxxx 其中, d 取值范围 1-9,x 取值范围 0-9
二进制: ± 1.yyyyyyyyyyy 其中, y 取值范围是 0 或 1 。
符号、指数和尾数 : 在一个二进制数规范化之后,只存储了一个数的三部分信息:符号、指数和尾数(小数点右边的位)
符号: 一个数的符号可以用一个二进制位来存储(0 或1 )。
指数(2 的幂): 定义为小数点移动的位数,注意幂可以为正也可以为负。余码表示法(后面讨论)是用来存储指数位的方法。
尾数:是指小数点右边的二进制数,它定义了该数的精度,尾数是作为无符号整数存储的。
符号 指数 尾数
温馨提示: 小数点和定点部分左边的位1并没有存储(即1.
),它们是隐含的
温馨提示:尾数是带符号的小数部分,像以符号加绝对值表示法存储的整数那样对待。
余码系统 :
正的和负的整数都可以作为无符号数存储,则在余码系统中的所有整数都是正数。而为了表示正的或负的整数,一个正整数(称为一个偏移量)加到每个数字中,将它们统一移到非负的一边,其中偏移量的值计算表达式
2^(m-1)-1
, m 是内存单元存储指数的大小。
例如,对于4 位存储单元,则其偏移量是 2^(4-1)-1=7
。
例如,我们可以用4 位存储单元在数字系统中表示16 个整数。使用一个单元作为0, 分开其他15 个(不等地)我们可以在-7〜8 的范围中表示整数,如图下图所示。在该范围中增加7 个单位到每个整数中,可以统一把所有整数向右移,使其均为整数而无需改变这些整数的相对位置,避免了相互调整,如图下图所示,新系统称为余7, 或者偏移量为7 的偏移表示法
IEEE 存储浮点数的标准
IEEE 是电气和电子工程师协会,定义了几种存储浮点数的标准,其中耳熟能详的有单精度
和双精度
单精度数格式: 采用总共32 位来存储一个浮点表示法的实数。符号占用1 位(0 为正,1 为负),指数占用8 位(使用偏移量127 ),尾数使用23 位(无符号数)。该标准有时称为余127 码(Excess_127 ),因为偏移量是127 。
双精度数格式: 釆用总共64 位来存储一个浮点表示法的实数。符号占用1 位(0 为正,1 为负),指数占用11 位(使用偏移量1023 ), 尾数使用52 位。该标准有时称为余1023 码(Excess_1023 ), 因为偏移量是1023 。
IEEE 标准浮点数的存储
将一个实数可以存储为IEEE标准浮点数格式的步骤如下:
例如,十进制5.75余127码(单精度)表示法。
符号 + S=0
二进制: 101.11 (小数点后连乘法)
规范化: + (1.0111)2 x 2^2
E和M值: E = 指数 + 余码 = 2 + 127 = 129 = (10000001)2, M = 尾数 = (0111)2 = 0111 000 ... 000 (在M右侧增加19个0使之成为23位)
表示法: S E M
存储数据: 0 10000001 0111 0000 0000 0000 0000 000
例如,十进制-0.0234375余127码(单精度)表示法。
符号: - S=1
二进制: 0.0234375 = 0.0000011
规范化: - (1.1)*10^-6
E和M值: E = 指数 + 余码 = -6 + 127 = 121 = (01111001)2, M = 尾数 = (1)2 = 1000 .... 0000 (在M右侧增加22个0使之成为23位)
表示法: S E M
存储数据: 1 01111001 1000 0000 0000 0000 0000 000
IEEE 标准存储的浮点数还原
将一个被IEEE标准存储的浮点数还原为原数字的流程如下:
例如,将位模式(11001010000000000111000100001111)2以余127码的格式存储与内存中,请求该数字原本的十进制数。
# 1.由于是单精度,则首位S,后8位为E,剩下23是M
S E M
1 10010100 00000000111000100001111
# 2.原数字符号判断
S = 1 , 则符号为负号(-)
# 3.求得位移量
E = (10010100)2 - 127 = 148 - 127 = 21
# 4.将二进制小数点前只能为1与尾数组合拼接获得规范化
(1.00000000111000100001111)2 x 2^21
# 5.去规范化胡获得二进制数
(1000000001110001000011.11)2
# 6.原本的十进制数并加上符号
-2 104 378.75
上溢和下溢
对于浮点数,有上溢和下溢两种情况,例如使用32 位内存单元(余127 码)的浮点表示法,该表示法不能存储很小或很大的绝对值。
绝对值很小的数
导致下溢
的情况。绝对值很大的数
导致上溢
的情况。零值存储 : 当有整数部分和小数部分的实数设置为零的时候是0.0 时,此时约定在这种情况下符号、指数和尾数都设为零。
截断错误 : 当使用浮点表示法存储实数时存储数字的值可能不是我们希望的。例如,假定我们需要在内存中用余
127 码表示法存储这个数字:
由上图可知小数部分右边的3 个1 被截掉了,这种原始数字与还原后数字的差异称为截断错误。在使用很小或很大数字的地方,如宇航业的计算中,这种类型的错误是很严重的。这种情况下, 我们需要更大的内存单元 (例如,64位,双精度) 和 其他的表示法。为此IEEE 定义了用于更大尾数的其他表示法。
描述:说到计算机数据的表示和存储,不得不提到原码、反码、补码。
原码:二进制定点表示法, 即最高位为符号位
0 表示正, 1 表示负, 其余位表示数值位
大小,比如 (0 000 0111) B= 7 而 (1 000 0111) B = -7
反码:正数的反码与其原码相同, 负数的反码时对其原码逐位取反(符号位除外)
补码:正数的补码与其原码相同, 负数的补码是在其反码的末尾加1,或者在原码减1在取反也是可以的(计算机中通常是使用补码来存放负数的
)。
计算机中的原码、反码和补码快速计算了解(重点):
[八位寄存器] | 数值 1 | 数值 -1 | 数值 1 +(-1)= 0 |
---|---|---|---|
原码 | 0 000 0001 | 1 000 0001 (符号位为 1) | 1 000 0010 = (0 000 0001 + 1 000 0001) = -2 |
反码 | 0 000 0001 | 1 111 1110 (符号位不变,按位取反) | 1 111 1111 = (0 000 0001 + 1 111 1110) = - 0 |
补码 | 0 000 0001 | 1 111 1111 (反码+1) | 0 000 0000 = (1111 1111 + 0000 0001) = 1 0000 0000 (八位寄存器取只取后八位) |
温馨提示:
原码在表示数字0时,有两种方式表达
(0000 0000)B = 0
与(1000 0000)B = -0
,所以显然使用原码来表示数值正负不合适。反码在表示数字0时,也有两种方式表达
(0000 0000)B = 0
与(1111 1111)B = -0
,所以显然使用反码来表示数值正负也是不合适。补码在进行计算0时,可以在
数值位减1再取反
或者在数值位取反后再加1
也是可以的,其结果表示是精确的,所以显然使用反码来表示数值正负是非常合适的,并且计算机默认是使用补码来表示数值的(重点)。
温馨提示:如果将符号位 与 数值位 在运行时进行对其分离,但是这样做会增加ACC累加器设计开销过大。
举例,求数值 7 与 - 7 的原码、反码、补码的二进制表示(八位寄存器)。
数值 7 | 数值 -7
原码 0 000 0111 | 1 000 0111
反码 0 000 0111 | 1 111 1000
补码 0 000 0111 | 1 111 1001
计算机中的原码、反码和补码取值范围:
| 定点整数 | 定点小数
原码 | -(2^(n-1) - 1) ~ 2^(n-1) - 1 | -1 < x < 1 |
反码 | -(2^(n-1) - 1) ~ 2^(n-1) - 1 | -1 < x < 1 |
补码 | -2^(n-1) ~ 2^(n-1) - 1 | -1 <= x < 1 |
温馨提示:定点小数精确的表示范围应该是,原码为 -1 * (1 - 2^-(N-1)) ~ 1 - 2^-(N-1)
,其补码为-1 ~ 1 -
2^-(N-1).
原码表示法公式(原理)
\[[x]_原 = \left\{ \begin{array}{rcl} 0, x & { 2^n > x \geq 0} \\ 2^n-x & { 0\geq x > -2^n} \\ \end{array} \right.\\ 其中 x 为真值,n 为整数的位数. \]
\[[x]_原 = \left\{ \begin{array}{rcl} x & { 1 > x \geq 0} \\ 1-x & { 0 \geq x > -1} \\ \end{array} \right. \\ x 为真值 \]
整数原码计算示例:如 15 与 - 15 数的表示流程。
数值 = 15 -> x = + 1111 -> [x]原 = 0,1111
数值 = - 15 -> x = - 1111 -> [x]原 = 2^4 - (- 1111) = 1 0000 + 1111 = 1,1111
如果是八位寄存器就为 1000 1111 。
Tips: 其中整数位数为4位,并且使用(逗号)将符号位与数值部分隔开。
小数原码计算示例:例如 0.15 与 - 0.15 数的表示流程。
数值 = 0.15 -> x = + 0.1111 -> [x]原 = 0.1111
数值 = - 0.15 -> x = - 0.1111 -> [x]原 = 1 - (- 0.1111) = 1 + 0.1111 = 1.1111
Tips: 其中整数位数为4位.,并且使用(小数点)将符号位与数值部分隔开。
原码特点: 表示简单直观但是在使用原码做加法时,会出现结果符号可正可负的问题。
正数的原码符号位为0;数值位为其真值
负数的原码符号位为1;数值位为其真值
补码表示法公式(原理)
\[[x]_补 = \left\{ \begin{array}{rcl} 0,x & { 2^n > x \geq 0} \\ 2^{n+1}+x & { 0 > x \geq -2^n } & (mod 2^{n+1})\\ \end{array} \right.\\ 其中 x 为真值,n 为整数的位数. \]
\[[x]_补 = \left\{ \begin{array}{rcl} x & { 1 > x \geq 0} \\ 2+x & { 0 \geq x > -1} & (mod 2) \end{array} \right. \\ 其中 x 为真值 \]
整数补码计算示例:如 15 与 - 15 数的表示流程。
数值 = 15 -> x =1111 -> [x]补 = 0,1111
数值 = -15 -> x = - 1111 -> [x]补 = 2^(4+1) + (- 1111) = 10 0000 - 1111 = 1 0001
八位补码形式:1111 0001
64位补码形式:1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 0001
正数的补码符号位为0;数值位为其真值
负数的补码符号位为1;数值位为其真值对应位求反后末位加1
反码表示法公式(原理)
\[[x]_反 = \left\{ \begin{array}{rcl} 0,x & { 2^n > x \geq 0} \\ (2^{n+1} -
1) +x & { 0 > x \geq -2^n } & (mod 2^{n+1} - 1)\\ \end{array} \right. \
其中x为真值,n为整数的位数 \]
\[[x]_反 = \left\{ \begin{array}{rcl} x & { 1 > x \geq 0} \\ (2 - 2^{-n}) +x
& { 0 \geq x > -1 } & (mod 2 - 2^{-n})\\ \end{array} \right. \
其中x为真值,n为小数的位数 \]
整数反码计算示例:如 15 与 - 15 数的表示流程。
数值 = 15 -> x = + 1111 -> [x]反 = 0,1111
数值 = -15 -> x = - 1111 -> [x]反 = ( 2^(4+1) - 1 ) + (- 1111) = 1 1111 - 1111 = 1 0000
八位反码形式:1111 0000
64位补码形式:1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 1111 0000
小数反码计算示例:求 - 13 / 64
的反码
-(8 + 4 + 1) / 64 = - ( 1⁄8 + 1⁄16 + 1⁄64) = -(2^3 + 2^4 + 2^6) = - (0.001101)2 = 1.110010 (反码)
解释:
1/8
= 2^-3 化为2进制为 (0.001)2 ,1/16
= 2^-4 化为2进制为(0.0001)2 ,1/64
= 2^-6 化为2进制为 (0.000001)2
正数的补码符号位为0;数值位为其真值
负数的补码符号位为1;数值位为其真值对应位求反
移码表示法公式(原理)
计算步骤:
整数移码计算示例:如 9 与 - 9 数的表示流程。
- x = + ( 1001 )2 , [x]补 = ( 0 1001 )2,[x]移 = ( 1 1001 )2
- x = - ( 1001 )2 , [x]反 = ( 1 0110 )2,[x]补 = ( 1 0111 )2,[x]移 = ( 0 0111 )2
举例,求 - 13 / 64 的补码
-13⁄64=(-0.001101)2,[x]反=1.110010 ,[x]补=1.110011 ,[x]移=0.110011
有整数和小数部分组合形成的数值
描述:十进制数转换为任意进制数 , 通常采用基数相乘法,对整数部分用除基取余法
,对小数部分用乘基取整法
,最后将整数和小数拼接在一起。
例如,将十进制数123.6875
转换成二进制数,最终结果为 (1111011.1011)2
# 整数部分 -> 除基取余法
123 % 2 = 1 # 最低位
61 % 2 = 1
30 % 2 = 0
15 % 2 = 1
7 % 2 = 1
3 % 2 = 1
1 % 2 = 1 # 最高位
# 结果 : 0111 1011 (八位寄存器,左边补0)
# 小数部分 -> 乘基取整法
0.6875 * 2 = 1 # 最高位
= 1.3750
0.3750 * 2 = 0
= 0.7500
0.7500 * 2 = 1
= 1.5000
0.5000 * 2 = 1 # 最低值
= 1.0000
# 结果 : 1011
温馨提示:小数和整数不一样,整数可以连续表示,但小数是离散的。二进制的小数只能表示 1/2, 1/4, ……, 1/2n
,
因此无法表示所有的十进制小数。
温馨提示:整数与小数的二进制最高位都在最左边。
而在将整数和小数转换成为八进制或者十二进制时,在转换时应以小数点为界。
整数部分:在从小数点开始往左数,将一串二进制数分为3位(八进制)一组或4位(十六进制)一组,在数的最左边可根据需要加“0”补齐;(左补齐)
小数部分,从小数点开始往右数,也将一串二进制分为3位一组或4位一组,在数的最右边也可以根据需要加“0”补齐。(右补齐)
最终使总的位数为3或4的整数倍,然后分别用对应的八进制数或十六进制数取代;
例: 将二进制数 1111000010.01101 分别转换为八进制数和十六进制数。
# 1111000010.01101 => 八进制
[00]1 111 000 010.011 01[0] # 左补齐两个00,右补齐一个0
1 7 0 2 3 2 => (1702.32)O
# 1111000010.01101 => 十六进制
[00]11 1100 0010.0110 1[000] # 左补齐两个00,右补齐三个000
3 C 2 6 8 => (3C2.68)H
三种机器数小结
,
(整数)或.
(小数)将数值部分和符号位隔开。按位取反
末尾加1就为补码,如果不加一就为反码。在任何语言中,文本的片断是用来表示该语言中某个意思的一系列的符号,而在计算机中可以用位模式来表示任何一个符号,例如
(A, B, C,…,Z)
来表示大写字母(a, b, c, •••, z)
表示小写字母,(0, 1, 2,…,9)
来表示数字字符(不是实际的数字,后面将看到它们的不同之处)(.,?,:,;,...,!)
来表示标点。(如空格、换行和制表符)
被用于文本的对齐和可读性。在一种语言中,位模式到底需要多少位来表示一个符号?
答: 这主要取决于该语言集中到底有多少不同的符号,即在一种语言中,表示某一符号的位模式的长度取决于该语言中所使用的符号的数量。更多的符号意味着更长的位模式。
例如,如果要创建的某个虚构的语言仅仅使用大写英文字母,则只需要26个符号,相应地这种语言的位模式至少需要表示26个符号,通常每个字母占用1字节。
例如,如果对于中文,可能需要更多的符号,通常每个文字占有2~4字节(与字符编码有关)。
位模式的长度与符号的数量关系是呈对数的(其表达式为:位模式长度 = log2符号数量),如果需要2个符号,位模式长度将是1位(log22=1),如果需要4个符号,位模式长度将是2位(log24=2).
代码与编码区别
现代计算机中常用的编码如下所示:
2^7=128
种不同的符号.2^32=4 294 967 296
个符号,该代码不同部分被分配用于表示来自世界上不同语言的符号,以及表示图像和特殊符号。(PS: 如今ASCII是Unicode的一部分)字节与字符的区别
现代计算机中不同编码占用的字节情况(考试中以及在开发中处理中文字符时会涉及):
符号:英文标点为一个字节,中文标点为两个字节。例如:英文句号占1个字节的大小,中文句号占2个字节的大小。
ASCII 码中,一个英文字母(不分大小写)为一个字节,一个中文汉字为两个字节。
Unicode 编码中,一个英文为一个字节,一个中文为两个字节。
UTF-8 编码中,一个英文字为一个字节,一个中文为三个字节。
UTF-16 编码中,一个英文字母字符或一个汉字字符存储都需要 2 个字节(Unicode 扩展区的一些汉字存储需要 4 个字节)。
UTF-32 编码中,世界上任何字符的存储都需要 4 个字节。
音频表示声音或音乐,它是随时间变化的实体,我们只能在每一时刻度量声音的密度。
音频本质上不同于数字与文本数据,音频是模拟数据的例子,即使我们能够在一段时间度量所有的值,也不能把它全部存在计算机内存中,因为可能需要无限数量的内存单元。
所以当我们讨论用计算机内存存储声音时,我们的意思是存储一个音频信号的密度,例如,每隔一段时间(一秒钟,一小时)来自麦克风的信号。
采样、量化、编码
计算机中要存储音频的需要进行采样、量化、编码
等关键操作步骤:
采样 : 我们需要在模拟信号上选择数量有限的点来度量它们的值并记录下来,例如上图中音频信号我们选择10 个样本,我们可以记录这些值来表现模拟信号。
Q: 下一个逻辑问题是我们每秒钟需要多少样本才能还原出原始信号的副本?
如果信号是平坦的,则需要很少的样本;如果信号变化剧烈,则需要更多的样本,所以说样本数量依赖于模拟信号中变化的最大数量。
采样率:通常每秒40 000个样本的釆样率对音频信号来说是足够好的。
量化 : 指的是将样本的值截取为最接近的整数值的一种过程(可以理解为四舍五入),从每个样本测量来的值是真实的数字, 为每个样本使用一个无符号的数(位模式)会更简便,所以需要针对其进行量化。
例如,如果实际的值为17.2,就可截取为17; 如果值为17.7,就可截取为18。
编码 :量化的样本值需要被编码成位模式,某一些系统为样本赋正值或负值,另一些仅仅移动曲线到正的区间从而只赋正值,换言之,一些系统使用无符号整数来表示样本,而另一些使用有符号的整数来做。
毎样本位: 对于每个样本系统需要决定分配多少位 ,每样本位的数量有时称为位深度,尽管在过去仅有8位分配给声音样本,现在每样本16、24甚至32位都是正常的。
位率:如果我们称位深度或每样本位的数量为B,每秒样本数为S,我们需要为每秒的音频存储SxB位,该乘积有时称为位率R。
例如,如果我们使用每秒40 000个样本以及每样本16 位,位率是R=40 000 x 16=640 000 b/s=640 KB/s。
声音编码标准
当今音频编码的主流标准是MP3 (MPEG Layer3的简写,它是用于视频压缩方法的MPEG (动态图像专家组)标准的一个修改版),除此之外还有AAC
、AC-3、AMR、WMA、ALAC、APE、FLAC、PCM、DSD、WAV、AIFF、MIDI
等主流音频编码格式解析。
aac,mp4,m4a
三种。(有损压缩).wma
, 但这种格式通常只能使用 Windows 自带的 MediaPlayer 来播放,与纯音频的媒体串流格式.ASF 类似。(无损压缩).flac
。(无损压缩).mid
。(无压缩)在计算机中存储图像使用两种不同的技术:光栅图或矢量图。
当我们需要存储模拟图像(如照片)时,就用到了光栅图(或位图),一张照片由模拟数据组成,不同的是数据密度(色彩)因空间变化,而不是因时间变化,同样需要针对其样本数据进行采样(扫描)。
样本称为像素(代表图像元素),换言之,整个图像被分成小的像素,每个像素假定有单独的密度值。
1.解析度 : 在图像处理中的扫描率称为解析度,如果解析率足够高,人眼不会看出在重现图像中的不连续。
2.色彩深度 :
用于表现像素的位的数量,即色彩深度,依赖于像素的颜色是如何由不同的编码技术来处理的,我们的眼睛有不同类型的感光细胞,一些响应红、黄、蓝
三原色(也叫RGB),
而另一些仅仅响应光的密度。
真彩色:用于像素编码的技术之一称为真彩色,它使用24位来编码一个像素(可以表达 16777216 种颜色),在该技术中每个三原色(RGB)都表示为8位,所以每种色彩都由0〜255之间的三维数字表示。
索引色:索引色(或调色板色)模式仅使用真彩色
里其中的一部分,因为真彩色模式使用了超过1600万种的颜色,许多应用程序不需要如此大的颜色范围,在该模式中每个应用程序从大的色彩集中选择一些颜色(通常是256种)并对其建立索引,对选中的颜色赋一个0〜255之间的值,对索引的使用减少了需要存储一个像素所需要的位的数量。(PS: 类似艺术家可能在他们的画室用到很多种颜色,但一次仅用到他们调色板中的一些。)
例如,真彩模式需要24位来储存一个像素,索引色模式通常使用256个索引,这需要8位来存储同样的像素。
例如,一部高质量的数码相机要用几乎3百万像素拍摄一张3X5英寸的相片。
真彩色模式存储所需要的位的数量:3 000 000 x 24 = 72 000 000
索引色模式存储所需要的位的数量:3 000 000 x 8 = 24 000 000
3.图像编码标准
在计算机中常用的图像编码的标准是JPEG、PNG、GIF等
JPEG (Joint Photographic Experts Group):是 JPEG 标准的产物,该标准由国际标准化组织(ISO)制订,是面向连续色调静止图像的一种压缩标准,使用真彩色模式,使用压缩图像来减少位的数量,常用格式后缀名为.jpg或.jpeg
PNG (Portable Network Graphics):便携式网络图形,是一种采用无损压缩算法的位图格式,支持索引、灰度、RGB三种颜色方案以及Alpha通道等特性.
GIF (Graphics Interchange Format):图形交换格式,它是一种位图,使用索引色模式。
温馨提示:光栅图有两个缺点,即文件体积太大和重新调整图像大小有麻烦,放大光栅图像意味着扩大像素,所以放大后的图像看上去很粗糙。
扩展知识: 一个字节8比特,像素通常表示位图(bitmap)中的一个点。
矢量图图像编码方法并不存储每个像素的位模式,一个图像被分解成几何图形的组合。
矢量图是由定义如何绘制这些形状的一系列命令构成的,当要显示或打印图像时,将图像的尺寸作为输入传给系统,于此同时系统会重新设计图像的大小并用相同的公式画出图像,所以每次绘制图像时公式也将重新估算一次,因此矢量图也称为几何模型或面向对象图形。
矢量图适合应用程序采用主要的几何元素来创建图像。它用于诸如Flash 这样的应用程序,以及创建TrueType (微软、苹果公司)和PostScript (Adobe 公司)字体,计算机辅助设计(CAD) 也使用矢量图进行工程绘图。
例如,线段、矩形或圆形,每个几何形状由数学公式表达。
例如,线段可以由它端点的坐标描述,圆可以由它的圆心坐标和半径长度来描述。
例如,使用矢量图绘制出半径为r的圆形,程序需要绘制该圆的主要信息如下:
温馨提示:当该圆的大小改变时,程序改变半径的值并重新计算这些信息以便再绘制一个圆,改变图像大小不会改变绘图的质量。
温馨提示:矢量图不适合存储照片图像的细微精妙,推荐使用JPEG 或GIF 光栅图提供了更好和更生动的图片。
视频是图像(称为帧)在时间上的表示,一部电影就是一系列的帧一张接一张地播放而形成运动的图像。换言之,视频是随空间(单个图像)和时间(一系列图像)变化的信息表现。
所以在计算机中我们也就知道如何储存视频,它将每一幅图像或帧转化成一系列位模式并储存,将这些图像组合起来就可表示视频。
温馨提示:现在视频通常是被压缩存储的,常常使用的*MPEG*
(Moving Picture Experts
Group,动态图像专家组)技术针对常视频进行压缩。
原文地址 : https://blog.weiyigeek.top/2022/6-2-694.html
本文至此完毕,更多技术文章,尽情期待下一章节!
专栏书写不易,如果您觉得这个专栏还不错的,请给这篇专栏 【点个赞、投个币、收个藏、关个注,转个发,留个言】(人间六大情) ,这将对我的肯定,谢谢!。
点击 👉 关注「 全栈工程师修炼指南」公众号
微信沟通交流: weiyigeeker (点击添加)
交流沟通群:629184198 或 关注公众号回复【学习交流群】
温馨提示: 由于作者水平有限,本章错漏缺点在所难免,希望读者批评指正,并请在文章末尾留下您宝贵的经验知识,联系邮箱地址 [email protected] 或者关注公众号 WeiyiGeek 联系我。
上一篇:软件开发项目文档系列之三如何撰写
下一篇:代码大全-如何建立一个高质量的子