快上网专注成都网站设计 成都网站制作 成都网站建设
成都网站建设公司服务热线:028-86922220

网站建设知识

十年网站开发经验 + 多家企业客户 + 靠谱的建站团队

量身定制 + 运营维护+专业推广+无忧售后,网站问题一站解决

javascript进位,javascript 位操作

js里面的~这个是运算符吗?

你好,有这样的运算,~是按位取反的操作,如:1的单字节二进制是00000001取反后就是11111110,最高位为符号位,转为成十进制就是-2.

铁山网站建设公司创新互联,铁山网站设计制作,有大型网站制作公司丰富经验。已为铁山近千家提供企业网站建设服务。企业网站搭建\外贸网站制作要多少钱,请找那个售后服务好的铁山做网站的公司定做!

下面这边文章来自:

有助于更好理解。

也可参阅

【数据结构知识点】中的 数据类型 ,地址:

【以下内容非本人原创,望对提问者有所帮助】

负数:

原码就是原来的表示方法

反码是除符号位(最高位)外取反

补码=反码+1

以前学习二进制编码时,老师讲了一堆堆的什么原码啊反码啊补码啊xxxx转换啊,还有负数的表示方式啊 总是记不零清,终于从网上找到了一种比较好的讲解方式,保存再share一下,不过为了系统化讲解,又找来了一些编码的基础知识,如果只想看负数编码记忆法,请跳转到

1.如果你不知道二进制怎么编码,请继续,否则请跳到2

1字节 = 8位,所以它能表示的最大数当然是8位都是1(既然2进制的数只能是0或1,如果是我们常见的10进制,那就8位都为9,这样说,你该懂了?)

1字节的二进制数中,最大的数:11111111。

这个数的大小是多少呢?让我们来把它转换为十进制数。

无论是什么进制,都是左边是高位,右边是低位。10进制是我们非常习惯的计数方式,第一位代表有几个1(即几个100),第二位代表有几个10(即几个101),第三位代表有几个100(即有几个102)…,用小学课本上的说法就是:个位上的数表示几个1,十位上的数表示向个10,百位上的数表示几个100……

同理可证,二进制数则是:第1位数表示几个1 (20),第2位数表示几个2(21),第3位数表示几个4(22),第4位数表示向个8(23)……

以前我们知道1个字节有8位,现在通过计算,我们又得知:1个字节可以表达的最大的数是255,也就是说表示0~255这256个数。

那么两个字节(双字节数)呢?双字节共16位。 1111111111111111,这个数并不大,但长得有点眼晕,从现在起,我们要学会这样来表达二制数:

1111 1111 1111 1111,即每4位隔一空格。

双字节数最大值为:

1 * 215 + 1 *214 + 1* 213 + 1 * 212 + 1 * 211 + 1 * 210 + …… + 1 * 22 + 1 * 21 + 1* 20 = 65535

    很自然,我们可以想到,一种数据类型允许的最大值,和它的位数有关。具体的计算方法方法是,如果它有n位,那么最大值就是:

n位二进制数的最大值:1 * 2(n-1) + 1 * 2(n-2) + ... + 1 * 20

2、理解有符号数和无符号数

负数在计算机中如何表示呢?这一点,你可能听过两种不同的回答。

一种是教科书,它会告诉你:计算机用“补码”表示负数。可是有关“补码”的概念一说就得一节课,这一些我们需要在第6章中用一章的篇幅讲2进制的一切。再者,用“补码”表示负数,其实一种公式,公式的作用在于告诉你,想得问题的答案,应该如何计算。却并没有告诉你为什么用这个公式就可以和答案? -----我就是被这个弄混淆的_

另一种是一些程序员告诉你的:用二进制数的最高位表示符号,最高位是0,表示正数,最高位是1,表示负数。这种说法本身没错,可是如果没有下文,那么它就是错的。至少它不能解释,为什么字符类型的-1用二进制表示是“1111 1111”(16进制为FF);而不是我们更能理解的“1000 0001”。(为什么说后者更好理解呢?因为既然说最高位是1时表示负数,那1000 0001不是正好是-1吗?-----re!当初偶就是这么想的,so一直在脑中打架,越打越混淆=,=)。

让我们从头说起。

2.1、你自已决定是否需要有正负。

就像我们必须决定某个量使用整数还是实数,使用多大的范围数一样,我们必须自已决定某个量是否需要正负。如果这个量不会有负值,那么我们可以定它为带正负的类型。

在计算机中,可以区分正负的类型,称为有符类型,无正负的类型(只有正值),称为无符类型。

数值类型分为整型或实型,其中整型又分为无符类型或有符类型,而实型则只有符类型。

字符类型也分为有符和无符类型。

比如有两个量,年龄和库存,我们可以定前者为无符的字符类型,后者定为有符的整数类型。

2、使用二制数中的最高位表示正负。

首先得知道最高位是哪一位?1个字节的类型,如字符类型,最高位是第7位,2个字节的数,最高位是第15位,4个字节的数,最高位是第31位。不同长度的数值类型,其最高位也就不同,但总是最左边的那位(如下示意)。字符类型固定是1个字节,所以最高位总是第7位。

(红色为最高位)

单字节数: 1111 1111

双字节数: 1111 1111 1111 1111

四字节数: 1111 1111 1111 1111 1111 1111 1111 1111

当我们指定一个数量是无符号类型时,那么其最高位的1或0,和其它位一样,用来表示该数的大小。

当我们指定一个数量是有符号类型时,此时,最高数称为“符号位”。为1时,表示该数为负值,为0时表示为正值。

 3、无符号数和有符号数的范围区别。

无符号数中,所有的位都用于直接表示该值的大小。有符号数中最高位用于表示正负,所以,当为正值时,该数的最大值就会变小。我们举一个字节的数值对比:

无符号数: 1111 1111   值:255 1* 27 + 1* 26 + 1* 25 + 1* 24 + 1* 23 + 1* 22 + 1* 21 + 1* 20

有符号数: 0111 1111   值:127         1* 26 + 1* 25 + 1* 24 + 1* 23 + 1* 22 + 1* 21 + 1* 20

  同样是一个字节,无符号数的最大值是255,而有符号数的最大值是127。原因是有符号数中的最高位被挪去表示符号了。并且,我们知道,最高位的权值也是最高的(对于1字节数来说是2的7次方=128),所以仅仅少于一位,最大值一下子减半。

不过,有符号数的长处是它可以表示负数。因此,虽然它的在最大值缩水了,却在负值的方向出现了伸展。我们仍一个字节的数值对比:

无符号数:                       0 ----------------- 255

有符号数:        -128 --------- 0 ---------- 127

 

同样是一个字节,无符号的最小值是 0 ,而有符号数的最小值是-128。所以二者能表达的不同的数值的个数都一样是256个。只不过前者表达的是0到255这256个数,后者表达的是-128到+127这256个数。

一个有符号的数据类型的最小值是如何计算出来的呢?

有符号的数据类型的最大值的计算方法完全和无符号一样,只不过它少了一个最高位(见第3点)。但在负值范围内,数值的计算方法不能直接使用1* 26 + 1* 25 的公式进行转换。在计算机中,负数除为最高位为1以外,还采用补码形式进行表达。所以在计算其值前,需要对补码进行还原。这里,先直观地看一眼补码的形式:

以我们原有的数学经验,在10进制中:1 表示正1,而加上负号:-1 表示和1相对的负值。

那么,我们会很容易认为在2进制中(1个字节): 0000 0001 表示正1,则高位为1后:1000 0001应该表示-1。

然而,事实上计算机中的规定有些相反,请看下表:

二进制值(1字节)     十进制值    

1000 0000红色的1代表负数蓝色的是补码(补码=反码+1)     -128    

1000 0001蓝色部分代表多大的值?:将补码还原为原码     -127想化成负数?:先减去1再按位取反    

1000 0010还原方法:补码-1再取反     -126    

1000 0011     -125    

...     ...    

1111 1110     -2    

1111 1111     -1    

 

首先我们看到,从-1到-128,其二进制的最高位都是1(表中标为红色),正如我们前面的学。

然后我们有些奇怪地发现,1000 0000 并没有拿来表示 -0;而1000 0001也不是拿来直观地表示-1。事实上,-1 用1111 1111来表示。

怎么理解这个问题呢?先得问一句是-1大还是-128大?

当然是 -1 大。-1是最大的负整数。以此对应,计算机中无论是字符类型,或者是整数类型,也无论这个整数是几个字节。它都用全1来表示 -1。比如一个字节的数值中:1111 1111表示-1,那么,1111 1111 - 1 是什么呢?和现实中的计算结果完全一致。1111 1111 - 1 = 1111 1110,而1111 1110就是-2。这样一直减下去,当减到只剩最高位用于表示符号的1以外,其它低位全为0时,就是最小的负值了,在一字节中,最小的负值是1000 0000,也就是-128。

--------小米批注:就是这部分蓝色的文字,让我终于能记清楚-1的编码方式了,汗=。=

我们以-1为例,来看看不同字节数的整数中,如何表达-1这个数:

字节数     二进制值     十进制值    

单字节数     1111 1111红色表示负数蓝色部分的补码为值1     -1    

负数:原码就是原来的表示方法、反码是除符号位(最高位)外取反、补码=反码+1双字节数     1111 1111 1111 1111     -1    

四字节数     1111 1111 1111 1111 1111 1111 1111 1111     -1    

可能有同学这时会混了:为什么 1111 1111 有时表示255,有时又表示-1?所以我再强调一下本节前面所说的第2点:你自已决定一个数是有符号还是无符号的。写程序时,指定一个量是有符号的,那么当这个量的二进制各位上都是1时,它表示的数就是-1;相反,如果事选声明这个量是无符号的,此时它表示的就是该量允许的最大值,对于一个字节的数来说,最大值就是255。

ok 摘抄暂告段落,其实原文对于c的一些基础数据类型知识介绍的非常详细,8过太长了,摘到我需要的内容后就没全帖过来,如果有需要学习的同学,建议参见原文:)

转自

关键字: 二进制编码,负数二进制,二进制

1-6 什么叫机器数?计算机为什么要采用补码?

2007-09-09 14:24:25

大 中 小

标签:教育杂谈

在计算机内部,所有信息都是用二进制数串的形式表示的。整数通常都有正负之分,计算机中的整数分为无符号的和带符号的。无符号的整数用来表示0和正整数,带符号的证书可以表示所有的整数。由于计算机中符号和数字一样,都必须用二进制数串来表示,因此,正负号也必须用0、1来表示。通常我们用最高的有效位来表示数的符号(当用8位来表示一个整数时,第8位即为最高有效位,当用16位来表示一个整数时,第16位即为最高有效位。)0表示正号、1表示负号,这种正负号数字化的机内表示形式就称为“机器数”,而相应的机器外部用正负号表示的数称为“真值”。将一个真值表示成二进制字串的机器数的过程就称为编码。

无符号数没有原码、反码和补码一说。只有带符号数才存在不同的编码方式。

带符号整数有原码、反码、补码等几种编码方式。原码即直接将真值转换为其相应的二进制形式,而反码和补码是对原码进行某种转换编码方式。正整数的原码、反码和补码都一样,负数的反码是对原码的除符号位外的其他位进行取反后的结果(取反即如果该位为0则变为1,而该位为1则变为0的操作)。而补码是先求原码的反码,然后在反码的末尾位加1 后得到的结果,即补码是反码+1。IBM-PC中带符号整数都采用补码形式表示。(注意,只是带符号的整数采用补码存储表示的,浮点数另有其存储方式。)

采用补码的原因或好处如下。

采用补码运算具有如下两个特征:

1)因为使用补码可以将符号位和其他位统一处理,同时,减法也可以按加法来处理,即如果是补码表示的数,不管是加减法都直接用加法运算即可实现。

2)两个用补码表示的数相加时,如果最高位(符号位)有进位,则进位被舍弃。

这样的运算有两个好处:

1)使符号位能与有效值部分一起参加运算,从而简化运算规则。从而可以简化运算器的结构,提高运算速度;(减法运算可以用加法运算表示出来。)

2)加法运算比减法运算更易于实现。使减法运算转换为加法运算,进一步简化计算机中运算器的线路设计。

下面深入分析上面所陈述的采用补码的原因(目的)。

用带符号位的原码进行乘除运算时结果正确,而在加减运算的时候就出现了问题,如下:假设字长为8bits

( 1 ) 10- ( 1 )10 = ( 1 )10 + ( -1 )10 = ( 0 )10

(00000001)原 + (10000001)原 = (10000010)原 = ( -2 ) 显然不正确.。

因为在两个整数的加法运算中是没有问题的,于是就发现问题出现在带符号位的负数身上,对除符号位外的其余各位逐位取反就产生了反码。反码的取值空间和原码相同且一一对应。下面是反码的减法运算:

( 1 )10 - ( 1 ) 10= ( 1 ) 10+ ( -1 ) 10= ( 0 )10

(00000001) 反+ (11111110)反 = (11111111)反 = ( -0 ) 有问题。

( 1 )10 - ( 2)10 = ( 1 )10 + ( -2 )10 = ( -1 )10

(00000001) 反+ (11111101)反 = (11111110)反 = ( -1 ) 正确

问题出现在(+0)和(-0)上,在人们的计算概念中零是没有正负之分的。

于是就引入了补码概念。负数的补码就是对反码加一,而正数不变,正数的原码反码补码是一样的。在补码中用(-128)代替了(-0),所以补码的表示范围为:

(-128~0~127)共256个。

注意:(-128)没有相对应的原码和反码, (-128) = (10000000) 补码的加减运算如下:

( 1 ) 10- ( 1 ) 10= ( 1 )10 + ( -1 )10 = ( 0 )10

(00000001)补 + (11111111)补 = (00000000)补 = ( 0 ) 正确

( 1 ) 10- ( 2) 10= ( 1 )10 + ( -2 )10 = ( -1 )10

(00000001) 补+ (11111110) 补= (11111111)补 = ( -1 ) 正确

采用补码表示还有另外一个原因,那就是为了防止0的机器数有两个编码。原码和反码表示的0有两种形式+0和-0,而我们知道,+0和-0是相同的。这样,8位的原码和反码表示的整数的范围就是-127~+127(11111111~01111111),而采用补码表示的时候,00000000是+0,即0;10000000不再是-0,而是-128,这样,补码表示的数的范围就是-128~+127了,不但增加了一个数得表示范围,而且还保证了0编码的唯一性。

整数和0的原码、反码和补码都相同,下面介绍手工快速求负数补码的方法。这个方法在教材的第8页已经提到了,这里再写出来以便能引起大家的注意。其方法如下:

先写出该负数的相反数(正数),再将该正数的二进制形式写出来,然后对这个二进制位串按位取反,即若是1则改为0,若是0则改为1,最后在末位加1。

接下来的问题是,如何能将减法运算转换成加法运算呢?

我们已经知道,原码表示简单直观,与真值转换容易。但如果用原码表示,其符号位不能参加运算。在计算机中用原码实现算术运算时,要取绝对值参加运算,符号位单独处理,这对乘除运算是很容易实现的,但对加减运算是非常不方便的,如两个异号数相加,实际是要做减法,而两个异号数相减,实际是要做加法。在做减法时,还要判断操作数绝对值的大小,这些都会使运算器的设计变得很复杂。而补码这种编码方式实际上正是针对上述问题的。通过用补码进行表示,就可以把减法运算化为加法运算。

在日常生活中,有许多化减为加的例子。例如,时钟是逢12进位,12点也可看作0点。当将时针从10点调整到5点时有以下两种方法:

一种方法是时针逆时针方向拨5格,相当于做减法:

10-5=5

另一种方法是时针顺时针方向拨7格,相当于做加法:

10+7=12+5=5    (MOD 12)

这是由于时钟以12 为模,在这个前提下,当和超过12时,可将12舍去。于是,减5相当于加7。同理,减4可表示成加8,减3可表示成加9,…。

在数学中,用“同余”概念描述上述关系,即两整数A、B用同一个正整数M (M称为模)去除而余数相等,则称A、B对M同余,记作:

A=B     (MOD M)

具有同余关系的两个数为互补关系,其中一个称为另一个的补码。当M=12时,-5和+7,-4和+8,-3和+9就是同余的,它们互为补码。

从同余的概念和上述时钟的例子,不难得出结论:对于某一确定的模,用某数减去小于模的另一个数,总可以用加上“模减去该数绝对值的差”来代替。因此,在有模运算中,减法就可以化作加法来做。

可以看出,补码的加法运算所依据的基本关系为:

[x]补+ [y]补= [x+y]补

补码减法所依据的基本关系式:

[x-y]补 =[x+(-y)]补= [x]补+ [-y]补

至于加法运算为什么比减法运算易于实现以及CPU如何实现各种算术运算等问题,则需要通过对数字电路的学习来理解CPU的运算器的硬件实现问题的相关内容了。

javascript 转换BCD码

二进制编码的十进制数,简称BCD码(Binarycoded Decimal). 这种方法是用4位二进制码的组合代表十进制数的0,1,2,3,4,5,6 ,7,8,9 十个数符。4位二进制数码有16种组合,原则上可任选其中的10种作为代码,分别代表十进制中的0,1,2,3,4,5,6,7,8,9 这十个数符。最常用的BCD码称为8421BCD码,8.4.2.1 分别是4位二进数的位取值。 点击此处将给出十进制数和8421BCD编码的对应关系表。

1、BCD码与十进制数的转换

BCD码与十进制数的转换.关系直观,相互转换也很简单,将十进制数75.4转换为BCD码如:

75.4=(0111 (0101.0100)BCD 若将BCD码1000 0101.0101转换为十进制数如: (1000 0101.0101)BCD=85.5

注意:同一个8位二进制代码表示的数,当认为它表示的是二进制数和认为它表示的是二进制编码的十进制数时,数值是不相同的。

例如:00011000,当把它视为二进制数时,其值为24;但作为2位BCD码时, 其值为18。

又例如00011100,如将其视为二进制数,其值为28,但不能当成BCD码,因为在8421BCD码中,它是个非法编码 .

2、BCD码的格式

计算机中的BCD码,经常使用的有两种格式,即分离BCD码,组合BCD码。

所谓分离BCD码,即用一个字节的低四位编码表示十进制数的一位,例如数82的存放格式为:

_ _ _1 0 0 0 _ _ _ _0 0 1 0 其中_表示无关值。

组合BCD码,是将两位十进制数,存放在一个字节中,例82的存放格式是1000 0010

3、BCD码的加减运算

由于编码是将每个十进制数用一组4位二进制数来表示,因此,若将这种BCD码直接交计算机去运算,由于

计算机总是把数当作二进制数来运算,所以结果可能会出错。例:用BCD码求38+49。

解决的办法是对二进制加法运算的结果采用"加6修正,这种修正称为BCD调整。即将二进制加法运算的结果修正为BCD码加法运算的结果,两个两位BCD数相加时,对二进制加法运算结果采用修正规则进行修正。修正规则:

(1)如果任何两个对应位BCD数相加的结果向高一位无进位,若得到的结果小于或等于9,则该不需修正;若得到的结果大于9且小于16时,该位进行加6修正。

(2)如果任何两个对应位BCD数相加的结果向高一位有进位时(即结果大于或等于16),该位进行加6修正.

(3)低位修正结果使高位大于9时,高位进行加6修正。

下面通过例题验证上述规则的正确性。

用BCD码求35+21 BCD码求25+37 用BCD码求38+49 用BCD码求42+95

用BCD码求91+83 用BCD码求94+7 用BCD码求76+45

两个组合BCD码进行减法运算时,当低位向高位有借位时,由于"借一作十六"与"借一作十"的差别,将比正确的结果多6,所以有借位时,可采用"减6修正法"来修正.两个BCD码进行加减时,先按二进制加减指令进行运算,再对结果用BCD调整指令进行调整,就可得到正确的十进制运算结果。 实际上,计算机中既有组合BCD数的调整指令,也有分离BCD数的调整指令。另外,BCD码的加减运算,也可以在运算前由程序先变换成二进制数,然后由计算机对二进制数运算处理,运算以后再将二进制数结果由程序转换为BCD码

这个应该还是比较详细滴

javascript中保留小数点后两位,第三位数字大于1时则进1

function test(a){

alert((parseFloat(a.toString()) +0.004).toFixed(2));

//加0.004是因为你是以第三位小数大于等于1来进位的,所以只要是第三个小数大于等于1时加上0.004那么他就会在toFixed(2)时自动四舍五入。这样就是你要得了

}

js 进一法进位,精确到一位小数该怎么写?

var a = 34.13;

a = Math.ceil(a*10);

alert(a);

a = a*1.0/10;

alert(a);

该方法采用的是ceil向上取整的方法。

首先将该数*10保证整数位,然后调用得到342,

接下来是要缩小到原来的十分之一,由于原来的类型是整数,所以要先转换成小数,因此*1.0;然后再除10,得到34.2

javascript的强制进位方法

代码如下,请测试看看~

html

head

script language="javascript"

function mytest(str,num){

var arrStr = str.split("\.");

var numLast = arrStr[1].length = num ?parseInt(arrStr[1]):parseInt(arrStr[1].substring(0,num))+1;

var strNum

numLast = numLast+"";

var arrNow = '';

//如果有进位了

if(numLast.lengthnum){

arrNow += (parseInt(arrStr[0])+1)+".";

for(var i=0;inum;i++){

arrNow += '0';

}

}else{

arrNow = parseInt(arrStr[0])+"."+numLast;

}

alert("arrNow="+arrNow);

}

/script

/head

body

input type="button" value="'156.92',1" onclick="mytest('156.92',2)";

input type="button" value="'156.999',2" onclick="mytest('156.999',2)";

input type="button" value="'222.22',2" onclick="mytest('222.22',2)";

input type="button" value="'333.93',2" onclick="mytest('333.93',2)";

input type="button" value="'2111.187',2" onclick="mytest('2111.187',2)";

/body

/html

js中0.1+0.2为什么不等于0.3

前两天看了小胡子哥写了一篇js中浮点数运算的一个比较特殊的 0.1+0.2 的问题, 揭秘 0.1 + 0.2 != 0.3 ,略感小胡子哥写的还是稍微粗略,于是查各种资料,将包括IEEE754关于浮点数二进制的只是又整理一下,做此记录。

上图是IEEE对浮点数表示的说明,这里分单精度与双精度之分,如下图:

对于单精度浮点数,采用32位存储,最高的1位是符号位s,接着的8位是指数E,剩下的23位为有效数字M。

对于双精度浮点数,采用64位存储,最高的1位是符号位S,接着的11位是指数E,剩下的52位为有效数字M。

在单精度浮点格式中,s、exp和frac字段分别为 1 位、k = 8 位和 n = 23 位,得到一个 32 位的表示。 在双精度浮点格式(C 语言中的 double)中,s、exp 和 frac 字段分别为 1 位、k = 11 位和 n = 52 位,得到一个 64 位的表示。

根据 exp 的值,被编码的值可以分成三种不同的情况(最后一种情况有两 个变种)。下图说明了对单精度格式的情况。

好了,下面我们重点关注一下情况1,并举例来看,不然实在头大啊。以单精度举例。

浮点数转换成二进制,我们要将整数部分和小数部分分开,整数部分采用除2取余,小数部分采用乘2取整。

例如,13.125 转换为二进制:

1.整数部分

逆序将余数拼上得到13的二进制:1101

2.小数部分

得到小数部分的二进制:0.001

两部分相加,得到13.125的二进制: 1101.001

好了,到现在,我们知道了如何将浮点数转换为二进制表示,也知道了IEEE中浮点数的存储方式,那么,我们接下来用13.125这个例子来看看计算机中具体是如何表示的呢。

二进制 1101.001 可以写成 1.101001 * 2^3 ,即这里 M 为 1.101001,E为3,s为0。

单精度下,符号位s即为0,阶码字段exp的值e=E+127,即e=3+127=130,130的二进制表示为 10000010

小数字段,frac为尾数M的二进制,即1.101001

那么,在单精度下,计算机中的表示为:

好了,关于浮点数转换二进制,以及浮点数的表示我们都知道了,那么,现在我们来看看,为什么 0.1+0.2!=0.3 的吧。首先,我们还是先看看js里到底输出多少吧:

于是,我们得到了0.1的二进制表示,即为 0.0001100110011(0011循环) ,即 1.100110011(0011)*2^-4

即,M 1.100110011(0011),E -4,

那么,s=0,e=-4+1023=1019,

那么,js中由于是双精度的,那么0.1的表示为:

0.2的二进制表示: 0.001100110011(0011循环) ,即 1.100110011(0011)*2^-3

那么,js双精度0.2的表示:

浮点数的加减运算一般由以下五个步骤完成:

将两个进行运算的浮点数的阶码对齐的操作。对阶的目的是为使两个浮点数的尾数能够进行加减运算。因为,当进行Mx·2Ex与My·2Ey加减运算时,只有使两浮点数的指数值部分相同,才能将相同的指数值作为公因数提出来,然后进行尾数的加减运算。

对阶的具体方法是:首先求出两浮点数阶码的差,即⊿E=Ex-Ey,将小阶码加上⊿E,使之与大阶码相等,同时将小阶码对应的浮点数的尾数右移相应位数,以保证该浮点数的值不变。几点注意:

(1)对阶的原则是小阶对大阶,之所以这样做是因为若大阶对小阶,则尾数的数值部分的高位需移出,而小阶对大阶移出的是尾数的数值部分的低位,这样损失的精度更小。

(2)若⊿E=0,说明两浮点数的阶码已经相同,无需再做对阶操作了。

(3)采用补码表示的尾数右移时,符号位保持不变。

(4)由于尾数右移时是将最低位移出,会损失一定的精度,为减少误差,可先保留若干移出的位,供以后舍入处理用。

尾数运算就是进行完成对阶后的尾数相加减。这里采用的就是我们前面讲过的纯小数的定点数加减运算。

在机器中,为保证浮点数表示的唯一性,浮点数在机器中都是以规格化形式存储的。对于IEEE754标准的浮点数来说,就是尾数必须是1.M的形式。由于在进行上述两个定点小数的尾数相加减运算后,尾数有可能是非规格化形式,为此必须进行规格化操作。 规格化操作包括左规和右规两种情况。 左规操作:将尾数左移,同时阶码减值,直至尾数成为1.M的形式。例如,浮点数0.0011·25是非规格化的形式,需进行左规操作,将其尾数左移3位,同时阶码减3,就变成1.1100·22规格化形式了。 右规操作:将尾数右移1位,同时阶码增1,便成为规格化的形式了。要注意的是,右规操作只需将尾数右移一位即可,这种情况出现在尾数的最高位(小数点前一位)运算时出现了进位,使尾数成为10.xxxx或11.xxxx的形式。例如,10.0011·25右规一位后便成为

1.00011·26的规格化形式了。

浮点运算在对阶或右规时,尾数需要右移,被右移出去的位会被丢掉,从而造成运算结果精度的损失。为了减少这种精度损失,可以将一定位数的移出位先保留起来,称为保护位,在规格化后用于舍入处理。 IEEE754标准列出了四种可选的舍入处理方法:

(1)就近舍入(round to nearest) 这是标准列出的默认舍入方式,其含义相当于我们日常所说的“四舍五入”。例如,对于32位单精度浮点数来说,若超出可保存的23位的多余位大于等于100…01,则多余位的值超过了最低可表示位值的一半,这种情况下,舍入的方法是在尾数的最低有效位上加1;若多余位小于等于011…11,则直接舍去;若多余位为100…00,此时再判断尾数的最低有效位的值,若为0则直接舍去,若为1则再加1。

(2)朝+∞舍入(round toward +∞) 对正数来说,只要多余位不为全0,则向尾数最低有效位进1;对负数来说,则是简单地舍去。

(3)朝-∞舍入(round toward -∞) 与朝+∞舍入方法正好相反,对正数来说,只是简单地舍去;对负数来说,只要多余位不为全0,则向尾数最低有效位进1。

(4)朝0舍入(round toward 0) 即简单地截断舍去,而不管多余位是什么值。这种方法实现简单,但容易形成累积误差,且舍入处理后的值总是向下偏差。

与定点数运算不同的是,浮点数的溢出是以其运算结果的阶码的值是否产生溢出来判断的。若阶码的值超过了阶码所能表示的最大正数,则为上溢,进一步,若此时浮点数为正数,则为正上溢,记为+∞,若浮点数为负数,则为负上溢,记为-∞;若阶码的值超过了阶码所能表示的最小负数,则为下溢,进一步,若此时浮点数为正数,则为正下溢,若浮点数为负数,则为负下溢。正下溢和负下溢都作为0处理。

0.1的阶码-4,0.2的阶码-3,对阶阶段,将0.1的阶码变为-3,然后0.1的尾数部分:

可能会有人问,这里最高位怎么是1,移位后不应该是0么,别忘了,尾数部分我们隐含了一个最高位是1的条件,因此,移位后,会将该位一并移过来。

将其与0.2的尾数部分进行相加:

注意,这里计算时,进位2位,去除原来最高位默认的1,相当于阶码部分加1,即由原来的-3变为-2,那么,阶码部分的表示:

而尾数部分,去除最高位1,最后一位1,进行舍入,得到52位新的二进制表示:

即,最后计算的结果如下:

该数表示的即0.1+0.2的结果 2^-2 * 1.0011001100110011001100110011001100110011001100110100

将其转换成十进制数为: 0.3000000000000000444089209850062616169452667236328125

由于精度问题,只取到 0.30000000000000004

到这里,就把所有的推演过程所需要的知识补充完整了,在推演的过程中,真心觉得,人工推演二进制真累啊,十分感谢计算机前辈,设计出方案并实践于计算机,感谢。


分享文章:javascript进位,javascript 位操作
浏览地址:http://6mz.cn/article/phscpo.html

其他资讯