• 回复
  • 收藏
  • 点赞
  • 分享
  • 发新帖

单片机代码执行效率的提高

1for循环采用 - - 方式

    C语言会生成汇编语言,而在汇编语言中,有一个不等于0的指令,for中使用 - - 的方式,在判断条件是否满足时,只使用一条汇编指令,而++的方式,要判断与某个值的大小,这在汇编中要使用多条指令。

    当然,不排除有一些编译器会自动将++for编译成 - - for

2、使用联合体进行位拆分

    对于32位的数据,要分出其中的四个字节,常用的方式,就是与运算。

而使用联合体与结构体的方式:

3、关键代码指定运行空间

    代码的运行空间是决定程序运行效率的一个关键因素。

    这里主要是指TIMCU,其他的DSP也是类似的。

    以其程序的运行在片内的RAM可以运行到其标称的150M或是200M,但是在Flash运行,则程序的执行速率只有6070M的样子,当然与代码的优化等级设置与具体的代码有关,但是从总体上来说,片上的RAM运行速率最高,Flash次之,外设的SRAM最低。

    那么可想而知,某些芯片标示的主频多高多高,而在实际使用时,往往受外设总线速度的限制,实际的运行速率是达不到的。

    其他的芯片,如果支持设置,原理应该也是相通的,要将关键代码,或是实时性要求比较高的算法,放在RAM中运行。

    如果你的芯片支持cache,那么要好好 利用了,效率可能会再高很多。

4、如果Flash允许,尽量使用静态函数,避免了调用函数时压栈出栈,速度快很多。 或者使用inline函数,使用容量换时间。

5、使用字节对齐。

    单片机内部的总线往往并不是8位的,而是32位或是更高位的,一些DSP内部总线也有256位或更高的。

    而每次只传输8位数据,其他的数据位空闲浪费,这时,使用字节对齐,可以提高内部总线的利用率,提高效率。

6、使用全局变量代替函数传递的参数。

    这种方式并不提倡,要仔细对变量的值进行维护,否则会有一些逻辑上的bug很难发现。

7、用乘法代替除法

    这种方式并没有统一性,只是有的地方可以使用,比如计算某变量的率时,分母往往都是同一个数值,这时,先计算分母的倒数,再用分子去乘,就避免了多次的除尘计算。

比如计算谐波时,要计算2~50次的谐波。

    这样,就把近50次的除法运算转成一次除法与多次乘法。

8、小数表达

    小数的表达,大多都是如下这样:

    这时,有的编译器会将其默认为double的,这样再运算时,计算时间自然就会变长。

    而使用如下表达时,而是单精度的,计算也会快一些,但是你的算法要求精度高时,那么还是使用双精度的吧。

9、函数调用越少越好

    这也是要看具体的代码了,如果重用代码量很高时,该嵌套还是要嵌套的。

10、习惯使用指针

    指针的方式,自然不用详说了,正确的使用,会使效率有很大的提高。

   以上只是个人在实际项目中的一些愚见、体会,其依据是在个人项目中的实践结果,并没有进行完善的理论认证。所以不对之处,烦请指教。

全部回复(6)
正序查看
倒序查看
2018-06-06 13:03
支持一下
0
回复
2018-06-06 13:15
加油加油
0
回复
2018-06-06 17:03
@电源网-璐璐
加油加油[图片]
感谢支持
0
回复
2018-06-06 17:08
@电源网-璐璐
加油加油[图片]
感谢支持
0
回复
appleY
LV.5
6
2018-06-22 20:10
字节拆分用指针不是更好?
0
回复
2018-06-27 08:29
@appleY
字节拆分用指针不是更好?
用指针可以
0
回复