功耗分析和优化
文件标识:RK-KF-YF-176
发布版本:V1.0.1
日期:2021-04-29
文件密级:□绝密 □秘密 □内部资料 ■公开
免责声明
本文档按“现状”提供,瑞芯微电子股份有限公司(“本公司”,下同)不对本文档的任何陈述、信息和内容的准确性、可靠性、完整性、适销性、特定目的性和非侵权性提供任何明示或暗示的声明或保证。本文档仅作为使用指导的参考。
由于产品版本升级或其他原因,本文档将可能在未经任何通知的情况下,不定期进行更新或修改。
商标声明
“Rockchip”、“瑞芯微”、“瑞芯”均为本公司的注册商标,归本公司所有。
本文档可能提及的其他所有注册商标或商标,由其各自拥有者所有。
版权所有 © 2021 瑞芯微电子股份有限公司
超越合理使用范畴,非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。
瑞芯微电子股份有限公司
Rockchip Electronics Co., Ltd.
地址: 福建省福州市铜盘路软件园A区18号
客户服务电话: +86-4007-700-590
客户服务传真: +86-591-83951833
客户服务邮箱: fae@rock-chips.com
前言
概述
本文档主要介绍 RK 平台芯片功耗的一些基础概念和优化方法。
产品版本
| 产品名称 | 内核版本 |
|---|---|
| 所有芯片 | 所有内核版本 |
读者对象
本文档(本指南)主要适用于以下工程师:
技术支持工程师
软件开发工程师
修订记录
| 版本号 | 作者 | 修改日期 | 修改说明 |
|---|---|---|---|
| V1.0.0 | 陈亮 | 2019-08-31 | 初始版本 |
| V1.0.1 | 黄莹 | 2021-04-29 | 修改格式,增加版权信息 |
目录
[TOC]
基础概念
频率(clk)和电压(voltage)
SoC 内部一般会包含很多模块,比如:ARM,GPU,DDR,I2C,SPI,USB 等,每个模块工作的时候,数字逻辑部分需要一个合适频率和对应的电压,模块频率越高,需要的电压也会越高,频率和电压是功耗的两个重要参数。
电压域 VD(voltage domain)和电源域 PD(power domain)
SoC 内部的各个模块,一般都有数字逻辑部分和 IO 部分,数字逻辑部分主要负责运算和状态控制,IO 部分主要负责接口信号传输(有些模块没有 IO,比如:ARM,GPU 等),数字逻辑和 IO 的供电一般都是分开的,IO 部分的功耗比较固定,而数字逻辑部分的功耗受频率和电压影响变化很大,为了优化功耗,把芯片内部数字逻辑部分按模块划分成电压域和电源域。
-
电压域表示芯片内部几个模块共同由一个外部电源供电的区域,可以独立调节或开关电压。一般运行电压相近,并且功耗不大的模块,可以放在同一个电压域中,但是如果功耗很大,最好独立一个电压域,方便做功耗管理,也避免峰值电流超过外部电源的限制。要保证所有的模块可以正常工作,需要把电压域的电压设置到对电压要求最高的模块所需要的电压(不包含关闭的模块)。
-
一个电压域里面可能包含很多个模块, 而这些模块一般不会同时工作,在有供电的情况下,不工作的模块存在漏电流(leakage),为了减小漏电流,通常会把一个电压域内部划分成几个区域, 每个区域可以独立开关(switch off)电源,某个区域关闭电源后,就与其他模块隔离(isolation),可以大大减小漏电流,这样的区域就叫做电源域。
以 RK3399 为例,有 6 个 VD:
- VD_CORE_B: 包含两个大核 Contex-A72,功耗比较大,所以独立一个电压域。
- VD_CORE_L: 包含四个小核 Contex-A53,功耗比较大,所以独立一个电压域。
- VD_LOGIC: 包含一些外设的控制器和系统总线,比如:USB,EMMC,GMAC,SPI,I2C,EDP,VOP,AXI,AHB,APB 等。
- VD_CENTER: 包含 vdpu,vepu,iep,rga 和 DDR 控制器。
- VD_GPU: 包含 GPU,功耗比较大,所以独立一个电压域。
- VD_PMU: 包含 PMU,SRAM,GPIO,PVTM 等涉及待机唤醒流程的模块。
框图如下:

DCDC(Direct Current)和 LDO(low dropout regulator)
SoC 的外部供电主要分为 DCDC 和 LDO 两种:
- DCDC 一般是指开关电源,转换效率高,效率能达到~80%~90%,电流较大时,需要用 DCDC 提高电源效率;
- LDO 主要特点是输入电流等于输出电流,所以电源效率就等于输出电压/输入电压,假设输入 3.8V,输出 1.0V,电源效率就是 1V/3.8V=26.3%, 电源效率低;
以 RK3126+RK816 的供电方案为例:
- RK816 的 4 路 BUCK 分别给 RK3126 的 ARM、LOG、DDR、IO 供电,因为这几路电流都比较大(BUCK 是一种降压型 DCDC);
- RK816 的 6 路 LDO 分别给 RK3126 的 PLL,PHY 和一些外设供电,这些模块的电流一般都比较小;
供电框图如下:

静态功耗和动态功耗
- 静态功耗是指 SoC 内部模块没有工作时,晶体管的泄露电流所消耗的功耗,静态功耗大小随温度和电压的升高而增大。
- 动态功耗是指 SoC 内部模块工作时,内部电路翻转所消耗的功耗,动态功耗大小随频率和电压的升高而增大。
动态功耗公式:
/* C是常量, V是电压, F是频率 */
P(d)= C * V^2 * F
DVFS(Dynamic Voltage and Frequency Scaling)、CPUFREQ 和 DEVFREQ
模块工作频率越高,电压越高,则功耗也越大,所以需要通过动态调整频率电压优化功耗,当系统空闲时,降低频率和电压,系统繁忙时,提高频率和电压。
- DVFS 是指动态调频调压的技术,作为 CPUFREQ 和 DEVFREQ 底层技术的实现;
- CPUFREQ 是指动态调节 CPU 频率的软件框架,包含几种不同的调频策略,细节请查看文档《Rockchip-Developer-Guide-Linux4.4-CPUFreq-CN》;
- DEVFREQ 是指动态调节外设(不包含 CPU)频率的软件框架,包含几种不同的调频策略,细节请查看《Rockchip-Developer-Guide-Linux4.4-Devfreq》;
功耗测量
优化功耗之前,需要把各路电源的电压和电流都测量出来,分析数据,然后再做对应的优化。
注:温度是影响功耗的一个重要参数,所以测量功耗的同时需要实时记录温度,获取温度的命令如下:
cat /sys/class/thermal/thermal_zone0/temp
测量方法
在电路上串联一个电阻 R,测量电阻两端的电压差 U, 则电流 I=U/R,一般电阻用 0.01 欧姆,需要根据电流大小调整电阻大小。 以 RK3399 EVB 板为例,采用电压测量法,在 VDD_CPU_B,VDD_CPU_L,VCC_1V8,VCC_DDR 输出端都串联了 0.01 欧姆电阻,如下图:

测量工具
由于需要测量的电源有很多路,使用多路电压电流采集器可以有效地提高测试效率。PowerMeterage 是 RockChip 开发的电压电流采集工具,可以同时测量 20 路功耗数据,界面如下:

PowerMeterage 硬件连接如下:

功耗数据分析
计算理论功耗
使用 PowerMeterage 工具,分解各路功耗,DCDC 按~80%-90%的效率折算到电池端,LDO 输出电流等于输入电流,把 DCDC,LDO 和其他电源都折算到电池端,加起来估算总功耗,如果和实测电池端的功耗相差太大,则可能存在漏电,需要进一步分析。
以 RK3326 EVB 板为例,静态桌面功耗数据如下:
注:各路测试结果需要折算到电池端(3.8V)的功耗,所以对比电池端的实测电流和理论电流会更方便。
| 类型 | 各路输出 | 电压(V) | 实测电流(mA) | 3.8V 端理论电流(mA) | 备注 |
|---|---|---|---|---|---|
| DC/DC | VDD_ARM | 0.96 | 10.20 | 3.23 | 按 80%效率, 换算公式:V * I / 效率 / 电池电压 |
| DC/DC | VDD_LOG | 0.96 | 89.30 | 28.20 | 例如:LOG 3.8V 端理论电流=0.96 * 89.3 / 0.8 / 3.8 = 28.2 |
| DC/DC | VCC_DDR | 1.26 | 38.50 | 15.91 | |
| DC/DC | VCC_IO | 2.99 | 4.50 | 4.43 | |
| LDO | VCC_1V8 | 1.81 | 28.80 | 28.80 | LDO 输出电流等输入电流 |
| LDO | VDD_1V0 | 1.00 | 10.90 | 10.90 | |
| LDO | VCC3V0_PMU | 3.01 | 1.20 | 1.20 | |
| 电池端 | VBAT | 3.81 | 94.60 | 92.67 | 理论值和实测值相近 |
对比 EVB 数据
分解的各路功耗数据,在相同场景下和 EVB 上的数据做对比,确认是否存在异常,比如下面是 RK3326 EVB 板和客户样机在静态桌面下的功耗对比,可以看出来客户板子的 ARM、LOG 两路功耗存在异常,需要进一步分析。
| 类型 | 各路输出 | EVB | 客户样机 | ||
|---|---|---|---|---|---|
| 电压(V) | 电流(mA) | 电压(V) | 电流(mA) | ||
| DC/DC | VDD_ARM | 0.96 | 10.20 | 1.10 | 212.50 |
| DC/DC | VDD_LOG | 0.96 | 89.30 | 1.00 | 151.30 |
| DC/DC | VCC_DDR | 1.26 | 38.50 | 1.27 | 40.50 |
| DC/DC | VCC_IO | 2.99 | 4.50 | 2.99 | 4.80 |
| LDO | VCC_1V8 | 1.81 | 28.80 | 1.81 | 29.80 |
| LDO | VDD_1V0 | 1.00 | 10.90 | 1.00 | 10.20 |
| LDO | VCC3V0_PMU | 3.01 | 1.20 | 3.01 | 1.40 |
| 电源端 | VBAT | 3.81 | 94.60 | 3.81 | 191.6 |
各路数据分析
VDD_CORE/VDD_CPU/VDD_ARM
这三个名字是指同一个电源,即:ARM 核心的电源,主要从以下几个方面分析功耗:
- 确认频率电压表(opp-table)是否正常,实测电压和设置电压是否一致。
相关的命令如下:
/* 获取频率电压表, target这一列表示某个频率需求的电压 */
cat /sys/kernel/debug/opp/opp_summary
device rate(Hz) target(uV) min(uV) max(uV)
-------------------------------------------------------------------
...
cpu0
408000000 950000 950000 1350000
600000000 950000 950000 1350000
816000000 1000000 1000000 1350000
1008000000 1125000 1125000 1350000
1200000000 1275000 1275000 1350000
1248000000 1300000 1300000 1350000
1296000000 1350000 1350000 1350000
/* 查看cpufreq当前使用的变频策略,默认的interactive策略cpu是变频的 */
cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor
interactive
/* 设置userspace策略定频cpu,然后设置不同频率,比较设置电压和实测电压 */
echo userspace > /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor
cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor
userspace
/* 查看cpufreq支持的频率点 */
cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_available_frequencies
408000 600000 816000 1008000 1200000 1248000 1296000
/* 设置定频的频率 */
echo 408000 > /sys/devices/system/cpu/cpu0/cpufreq/scaling_setspeed
/* 确认当前频率 */
cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_cur_freq
408000
/* 确认当前电压,并实测比较,vdd_arm表示regulator的名字,不同项目会有变化 */
cat /sys/kernel/debug/regulator/vdd_arm/voltage <
950000
/* 获取所有regulator当前的电压 */
cat /sys/kernel/debug/regulator/regulator_summary <
regulator use open bypass voltage current min max
-------------------------------------------------------------------------------
...
vcc3v8_sys 0 12 0 3800mV 0mA 3800mV 3800mV
deviceless 0mV 0mV
vdd_logic 0 4 0 950mV 0mA 950mV 1350mV
dmc 950mV 1350mV
ff400000.gpu 950mV 1350mV
bus-apll 950mV 1350mV
deviceless 0mV 0mV
vdd_arm 0 2 0 950mV 0mA 950mV 1350mV
cpu0 950mV 1350mV
deviceless 0mV 0mV
...
- 查看 cpu 负载,分析是否有异常的任务或中断。
/* 使用top命令查看任务负载,不同版本的top输出会有差异,此版本top支持查看线程和线程运行的cpu */
top -m 5 -t
User 51%, System 2%, IOW 0%, IRQ 0%
User 712 + Nice 0 + Sys 33 + Idle 634 + IOW 0 + IRQ 0 + SIRQ 0 = 1379
/* PR这一列表示线程当前运行的cpu,所有cpu的负载百分比加起来等于100%,所以每个cpu的最高的负载百分比为100%/NR_CPU,4核的SoC单个CPU最高负载百分比为25% */
PID TID PR CPU% S VSS RSS PCY UID Thread Proc
2631 2631 3 25% R 3104K 552K fg root busybox busybox
2632 2632 2 25% R 3104K 552K fg root busybox busybox
2633 2633 1 3% R 740K 400K fg root top /data/top
255 476 0 0% S 15492K 4988K fg system HwBinder:255_1 /vendor/bin/hw/android.hardware.sensors@1.0-service
419 478 1 0% S 3770752K 256884K fg system SensorService system_server
/* 使用cpustats观察cpu频率变化 */
cpustats
Total: User 600 + Nice 0 + Sys 3 + Idle 591 + IOW 0 + IRQ 0 + SIRQ 0 = 1194
408000kHz 0 +
600000kHz 0 +
816000kHz 0 +
1008000kHz 0 +
1200000kHz 0 +
1248000kHz 0 +
1296000kHz 0 +
1416000kHz 0 +
1512000kHz 1200 = 1200 /* 统计时间内,总共有1200个系统时间片(jiffies),1512M运行了1200个时间片 */
/* 下面可以看到每个cpu的负载情况,包括用户态,内核态,中断和空闲时间 */
cpu0: User 0 + Nice 0 + Sys 1 + Idle 294 + IOW 0 + IRQ 0 + SIRQ 0 = 295
cpu1: User 299 + Nice 0 + Sys 1 + Idle 0 + IOW 0 + IRQ 0 + SIRQ 0 = 300
cpu2: User 1 + Nice 0 + Sys 1 + Idle 296 + IOW 0 + IRQ 0 + SIRQ 0 = 298
cpu3: User 300 + Nice 0 + Sys 1 + Idle 0 + IOW 0 + IRQ 0 + SIRQ 0 = 301
/* 通过cpufreq节点查看各个频率运行时间的占比,时间单位:jiffies */
cat /sys/devices/system/cpu/cpu0/cpufreq/stats/time_in_state
408000 718186
600000 548
816000 368
1008000 1578
1200000 1104
1248000 84
1296000 101
1416000 678
1512000 47495
/* 查看所有外设的中断数量 */
cat /proc/interrupts
CPU0 CPU1 CPU2 CPU3
1: 0 0 0 0 GICv2 29 Edge arch_timer
2: 181898 165057 636772 839244 GICv2 30 Edge arch_timer
5: 180743 39000 28905 65189 GICv2 62 Level rk_timer
13: 260634 0 0 0 GICv2 39 Level ff180000.i2c
14: 354805 0 0 0 GICv2 40 Level ff190000.i2c
15: 0 0 0 0 GICv2 41 Level ff1a0000.i2c
...
VDD_GPU
VDD_GPU 的功耗主要是确认频率电压表是否正常,实测电压和设置电压是否一致,用的是 devfreq 节点。
注:有些芯片 GPU 模块没有独立的 VD,会把 GPU 放在 VDD_LOGIC 里面,这时候需要确认的则是 VDD_LOGIC 的电压是否正常。
/* 获取频率电压表 */
cat /sys/kernel/debug/opp/opp_summary
device rate(Hz) target(uV) min(uV) max(uV)
-------------------------------------------------------------------
...
platform-ff400000.gpu
200000000 950000 950000 950000
300000000 950000 950000 950000
400000000 1025000 1025000 1025000
480000000 1100000 1100000 1100000
520000000 1150000 1150000 1150000
...
/* 查看gpu devfreq当前使用的变频策略,默认的simple_ondemand策略gpu是变频的 */
cat /sys/class/devfreq/ff400000.gpu/governor
simple_ondemand
注:ff400000.gpu其中ff400000是gpu的寄存器地址,所以不同芯片这个name也会不同。
/* 设置userspace策略定频gpu,然后设置不同频率,比较设置电压和实测电压 */
echo userspace > /sys/class/devfreq/ff400000.gpu/governor
cat /sys/class/devfreq/ff400000.gpu/governor
userspace
/* 查看gpu devfreq支持的频率点 */
cat /sys/class/devfreq/ff400000.gpu/available_frequencies
520000000 480000000 400000000 300000000 200000000
/* 设置定频的频率 */
echo 200000000 > /sys/class/devfreq/ff400000.gpu/userspace/set_freq
/* 确认当前频率 */
cat /sys/class/devfreq/ff400000.gpu/cur_freq
200000000
/* 确认当前电压,并实测比较 */
cat /sys/kernel/debug/regulator/vdd_gpu/voltage
950000
/* 查看gpu的负载 */
cat /sys/class/devfreq/ff400000.gpu/load
0@200000000Hz
VDD_LOGIC
VDD_LOGIC 里面一般会包含很多模块,为了方便功耗管理,内部又会划分成很多个 PD,主要从以下几个方面分析功耗:
- 确认各个模块的运行频率和开关状态。
cat /sys/kernel/debug/clk/clk_summary
clock enable_cnt prepare_cnt rate accuracy phase
----------------------------------------------------------------------------------------
xin24m 9 10 24000000 0 0
...
pll_gpll 1 1 1200000000 0 0
gpll 9 20 1200000000 0 0
clk_sdio_div50 1 1 100000000 0 0
clk_sdio 1 5 100000000 0 0
sdio_sample 0 1 50000000 0 0
sdio_drv 0 1 50000000 0 180
clk_emmc_div50 1 1 300000000 0 0
clk_emmc 1 5 300000000 0 0
emmc_sample 0 1 150000000 0 42
emmc_drv 0 1 150000000 0 180
...
- 确认各个 PD 的开关状态。
cat /sys/kernel/debug/pm_genpd/pm_genpd_summary <
domain status slaves
/device runtime status
----------------------------------------------------------------------
pd_gpu off
/devices/platform/ff400000.gpu suspended
pd_vi off
/devices/platform/ff4a8000.iommu suspended
pd_vo on
/devices/platform/ff460f00.iommu active
/devices/platform/ff470f00.iommu suspended
/devices/platform/ff2e0000.video-phy suspended
/devices/platform/ff450000.dsi active
/devices/platform/ff460000.vop active
/devices/platform/ff470000.vop suspended
/devices/platform/ff480000.rk_rga suspended
pd_vpu off
/devices/platform/ff440440.iommu suspended
/devices/platform/ff442800.iommu suspended
/devices/platform/vpu_combo suspended
pd_mmc_nand on
/devices/platform/ff380000.dwmmc unsupported
/devices/platform/ff390000.dwmmc unsupported
/devices/platform/ff3b0000.nandc active
pd_gmac off
pd_sdcard off
pd_usb on
/devices/platform/ff300000.usb active
- DDR 模块一般会放在 VDD_LOGIC 里面,并且 DDR 模块功耗较大,和 GPU 一样使用 devfreq 策略优化功耗,所以需要确认频率电压表和实测电压。DDR 还有一些低功耗的配置,比如,pd_idle,sr_idle,odt 开关和其他一些 timing 配置,调试流程比较复杂,需要参考详细的 DDR 文档。
cat /sys/kernel/debug/opp/opp_summary
device rate(Hz) target(uV) min(uV) max(uV)
-------------------------------------------------------------------
platform-dmc
194000000 950000 950000 950000
328000000 950000 950000 950000
450000000 950000 950000 950000
528000000 975000 975000 975000
666000000 1000000 1000000 1000000
...
/* ddr默认使用dmc_ondemand变频策略 */
cat /sys/class/devfreq/dmc/governor
dmc_ondemand
其他设置频率和电压的命令与GPU devfreq一样。
VCC_DDR
VCC_DDR 主要是给 DDR 颗粒和 SoC 上 DDR-IO 部分供电,影响 VCC_DDR 功耗的参数有:DDR 频率,DDR 的负载,DDR 低功耗配置,DDR 颗粒类型等。相同条件下,不同厂商的 DDR 颗粒,功耗可能也会有很大的差异。
VCC_IO
VCC_IO 主要是给 SoC 上的 IO Pad 和一些外设供电,主要从以下几个方面分析功耗:
- 外设模块的工作状态,是否存在漏电。
- SoC 上的 IO 管脚状态是否与外设匹配,比如,IO 输出高,而接的外设管脚是低电平。
常见场景分析
静态桌面
主要是显示模块在工作,CPU,GPU,DDR 应该降到最低频率,并且进入低功耗状态,VDD_CPU,VDD_GPU,VDD_LOGIC 都调到 opp-table 的最低电压,确认 clk_summary,pm_genpd_summary 的状态,确认外设模块(WIFI、BT 等)都处于关闭状态。静态桌面一般作为其他场景功耗的基础,所以需要优先把功耗调到最优状态。
视频播放
主要是视频解码器(VPU/RKVDEC)在工作,GPU 一般处于关闭状态,重点确认 DDR 的运行频率和 VDD_LOGIC 的电压是否正常。
游戏
主要是 CPU 和 GPU 在工作,重点分析 CPU 和 GPU 的负载,频率变化,VDD_CPU 和 VDD_GPU 的电压是否正常。
二级待机
一般情况下,VDD_CPU 和 VDD_GPU 会关闭电源,VDD_LOG 只保留部分唤醒模块供电,所以重点分析 IO,DDR 颗粒和一些外设的功耗。
功耗优化策略
CPU 优化
- 调整 cpufreq 参数。
/* 默认使用的是interactive变频策略,相关参数如下: */
ls -l /sys/devices/system/cpu/cpu0/cpufreq/interactive
go_hispeed_load /* 负载大于go_hispeed_load且频率小于hispeed_freq时,直接跳到hispeed_freq */
hispeed_freq /* 从低频跳转到高频时,需要先跳到hispeed_freq过渡 */
above_hispeed_delay /* 频率大于hispeed_freq时,每次提频前需要维持的时间 */
min_sample_time /* 每次提频后,如果下一个频率是降频,降频前需要维持的时间 */
target_loads /* 变频的目标负载 */
timer_rate /* 负载采样时间,单位:us */
timer_slack /* cpu进入idle后的负载采样时间 */
boost /* 频率小于hispeed_freq时,持续boost到hispeed_freq */
boostpulse /* 频率小于hispeed_freq时,boost到hispeed_freq,维持一段时间 */
boostpulse_duration /* boostpulse维持的时间,单位:us */
io_is_busy /* io等待是否计算到cpu负载 */
我们主要调整hispeed_freq,target_loads,timer_rate这三个参数:
hispeed_freq:选择一个合适的过渡频率,让cpu稳定在中间频率,功耗最优,这个值太大或太小都会造成cpu容易跳到高频,增加功耗。
target_loads:加大后更容易跑低频,功耗下降,性能也会下降。
timer_rate:加大后更容易跑低频,功耗下降,性能也会下降。
- 关闭部分 cpu,限制 cpu 最高频率。
/* 关闭cpu2,cpu3 */
echo 0 > /sys/devices/system/cpu/cpu2/online
echo 0 > /sys/devices/system/cpu/cpu3/online
/* 限制cpu0最高跑1200MHz */
echo 1200000 > /sys/devices/system/cpu/cpu0/cpufreq/scaling_max_freq
- ARM Big-Little 架构的 SoC,可以通过 CPUSET,把高负载的任务绑定在小核上,小核能效比更高。
注:对于 SMP 架构的 SoC,也可以把任务集中绑定在某些 cpu 上,让其他 cpu 可以进入低功耗状态,但是可能会导致 cpu 容易跑高频,功耗反而上升。
/* 创建小核分组 */
mkdir /dev/cpuset/little
/* 设置小核分组允许使用的cpu */
echo 0-3 > /dev/cpuset/little/cpus
/* 把pid=1111的任务加入到小核分组 */
echo 1111 > /dev/cpuset/little/tasks
/* Android系统,默认会创建几个分组,框架层把任务分类到不同的分组,可以调整每个分组的cpus,分析功耗 */
ls /dev/cpuset
background /* 后台任务 */
foreground /* 前景任务 */
system-background /* 系统级后台任务 */
top-app /* 前景的焦点任务 */
- 通过 CPUCTL 限制高负载任务使用 cpu 的带宽(需要打开 CONFIG_CFS_BANDWIDTH 宏)。
/* 创建带宽限制分组 */
mkdir /dev/cpuctl/mygroup
/* 设置带宽限制的周期为10ms */
echo 10000 > /dev/cpuctl/mygroup/cpu.cfs_quota_us
/* 每个周期内,组内任务运行总时间不能超过5ms,这个值可以大于cfs_quota_us,因为是多个cpu运行时间总和 */
echo 5000 > /dev/cpuctl/mygroup/cpu.cfs_period_us
/* 把相关任务加入分组 */
echo 1111 > /dev/cpuctl/mygroup/tasks
echo 1112 > /dev/cpuctl/mygroup/tasks
/* cpu.shares表示通过权重限制任务的带宽,用于性能优化,不会影响功耗 */
/dev/cpuctl/mygroup/cpu.shares
DDR 优化
- 场景变频:不同场景配置不同 DDR 频率,4K 视频,录像,双屏显示等。
/* 场景定义 */
include/dt-bindings/clock/rk_system_status.h
#define SYS_STATUS_NORMAL (1<<0)
#define SYS_STATUS_SUSPEND (1<<1)
#define SYS_STATUS_IDLE (1<<2)
#define SYS_STATUS_REBOOT (1<<3)
#define SYS_STATUS_VIDEO_4K (1<<4)
#define SYS_STATUS_VIDEO_1080P (1<<5)
...
/* dts配置不同场景的频率 */
arch/arm64/boot/dts/rockchip/px30.dtsi
dmc: dmc {
compatible = "rockchip,px30-dmc";
...
system-status-freq = <
/*system status freq(KHz)*/
SYS_STATUS_NORMAL 528000
SYS_STATUS_REBOOT 450000
SYS_STATUS_SUSPEND 194000
SYS_STATUS_VIDEO_1080P 450000
SYS_STATUS_BOOST 528000
SYS_STATUS_ISP 666000
SYS_STATUS_PERFORMANCE 666000
>;
...
/* 获取当前系统处于哪个场景 */
cat /sys/class/devfreq/dmc/system_status
0x401
- 负载变频:监控负载,自动调整 DDR 频率,负载变频可能会导致性能下降,可以结合场景变频,在某些场景下,固定 DDR 频率。
/* dts配置负载变频参数,需要打开dfi节点监控DDR利用率 */
dmc: dmc {
compatible = "rockchip,px30-dmc";
...
/* 通过dfi监控DDR的利用率 */
devfreq-events = <&dfi>;
/*
* 调频阀值:
* 当利用率超过40%时,调到最高频,
* 当负载小于40%且大于40%-20%是维持当前频率
* 当负载小于40%-20%,会调到一个频率,使得负载差不多为40%-2%/2。
*/
upthreshold = <40>;
downdifferential = <20>;
/* 查看当前系统DDR的负载 */
cat /sys/class/devfreq/dmc/load <
33@528000000Hz
- DDR DEVFREQ 更详细的配置和优化请查看文档《Rockchip-Developer-Guide-Linux4.4-Devfreq》。
温控优化
当温度升高到一定程度时,功耗会急剧上升,并且在高压的情况下,表现更明显。
- 改善硬件散热条件。
- 优化软件温控策略,避免温度波动太大。
- 通过软件限制,避免高温时,同时出现高压。
&cpu0_opp_table {
/* 温度超过85度的时候,限制cpu最高电压为1.1V */
rockchip,high-temp = <85000>;
rockchip,high-temp-max-volt = <1100000>;
/* 或者直接通过限制最高主频来避免高压 */
rockchip,high-temp-max-freq = <1008000>;
};
电源优化
- 降压电路,压降和电流较大时,建议使用 DCDC,提高效率,减小功耗。
例如: 输入 3.3V,输出 1.0V-50mA
| 电源类型 | 输入电流 | 功耗 |
|---|---|---|
| LDO | 50mA | 165mW |
| DCDC(按 80%效率) | 18.9mA | 62.4mW |