跳到主要内容

功耗分析和优化

文件标识:RK-KF-YF-176

发布版本:V1.0.1

日期:2021-04-29

文件密级:□绝密 □秘密 □内部资料 ■公开

免责声明

本文档按“现状”提供,瑞芯微电子股份有限公司(“本公司”,下同)不对本文档的任何陈述、信息和内容的准确性、可靠性、完整性、适销性、特定目的性和非侵权性提供任何明示或暗示的声明或保证。本文档仅作为使用指导的参考。

由于产品版本升级或其他原因,本文档将可能在未经任何通知的情况下,不定期进行更新或修改。

商标声明

“Rockchip”、“瑞芯微”、“瑞芯”均为本公司的注册商标,归本公司所有。

本文档可能提及的其他所有注册商标或商标,由其各自拥有者所有。

版权所有 © 2021 瑞芯微电子股份有限公司

超越合理使用范畴,非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。

瑞芯微电子股份有限公司

Rockchip Electronics Co., Ltd.

地址: 福建省福州市铜盘路软件园A区18号

网址: www.rock-chips.com

客户服务电话: +86-4007-700-590

客户服务传真: +86-591-83951833

客户服务邮箱: fae@rock-chips.com


前言

概述

本文档主要介绍 RK 平台芯片功耗的一些基础概念和优化方法。

产品版本

产品名称内核版本
所有芯片所有内核版本

读者对象

本文档(本指南)主要适用于以下工程师:

技术支持工程师

软件开发工程师

修订记录

版本号作者修改日期修改说明
V1.0.0陈亮2019-08-31初始版本
V1.0.1黄莹2021-04-29修改格式,增加版权信息

目录

[TOC]


基础概念

频率(clk)和电压(voltage)

SoC 内部一般会包含很多模块,比如:ARM,GPU,DDR,I2C,SPI,USB 等,每个模块工作的时候,数字逻辑部分需要一个合适频率和对应的电压,模块频率越高,需要的电压也会越高,频率和电压是功耗的两个重要参数。

电压域 VD(voltage domain)和电源域 PD(power domain)

SoC 内部的各个模块,一般都有数字逻辑部分和 IO 部分,数字逻辑部分主要负责运算和状态控制,IO 部分主要负责接口信号传输(有些模块没有 IO,比如:ARM,GPU 等),数字逻辑和 IO 的供电一般都是分开的,IO 部分的功耗比较固定,而数字逻辑部分的功耗受频率和电压影响变化很大,为了优化功耗,把芯片内部数字逻辑部分按模块划分成电压域和电源域。

  • 电压域表示芯片内部几个模块共同由一个外部电源供电的区域,可以独立调节或开关电压。一般运行电压相近,并且功耗不大的模块,可以放在同一个电压域中,但是如果功耗很大,最好独立一个电压域,方便做功耗管理,也避免峰值电流超过外部电源的限制。要保证所有的模块可以正常工作,需要把电压域的电压设置到对电压要求最高的模块所需要的电压(不包含关闭的模块)。

  • 一个电压域里面可能包含很多个模块, 而这些模块一般不会同时工作,在有供电的情况下,不工作的模块存在漏电流(leakage),为了减小漏电流,通常会把一个电压域内部划分成几个区域, 每个区域可以独立开关(switch off)电源,某个区域关闭电源后,就与其他模块隔离(isolation),可以大大减小漏电流,这样的区域就叫做电源域。

以 RK3399 为例,有 6 个 VD:

  • VD_CORE_B: 包含两个大核 Contex-A72,功耗比较大,所以独立一个电压域。
  • VD_CORE_L: 包含四个小核 Contex-A53,功耗比较大,所以独立一个电压域。
  • VD_LOGIC: 包含一些外设的控制器和系统总线,比如:USB,EMMC,GMAC,SPI,I2C,EDP,VOP,AXI,AHB,APB 等。
  • VD_CENTER: 包含 vdpu,vepu,iep,rga 和 DDR 控制器。
  • VD_GPU: 包含 GPU,功耗比较大,所以独立一个电压域。
  • VD_PMU: 包含 PMU,SRAM,GPIO,PVTM 等涉及待机唤醒流程的模块。

框图如下:

rk3399_vd_pd.png

DCDC(Direct Current)和 LDO(low dropout regulator)

SoC 的外部供电主要分为 DCDC 和 LDO 两种:

  • DCDC 一般是指开关电源,转换效率高,效率能达到~80%~90%,电流较大时,需要用 DCDC 提高电源效率;
  • LDO 主要特点是输入电流等于输出电流,所以电源效率就等于输出电压/输入电压,假设输入 3.8V,输出 1.0V,电源效率就是 1V/3.8V=26.3%, 电源效率低;

以 RK3126+RK816 的供电方案为例:

  • RK816 的 4 路 BUCK 分别给 RK3126 的 ARM、LOG、DDR、IO 供电,因为这几路电流都比较大(BUCK 是一种降压型 DCDC);
  • RK816 的 6 路 LDO 分别给 RK3126 的 PLL,PHY 和一些外设供电,这些模块的电流一般都比较小;

供电框图如下:

rk3126_rk816.png

静态功耗和动态功耗

  • 静态功耗是指 SoC 内部模块没有工作时,晶体管的泄露电流所消耗的功耗,静态功耗大小随温度和电压的升高而增大。
  • 动态功耗是指 SoC 内部模块工作时,内部电路翻转所消耗的功耗,动态功耗大小随频率和电压的升高而增大。
动态功耗公式:
/* C是常量, V是电压, F是频率 */
P(d)= C * V^2 * F

DVFS(Dynamic Voltage and Frequency Scaling)、CPUFREQ 和 DEVFREQ

模块工作频率越高,电压越高,则功耗也越大,所以需要通过动态调整频率电压优化功耗,当系统空闲时,降低频率和电压,系统繁忙时,提高频率和电压。

  • DVFS 是指动态调频调压的技术,作为 CPUFREQ 和 DEVFREQ 底层技术的实现;
  • CPUFREQ 是指动态调节 CPU 频率的软件框架,包含几种不同的调频策略,细节请查看文档《Rockchip-Developer-Guide-Linux4.4-CPUFreq-CN》;
  • DEVFREQ 是指动态调节外设(不包含 CPU)频率的软件框架,包含几种不同的调频策略,细节请查看《Rockchip-Developer-Guide-Linux4.4-Devfreq》;

功耗测量

优化功耗之前,需要把各路电源的电压和电流都测量出来,分析数据,然后再做对应的优化。

注:温度是影响功耗的一个重要参数,所以测量功耗的同时需要实时记录温度,获取温度的命令如下:

cat /sys/class/thermal/thermal_zone0/temp

测量方法

在电路上串联一个电阻 R,测量电阻两端的电压差 U, 则电流 I=U/R,一般电阻用 0.01 欧姆,需要根据电流大小调整电阻大小。 以 RK3399 EVB 板为例,采用电压测量法,在 VDD_CPU_B,VDD_CPU_L,VCC_1V8,VCC_DDR 输出端都串联了 0.01 欧姆电阻,如下图:

rk3399_rk808.png

测量工具

由于需要测量的电源有很多路,使用多路电压电流采集器可以有效地提高测试效率。PowerMeterage 是 RockChip 开发的电压电流采集工具,可以同时测量 20 路功耗数据,界面如下:

powerme.png

PowerMeterage 硬件连接如下:

powerme1.png

功耗数据分析

计算理论功耗

使用 PowerMeterage 工具,分解各路功耗,DCDC 按~80%-90%的效率折算到电池端,LDO 输出电流等于输入电流,把 DCDC,LDO 和其他电源都折算到电池端,加起来估算总功耗,如果和实测电池端的功耗相差太大,则可能存在漏电,需要进一步分析。

以 RK3326 EVB 板为例,静态桌面功耗数据如下:

注:各路测试结果需要折算到电池端(3.8V)的功耗,所以对比电池端的实测电流和理论电流会更方便。

类型各路输出电压(V)实测电流(mA)3.8V 端理论电流(mA)备注
DC/DCVDD_ARM0.9610.203.23按 80%效率, 换算公式:V * I / 效率 / 电池电压
DC/DCVDD_LOG0.9689.3028.20例如:LOG 3.8V 端理论电流=0.96 * 89.3 / 0.8 / 3.8 = 28.2
DC/DCVCC_DDR1.2638.5015.91
DC/DCVCC_IO2.994.504.43
LDOVCC_1V81.8128.8028.80LDO 输出电流等输入电流
LDOVDD_1V01.0010.9010.90
LDOVCC3V0_PMU3.011.201.20
电池端VBAT3.8194.6092.67理论值和实测值相近

对比 EVB 数据

分解的各路功耗数据,在相同场景下和 EVB 上的数据做对比,确认是否存在异常,比如下面是 RK3326 EVB 板和客户样机在静态桌面下的功耗对比,可以看出来客户板子的 ARM、LOG 两路功耗存在异常,需要进一步分析。

类型各路输出EVB客户样机
电压(V)电流(mA)电压(V)电流(mA)
DC/DCVDD_ARM0.9610.201.10212.50
DC/DCVDD_LOG0.9689.301.00151.30
DC/DCVCC_DDR1.2638.501.2740.50
DC/DCVCC_IO2.994.502.994.80
LDOVCC_1V81.8128.801.8129.80
LDOVDD_1V01.0010.901.0010.20
LDOVCC3V0_PMU3.011.203.011.40
电源端VBAT3.8194.603.81191.6

各路数据分析

VDD_CORE/VDD_CPU/VDD_ARM

这三个名字是指同一个电源,即:ARM 核心的电源,主要从以下几个方面分析功耗:

  • 确认频率电压表(opp-table)是否正常,实测电压和设置电压是否一致。

相关的命令如下:

/* 获取频率电压表, target这一列表示某个频率需求的电压 */
cat /sys/kernel/debug/opp/opp_summary
device rate(Hz) target(uV) min(uV) max(uV)
-------------------------------------------------------------------
...
cpu0
408000000 950000 950000 1350000
600000000 950000 950000 1350000
816000000 1000000 1000000 1350000
1008000000 1125000 1125000 1350000
1200000000 1275000 1275000 1350000
1248000000 1300000 1300000 1350000
1296000000 1350000 1350000 1350000

/* 查看cpufreq当前使用的变频策略,默认的interactive策略cpu是变频的 */
cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor
interactive

/* 设置userspace策略定频cpu,然后设置不同频率,比较设置电压和实测电压 */
echo userspace > /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor
cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor
userspace

/* 查看cpufreq支持的频率点 */
cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_available_frequencies
408000 600000 816000 1008000 1200000 1248000 1296000

/* 设置定频的频率 */
echo 408000 > /sys/devices/system/cpu/cpu0/cpufreq/scaling_setspeed

/* 确认当前频率 */
cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_cur_freq
408000

/* 确认当前电压,并实测比较,vdd_arm表示regulator的名字,不同项目会有变化 */
cat /sys/kernel/debug/regulator/vdd_arm/voltage <
950000

/* 获取所有regulator当前的电压 */
cat /sys/kernel/debug/regulator/regulator_summary <
regulator use open bypass voltage current min max
-------------------------------------------------------------------------------
...
vcc3v8_sys 0 12 0 3800mV 0mA 3800mV 3800mV
deviceless 0mV 0mV
vdd_logic 0 4 0 950mV 0mA 950mV 1350mV
dmc 950mV 1350mV
ff400000.gpu 950mV 1350mV
bus-apll 950mV 1350mV
deviceless 0mV 0mV
vdd_arm 0 2 0 950mV 0mA 950mV 1350mV
cpu0 950mV 1350mV
deviceless 0mV 0mV
...
  • 查看 cpu 负载,分析是否有异常的任务或中断。
/* 使用top命令查看任务负载,不同版本的top输出会有差异,此版本top支持查看线程和线程运行的cpu */
top -m 5 -t
User 51%, System 2%, IOW 0%, IRQ 0%
User 712 + Nice 0 + Sys 33 + Idle 634 + IOW 0 + IRQ 0 + SIRQ 0 = 1379

/* PR这一列表示线程当前运行的cpu,所有cpu的负载百分比加起来等于100%,所以每个cpu的最高的负载百分比为100%/NR_CPU,4核的SoC单个CPU最高负载百分比为25% */
PID TID PR CPU% S VSS RSS PCY UID Thread Proc
2631 2631 3 25% R 3104K 552K fg root busybox busybox
2632 2632 2 25% R 3104K 552K fg root busybox busybox
2633 2633 1 3% R 740K 400K fg root top /data/top
255 476 0 0% S 15492K 4988K fg system HwBinder:255_1 /vendor/bin/hw/android.hardware.sensors@1.0-service
419 478 1 0% S 3770752K 256884K fg system SensorService system_server

/* 使用cpustats观察cpu频率变化 */
cpustats
Total: User 600 + Nice 0 + Sys 3 + Idle 591 + IOW 0 + IRQ 0 + SIRQ 0 = 1194
408000kHz 0 +
600000kHz 0 +
816000kHz 0 +
1008000kHz 0 +
1200000kHz 0 +
1248000kHz 0 +
1296000kHz 0 +
1416000kHz 0 +
1512000kHz 1200 = 1200 /* 统计时间内,总共有1200个系统时间片(jiffies),1512M运行了1200个时间片 */
/* 下面可以看到每个cpu的负载情况,包括用户态,内核态,中断和空闲时间 */
cpu0: User 0 + Nice 0 + Sys 1 + Idle 294 + IOW 0 + IRQ 0 + SIRQ 0 = 295
cpu1: User 299 + Nice 0 + Sys 1 + Idle 0 + IOW 0 + IRQ 0 + SIRQ 0 = 300
cpu2: User 1 + Nice 0 + Sys 1 + Idle 296 + IOW 0 + IRQ 0 + SIRQ 0 = 298
cpu3: User 300 + Nice 0 + Sys 1 + Idle 0 + IOW 0 + IRQ 0 + SIRQ 0 = 301

/* 通过cpufreq节点查看各个频率运行时间的占比,时间单位:jiffies */
cat /sys/devices/system/cpu/cpu0/cpufreq/stats/time_in_state
408000 718186
600000 548
816000 368
1008000 1578
1200000 1104
1248000 84
1296000 101
1416000 678
1512000 47495

/* 查看所有外设的中断数量 */
cat /proc/interrupts
CPU0 CPU1 CPU2 CPU3
1: 0 0 0 0 GICv2 29 Edge arch_timer
2: 181898 165057 636772 839244 GICv2 30 Edge arch_timer
5: 180743 39000 28905 65189 GICv2 62 Level rk_timer
13: 260634 0 0 0 GICv2 39 Level ff180000.i2c
14: 354805 0 0 0 GICv2 40 Level ff190000.i2c
15: 0 0 0 0 GICv2 41 Level ff1a0000.i2c
...

VDD_GPU

VDD_GPU 的功耗主要是确认频率电压表是否正常,实测电压和设置电压是否一致,用的是 devfreq 节点。

注:有些芯片 GPU 模块没有独立的 VD,会把 GPU 放在 VDD_LOGIC 里面,这时候需要确认的则是 VDD_LOGIC 的电压是否正常。

/* 获取频率电压表 */
cat /sys/kernel/debug/opp/opp_summary
device rate(Hz) target(uV) min(uV) max(uV)
-------------------------------------------------------------------
...
platform-ff400000.gpu
200000000 950000 950000 950000
300000000 950000 950000 950000
400000000 1025000 1025000 1025000
480000000 1100000 1100000 1100000
520000000 1150000 1150000 1150000
...

/* 查看gpu devfreq当前使用的变频策略,默认的simple_ondemand策略gpu是变频的 */
cat /sys/class/devfreq/ff400000.gpu/governor
simple_ondemand
注:ff400000.gpu其中ff400000是gpu的寄存器地址,所以不同芯片这个name也会不同。

/* 设置userspace策略定频gpu,然后设置不同频率,比较设置电压和实测电压 */
echo userspace > /sys/class/devfreq/ff400000.gpu/governor
cat /sys/class/devfreq/ff400000.gpu/governor
userspace

/* 查看gpu devfreq支持的频率点 */
cat /sys/class/devfreq/ff400000.gpu/available_frequencies
520000000 480000000 400000000 300000000 200000000

/* 设置定频的频率 */
echo 200000000 > /sys/class/devfreq/ff400000.gpu/userspace/set_freq

/* 确认当前频率 */
cat /sys/class/devfreq/ff400000.gpu/cur_freq
200000000

/* 确认当前电压,并实测比较 */
cat /sys/kernel/debug/regulator/vdd_gpu/voltage
950000

/* 查看gpu的负载 */
cat /sys/class/devfreq/ff400000.gpu/load
0@200000000Hz

VDD_LOGIC

VDD_LOGIC 里面一般会包含很多模块,为了方便功耗管理,内部又会划分成很多个 PD,主要从以下几个方面分析功耗:

  • 确认各个模块的运行频率和开关状态。
cat /sys/kernel/debug/clk/clk_summary
clock enable_cnt prepare_cnt rate accuracy phase
----------------------------------------------------------------------------------------
xin24m 9 10 24000000 0 0
...
pll_gpll 1 1 1200000000 0 0
gpll 9 20 1200000000 0 0
clk_sdio_div50 1 1 100000000 0 0
clk_sdio 1 5 100000000 0 0
sdio_sample 0 1 50000000 0 0
sdio_drv 0 1 50000000 0 180
clk_emmc_div50 1 1 300000000 0 0
clk_emmc 1 5 300000000 0 0
emmc_sample 0 1 150000000 0 42
emmc_drv 0 1 150000000 0 180
...
  • 确认各个 PD 的开关状态。
cat /sys/kernel/debug/pm_genpd/pm_genpd_summary                                <
domain status slaves
/device runtime status
----------------------------------------------------------------------
pd_gpu off
/devices/platform/ff400000.gpu suspended
pd_vi off
/devices/platform/ff4a8000.iommu suspended
pd_vo on
/devices/platform/ff460f00.iommu active
/devices/platform/ff470f00.iommu suspended
/devices/platform/ff2e0000.video-phy suspended
/devices/platform/ff450000.dsi active
/devices/platform/ff460000.vop active
/devices/platform/ff470000.vop suspended
/devices/platform/ff480000.rk_rga suspended
pd_vpu off
/devices/platform/ff440440.iommu suspended
/devices/platform/ff442800.iommu suspended
/devices/platform/vpu_combo suspended
pd_mmc_nand on
/devices/platform/ff380000.dwmmc unsupported
/devices/platform/ff390000.dwmmc unsupported
/devices/platform/ff3b0000.nandc active
pd_gmac off
pd_sdcard off
pd_usb on
/devices/platform/ff300000.usb active

  • DDR 模块一般会放在 VDD_LOGIC 里面,并且 DDR 模块功耗较大,和 GPU 一样使用 devfreq 策略优化功耗,所以需要确认频率电压表和实测电压。DDR 还有一些低功耗的配置,比如,pd_idle,sr_idle,odt 开关和其他一些 timing 配置,调试流程比较复杂,需要参考详细的 DDR 文档。
cat /sys/kernel/debug/opp/opp_summary
device rate(Hz) target(uV) min(uV) max(uV)
-------------------------------------------------------------------
platform-dmc
194000000 950000 950000 950000
328000000 950000 950000 950000
450000000 950000 950000 950000
528000000 975000 975000 975000
666000000 1000000 1000000 1000000
...

/* ddr默认使用dmc_ondemand变频策略 */
cat /sys/class/devfreq/dmc/governor
dmc_ondemand

其他设置频率和电压的命令与GPU devfreq一样。

VCC_DDR

VCC_DDR 主要是给 DDR 颗粒和 SoC 上 DDR-IO 部分供电,影响 VCC_DDR 功耗的参数有:DDR 频率,DDR 的负载,DDR 低功耗配置,DDR 颗粒类型等。相同条件下,不同厂商的 DDR 颗粒,功耗可能也会有很大的差异。

VCC_IO

VCC_IO 主要是给 SoC 上的 IO Pad 和一些外设供电,主要从以下几个方面分析功耗:

  • 外设模块的工作状态,是否存在漏电。
  • SoC 上的 IO 管脚状态是否与外设匹配,比如,IO 输出高,而接的外设管脚是低电平。

常见场景分析

静态桌面

主要是显示模块在工作,CPU,GPU,DDR 应该降到最低频率,并且进入低功耗状态,VDD_CPU,VDD_GPU,VDD_LOGIC 都调到 opp-table 的最低电压,确认 clk_summary,pm_genpd_summary 的状态,确认外设模块(WIFI、BT 等)都处于关闭状态。静态桌面一般作为其他场景功耗的基础,所以需要优先把功耗调到最优状态。

视频播放

主要是视频解码器(VPU/RKVDEC)在工作,GPU 一般处于关闭状态,重点确认 DDR 的运行频率和 VDD_LOGIC 的电压是否正常。

游戏

主要是 CPU 和 GPU 在工作,重点分析 CPU 和 GPU 的负载,频率变化,VDD_CPU 和 VDD_GPU 的电压是否正常。

二级待机

一般情况下,VDD_CPU 和 VDD_GPU 会关闭电源,VDD_LOG 只保留部分唤醒模块供电,所以重点分析 IO,DDR 颗粒和一些外设的功耗。

功耗优化策略

CPU 优化

  • 调整 cpufreq 参数。
/* 默认使用的是interactive变频策略,相关参数如下: */
ls -l /sys/devices/system/cpu/cpu0/cpufreq/interactive
go_hispeed_load /* 负载大于go_hispeed_load且频率小于hispeed_freq时,直接跳到hispeed_freq */
hispeed_freq /* 从低频跳转到高频时,需要先跳到hispeed_freq过渡 */
above_hispeed_delay /* 频率大于hispeed_freq时,每次提频前需要维持的时间 */
min_sample_time /* 每次提频后,如果下一个频率是降频,降频前需要维持的时间 */
target_loads /* 变频的目标负载 */
timer_rate /* 负载采样时间,单位:us */
timer_slack /* cpu进入idle后的负载采样时间 */
boost /* 频率小于hispeed_freq时,持续boost到hispeed_freq */
boostpulse /* 频率小于hispeed_freq时,boost到hispeed_freq,维持一段时间 */
boostpulse_duration /* boostpulse维持的时间,单位:us */
io_is_busy /* io等待是否计算到cpu负载 */

我们主要调整hispeed_freq,target_loads,timer_rate这三个参数:

hispeed_freq:选择一个合适的过渡频率,让cpu稳定在中间频率,功耗最优,这个值太大或太小都会造成cpu容易跳到高频,增加功耗。
target_loads:加大后更容易跑低频,功耗下降,性能也会下降。
timer_rate:加大后更容易跑低频,功耗下降,性能也会下降。
  • 关闭部分 cpu,限制 cpu 最高频率。
/* 关闭cpu2,cpu3 */
echo 0 > /sys/devices/system/cpu/cpu2/online
echo 0 > /sys/devices/system/cpu/cpu3/online

/* 限制cpu0最高跑1200MHz */
echo 1200000 > /sys/devices/system/cpu/cpu0/cpufreq/scaling_max_freq
  • ARM Big-Little 架构的 SoC,可以通过 CPUSET,把高负载的任务绑定在小核上,小核能效比更高。

注:对于 SMP 架构的 SoC,也可以把任务集中绑定在某些 cpu 上,让其他 cpu 可以进入低功耗状态,但是可能会导致 cpu 容易跑高频,功耗反而上升。

/* 创建小核分组 */
mkdir /dev/cpuset/little

/* 设置小核分组允许使用的cpu */
echo 0-3 > /dev/cpuset/little/cpus

/* 把pid=1111的任务加入到小核分组 */
echo 1111 > /dev/cpuset/little/tasks

/* Android系统,默认会创建几个分组,框架层把任务分类到不同的分组,可以调整每个分组的cpus,分析功耗 */
ls /dev/cpuset
background /* 后台任务 */
foreground /* 前景任务 */
system-background /* 系统级后台任务 */
top-app /* 前景的焦点任务 */
  • 通过 CPUCTL 限制高负载任务使用 cpu 的带宽(需要打开 CONFIG_CFS_BANDWIDTH 宏)。
/* 创建带宽限制分组 */
mkdir /dev/cpuctl/mygroup

/* 设置带宽限制的周期为10ms */
echo 10000 > /dev/cpuctl/mygroup/cpu.cfs_quota_us

/* 每个周期内,组内任务运行总时间不能超过5ms,这个值可以大于cfs_quota_us,因为是多个cpu运行时间总和 */
echo 5000 > /dev/cpuctl/mygroup/cpu.cfs_period_us

/* 把相关任务加入分组 */
echo 1111 > /dev/cpuctl/mygroup/tasks
echo 1112 > /dev/cpuctl/mygroup/tasks

/* cpu.shares表示通过权重限制任务的带宽,用于性能优化,不会影响功耗 */
/dev/cpuctl/mygroup/cpu.shares

DDR 优化

  • 场景变频:不同场景配置不同 DDR 频率,4K 视频,录像,双屏显示等。
/* 场景定义 */
include/dt-bindings/clock/rk_system_status.h
#define SYS_STATUS_NORMAL (1<<0)
#define SYS_STATUS_SUSPEND (1<<1)
#define SYS_STATUS_IDLE (1<<2)
#define SYS_STATUS_REBOOT (1<<3)
#define SYS_STATUS_VIDEO_4K (1<<4)
#define SYS_STATUS_VIDEO_1080P (1<<5)
...

/* dts配置不同场景的频率 */
arch/arm64/boot/dts/rockchip/px30.dtsi
dmc: dmc {
compatible = "rockchip,px30-dmc";
...
system-status-freq = <
/*system status freq(KHz)*/
SYS_STATUS_NORMAL 528000
SYS_STATUS_REBOOT 450000
SYS_STATUS_SUSPEND 194000
SYS_STATUS_VIDEO_1080P 450000
SYS_STATUS_BOOST 528000
SYS_STATUS_ISP 666000
SYS_STATUS_PERFORMANCE 666000
>;
...

/* 获取当前系统处于哪个场景 */
cat /sys/class/devfreq/dmc/system_status
0x401
  • 负载变频:监控负载,自动调整 DDR 频率,负载变频可能会导致性能下降,可以结合场景变频,在某些场景下,固定 DDR 频率。
/* dts配置负载变频参数,需要打开dfi节点监控DDR利用率 */
dmc: dmc {
compatible = "rockchip,px30-dmc";
...
/* 通过dfi监控DDR的利用率 */
devfreq-events = <&dfi>;
/*
* 调频阀值:
* 当利用率超过40%时,调到最高频,
* 当负载小于40%且大于40%-20%是维持当前频率
* 当负载小于40%-20%,会调到一个频率,使得负载差不多为40%-2%/2。
*/
upthreshold = <40>;
downdifferential = <20>;

/* 查看当前系统DDR的负载 */
cat /sys/class/devfreq/dmc/load <
33@528000000Hz
  • DDR DEVFREQ 更详细的配置和优化请查看文档《Rockchip-Developer-Guide-Linux4.4-Devfreq》。

温控优化

当温度升高到一定程度时,功耗会急剧上升,并且在高压的情况下,表现更明显。

  • 改善硬件散热条件。
  • 优化软件温控策略,避免温度波动太大。
  • 通过软件限制,避免高温时,同时出现高压。
&cpu0_opp_table {
/* 温度超过85度的时候,限制cpu最高电压为1.1V */
rockchip,high-temp = <85000>;
rockchip,high-temp-max-volt = <1100000>;

/* 或者直接通过限制最高主频来避免高压 */
rockchip,high-temp-max-freq = <1008000>;
};

电源优化

  • 降压电路,压降和电流较大时,建议使用 DCDC,提高效率,减小功耗。

例如: 输入 3.3V,输出 1.0V-50mA

电源类型输入电流功耗
LDO50mA165mW
DCDC(按 80%效率)18.9mA62.4mW