基于UE自适应的5G节能
为了降低UE侧的功耗,UE可以利用手机内部的可用信息,如文件大小、流量到达率、应用层流量的吞吐量/时延要求、不同频率、带宽、载波数、调度时间线等的RF(Radio Freqency)和BB(BaseBand)的实现特定功耗特性。这些信息可以在UE侧直接用于降低功率,但在大多数情况下,这些信息应该传输到网络,以帮助网络配置/调度UE以节省功率。这是因为UE的功耗高度依赖于UE配置,并且配置由网络完成。
NR支持更高的数据速率和更宽的带宽(单载波最高可达400MHz)。这需要在RF侧和基带侧都具有更高的数据处理速率;支持更高的采样率、更小的时隙长度、更高的编码器/解码器吞吐量、更快的时钟、更高电压(具有更高的泄漏)、更大的内存和LTE-NR双连接需要显著更高的功耗。尤其是,毫米波的支持需要额外的功率消耗,以用于波束赋形部署和波束管理。
引入BWP和跨时隙调度来克服增加的功耗。网络可以使用BWP来调整带宽以满足数据传输/接收需求。网络可以将窄的BWP配置为仅监视PDCCH,或者将更宽的BWP设置为接收大型数据。使用BWP的信道带宽自适应是一种有效的节能技术。
然而,UE是否能够期望节能取决于网络配置/调度决策。如果网络没有配置不同大小的多个BWP,或者如果网络没有考虑流量需求和UE功耗来更改BWP,那么,即使配置了多个不同的BWP,UE侧也可能没有节能(例如,当BWP仅用于负载平衡目的时)。LTE中的类似示例是DRX配置。如果由于网络复杂性而仅使用非常简单的配置,则很难期望UE侧的预期节能增益。UE对信道状态和业务需求/模式/使用有更好的了解,可以帮助网络在连接模式和空闲模式下对BWP配置和调度做出更好的决策,如图1所示。

如果UE可以指示其优选的BWP配置,则UE可以潜在地实现更高的功率节省。很明显,UE想知道设备主人对APP的偏好、要接收/发送的流量的类型/数量/持续时间等信息。这种信息可以与内部功耗统计数据结合使用,以确定BWP的正确大小。另一个原因是不同的UE可以具有不同的RF能力和不同的实现。这意味着对于不同的UE,特定业务的最佳BWP可能不同。
网络为什么喜欢配置更大的BWP?这是因为,随着BWP和载波数量的增加,网络可以保持较高的调度灵活性,以提高网络容量。因此,在许多情况下,分量载波在没有数据传输的情况下也是活动的。在这种情况下,UE应该能够请求使用较小的BWP或关闭未使用/空闲的分量载波。
NR具有非常灵活的HARQ调度和定时。与具有固定HARQ timing的LTE不同,NR的PDSCH和相应ACK的传输timing可以由DCI动态确定和指示。增加的灵活性使得网络调度器更容易服务于具有不同处理能力、不同流量需求、不同时延需求等的多个UE。
自包含时隙调度可能有助于UE节能。例如,在时隙N中接收PDCCH、在时隙N+4中接收PDSCH并在时隙M+8中发送ACK的UE可以在时隙H和N+4之间以及在N+4和N+8之间进入微睡眠状态。如果网络可以使用PDCCH、PDSCH和ACK来调度该UE,所有这些都在同一时隙N中(自包含时隙调度),或者至少在时间上非常接近,然后,UE可以快速完成数据接收并进入更长时间的深度睡眠模式,这将节省更多的功率,如图2所示。由于斜坡上升和斜坡下降都会带来功率成本,因此最好降低这些功率成本并延长调制解调器的睡眠时间。这可以通过UE指示到网络的优选K0、K1、K2值信令来实现。

在NR中,3GPP 38.331定义了非常灵活的PDCCH/PDSCH时域资源分配(TDRA:time-domain resource allocation)模式。特别是,RRC可以为每个BWP配置一个表,其中包括可能(最多16个)TDRA模式的列表。TDRA表的每个条目包括三个字段,即K0、PDSCH映射类型和StartSymbolLandLength。K0定义时隙中PDCCH和PDSCH之间的距离(即,K0=0表示相同时隙调度,而K0>0表示跨时隙调度);映射类型将调度定义为基于时隙或基于mini-slot;startSymbolAndLength定义了时隙内PDSCH分配的位置和范围。在PHY层,PDCCH DCI解码提供表的条目索引,向UE指示应在当前时隙中使用TDRA表的哪个条目。理论上,gNB可以通过DCI将TDRA从一个时隙改变到另一个时隙。在PDCCH解码完成之前,UE不知道用于当前时隙的模式。
TDRA模式有很多种,包括相同时隙调度和跨时隙调度模式,可以为UE提供显著的功率节省,前提是该模式(即表项)在DCI解码之前由UE已知。
已经注意到,LTE CA消耗大量功率。但是,真正的问题不是它消耗高功率,而是用于激活次载波的大部分功率被浪费,而不是用于数据传输。在典型的CA场景中,有以下问题。
1) 激活时延:SCell通常仅在网络下行队列建立超过某个阈值后激活,这会由于激活延迟而延迟快速数据传输。
2) 停用时延:数据传输完成后,网络不会快速停用,尽管未发生活动数据传输。尽管存在基于MAC CE的动态激活/去激活机制,但该机制很少在现场使用,去激活主要依赖于SCell去激活定时器,该定时器通常配置为数百毫秒(通常在下一个开启持续时间内,其间穿插着一个长的CDRX周期)
3) SCELL导致总吞吐量低:有时观察到,具有低可实现吞吐量的SCELL并不总是对总体可实现的吞吐量做出巨大贡献。在这种情况下,额外载波用于更高可实现吞吐量的优势受到CA激活本身的功率惩罚的限制。
在这种情况下,基于UE的网络输入在CA激活/去激活方面总是有利的。网络可以基于这些UE提供的输入做出更好的决策。
快速激活/去激活可以帮助UE节省功率。为了减少激活和去激活所需的时延,可以想到的第一种方法是基于DCI的信令。由于DCI是在物理层处理的,因此它比当前基于MAC-CE的方案更快。
基于DCI的隐式激活机制
更具体地说,可以考虑使用跨载波和跨时隙调度的基于DCI的隐式激活机制。这种方法需要配置有跨载波调度支持的CA。为了激活载波(当前已停用),网络可以简单地发送调度DCI,其中载波指示符字段(CIF:Carrier Indicator Field)设置为调度的分量载波。在这种情况下,调度DCI的K0值应大于分量载波激活所需的时间。
UE发起快速SCell激活/去激活
改进的另一方面是UE发起的激活/去激活方法。这对于减少激活/去激活的时延非常有用,因为UE可以使用应用层中可用的信息(例如文件大小)来下载或上传。
文件下载中的SCell激活:当UE想要下载文件时,UE可以知道它将很快从应用层开始下载文件,并向网络发送一个明确的请求,以提前打开其他组件载波。这在减少延迟方面非常有效,因为网络通常无法访问此信息,这主要是由于在TLS会话中执行的数据传输。网络通常仅在下行队列开始累积超过某个阈值后才打开附加分量载波,这有点慢。从测试可知,激活时延可以从35ms减少到12ms。
文件下载中的SCell停用:当前LTE/NR支持用于停用SCell的sCellDeactivationTimer 。每当接收到DL/UL许可时,定时器被重置。当在sCellDeactivationTimer 持续时间内未收到DL/UL授权时,它将过期。可配置定时器值的范围从20ms到1280ms,并且通常以最大努力流的长DRX周期范围的值结束。如果未配置此参数,则使用无穷大值,并且SCell只能由MAC CE停用。在现场日志中,确实看到该定时器的值范围很广,从20ms到无穷大。由于如此大的去激活值,即使在完成文件下载之后,UE也必须等待定时器到期,以便去激活SCELL。这个问题被夸大了,尤其是当下载的文件较小时。对于小文件下载,与PDCCH监控时间相比,数据的实际活动传输时间要小得多,在PDCCH监控期间,SCell处于活动状态,导致UE上的RRC连接效率极低,消耗大量功率。在这种情况下,如果UE具有向网络指示SCell去激活请求的机制,则UE可以避免使用CA进行PDCCH监控的功率损失。从测试中发现,去激活延迟平均从130ms减少到20ms。
文件上传中的SCell激活:当UE从RRC空闲开始在UL中发送数据时(这是上传大文件时的典型情况),它首先必须连接到网络才能进入RRC连接模式。在这种情况下,MSG3可以包括BSR。这是不同步的UE能够告诉网络它有大量数据要传输到网络的最早时间。因此,在这种情况下,UE发起的SCell激活没有多少好处。然而,当UE仅在RRC连接模式下从PCell开始传输时,UE可以在BSR传输时机到来之前主动发送SCell激活请求。在这种情况下,时延有所减少,平均为BSR报告期的一半。因此,在这种情况下,减少的时延取决于BSR报告期。
文件上传中的SCell停用:这种情况与文件下载中的SCEL停用非常相似。由于UE知道文件上传是否已经完成,因此UE可以立即向网络发送SCell去激活请求,以避免为SCell小区浪费能量。从测试中发现,去激活时延从192ms减少到16ms。
NR支持最多两个具有可变MIMO层数的码字。前四层映射到第一码字,其余4层映射到第二码字。一旦RRC配置了支持的码字数量,则在DCI中动态指示PDSCH传输的MIMO层的实际数量。
DCI中指示的层数取决于网络实现,但通常基于从UE报告的秩指示来确定。然而,请注意,来自UE的秩指示并不保证网络仅调度小于或等于所报告秩的层的PDSCH。网络调度的层数可能大于报告的秩,但可能性较小。由于这个原因,UE应该准备好接收最大数量的层,这总是RRC配置的;4用于单个码字,8用于双码字。
在UE端,缓冲到最大层数会消耗大量的功率/能量。射频集成电路包括用于每一层的专用接收器链,BB中的一些块(如ADC)也是层特定的。因此,随着最大层数的增加,这些块消耗的功率线性增加。
问题在于,即使报告的秩低于最大值,UE也必须使最大数量的RF链就绪。此外,RRC配置的最大层数不适用于动态业务到达,这使得UE在缓冲未使用层的不必要信号时浪费了功率。
为了节省UE功率,建议限制MIMO层的最大数量。由于层数与要支持的数据速率量直接相关,因此应根据流量到达控制最大层数。当流量到达率较高且等级较高时,可以配置较大的最大数量。当流量到达率较低时,可以配置较小的最大层数(等于或低于秩)。
DRX机制是UE节能的关键组件机制之一,但在LTE中使用较少。例如,LTE网络仅使用有限的DRX参数集,并且它们几乎没有改变。长Long inactivity timer (~200ms)就是这样的例子之一。在许多情况下,相同的DRX配置应用于所有UE,这意味着网络通常不会考虑UE流量的不同特征。当进行VoLTE呼叫时,网络会更改DRX参数,以更节能的方式支持它。考虑到NR DRX设计本质上与LTE没有什么不同,预计NR网络将具有与LTE网络类似的配置。
然而,由于NR用例/场景的范围比LTE的范围宽得多,预计NR中的流量到达/需求会有更多的变化。对于UE的节能运行,快速适应此类变化至关重要。DRX参数是实现这种自适应的关键参数之一。但是,如上所述,它是静态的,在大多数情况下没有得到充分利用。因此,建议进一步利用它进行自适应并更好地支持,UE可以基于UE内部的信息(如流量到达统计、用户行为统计、功耗统计)向网络提供帮助信息。
在上面的讨论中,DRX包括连接模式DRX(CDRX)和空闲模式DRX。但是CDRX在适应动态变化的流量方面更为相关。
考虑到BWP最常见的用例是节能,BWP和DRX之间是有连接的。考虑到这两种功能都可以配置为快速适应业务到达,同时试图降低功耗,可以考虑两种功能的联合部署。例如,NR可以支持每BWP DRX配置。例如,窄带部分BWP1和宽带部分BWP2可以配置为short/long DRX cycle timer, on duration timer, inactivity timer等的不同值。BWP1的值可以配置为不同于BWP2的值,以在BWP1中没有太多流量时进一步降低功耗。BWP和DRX参数之间的这种关联可以提供更大的灵活性,从而实现更好的适应。