缩短PDSCH传输与下行HARQ反馈之间的处理时间
为了缩短时延,可以从UE处理步骤以及潜在的限制或设计变更,将重点放在下行数据传输和下行HARQ反馈之间的处理时间减少上,以便能够减少下行数据情况下的最大允许处理时间。
从发送PDSCH数据到UE进行HARQ Ack反馈期间,UE中所需的处理步骤较多,如下:
第一步:包括FFT的下行信号采样
第一步显然是在UE处进行所需的数据采样,以便创建所考虑的下行TTI的BB样本。UE还将需要应用FFT以启用任何类型的LTE OFDM基于post的处理。该第一步需要的处理步骤独立于任何进一步的设计考虑,包括缩短TTI长度,因为这是UE中需要的连续处理。
第二步:为下行调度解码的信道评估
在能够开始PDCCH盲解码和搜索下行分配之前,UE需要创建用于下行控制信道解码的信道估计。
对于传统PDCCH,使用基于CRS的下行控制解调,并且UE可以使用先前下行子帧中的CRS,以便与包含在下行控制区域中的CRS RE一起提高信道估计精度。因此,UE可以在第一各OFDM符号(在2个CRS端口的情况下)或第二个OFDM符号(在4个CRS端口的情况下)之后开始创建用于下行控制解码的最终信道估计。对于缩短TTI操作的下行控制的基于CRS的解调,类似的操作是可能的,并且只要在sPDCCH区域之前(执行时域外推)或在sPDCCH区域内接收到包含CRS RE的最后OFDM符号,就可以开始信道估计创建。
对于基于DM-RS的下行控制解码,UE所需的处理步骤略有不同。首先,由于DM-RS序列本身和用于下行控制的DM-RS的预编码可能在TTI到TTI的基础上改变,因此使用来自先前TTI的DM-RS信息将是不可能的。因此,UE应当仅从当前TTI和PRB的DM-RS创建信道估计,其中UE可能期望下行控制信息。比较传统1ms操作的两种情况,对于基于PDCCH/CRS的操作,UE能够最迟在第二个OFDM符号之后开始创建所需的信道估计。与EPDCCH/DMRS相反,UE将需要等待可靠信道估计的创建,直到接收到子帧的最后符号为止(即超过0.7ms之后)。因此,至少对于基于1ms TTI的操作,与基于DM-RS的EPDCCH相比,基于CRS的PDCCH允许在UE中更短的处理时间。
第三步:下行调度解码
在具有可用的信道估计并且知道下行控制区域之后,UE能够在PDCCH上开始下行控制盲解码。UE可以以不同方式意识到下行控制区域。在传统PDCCH的情况下,UE需要通过解码PCFICH来识别PDCCH长度。对于传统EPDCCH,EPDCCH集被配置为高层,因此,在接收下行子帧之前,下行控制区域已经是已知的。
由于CCE在整个下行控制区域上在时频上交错,因此UE在接收到包含下行控制的最后OFDM符号之前不能开始DCI盲解码。由于传统PDCCH与PDSCH区域在时域复用,这使得UE能够在下行子帧结束之前开始搜索DCI路径。相反,对于传统EPDCCH,UE需要等待盲解码至少直到子帧结束,即与PDCCH情况相比,UE将能够在超过0.7ms之后开始下行控制解码。
DCI盲解码在Rel-13 中被广泛讨论,所需盲解码的总数由(E)PDCCH/spdch候选的数量和UE被请求搜索的不同DCI格式的数量给出。为了减少下行控制解码所需的处理时间,可能需要通过减少要监视的DCI格式的数量或减少PDCCH/spdch候选的数量来减少所需的盲解码的数量。
第四步:准备下行数据进行Turbo解码
UE的下一个逻辑步骤将是为turbo解码器创建输入数据。这包括UE的几个处理步骤:
1. 天线端口特定信道估计
2. 线性UE接收机滤波器计算
3. 线性PDSCH预滤波,包括为turbo解码器创建信道和干扰估计
4. 解调包括计算每个比特的对数似然比、Turbo码块的解扰和解交织。
对于特定于天线端口的信道估计,可以再次分别查看基于CRS的解调(下行TM1-6)和基于DM-RS的解调(下行TM7-10)。对于基于CRS的TM,UE可以独立于知道其自己的下行分配的细节而开始为已知的当前天线CRS端口和来自CRS RE的一些基线干扰估计创建信道估计。因此,UE可能仍然能够在已经创建基本原始信道和干扰估计的同时执行下行控制解码。相反,对于基于DM-RS的TM,UE只能在解码了有效的下行授权并且知道其分配的资源以及适用的DM-RS端口(包括MIMO层的数量)之后开始该逻辑步骤。
知道分配的PDSCH资源以及具有可用的天线端口特定信道和干扰估计,UE将计算用于创建用于PDSCH turbo解码的单个输入流的一些多天线接收机预滤波器。复杂性和所需的处理时间取决于几个方面。首先,与普通MMSE或甚至MRC多天线接收机组合相比,任何诸如RML或SLIC的高级UE接收机具有更高的计算复杂度,此外,NAICS高级接收机需要执行干扰信号参数的盲检测。MMSE-IRC所需的干扰协方差矩阵估计增加了复杂性,并且更多支持的下行SU-MIMO流将使PDSCH预滤波器的计算复杂化。
在计算了预滤波器系数之后,UE随后将为Turbo解码过程创建每个传输块的单个输入流和相应的信道和干扰估计。这涉及传输块特定解调以及turbo编码数据的子帧相关解扰和解交织。
第五步:PDSCH Turbo解码
turbo解码的步骤通常被视为UE的PDSCH操作中计算最复杂和最耗时的部分。
LTE Turbo解码器针对最大码块大小为6144位的每个Turbo码块独立工作。因此,所需解码时间由Turbo码块的数量(即数据比特/TTI的数量)给出。每个TTI的码块的数量是调度载波的数量、使用的MCS、分配的带宽和高阶SU-MIMO利用率的功能。为了满足PDSCH解码性能要求,需要对单个码块进行多次Turbo解码迭代。
在使用不同码块的一些迭代解码(例如SIC/PIC/联合解码)的高级非线性Turbo接收机操作的情况下,复杂度和处理时间通常显著增加,并且将强烈依赖于并行传输的数据流(由于SU-MIMO或MUST/NOMA操作)。对于能够这种高级非线性PDSCH解码的UE,返回到正常turbo解码操作可能是实现减少处理时间操作的一种方法。
第六步:在BB中的PUCCH/PUSCH上创建和复用下行HARQ Ack
接下来,UE需要根据PDSCH解码结果创建要发送回eNB的相关HARQ Ack信息。该信息将与其他上行信道信息(例如用于其他载波的HARQ-ACK、SR或CSI等)一起复用并编码,以便创建特定格式的编码UCI信息。然后将UCI调制并放置在PUCCH上或穿刺到PUSCH中以在数字基带中传输,以便创建用于传输的上行基带信号。
第七步:准备PUSCH/PUCCH传输,包括下行HARQ Ack信息
最后,但重要的是,上行数据在LTE 上行载波上调制并在特定上行子帧/TTI中传输。
减少UE处理时间的可能方法
有没有办法将绝对下行数据减少到1ms子帧操作的HARQ ACK反馈时延以及缩短的TTI操作。
自LTE引入调制解调器芯片,而且技术进步神速,这意味着并非所有所需的处理时间减少都需要通过设计更改或限制来实现!因为所有LTE Rel-8 UE需要满足传统处理时间,而只有能够缩短处理时间的UE需要符合指定的缩短处理时间。因此,即使没有太多限制,也可以指定严格的处理时间。
(一)减少最大TA
LTE R8设计通过可用的定时提前(对应于往返传播)使[0…667us]的范围能够在高达100km的小区半径下运行。为了以减少时延,将需要对最大TA进行限制,特别是当考虑例如2个OFDM符号的TTI长度的较短TTI操作时。当查看表1中当前可用的最大TA值和TTI长度之间的关系时,这是相当明显的,其中对于2个符号的最短TTI长度,最大TA单独将最小处理时间限制在4个TTI以上。

因此,非常清楚的是,短的TTI操作将不可能用于具有例如5-10km半径或更大的非常大的小区。另一方面,由于TTI较短的固有覆盖限制(例如HARQ-ACK覆盖),这种小区大小无论如何都不可行。由于对于较长的TTI长度,TA的影响较小,因此对于时隙级和1ms TTI,对于缩短的处理时间操作,可能存在较大的小区半径。
例如,将传统1ms TTI的缩短处理时间操作限制为25km小区半径将已经为UE节省了几乎一半的子帧(即450us),这大约是将HARQ Ack定时从传统N+4减少到N+3操作所需的一半,而无需任何附加更改/限制。因此,限制最大允许TA显然是缩短处理时间操作的关键组成部分之一。请注意,这并没有改变LTE的部署,在小区边界的非常大的小区中的UE可能不会以减少的处理时间来操作(而是像过去一样使用具有N+4假设的传统1ms TTI,甚至使用TTI捆绑)。
(二)减少下行控制解码时间
下行控制解码时间取决于所使用的参考信号(DM-RS与CRS)、下行控制区域的结构(TDM与PDCCH/SPDCH、FDM与EPDCCH)和盲解码候选数(DCI格式和USS候选数)。
特定处理器/调制解调器速度的UE中执行单个下行控制盲解码本身所需的时间与TTI长度无关。对于较短的TTI长度,所需下行盲解码时间与TTI长度的比率当然要大得多。因此,随着TTI长度的缩短,减少盲解码的数量的重要性显著增加。
1. 下行控制区的结构和使用的参考信号:
如上所述,与使用EPDCCH进行1ms TTI相比,使用传统PDCCH进行1ms TTI允许至少提前0.7ms开始下行控制解码。因此,由于下行控制和下行数据区域的TDM复用,可以更早地执行PDSCH信道估计、预滤波计算、PDSCH预滤波甚至PDSCH Turbo解码的以下步骤。
在缩短TTI下行控制的设计中,尽可能早地将下行控制清楚地放置在TTI中是有利的,因此,应使用一些TDM类型的sPDCCH/sPDSCH复用。从开销和处理时间的角度来看,基于CRS的sPDCCH解调将是优选的,但是这将限制sTTI操作到非MBSFN子帧。
2. 限制要监控的DCI格式的数量:
如前所述,尤其是对于较短的TTI长度,需要考虑盲解码限制。这包括限制要为缩短的TTI操作监控的DCI格式的数量。对于sPDSCH和sPUSCH授权,只有一种统一的快速DCI格式,可将盲解码减少50%(对于上行TM2操作,减少75%)。
对于使用传统1ms TTI减少处理时间的操作,也可以考虑对PDCCH DL控制的限制,但其重要性不如sTTI操作。这可能包括将PDSCH操作的缩短处理时间限制为仅TM特定DCI格式。
3. 限制USS候选数量缩短TTI部署
USS候选者的数量可以受到限制,由于下行控制解码的效果越大,TTI长度越短,特别是对于非常短的TTI长度,将需要用于UE的非常小且紧凑的USS。
(三)对基于CRS的TM的可能限制(至少对于1ms TTI)
对于基于CRS的PDSCH,可以在UE完成搜索可能的下行授权之前已经创建天线端口特定的信道估计。在解码下行授权之后,UE将能够在TTI结束之前已经开始预滤波计算、PDSCH预滤波和解调以及PDSCH turbo解码(特别是对于使用PDCCH控制的1ms TTI)。相反,对于传统的基于DM-RS的PDSCH TM,一些DM-RS RE位于最后两个OFDM符号中,这在很大程度上限制了TTI内的PDSCH处理,特别是对于5-8层MIMO操作。
对基于CRS的TM的限制将使1ms的缩短处理时间操作仅限于非MBSFN子帧,这显然不是设计目标。因此,这种限制可能不可行。然而,与基于DM-RS的TM相比,用于1ms TTI操作的基于CRS的TM可能需要较少的其他限制。
(四)将DM-RS放置在TTI末端(至少对于缩短的TTI)
与上一节中针对1ms TTI的注意事项相同,也可应用于缩短的TTI操作。由于未指定用于缩短的TTI的DM-RS结构,因此新的DM-RS设计有可能通过将DM-RS RE放置在TTI/时隙的开始处(或至少不在传统DM-RS的情况下的结束处)来减少处理时间。然而,这将使传统ue和支持减少处理时间的新ue之间的MU-MIMO复杂化。此外,DM-RS可能会与现有的CSI-RS端口发生冲突。
(五)限制标称峰值数据速率以缩短处理时间操作
PDSCH的turbo解码所需的时间由UE需要解码的turbo码块的数量给出。因此,为了保持HARQ Ack反馈延迟足够低,可能需要限制1ms TTI的缩短处理时间操作或缩短TTI操作的标称峰值数据速率。
可以设想几种限制标称峰值数据速率的不同方式:
A.减小最大TBS尺寸:
这意味着限制用于PDSCH调制的最大使用MCS或可分配给载波上的UE的PDSCH带宽。
查看1ms TTI的情况,如果UE中当前仅在峰值数据速率下需要2ms进行Turbo解码,则将最大TBS限制为75%将节省Turbo解码时间0.5ms,这与减少的TA节省一起将足以在N+3定时下操作,而无需对载波数量或支持的MIMO层的最大数量进行任何额外限制。这样的限制一开始可能看起来相当有害,但再详细一点看,这并不是一个大问题。由于监管和许可限制,许多运营商需要部署小于20MHz的载波带宽。对于此类载波,最大峰值数据速率低于UE能力,这意味着对于高达15MHz的载波带宽,不需要特定于载波的MCS/PRB限制。此外,处于这种有利条件下的ue的份额相当有限,并且仅适用于小区中心。
对于缩短的TTI操作,由于可用的PDSCH符号较少,最大TBS大小将自动变小,而不会限制更高MCS的使用。然而,由于较短的TTI操作而自动减小的最大TBS大小可能不够,并且对于较短的TTI也可能需要进一步的TBS限制,因为其他步骤所需的处理时间不依赖于TTI长度。
B.减少MIMO层的数量:
降低峰值数据速率的另一种方法是限制SU-MIMO层的数量,从而在UE中实现更快的处理。限制MIMO层的数量一方面将减少turbo解码,因为可用的turbo码块将更少,另一方面,对于例如MMSE-IRC预滤波,需要稍微更少的UE处理,其中逆的复杂度增长n2.373,其中n是层的数量。
与减少最大使用的MCS/tb相比,限制中的粒度要粗得多,因为最近在现场只有2流MIMO ue可用,导致粒度减少50%(即基本上不启用SU-MIMO以减少处理时间操作)。
C.减少支持CA的UE的可调度组件载波:
减少turbo码块的数量的另一种方法是减少可调度的载波的数量,每个载波可实现峰值数据速率。在UE将不配置最大数量的支持的cc的情况下,对于配置的cc,实际上可能不需要限制UE的MCS、资源分配或SU-MIMO能力,即不存在数据速率损失。
总的来说,在修复上述三个选项中的一个方面定义一定的限制可能不太好。最灵活的方案是将eNB调度减少的处理时间操作的最大瞬时峰值数据速率限制在一定的目标减少量。在几乎所有的情况下,UE将不会同时处于非常高的SINR状态,被配置为具有每个具有20MHz带宽的最大数量的支持载波,传播信道支持最大数量的MIMO层,并且eNB尝试同时在所有载波上调度UE全频带。此外,在TCP慢启动阶段,不需要实现UE峰值数据速率。简言之,可能需要在最大总体可调度峰值速率中定义一些限制,但这应该留给eNB调度器实现。
(六)限制对迭代turbo接收机操作的支持,以缩短处理时间
与独立处理每个Turbo码块相比,高级迭代Turbo接收架构(例如PIC/SIC/联合解码)在计算上更复杂。支持这种高级操作的终端显然应该能够减少所需的处理时间,假设正常的线性接收机处理。因此,这样的ue可以仅将高级接收机操作用于传统处理,但是对于1ms TTI或缩短的TTI的缩短处理时间操作可能根本不支持它。对于这样的UE,具有不用于减少处理时间操作的高级处理能力,可能根本不需要降低支持的峰值数据速率(至少对于1ms和时隙级TTI)或者,与仅具有更传统的线性接收机处理能力的UE相比,限制可能小得多。因此,峰值数据速率的所需降低也可以是UE能力。