通信中AI/ML中的数据收集
数据收集可以在LCM(Large Capacity Memory)中出于不同的目的进行,例如,模型训练、模型推断、模型监控、模型选择、模型更新等。每个都可以根据不同的要求和潜在的规范影响进行。
协议R18 已经就AI/ML SID的数据收集开始讨论,一些公司提出了数据收集主题。比如模型训练和监控的数据收集,但在设置问题时,模型训练和监测之间没有区别。根据公司的反馈,人们希望在模型培训和监控之间进行讨论,因为不同LCM目的的数据收集要求可能截然不同。
数据收集可以在LCM中出于不同的目的进行,例如,模型训练、模型推断、模型监控、模型选择、模型更新等。每个都可以根据不同的要求和潜在的规范影响进行。
从逻辑上讲,当层2参与考虑对R18 AI、ML数据收集的潜在规范影响时,正常工作程序如下:
1. 物理层确定每个典型用例的数据收集场景,例如模型训练、模型监控,并分析每个用例每个应用场景的潜在数据收集需求;
2. 从物理层发送协调LS以通知RAN2每个用例的每个应用场景的潜在数据收集需求,这将触发RAN2关于每个用例每个应用场景数据收集的过程和信令讨论;
3. RAN2分析现有数据收集框架是否可用于RAN1 LS的新数据收集要求,并决定是否需要在现有数据收集架构基础上进行任何增强以满足物理层数据收集要求;
不幸的是,PHY尚未在数据收集要求方面取得重大进展,因此尚未向RAN2发送协调LS以引发有价值的讨论。但从RAN2的角度来看,公司认为R18 AI、ML SID对数据收集的规范影响肯定会涉及RAN2的工作,尤其是配置和报告程序。此外,LCM单个功能所在的位置还影响如何设计数据收集要求,例如,如果在OTT服务器上训练模型,则获取用于模型训练的数据集的方式将取决于实施,但如果在gNB上训练模型的话,则可能需要指定的数据集获取方法。
LCM各个功能所在的位置应根据每个用例的LCM程序进行讨论。最具挑战性的方面是模型训练的数据收集,因此我们可以从模型训练开始。

基于上述定义,可以得出结论,对于在线训练,模型训练和模式推理应该位于同一地点,而对于离线训练,模型训练和模式推理可以位于同一位置或分布在不同的功能实体中。
对于在线培训,新收集的数据应以(接近)实时的方式持续用于模型培训,这意味着用于在线培训的数据收集程序应在模型培训执行的实体处终止,或在与模型培训执行实体通信时延迟很短的实体处结束。该原理可以应用于所有类型的模型,即UE侧模型、网络侧模型和双边模型。
对于CSI反馈用例,对于UE侧模型,在UE处终止模型训练的数据收集,而对于gNB侧模型,则在DU或CU或gNB处终止模型培训的数据收集;
对于波束管理用例,对于UE侧模型,在UE处终止模型训练的数据收集,而对于gNB侧模型,则在DU或CU或gNB处终止模型培训的数据收集;
对于定位用例,对于UE侧模型,在UE处终止用于模型训练的数据收集,对于gNB侧模型,则在DU或CU或gNB处终止用于建模训练的数据采集,并且对于LMF侧模型,将在LMF处终止模型训练的数据收集。
对于离线训练,情况有点复杂,因为模型训练和模型推理可以位于不同的功能实体,即使对模型训练的数据收集没有严格的时间延迟限制。如果与模型培训相比,模型推断位于单独的功能实体,则离线培训也可能涉及模型转移/交付程序,因此离线培训与在线培训完全不同。
理论上,离线训练的数据收集过程可以在通信系统中的任何地方终止,但从可行性的角度来看,模型如何被传输/传递到模型推断执行的实体也可能影响离线训练数据收集过程终止的位置。从逻辑上讲,离线培训的数据收集程序通常在模型培训执行的实体处终止,这可以节省一些额外的工作,以便在另一个步骤中将收集的数据传送到模型培训实体,但并不总是适用,仍需逐例讨论。
如果使用离线训练方法,应逐个考虑离线培训的数据收集程序终止的情况。
关于定位用例的离线培训可能比较容易讨论,所以可以从这个开始。对于定位模型离线训练,可以在LMF处训练所有类型的定位模型,即UE侧模型、gNB侧模型和LMF侧模型,这在逻辑上是很好的,因为LMF是定位的管理器实体,并且可以使用模型传输/交付方法将UE侧/gNB侧模型传输到UE/gNB。但这一判断假设,如果定位模型在UE/gNB中针对UE侧模型/gNB侧模型进行离线训练,则无法获得额外的好处。
如果UE侧定位模型在UE处离线训练而不是在LMF处训练,是否有任何额外的好处,例如数据隐私、高精度模型?
如果gNB侧定位模型在gNB进行离线训练而不是在LMF进行训练,是否有任何额外的好处,例如数据隐私、高精度模型?
对于CSI反馈和波束管理用例,我离线模型训练的数据收集至少可以在所有类型的模型(即UE侧模型和gNB侧模型)的gNB处终止,因为该模型将用于基于物理层输入的推断。CN实体(例如AMF、NWDAF)可能可以收集训练数据,但奇怪的是,L1度量是由CN收集的,CN通常对无线测量不感兴趣。但OAM和OTT服务器可以基于当前的数据收集方法收集物理层度量。对于UE侧模型,也可以在UE进行离线训练,但考虑到UE通常具有较低的模型训练能力,额外的益处仍然不清楚。
数据收集也可用于模型更新。考虑到模型更新是一种特殊的模型训练,可以优先考虑模型训练的数据收集讨论。在完成关于数据收集的模型训练的讨论之后,可以重新评估与模型训练相比,模型更新是否应该解决任何差异。
关于模型推断、模型监控和模型选择的数据收集,数据收集需求高度依赖于RAN1中特定于用例的讨论。以模型监控为例,使用哪种类型的模型(例如UE侧模型或网络侧模型)以及哪个节点(例如UE或网络)控制模型监控将共同决定需要什么样的数据收集要求,因此RAN2讨论模型推断、模型监控和模型选择的数据收集还为时过早。