人类感知应用,如活动识别、跌倒检测和健康监测,已经因人工智能(AI)和机器学习技术的进步而发生了革命性的变化。这些应用可以通过监控人类行为并提供关键的健康评估数据,显著影响健康管理。然而,由于个体行为、环境因素和设备物理位置的变化,通用AI模型的性能往往受到限制。特别是在遇到传感器数据分布变化时,这种变化会导致训练和测试条件之间的不匹配。因此,个性化对于适应特定用户的模式至关重要,使这些模型在实际应用中更加有效和可靠。
研究人员面临的核心问题是,在有限的数据可用或收集的数据因外部条件变化而表现出变异性时,如何将AI模型适应个别用户。尽管通用模型能够在更广泛的人群中进行泛化,但在面对独特的用户特定变化(如运动模式、语音特征或健康指标的变化)时,它们往往会表现不佳。这一问题在医疗保健场景中尤为突出,因为数据稀缺常见,且独特患者特征在训练数据中往往被低估。此外,不同场景中的用户内变异性导致了缺乏泛化能力,这在健康监测等应用中尤为重要,因为生理状况可能会因疾病进展或治疗干预而显著变化。
为了个性化模型,已提出了多种方法,包括连续个性化和静态个性化技术。连续个性化涉及基于新获得的数据更新模型。然而,在医疗保健应用中获取此类数据的地面实况可能劳动密集且需要持续的临床监督,使得这种方法在实时或大规模部署中不可行。另一方面,静态个性化在用户注册期间使用有限的初始数据集进行。虽然这减少了计算开销并最小化了用户参与度,但通常会导致模型在初始注册阶段未见过的情境中泛化能力较差。
来自雪城大学和亚利桑那州立大学的研究人员介绍了一种新的方法,称为CRoP(Context-wise Robust Static Human-Sensing Personalization)。该方法利用现成的预训练模型,并通过剪枝技术对其进行适应,以解决用户内变异性问题。CRoP方法的独特之处在于其使用模型剪枝,即从个性化模型中移除冗余参数,并用通用参数替换。这项技术有助于保持个性化模型在不同未见情境中的泛化能力,同时确保其在训练情境中的高性能。使用这种方法,研究人员可以创建即使在用户外部条件发生显著变化时也能稳健运行的静态个性化模型。
CRoP方法首先使用用户初始注册期间收集的有限数据对通用模型进行微调。然后,通过剪枝识别并移除对给定情境下模型推理贡献不大的冗余参数。接下来,用通用模型中的相应参数替换剪枝参数,从而恢复模型的泛化能力。最后一步是在可用的用户数据上进一步微调混合模型,以优化性能。这个三步过程确保个性化模型在不同未见情境中保持泛化能力,同时不牺牲其在训练情境中的有效性。
研究人员在四个人类感知数据集上测试了该方法:PERCERT-R临床言语治疗数据集、WIDAR基于WiFi的活动识别数据集、ExtraSensory移动感知数据集和通过可穿戴传感器收集的压力感知数据集。结果显示,CRoP相比通用模型在个性化准确性方面提高了35.23%,在泛化方面比传统微调方法提高了7.78%。具体来说,在WIDAR数据集中,CRoP在主要情境下的准确性从63.90%提高到87.06%,同时在未见情境中的性能下降较少,展示了其在适应不同用户情境方面的稳健性。同样,在PERCERT-R数据集中,CRoP在初始情境下的准确率为67.81%,在未见情境中的性能稳定性为13.81%。
研究表明,CRoP模型在个性化和泛化方面优于传统的SHOT、PackNet、Piggyback和CoTTA等方法。例如,PackNet在个性化方面仅提高了26.05%,在泛化方面下降了1.39%,而CRoP提供了35.23%的个性化提升和7.78%的泛化增益。这表明CRoP通过结合剪枝和恢复技术,在处理人类感知应用中常见的分布变化方面更为有效。
研究的关键结论包括:
- CRoP相比通用模型在个性化准确性方面提高了35.23%。
- 使用CRoP相比传统微调在泛化方面提高了7.78%。
- 在大多数数据集中,CRoP的表现优于其他最先进的方法,如SHOT和CoTTA,提升幅度为9-20%。
- 该方法在不同情境中保持高性能,且额外计算开销极小。
- 该方法特别适用于健康相关应用,因为在这些应用中,用户条件的变化频繁且难以预测。
总之,CRoP为解决静态个性化局限性提供了一种新颖的解决方案。利用现成模型并结合剪枝技术,有效地平衡了用户内个性化与泛化之间的权衡。这种方法满足了在不同情境中表现良好的个性化模型的需求,使其特别适合医疗保健等敏感应用,这些应用需要高度的稳健性和适应性。
(全文结束)

