2020.10.10更新,由于做的方向和这个很相近,所以将详细理解并记录里面的数学推导
————————————————分割线—————————————————
这文章主要是搭一个架子,是比较新的研究方向,用RIS 来做RF感知
Abstract
用RF传感来做人类姿势识别逐渐被人们所关注,因为它是普及的,非接触式的,可以保护隐私的。常规的RF感知技术是被无线环境所约束的,这就限制了用来携带关于人类姿势的多维信息传输信道的数量。而我们基于RIS的,用于姿势识别的的RF感知系统不是被动的适应。这个系统是可以主动定制环境以提供我们需要的信道,然而这个配置方式是很具有挑战性的,然后把它建模成了一个优化问题,然后把这个问题分解成两个子问题,然后提出解决算法。
Introduction
射频传感背后的原理是传感目标对无线信号传播的影响可以被接收机识别出来,姿势识别有很多应用场景,比如监视,远程健康监控,所以设计对姿势识别高度准确的射频识别系统是很重要的
射频姿势识别目标是识别不同的人类姿势,比如说站立,走路,坐着,躺着,这些可以通过分析不同姿态下无线信号的传播特性而得到,确实已经提出了一些相关的解决方案,比如说用RFID的标签,用WiFi设备探测到的相位移动来发现人的摔倒。而信道越多,姿势识别的准确性就越强,
然而,由于无线环境的复杂性,姿势识别的准确性很大程度上会受到不被期望的多径信息的影响,更别说本来不相干信道就很少,而RIS的发现则为我们解决这个问题提供了可行的路线,通过使用RIS,可以人为制造出不相关信道,定制channel让我们的姿势识别更加可靠
通过恰当的编程,我们就可以让RIS 人工制造出足够好的信道,但是这样的一个系统也是有问题的,首先为了获得更高的准确性,RIS 应当被仔细地设计,但是RIS 的复杂性决定了找到这样的一个状态是很困难的。第二,对于姿势识别的决策方程对识别效果的影响是相当大的,也是和RIS优化函数密切相关的。因此我们应当同时优化配置和决策方程,由此获得最大的识别准确度
为了解决这些问题,把大问题分解成了两个小问题,也就是配置优化和决策函数优化两个子问题,然后搞一个交替优化算法和监督学习算法来分别求解这两个子问题。更重要的是,为了阐述我们的方法在实际系统里的作用,我们用USRP实现了我们的系统,也做了模拟来看系统设计的效果,本文的贡献大概如下:
1)建立了一个姿势识别系统,用的是低成本的RIS和USRP,通过优化RIS配置来创建最优传播链,系统就可以准确判断人的姿势
2)搞了一个联合的RIS配置和决策方程优化问题,以实现误判函数的最小化,由此提出的问题用我们提出的算法解决,但是我们的算法是把配置和决策分开优化的,我们也分析了算法的收敛性
3)同时做了模拟实验和真实实验,结果表明姿势识别的准确性随着RIS大小以及独立组的个数而上升
文章的组成如下:第二部分讲了基于RIS的人类姿势识别系统,第三部分建模了一个问题来优化RIS配置和决策函数来最小化错误函数,第四部分解这个函数,第五部分讲系统搭建,第六部分是实验结果,第七部分是结论
系统设计
RIS 模型
实际上RIS是一个有大量均匀分布,电可控的RIS元件组成的电磁可重构人工薄膜,每个RIS元件由多个金属片组成,这些金属片由电可控元件连接,例如PIN二极管,这些元件组装在电介质表面。每个PIN二极管可以根据施加的偏置电压切换到接通或断开状态。RIS元件的状态由RIS元件上PIN二极管的状态决定。RIS元件的每一个状态都显示出其自身的电特性,从而导致入射射频信号具有独特的反射系数。假设一个RIS元件包含N D N_DND个PIN二极管,因此RIS元件可以被配置成第二种可能的状态。我们将在第五节中详细描述RIS元素的实现。
用一个集合S a S_aSa来描述所有的RIS元素的状态,状态总数为N a N_aNa, 第i个元素的状态为s i ^ \hat{s_i}si^,对于频率f c f_cfc,RIS元素的反射系数可以表示为r ( θ I , θ R , s ) r(\theta_I, \theta_R, s)r(θI,θR,s),也就是入射角θ I = ( θ I , 1 , θ I , 2 ) \theta_I=(\theta_{I,1}, \theta_{I,2})θI=(θI,1,θI,2)(不过为啥是这种像坐标一样的形式?)、反射角θ R = ( θ R , 1 , θ R , 2 ) \theta_R=(\theta_{R,1}, \theta_{R,2})θR=(θR,1,θR,2)、状态s的函数,不过这个函数的值是个复数,其模长代表振幅比,相角代表入射和反射信号之间的相移
因为RIS 里面的元素实在是太多了,所以分别控制每一个RIS元素实在是不现实的,为了降低操控代价,我们把这些RIS元素分组,每一组包含同样数量的RIS 元素,同一组RIS元素在一个方形区域中,如图
所有的RIS元素被等价地分到了L个组里面,用N G = N / L N_G=N/LNG=N/L定义组的大小,在我们的系统中,我们在组的基本单元中操纵RIS元素,也就是说同一个组的RIS的状态相同,不同组相互独立,假设第l个组的状态为ν l \nu_lνl,我们定义包含了所有l组的状态的向量ν \bm{\nu}ν为RIS的configuration(配置),通过调整configuration,RIS可以改变反射信号的波形,形成beamforming,通过利用这些不同的波形,就可以实现姿势识别
信道模型
收发器包括发射机和接收机,它们分别配备有天线以发射与接收RF信号,发射器的天线是一个定向天线,用T x T_xTx来表示,T x T_xTx的主瓣指向RIS,因此大多数发射的信号被RIS反射和改变,被改变了的信号到达了RIS前面的区域,又被人体反射,接收器的天线,我们用R x R_xRx来表示,是一个全向垂直天线,所有被人体反射的信号都能被接收到,另外R x R_xRx天线就放在RIS下面,所以RIS反射的信号是不会直接被R x R_xRx捕获的
从发射机到接收机的传输信道可以建模为Rice(莱斯)信道,该信道由直接视线(LoS)分量、多个反射主导分量和多径分量组成:
直接视线分量代表着直接从T x T_xTx到R x R_xRx的没有任何反射的传播路径。
反射控制分量是指通过从RIS元件和人体反射的最短路径从发射机发送到接收机的信号
多径分量代表经过复杂的环境反射和散射得到的信号
定义RIS前面的部分为感兴趣的区域,在这一部分我们探测人类的姿势,它实际上是一个立方体区域,另外我们把这个感兴趣的区域分成了M个大小一致的方形块区域,由此人类的身体就可以被看成是无线信号的反射器,不失一般性地,我们定义这M个空间块的反射协方差为η = ( η 1 , . . . η M ) \bm{\eta}=(\eta_1,...\eta_M)η=(η1,...ηM),也可以给它取名叫space reflection vector(空间反射向量),直观地说,空间反射向量是由人体在感兴趣的空间中的姿势决定的。例如,对于给定的姿势,如果一个空间块包含人体的一部分,其η m \eta_mηm将非零。否则,如果第m个空格块为空,则η m = 0 \eta_m=0ηm=0。换言之,空间反射向量承载着人体姿态的信息
当给定了configurationν \bm{\nu}ν和空间反射向量η \bm{\eta}η之后,我们定义h d h_dhd为直接LoS路径的信道增益,h r l h_{rl}hrl和σ \sigmaσ是随机变量,h n , m ( ν l , η m ) h_{n,m}(\nu_l, \eta_m)hn,m(νl,ηm)表示经过第l ll组RIS中的第n nn个RIS元素反射后通过第m个空间块直接打到接收器上的的信号的信道增益,P t P_tPt为发出的信号的发射能量,收到的信号就可以这么表示:y = h d ⋅ P t ⋅ x + ∑ m ∈ [ 1 , M ] ∑ l ∈ [ 1 , L ] ∑ n ∈ N l h n , m ( ν l , η m ) ⋅ P t ⋅ x + h r l ⋅ P t ⋅ x + σ y=h_d \cdot P_t \cdot x+ \sum_{m\in[1,M]}\sum_{l\in[1,L]}\sum_{n\in\mathcal{N_l}}h_{n,m}(\nu_l, \eta_m) \cdot P_t \cdot x + h_{rl} \cdot P_t \cdot x + \sigmay=hd⋅Pt⋅x+m∈[1,M]∑l∈[1,L]∑n∈Nl∑hn,m(νl,ηm)⋅Pt⋅x+hrl⋅Pt⋅x+σ (为啥要P t P_tPt乘x)
第一项表示直接的LoS分量的信号,第二项表示N*M个反射主导分量的信号,第三项代表多径分量,第四项代表噪声
h d h_dhd和h n , m ( ν l , η m ) h_{n, m}(\nu_l, \eta_m)hn,m(νl,ηm)的表示方式如下:
在定义g T , l o s g_{T,los}gT,los和g R , l o s g_{R,los}gR,los分别代表LoS分量中的发射器和接收器的信道增益,以及d l o s d_{los}dlos为发射和接收天线之间的LoS距离后,
h d = λ 4 π ⋅ g T , l o s g R , l o s ⋅ e − j 2 π d l o s / λ d l o s h_d=\frac{\lambda}{4\pi} \cdot \frac{\sqrt{g_{T,los}g_{R,los}} \cdot e^{-j2\pi d_{los}/\lambda}}{d_{los}}hd=4πλ⋅dlosgT,losgR,los⋅e−j2πdlos/λ
定义r n , m ( ν l ) = r ( θ n I , θ m R , ν l ) r_{n,m}(\nu_l)=r(\theta_n^I, \theta_m^R, \nu_l)rn,m(νl)=r(θnI,θmR,νl)为denotes the reflection coefficient of the n-th RIS element for the incidence signal towards the m-th space block in state ν l \nu_lνl(翻译不明白),g T , n g_{T,n}gT,n是发射器到第n个RIS元素的增益,g R , m g_{R,m}gR,m是接收装置到第m个空间快的增益,d n d_ndn是发射天线到第n个RIS元素的距离,d n , m d_{n,m}dn,m是第n个RIS元素经过第m个空间块到达接收天线的距离,
h n , m ( ν l , η m ) = λ ⋅ r n , m ( ν l ) ⋅ η m ⋅ g T , n g R , m ⋅ e − j 2 π ( d n + d n , m ) / λ 4 π ⋅ d n ⋅ d n , m h_{n,m}(\nu_l,\eta_m)=\frac{\lambda \cdot r_{n, m}(\nu_l)\cdot \eta_m \cdot \sqrt{g_{T,n}g_{R,m}}\cdot e^{-j2\pi(d_n + d_{n,m})/\lambda}}{4\pi \cdot d_n \cdot d_{n,m}}hn,m(νl,ηm)=4π⋅dn⋅dn,mλ⋅rn,m(νl)⋅ηm⋅gT,ngR,m⋅e−j2π(dn+dn,m)/λ
两个噪声分别表示为:
h r l ∼ C N ( 0 , ϵ r l ) h_{rl} \sim \mathcal{CN}(0,\epsilon_{rl})hrl∼CN(0,ϵrl), σ ∼ C N ( 0 , ϵ n ) \sigma \sim \mathcal{CN}(0,\epsilon_n)σ∼CN(0,ϵn)
协议设计
为协调RIS和收发机执行姿态识别,提出了一个周期性配置协议,协议中的时间轴以帧为单位,时间间隔为δ \deltaδ,每一个时间帧内,每个RIS元素的状态从s 1 ^ \hat{s_1}s1^到s 2 ^ \hat{s_2}s2^依序变化,RIS元素在每个状态中持续的时间需要人为去定制,在提出的协议下,可以减轻由于RIS元素的可用状态集的不连续性而导致的RIS限制。(为什么),对第l ll组,在每一帧当中,RIS元素在不同状态下的持续时间可以用一个向量t ~ l = ( t ~ l , 1 , . . . , t ~ l , N a ) T \bm{\widetilde{t}_l}=(\widetilde{t}_{l,1}, ..., \widetilde{t}_{l, N_a})^Ttl=(tl,1,...,tl,Na)T表示,再提升一层,就可以用一个向量(或许叫矩阵更恰当?)来表示所有的RIS的frame configuration t = ( t ~ 1 T , . . . , t ~ L T ) T \bm{t}=(\bm{\widetilde{t}}_1^T, ..., \bm{\widetilde{t}}_L^T)^Tt=(t1T,...,tLT)T,在基于RIS的姿势识别系统中,这个矩阵应当被非常认真的配置,这样才能保证人类的姿势被准确识别。为了降低计算代价,将若干组frame configuration作为一个循环周期,但这些frame configuration未必需要相同,将这个间隔命名为recognition period。
假定recognition period 是由K帧组成的,K帧的配置被叫做configuration matrix,表示为T = ( t 1 , . . . , t K ) T \bm{T}= (\bm{t}_1, ...,\bm{t}_K)^TT=(t1,...,tK)T,其中t k = ( t ~ k , 1 T , . . . , t ~ k , L T ) T \bm{t}_k=(\bm{\widetilde{t}}_{k,1}^T, ... , \bm{\widetilde{t}}_{k,L}^T)^Ttk=(tk,1T,...,tk,LT)T是第k帧RIS的configuration,而t ~ k , l \bm{\widetilde{t}}_{k,l}tk,l是第k帧第l ll组的frame configuration。
接收器通过在一个recognition period 中测量到的K个信号的均值识别人的姿势,对于第k帧,收到的信号的均值为y k = h d ⋅ P t ⋅ x + ∑ m = 1 M ∑ l = 1 L ∑ n ∈ N l ∑ i ∈ S a t k , l , i ⋅ h n , m ( s i ^ , η m ) ⋅ P t ⋅ x + h ‾ r l ⋅ P t ⋅ x + σ ‾ y_k=h_d \cdot P_t \cdot x + \sum_{m=1}^M\sum_{l=1}^L\sum_{n\in \mathcal{N}_l}\sum_{i\in\mathcal{S}_a}t_{k,l,i} \cdot h_{n,m}(\hat{s_i}, \eta_m) \cdot P_t \cdot x + \overline{h}_{rl} \cdot P_t \cdot x + \overline{\sigma}yk=hd⋅Pt⋅x+m=1∑Ml=1∑Ln∈Nl∑i∈Sa∑tk,l,i⋅hn,m(si^,ηm)⋅Pt⋅x+hrl⋅Pt⋅x+σ,为了表示好看和运算方便起见,在定义了A AA之后,就可以写成h d ⋅ P t ⋅ x + P t ⋅ x ⋅ t k T A η + h ‾ r l ⋅ P t ⋅ x + σ ‾ h_d \cdot P_t \cdot x+ P_t \cdot x \cdot \bm{t_k^TA\eta} + \overline{h}_{rl} \cdot P_t \cdot x + \overline{\sigma}hd⋅Pt⋅x+Pt⋅x⋅tkTAη+hrl⋅Pt⋅x+σ
把这k帧的放在一起形成一个向量y \bm{y}y,整个k帧的向量表示为
y = h d ⋅ P t ⋅ x + P t ⋅ x ⋅ T A η + h ‾ r l ⋅ P t ⋅ x + σ ‾ \bm{y}= h_d \cdot P_t \cdot \bm{x} + P_t \cdot \bm{x \cdot TA\eta}+ \overline{h}_{rl} \cdot P_t \cdot \bm{x} + \bm{\overline{\sigma}}y=hd⋅Pt⋅x+Pt⋅x⋅TAη+hrl⋅Pt⋅x+σ
由于η \bm{\eta}η反映了人体姿态的信息,所以T A \bm{TA}TA反映了人体信息如何映射到我们的测量值上,所以定义Γ = T A \bm{\Gamma=TA}Γ=TA,并给Γ \bm{\Gamma}Γ起名叫measurement matrix,另外y \bm{y}y是一个k维的复向量,在给定这样一个k维的复向量y \bm{y}y和configuration matrix T \bm{T}T之后,接收器用似然函数来做姿势识别,我们给它起名叫decision function,形式是L ( H i ∣ y ) T \mathcal{L(H_i|y})^TL(Hi∣y)T,代表对于测量结果y \bm{y}y,判定出为第i种姿势的概率,H i \mathcal{H}_iHi指的就是“推断看到了第i种姿势”所以设计决策方程以及configuration matrix(这东西和measurement matrix之间就差了一个常数的乘法)很重要
基于RIS的姿势识别的问题定义
通过最小化失误函数来进行姿势识别优化问题的定义,随后把它分解成两个子问题,也就是配置优化问题和决策函数优化问题。
问题定义
loss函数为平均认错的概率,其中p i p_ipi代表第i种姿势出现的概率,χ i , i ′ \chi_{i, i^\prime}χi,i′代表把i ii认成i ′ i^\primei′的惩罚,P r ( y i ∣ η i ) Pr(\bm{y_i|\eta_i})Pr(yi∣ηi)代表当空间反射分布是η i \bm{\eta_i}ηi的时候,测得y i \bm{y_i}yi的概率。目标函数,也是平均错误识别开销,可以用如下方式来计算
Ψ L = ∑ i , i ′ ∈ [ 1 , N p ] , i ≠ i ′ p i ⋅ χ i , i ′ ⋅ ∫ y i ∈ C K P r ( y i ∣ η i ) ⋅ L ( H i ′ ∣ y i ) ⋅ d y i \Psi_{\mathcal{L}}= \sum_{i,i^\prime \in [1,N_p],i \neq i ^\prime}p_i \cdot \chi_{i,i^\prime} \cdot \int_{\bm{y}_i \in \mathbb{C}^K }Pr(\bm{y}_i|\bm{\eta}_i)\cdot \mathcal{L(H_{i^\prime}|\bm{y_i}})\cdot d\bm{y_i}ΨL=i,i′∈[1,Np],i=i′∑pi⋅χi,i′⋅∫yi∈CKPr(yi∣ηi)⋅L(Hi′∣yi)⋅dyi
对应的优化问题:
这五个限制依次代表似然函数给出的概率是正数、求和为1、y和其他元素的关系、时间长之和为δ \deltaδ、每段时长要大于0
问题分解
上面的那个优化问题不好解决,把它拆成两个(话说直接拆真的没问题吗)
1)configuration matrix优化:
2)决策函数优化
随后是大篇幅的讲优化方法,略过
系统搭建
首先讲RIS的搭建,随后讲发射器和接收器的模块
RIS的搭建
发射接收器模块
太过细节,所以也略去
Conclusion
本文设计了一个基于RIS的姿态识别系统。配置设计中,我们提出了一种基于帧的周期性配置协议。在协议中,我们提出了一个最小化错误识别代价的优化问题。为了解决这个问题,我们把它分解成配置矩阵和决策函数优化问题,并提出了FCAO算法和监督算法分别用学习算法求解。此外,基于USRPs,我们还设计了系统并在实际环境中进行了姿态识别实验。仿真结果表明,FCAO算法可以得到最优配置矩阵,这导致测量矩阵的平均互相关度较低。实验性的结果表明,平均互相干度较低的构型矩阵具有较高的相关性与识别精度,也有着较低的错误识别成本。另外,结合仿真和实验结果表明,姿态识别精度随尺寸的增加而提高。