Reconfigurable Intelligent Surface Based RF Sensing ...

闲鱼技术01 发表于 2022-10-18 09:23

简介

传统的用射频信号进行手势识别的方法受到环境限制，携带人体动作信息的信道数量会受到限制。一个直观的解释是，当独立的信道越多的时候可以从动作中得到的信息就越多。而如果使用RIS的话就可以改变环境，提供理想的信道条件。
难点在于：

[*]由于阵元的个数很多，每个阵元又有多个状态，所以优化配置的复杂度很高。
[*]决策函数（由接收信号到感知结果的映射函数）和RIS的配置是耦合的，因此需要联合优化这两者。
本文将优化问题分解为两个子问题：配置优化问题和决策函数优化问题，然后分别用交替优化算法和监督学习算法求解这两个子问题。
这里文中还做了额外说明：当有多个RIS的时候可以认为是一个等效的RIS，只不过阵元的个数增加了。但是当信号在多个RIS之间进行反射时，信道的模型就需要进行修改。
符号表

系统设计

基于RIS的动作识别系统

RIS可以反射并调整入射的某个范围内的窄带信号，假设RIS的工作频率是 f_c ，发射机持续发射 f_c 的单频信号，需要的带宽几乎为0，说明这个系统可以高效利用频谱。
RIS模型

定义阵元个数N，集合为 \mathcal{N} 。每个阵元是由多个金属片（用PIN二极管连接）构成。每个二极管有开关两种状态，因此RIS的状态个数由二极管的个数决定。定义每个RIS的状态集合为 \mathcal{S}_a ，其中每个状态定义为 \hat{s}_{i} 。
假设每个阵元之间都是不相关的，其反射系数只由自身决定。对于某个频率的信号，将反射系数表示为 r\left(\boldsymbol{\theta}_{I}, \boldsymbol{\theta}_{R}, s\right) ，参数是入射角度 \boldsymbol{\theta}_{I}=\left(\theta_{I, 1}, \theta_{I, 2}\right) ，反射角度 \boldsymbol{\theta}_{R}=\left(\theta_{R, 1}, \theta_{R, 2}\right) 和状态 s 决定。RIS阵元的反射系数认为是已知的先验知识。

信号对阵元的入射和反射

反射系数是一个复数，幅值和相位分别表示反射信号和入射信号的幅值之比和相位偏移，这可以通过仿真得到。由于模型不依赖于RIS具有特定的反射系数，这个模型和系统可以应用于使用不同频率的RIS的场景。
为了降低复杂度，将若干个阵元分为一组，一共L组，每组 N_G=N/L 个。第 l 个组的状态表示为 s_l ，这L个组的状态向量表示为： \boldsymbol{s}=\left(s_{1}, \ldots, s_{L}\right) 。通过改变RIS的设置可以实现波束赋形，这样可以增强对动作的识别。
需要说明的是：在这篇文章中假设RIS阵元之间的相关性是可以忽略的，其反射系数只由自身的状态决定。因为是将多个阵元合成一个组，这样阵元之间因为状态不同导致的相互影响也会减弱。另外实验结果也证明了这样近似对结果不会有太大影响。
信道模型

前面提到，收发器都是只有一根天线的，发射机以功率 P_t 连续发射载频为 f_c 的基带信号。信号被RIS反射后再打到人体在不同的位置反射，最后到达Rx。由于Rx位于RIS的正下方，所以RIS反射的信号不会直接被Rx接收。
从发射机到接收机的信道可以建模为莱斯信道，也就是由一个LoS分量、一个多径分量和多个反射主导分量构成。LoS分量指的是从Tx直接到Rx，反射主导分量表示通过RIS阵元和人体两次反射被Rx接收的最短路径，多径分量是信号被复杂环境反射和散射。
将感兴趣的区域离散化为M个方块，在这个区域里的人体当作是反射体，M个格子的空间反射系数定义为 \boldsymbol{\eta}=\left(\eta_{1}, \ldots, \eta_{M}\right) ，这个反射系数和上面的RIS的反射系数要区分开，空间反射系数是由人体的姿势决定的。如果一个格子包含了人体，那这个格子的反射系数就不为0，反之则为0。
在给定设置 \mathcal{s} 和空间反射系数向量 \mathcal{\eta} 的前提下，接收信号可以表示为 y=h_{d} \cdot P_{t} \cdot x+\sum_{m \in} \sum_{l \in} \sum_{n \in \mathcal{N}_{l}} h_{n, m}\left(s_{l}, \eta_{m}\right)\cdot P_{t} \cdot x+h_{\mathrm{rl}} \cdot P_{t} \cdot x+\sigma\\ 第一项表示LoS，第二项表示N×M个反射主导分量，第三项是多径分量。 \sigma表示噪声。 h_d 表示LoS的信道增益 h_{d}=\frac{\lambda}{4 \pi} \cdot \frac{\sqrt{g_{T, \operatorname{los} g_{R, \operatorname{los}}} \cdot e^{-j 2 \pi d_{\operatorname{los}} / \lambda}}}{d_{\operatorname{los}}}\\ 另外 h_{n, m}\left(s_{l}, \eta_{m}\right) 代表被在 s_l 状态下的第l个组中的第n个阵元和第m个空间块反射到达接收机的信道增益：h_{n, m}\left(s_{l}, \eta_{m}\right)\quad=\frac{\lambda \cdot r_{n, m}\left(\nu_{l}\right) \cdot \eta_{m} \cdot \sqrt{g_{T, n} g_{R, m}} \cdot e^{-j 2 \pi\left(d_{n}+d_{n, m}\right) / \lambda}}{4 \pi \cdot d_{n} \cdot d_{n, m}}\\ 其中 r_{n, m}\left(s_{l}\right)=r\left(\boldsymbol{\theta}_{n}^{I}, \boldsymbol{\theta}_{m}^{R}, s_{l}\right) 就是上面定义的RIS反射系数。噪声 \sigma 服从复正态分布 \sigma \sim \mathcal{C} \mathcal{N}(0, \epsilon) 。
因为有 (N_a)^L 个状态，状态变化信道条件也会变，所以有 (N_a)^L 种可能的传输信道。因此改变RIS的配置可以增加传输信道的分集（diversity）数。我的理解是，信号从很多个不同信道到达接收机，肯定比只有一条信道得到的信息更多，RIS就可以使信道的个数增加。
协议设计

当状态数Na为4时的例子

协议将时间分为 \delta 时长的frame，在每个frame里，每个RIS阵元从状态 \hat{s}_1 逐个切换到 \hat{s}_{N_a} 。可以从图中看到四个状态的持续时间不一定相同，而每个状态的持续时间也是一个需要设计的参数。对一个frame，第 l 个组中每个阵元不同状态的持续时间表示为 \tilde{\boldsymbol{t}}_{l}=\left(\tilde{t}_{l, 1}, \ldots, \tilde{t}_{l, N_{a}}\right)^{T} ，其中 \sum_{i=1}^{N_{a}} \tilde{t}_{l, i}=\delta ，也就是所有时间之和等于一个frame的持续时间。
基于这个定义，可以把RIS的frame设置表示为向量 \boldsymbol{t}=\left(\tilde{\boldsymbol{t}}_{1}^{T}, \ldots, \tilde{\boldsymbol{t}}_{L}^{T}\right)^{T} ，每个元素代表一个组的设置，而一个组又分为 N_a 个状态，因此这个t实际上是一个 L×N_a 的矩阵。定义识别时段（recognition period）为RIS设置重复改变的时间。
如上图所示，识别时段由K个frame组成，这一个时间段的配置矩阵又可以定义为一个三维矩阵，加上了时间维度， T=\left(\boldsymbol{t}_{1}, \ldots \boldsymbol{t}_{K}\right)^{T} ，其中\boldsymbol{t}_{k}=\left(\tilde{\boldsymbol{t}}_{k, 1}^{T}, \ldots, \tilde{\boldsymbol{t}}_{k, L}^{T}\right)^{T}(k \in) 。
在识别姿势的时候，对收到的K个frame的测量值分别取平均，在第k个frame中，接收信号的均值可以表示为： \begin{aligned} y_{k}=& h_{d} \cdot P_{t} \cdot x+\sum_{m=1}^{M} \sum_{l=1}^{L} \sum_{n \in \mathcal{N}_{l}} \sum_{i \in \mathcal{S}_{a}} t_{k, l, i} \cdot h_{n, m}\left(\hat{s}_{i}, \eta_{m}\right)\cdot P_{t} \cdot x+\bar{h}_{\mathrm{rl}} \cdot P_{t} \cdot x+\bar{\sigma} \\ =& h_{d} \cdot P_{t} \cdot x+P_{t} \cdot x \cdot \boldsymbol{t}_{k}^{T} \boldsymbol{A} \boldsymbol{\eta}+h_{\mathrm{rl}} \cdot P_{t} \cdot x+\bar{\sigma}_{k} \end{aligned}\\ \boldsymbol{A}=\left(\boldsymbol{\alpha}_{1}, \ldots, \boldsymbol{\alpha}_{M}\right) 是投影矩阵， \boldsymbol{\alpha}_{m}=\left(\hat{\boldsymbol{\alpha}}_{m, 1}^{T}, \ldots, \hat{\boldsymbol{\alpha}}_{m, L}^{T}\right)^{T} ，且\hat{\boldsymbol{\alpha}}_{m,l}=\left(\hat{\alpha}_{m, l, 1}, \ldots, \hat{\alpha}_{m, l, N_{a}}\right)^{T} ，其中 \sigma_k 表示第k个frame的平均噪声，服从复高斯分布。
接收机通过这K个均值识别人体姿势，测量向量定义为： \boldsymbol{y}(\boldsymbol{T}, \boldsymbol{\eta})=\left(y_{1}, \ldots, y_{K}\right)^{T} ，基于上面的表达式，测量向量可以进一步表示为 \boldsymbol{y}=h_{d} \cdot P_{t} \cdot \boldsymbol{x}+P_{t} \cdot \boldsymbol{x} \cdot \boldsymbol{T} \boldsymbol{A} \boldsymbol{\eta}+h_{\mathrm{rl} 1} \cdot P_{t} \cdot \boldsymbol{x}+\overline{\boldsymbol{\sigma}}\\ 实际上就是用向量形式表示了。 TA 决定了人类的姿势信息如何映射到测量值上，定义 \Gamma=\boldsymbol{T} A 为测量矩阵。y是一个K维的复数向量，给定测量向量y和配置矩阵T，接收端采用了一个似然函数来预测，也就是所说的决策函数，可以表示为 \mathcal{L}(\boldsymbol{y}) 。这里 \mathcal{L}(\boldsymbol{y}) 是一个 N_p 维的向量，每个元素代表预测为第i个姿势的概率。
而姿态识别的性能取决于决策函数和配置矩阵的设计，为了获得较高的识别精度，需要对决策函数和构型矩阵进行优化。
问题建模

将问题分解为两个子问题，即配置优化和决策函数优化。
问题建模

第i个姿势的测量向量可以由配置矩阵T和空间反射系数矩阵 \eta_i 决定，记为 \boldsymbol{y}_{i}=\boldsymbol{y}\left(\boldsymbol{T}, \boldsymbol{\eta}_{i}\right) ，将目标函数设置为最小化错误识别的代价： \Psi_{\mathcal{L}}=\sum_{i, i^{\prime} \in\left,} p_{i \neq i^{\prime}} \cdot \chi_{i, i^{\prime}} \cdot \int_{\boldsymbol{y}_{i} \in \mathbb{C}^{K}} \operatorname{Pr}\left(\boldsymbol{y}_{i} \mid \boldsymbol{\eta}_{i}\right) \cdot \mathcal{L}_{i^{\prime}}\left(\boldsymbol{y}_{i}\right) \cdot d \boldsymbol{y}_{i},\\ 其中 p_i 是第i个姿势对应的概率， \chi_{i, i^{\prime}} 代表将第i个预测为第i&#39;个的代价，而Pr代表在空间反射向量的条件下得到测量向量的概率。因此积分符号内的表达式的含义就是根据接收信号错误识别成第i&#39;个姿势的概率。
基于上面的式子，这个优化问题可以建模为

在 P1中，优化的参数是决策函数 \mathcal{L} 和配置矩阵 T 。约束8和9是对概率函数的限制。约束10是信道模型的约束，是从空间反射系数向量 \eta 到测量向量y的关系。约束11和12是指在一个frame里所有状态时间都为正值，且加起来为 \delta 。
在解这个问题的时候，还需要用到另一个假设：假设每个姿势的先验概率是已知的，并且错误估计代价为1，正确估计代价为0，即 \mathcal{X}_{i,i}=0, \mathcal{X}_{i,i&#39;}=1 。
问题分解

P1中配置矩阵和决策函数是耦合的，需要共同优化，导致很难求解。所以可以分为两个子问题，配置矩阵优化和决策函数优化。
配置矩阵优化。给定决策函数的前提下，对于配置矩阵的优化表示为： \begin{array}{l} (\mathrm{P} 2): \min _{T} \Psi_{\mathcal{L}}\\ \text { s.t. } \boldsymbol{y}_{i}=h_{d} \cdot P_{t} \cdot \boldsymbol{x}+P_{t} \cdot \boldsymbol{x} \cdot \boldsymbol{T} \boldsymbol{A} \boldsymbol{\eta}_{i}\\ +\bar{h}_{\mathrm{rl}} \cdot P_{t} \cdot \boldsymbol{x}+\overline{\boldsymbol{\sigma}}, \quad \forall i \in\left \text {, }\\ \mathbf{1}^{T} \tilde{\boldsymbol{t}}_{k, l}=\delta, \quad \forall k \in, l \in,\\ \tilde{t}_{k, l, i} \geq 0, \quad \forall k \in, l \in, i \in\left \text {. } \end{array}\\ 决策函数优化。在给定配置矩阵的前提下，决策函数的优化可以表示为： \begin{aligned} (\mathrm{P} 3): \min _{\mathcal{L}} & \Psi_{\mathcal{L}} \\ \text { s.t. } & \mathcal{L}_{i^{\prime}}\left(\boldsymbol{y}_{i}\right) \geq 0, \forall \boldsymbol{y}_{i} \in \mathbb{C}^{K}, i, i^{\prime} \in\left, \\ & \sum_{i^{\prime} \in\left} \mathcal{L}_{i^{\prime}}\left(\boldsymbol{y}_{i}\right)=1, \forall \boldsymbol{y} \in \mathbb{C}^{K} \end{aligned}\\
求解算法

配置矩阵优化算法

对于P2，是要最优化配置矩阵来使平均错误识别代价最小。直接求解需要知道空间反射系数向量 \eta 作为先验知识。但是，已知 \eta 来优化配置矩阵可能对姿态的细微变化很敏感。为了寻找一个适用于一般姿态识别场景的最优配置矩阵，文中在不给定特定空间反射向量的情况下优化RIS配置。
由于决策函数基于测量向量 y 来判断，作者想要通过优化配置矩阵 T 来使得 y 包含有最丰富的信息。因为人体的分布信息是包含在 \eta 中的，因此需要从 y 中以最小的损失重建出 \eta 。
由于来自多径分量和噪声的信号通常比反射信道的增益小得多，而且是由环境决定的随机值，因此可以忽略它们，将 \eta 和 y 的关系建模为： y=P_t \cdot x \cdot T A\eta\\ 因为空间块的数量很多，比帧多很多，可以认为 M\gg K 。这样的话上式就是一个有无数解的欠定方程。因此在给定 TA 的情况下没办法从 y 中恢复出 \eta ，除非额外添加一些约束。
方程来说，一个常用的约束就是需要重建的信号是稀疏的，为了让目标信号，也就是 \eta 是稀疏的，需要让它的非零项远小于信号向量的维度。 |\operatorname{supp}(\boldsymbol{\eta})| \ll \operatorname{dim}(\boldsymbol{\eta})\\ 现实的感知情况是可以满足这种条件的，首先人体在感兴趣区域中只占一小部分，大部分都是空的，而且对于人体所在的空间块来说，只有人体表面满足特定角度的块才能将入射信号反射到接收机，这一部分的空间块的反射系数才不为0。因此利用压缩感知方法可以有效地重建欠定方程中的 \eta 。
为了最小化重建信号的损失，需要最小化测量矩阵 \Gamma=T A 的平均互相关性，定义为： \mu(\boldsymbol{\Gamma})=\frac{1}{M(M-1)} \cdot \sum_{m, m^{\prime} \in, m \neq m^{\prime}} \frac{\left|\gamma_{m}^{T} \gamma_{m^{\prime}}\right|}{\left\|\gamma_{m}\right\|_{2} \cdot\left\|\gamma_{m^{\prime}}\right\|_{2}}\\ 其中 \gamma_m=T\alpha_m 表示 \Gamma 的第m列。因此基于上式，可以把配置的优化重构为互相关性的优化：

由于目标函数是非凸的，优化是一个NP难问题。另外，P4的参数有 K\times L \times N_a 个，在实际应用中，测量数目K和组数L都会比较大，因此复杂度较大，而且这些参数互相耦合，因此也不能分为子问题来解决。
为了降低复杂度，文中采用了交替优化（AO）的思想，提出了FCAO（frameconfiguration alternating optimization）算法，交替优化每个frame的配置。在FCAO算法中，通过固定其他K1帧配置，以迭代的方式交替优化每个帧配置，直到达到收敛。
在每次迭代的时候优化P4的 t_k ，而配置矩阵的其他值 \boldsymbol{T}_{-k}=\left(\boldsymbol{t}_{1}, \ldots, \boldsymbol{t}_{k-1}, \boldsymbol{t}_{k+1}, \ldots, \boldsymbol{t}_{K}\right) 都保持不变。另外，定义 u_{m,m&#39;} 来衡量 \gamma_m 和 \gamma_{m&#39;} ，也就是配置矩阵的两列之间的相关性，表达式为： u_{m, m^{\prime}}=\frac{\gamma_{m}^{T} \gamma_{m^{\prime}}}{\left\|\gamma_{m}\right\|_{2} \cdot\left\|\gamma_{m^{\prime}}\right\|_{2}}\\ 定义 \boldsymbol{u}=\left(u_{1,2}, \ldots, u_{1, M}, \ldots, u_{2,3}, \ldots, u_{M-1, M}\right) 这个向量来表示各不同列之间的相关性。每次迭代的优化问题表示为：

为了解决这个问题，可以用增广拉格朗日法，原始的约束优化问题是通过求解增广拉格朗日函数的无约束最小化序列来解决的。
To solve (P5), we can adopt the augmented Lagrangian method , where the original constrained optimization problem is handled by solving a sequence of unconstrained minimizations for the augmented Lagrangian function.为了表示增广拉格朗日函数，定义P5的指标函数为 \mathbb{I}\left(\boldsymbol{t}_{k}\right)=\left\{\begin{array}{ll} 1, & \text { if } \tilde{\boldsymbol{t}}_{k, l} \succeq 0 \text { and } \mathbf{1}^{T} \tilde{\boldsymbol{t}}_{k, l}=1, \forall l \in \\ 0, & \text { otherwise. } \end{array}\right.\\ P5的增广拉格朗日函数可表示为：

其中 \rho 是一个正的尺度因子， \beta=\left(\beta_{1,2}, \beta_{1,3}, \ldots, \beta_{1, M}, \beta_{2,3}, \ldots, \beta_{M-1, M}\right) \in \mathbb{C}^{M(M-1) / 2} 是拉格朗日乘数向量，增广拉格朗日方法通过最小化(32)的序列，在每次迭代中β固定，找到(P5)的局部最优解。求解的完整算法可以去看原文的附录A。
（另外原文在符号标注上好像有一点问题，P5和P6好像有几个地方搞混了，而且其他地方也有几个错误）
监督学习算法

为了解决P3，也就是决策函数的优化问题，将决策函数 \mathcal{L} 用一个实数参数向量 \boldsymbol{\theta} \in \mathbb{R}^{L} 来描述，参数化后的函数表示为 \mathcal{L}^\theta ，决策函数的优化问题表示为：

文中提出了基于监督学习的神经网络来求解，具体来说用的是全连接的神经网络。网络由输入层、多个隐藏层和输出层组成。输入层对K维的复数测量向量 y 进行处理然后传递给第一个隐藏层。设第j个隐藏层有 n_{hid,j} 个节点，每个节点计算其输入的带偏置项的加权和，用激活函数处理，并将结果输出到下一层与之连接的节点。
输出层的节点数量就是姿势的数量 N_P ，输出层用一个softmax来处理输入的结果，表示为： \boldsymbol{y}=f_{\text {softmax }}(\boldsymbol{x})=\left[\frac{e^{x_{1}}}{\sum_{n=1}^{N_{P}} e^{x_{n}}}, \quad \ldots, \quad \frac{e^{x_{N_{P}}}}{\sum_{n=1}^{N_{P}} e^{x_{n}}}\right]\\ 这个公式将x转换为y，且满足上面的约束34和35。而决策函数的参数 \theta 其实就是网络节点的权重和偏移。由于神经网络的参数决定了决策函数的性能，即平均错误识别代价。因此文中提出了一种基于后向传播的算法来找到最优的参数。
将数据表示为 \mathcal{D}=\left\{\left(\boldsymbol{y}_{j}, \boldsymbol{L}_{j}\right)\right\}_{j=1}^{N_{\text {data }}} ，这里 y_j 和 L_j 定义为第j个测量向量和它的独热码标签， N_{data} 表示数据集的大小。另外，数据集的分布需要满足人体姿势的先验概率分布。
定义神经网络估计的损失函数为： E_{j}=\sum_{i=1}^{N_{P}} \sum_{i^{\prime}=1}^{N_{P}} \tilde{p}_{j, i^{\prime}} \chi_{i, i^{\prime}} L_{j, i}\\ 基于后向传播算法，参数的更新表示为： \Delta \boldsymbol{\theta}=-\zeta \frac{\partial E_{j}}{\partial \boldsymbol{\theta}}\\ 其中 \zeta 代表学习率，参数迭代更新直到平均损失收敛。
性能分析

FCAO算法收敛性

可以证明每一次迭代的目标值都比上一次低，且由于平均互相关 \Gamma = TA 有下界0，因此该算法一定收敛。
监督学习算法收敛性

同上， \theta 只会往损失下降的方向更新，且有下界0。
决策函数的最优性

反向传播算法会陷入局部最优，为了找到全局最优，可以多次进行和用模拟退火算法辅助。留待以后的工作进行。
最小平均错误识别代价的上界

当已知不同姿态的反射系数向量时，基于信号检测贝叶斯判据可得到最优决策函数： \mathcal{L}_{i}^{*}(\boldsymbol{y})=\left\{\begin{array}{ll} 1, & \text { if } I_{i}(\boldsymbol{y}) \leq I_{j}(\boldsymbol{y}), \forall j \in\left \\ 0, & \text { otherwise } \end{array}\right.\\ 其中 I_{i}(\boldsymbol{y})=\sum_{j=0}^{M} p_{j} \cdot\left(\chi_{i j}-\chi_{j j}\right) \cdot \operatorname{Pr}\left(\boldsymbol{y} \mid \boldsymbol{\eta}_{j}\right) 。在给定最优决策函数的前提下，平均错误识别代价可以被最小化。根据下面的命题，可以得到最小错误识别代价的上界是一个单调递减函数：
命题1：
假设反射系数向量已知，且 \chi_{i, i}=1, \chi_{i, j}=0(i \neq j) ，最小平均错误识别代价的上界表示为： \Psi_{\mathcal{L}^{*}} \leq \sum_{i=1}^{N_{P}} \sum_{j=1}^{N_{P}} p_{j} \mathcal{P}\left(K, Z_{i j}\left(\gamma_{\mathrm{Rx}}\right)^{2} / 2\right), \quad i \neq j\\ 其中 \gamma_{RX} 表示接收信号的信噪比， \mathcal{P} 表示正则化伽马函数， Z_{ij}(\gamma_{\mathrm{Rx}})=\frac{\sqrt{\gamma_{\mathrm{Rx}}}\left(\gamma_{\mathrm{Rx}}\left\|\hat{\boldsymbol{y}}_{j}-\hat{\boldsymbol{y}}_{i}\right\|_{2}^{2} / \bar{\epsilon}-\ln \left(p_{j} / p_{i}\right)\right)}{\left\|\hat{\boldsymbol{y}}_{j}-\hat{\boldsymbol{y}}_{i}\right\|_{2}}\\ 这里 \hat{y}_i 表示预期接收到的来自第i个姿势的信号。由于 \gamma_{\mathrm{Rx}} 和 P_t 成比例关系，所以最小平均错误代价的上界是一个关于 P_t 的单调递减函数。证明见附录B。
系统设置

RIS布置

RIS系统

文中用的RIS是一个 69 \times 69 \times 0.52 \mathrm{~cm}^{3} 大小的平面，每行每列包含了48个阵元，也就是 48\times48 的阵列。每个阵元是 1.5\times 1.5\times 0.52 \mathrm{~cm}^{3} 大小的，而且由四个金属片组成，两个相邻金属片由一个PIN二极管连接。发射信号是单频的3.198GHz。
因为有3个二极管，所以有8个状态

不同状态下阵元沿法线方向反射的相位和幅值变化

其他的设置都和之前的论文类似，所以剩下省略。
收发模块

对于设计的收发模块，接收信号的功率可以表示为 P_{\mathrm{Rx}}= P_{\mathrm{Tx}}+G^{\mathrm{LNA}}+G_{\mathrm{Tx}}^{A}-L_{\mathrm{Tx} \rightarrow \mathrm{RIS}}-L_{\mathrm{RIS} \rightarrow \mathrm{SB}} \\-L_{\mathrm{SB} \rightarrow \mathrm{Rx}}-R_{\mathrm{RIS}}-R_{\mathrm{SB}}+G_{\mathrm{Tx}}^{A}+G^{\mathrm{LNA}}\\ 也就是说发射信号经过LNA和天线增益放大，收到路径传输和反射的影响功率降低。通过自由空间LoS路径损失模型可以计算出Tx到RIS的损失大概为： L_{\mathrm{Tx} \rightarrow R I S}=20 \log _{10}\left(d_{\mathrm{Tx} \rightarrow \mathrm{RIS}}\right)+20 \log _{10}\left(f_{c}\right)-144.55\\
仿真以及实验结果

仿真和实验设置

a仿真，b实验

Tx距离RIS10个波长（大概0.936m），这样入射的信号对于RIS来说可以近似为平面波，因此，RIS元素上的入射信号的入射角大致相同，即 (60°，0°) 。人体位于感兴趣区域，由于感兴趣的空间在Tx天线的后面，而Tx天线是定向喇叭天线，从Tx天线到感兴趣的空间不存在LoS信号路径。
利用CST仿真得到RIS阵元的反射系数函数，模拟在相同角度的z轴极化平面波信号入射下的远场辐射图。仿真在unit-cell边界（？）下的频域内进行。

仿真参数

实验的环境如图b所示，在墙壁上覆盖了吸波材料，营造一个低反射环境，来模拟一个很大的空房间。
基于收发模块之间的损失表达式和实验的设置，可以计算基于RIS的传输的链路损失，假设在RIS上的反射不会导致能量损失，即 R_{RIS}=R_B=0 ，则接收信号功率为 P_{Rx}=-70.75 dBm ，如果没有LNA的话接收功率将会低于噪声级（约-100dBm）。
仿真结果

测量矩阵的平均互相关和FCAO算法迭代次数的关系

上图表示的是平均互相关 \Gamma 和算法迭代次数之间的关系。可以看到 \Gamma 随着迭代次数下降，证明了FCAO算法的有效性。另外，帧数K越大，收敛的结果越小。
\gamma_m 也就是 \Gamma 的第m列，表示的是第m个空间块的测量值。因为 \gamma_m=T\alpha_m ，为了降低 \Gamma 的互相关性，需要配置矩阵 T 在将 \alpha_m 映射到 \gamma_m 时，不同的 \gamma_m 的值较大的元素分布在不同维度。
当Ｋ很大时， \gamma_m 的维度也会很大，因此找到 T 使得 \gamma_m 中大的分量分布在不同维度的概率就更大了。

配置矩阵和平均互相关性

上图a中是一个随机的配置矩阵，其中所有状态的持续时间都是服从相同的均匀分布。而图b是测量矩阵 \Gamma 不同列之间的相关性。图c和d分别是最优化的配置矩阵和平均互相关性。可以看到优化后的配置矩阵得到的结果的互相关性有了明显的下降。

最优相关性和组的个数、大小的关系

当组数增加的时候，组的大小减少，这个时候平均互相关性会降低。反之则上升。所以需要平衡计算复杂度和性能之间的关系。
实验结果

文中首先进行了一个实验，证明RIS可以增加传输信道的数量，并且RIS阵元之间的相关性可以忽略。
在感兴趣区域放置一个 10\times10cm^2 的铜片，然后用40个随机配置（但是图中显示的是50个）来得到接收信号，并用接收信号和预期信号进行对比，可以看到在改变配置的时候接收信号也会改变，证明了RIS可以增加传输信道的能力。

接收到信号和期望信号的归一化振幅和相位

另外，可以看到测量信号和在阵元无关的假设下的预期信号几乎是一样的。说明把多个阵元当作一个组，可以减弱阵元间的相关性。
在这个实验中，演示了系统在优化配置的情况下进行高精度人体姿态识别的能力。设置K=10，即一个识别过程有10帧，考虑如下图所示的4种姿势。

需要识别的姿势

对于每种姿势，在随机配置下和最优化配置下采集150个测量向量，组成数据集。然后将其分为训练集和测试集，大小为4:1。对于每种情况，训练决策函数，然后用训练的网络来处理测试集中的数据，并记录每个姿势对应的概率。
为了进行对比，还在没有配置的情况下进行实验，也就是让阵元固定为某个状态，这样这个系统就是只是一个单天线传感系统了。

三种情况下训练模型的误差对比

将错误识别的代价设置为1，则平均代价随训练过程的变化如图所示。可以看到最优化的收敛结果比随机结果小了10倍，证明了优化算法降低互相关性是可以提升识别的准确率的。另外，和不配置的情况对比，可以知道RIS对环境的改变有助于提高准确率。
对于这一点我的理解是RIS改变了信号到接收机的传输信道，在这一过程中可以认为物体是静止的（实际上就是静止的，而且相对于改变配置的速度来说，缓慢运动应该都可以算作是静止的），而在改变信道的过程中，信号通过多个信道（不知道信道是不是独立）到达接收机，相当于是从多个角度来观察物体，因此可以获得更多信息。
另外图中还有一个现象，就是一开始训练epoch比较少的时候，优化算法的效果比其他两种都要差，文中也进行了解释。因为在无配置的情况下，测量矩阵将反射系数向量映射为一维复数，结构简单容易训练。而相比于随机配置，优化配置的信号中包含了更多信息，随着测量向量中信息的增加，用监督学习算法训练神经网络对其进行分类的难度增大。

姿势识别的正确率

图a和b分别为优化和随机的结果，优化的结果明显更好。c是无配置的情况。
总结

本文设计了一个用RIS来进行姿势识别的系统。为了得到最佳的感知效果，将其分为两个子问题分别优化，分别是配置矩阵优化和决策函数。用测量矩阵的平均互相关性来衡量感知的效果。结果表明优化配置->随机配置->无配置。

页: [1]

Unity开发者联盟's Archiver

Reconfigurable Intelligent Surface Based RF Sensing ...