LQR에서 제어는 적분항 속의 값(x^T Q x + u^T R u) 을 가장 최소화할 수 있는 방향으로 제어됩니다.
즉 적분항 속의 값은 마치 머신러닝의 loss function처럼 작용한다는 것이죠. 그래서 우리가 사전에 정의하는 행렬인 Q와 R값을 통하여 내가 어떤 값에 더 비중을 두고 제어를 할지 결정할 수 있게 됩니다.
예를 들면, 내가 state 변수 x를 [x,y,z] position으로 설정하였을 때, 이 시스템이 x방향으로는 빠르게 수렴했으면 좋겠고, 나머지 방향은 천천히 수렴해도 된다고 생각해봅시다. 제어되어 가기 원하는 점은 (0,0,0)으로 하고, 이때, Q를 diag(100,1,1)로 설정하게 되면, 이 시스템은 x방향으로의 변위를 다른 방향보다 10배 더 민감하게 인식하게 되므로, x방향 변위가 0에 더 빨리 다가갈 수 있도록 제어하는 것이죠.
해당 내용은 여러 학교에서 학부 과정 이후의 범위일 수 있으므로, 추가적인 질문이 있으면 언제든 더 올려주시면 답변해드리겠습니다!