Cross Street

고양이 눈은 로봇 카메라에 어떤 영감을 주는가?

2025년 8월 통권 239호

고양이의 일자형 동공과 휘판

빛에 따라 동공이 가늘게 일자로 좁혀지는 고양이의 눈은 신비롭고 독특한 인상을 준다. 소설이나 영화에서도 고양이의 눈처럼 날카롭고 신비로운 동공(눈동자)은 캐릭터에 예리함, 이질감, 위험한 매력을 부여하며 독자와 관객에게 강렬한 인상을 남긴다. 수정체에서 빛이 통과하는 부분인 동공은 고정된 게 아니라 주변 근육의 작용으로 크기가 변한다. 즉, 망막으로 들어오는 빛의 양을 조절하는 조리개로, 빛이 강하면 크기가 작아지고 약하면 커진다. 사람의 눈동자는 원형으로 그 크기가 변하지만 고양이는 일자로 좁혀지기 때문에, 소설 속 캐릭터의 세로로 가늘어진 동공은 해당 인물의 비인간적인 특징이나 위협적인 분위기를 강조할 때 이용된다. 


고양이와는 달리, 염소와 같은 초식동물은 대체로 수평으로 넓은 직사각형 형태의 동공을 갖는다. 한편 고양이와 같은 고양잇과인 호랑이는 사람과 비슷하게 동그란 동공을 갖고 있다. 이와는 전혀 다르게, 갑오징어는 가로세로 모양이 아닌 알파벳 W 모양의 동공을 갖는다. 단순히 빛의 양을 조절하는 조리개 역할을 한다면 동공의 모양이 왜 동물마다 다른 것인지 선뜻 이해가 가질 않는다. 어쩌면 사람처럼 원형인 게 가장 무난한 구조라는 생각도 해볼 수 있다. 미국 버클리 캘리포니아 대학의 마틴 뱅크스 교수는 동물의 눈동자 모양이 다양한 이유가 생태적 차이에서 기인할 것이라는 가설을 바탕으로 몇 가지 실험을 진행했다. 먼저 214종의 육상동물을 초식동물과 육식동물, 주행성 및 야행성으로 나누고 동공의 모양과 연계성을 살펴보았다. 그 결과 초식동물 42종 가운데 36종이 가로로 길쭉한 눈동자였다. 반면 육식동물은 사냥 행태에 따라 눈동자 모양이 달랐다. 사냥감을 쫓아가서 잡는 활동형(active)은 사람처럼 동그란 동공을 가진 반면, 풀숲에 숨어있다 기습하는 매복형(ambush)은 65종 가운데 44종이 세로로 길쭉한 눈동자였다. 


마틴 뱅크스는 매복형 포식자의 수직 동공이 사냥감의 거리를 정확히 파악하는데 도움이 될 것으로 보았다. 흔히 눈으로 거리를 파악하는 데에는 양안 시차가 가장 중요한 것으로 알려져 있다. 뇌는 양쪽의 눈에서 받아들이는 정보의 차이를 해석해 입체영상을 재구성하기 때문이다. 고양이도 양안시를 이미 사용하고 있기 때문에 거리감을 갖기에 충분할 수도 있는데 굳이 길쭉한 동공이 필요한 이유는 무엇일까. 마틴은 몇 년 전 발표한 그의 논문에서 힌트를 얻을 수 있었다. 물체의 거리를 파악하는데 양안시의 입체 정보 뿐만 아니라 심도(depth of focus)도 매우 중요한 요소라는 것이다. 심도란 물체가 선명하게 보이는 영역을 의미한다. 초점을 조금만 벗어나도 물체가 흐릿하게 보일 때 우리는 심도가 얕다고 얘기한다. 인물 사진을 예쁘게 찍기 위해 많이 사용하는 방식이다. 반면 풍경사진에서는 심도를 깊게 만들어서 피사체가 거리에 상관없이 전부 선명하게 만든다. 인물사진과 풍경사진을 비교해보면 어떤 대상의 거리를 파악할 때는 심도가 얕아 앞뒤의 대상이 흐릿해지는 게 유리하다는 것을 파악할 수 있다. 마틴은 고양이가 사냥감과 자신의 거리를 보다 명확히 파악하기 위해서 양안의 입체시(steropsis)와 일자형 동공에서 얻어지는 흐릿함의 정도(blur)를 동시에 활용한다고 생각했다.


심도를 얕게 해서 인물사진을 잘 찍기 위해서는 조리개를 크게 확대하면 되고, 반대로 심도를 깊게 하려면 조리개를 작게 줄이면 된다. 대낮에 고양이가 먹이를 잘 포착하려면 동공을 크게 확대하면 된다. 하지만 동공을 크게 넓히는 순간 너무 많은 빛이 망막에 도달하여 눈부심을 피할 수 없게 된다. 반면, 수직형 동공 형태로 조리개를 줄이면, 빛의 양도 적절히 조절할 수 있고 한쪽 방향으로는 매우 얕은 심도를 얻게 되어 원하는 목표물만 선명한 영상을 얻을 수 있다. 상대적으로 몸집이 작은 매복형 포식자들은 늘 풀숲에서 사냥감을 찾아야하니 그들의 눈에는 거칠거칠한 풀숲이 노이즈로 작용했을 것이다. 이런 상황에서 목표물을 더욱 정확히 포착하기 위해 세로형 동공이 수렴진화적으로 나타나게 되었을 것이라고 마틴은 설명한다. 


심도에 대해서 좀 더 얘기해보자. 야간에는 빛을 많이 받아들이기 위해 어차피 조리개를 크게 확대해야 한다. 그럼 얻어지는 영상은 자연스레 심도가 얕아지게 되어 원하는 물체만 선명하게 볼 수 있다. 게다가 고양이는 사람의 동공보다 3배 더 크게 확대될 수 있어서 야행성 사냥에 안성맞춤이다. 하지만 깜깜한 밤에는 광량이 충분하지 않아서 사냥감이 잘 안보일 수 있다. 여기서 고양이 눈의 비밀병기인 휘판(tapetum lucidum)이 등장한다. 휘판은 눈 망막 뒤에 존재하는 반사층으로, 들어온 빛을 다시 망막으로 되돌려 줌으로써 희미한 빛에서도 시각 감도를 높여주는 역할을 한다. 고양이는 휘판 덕분에 시각 민감도가 약 44% 향상되어 밤에도 사냥감을 선명하게 볼 수 있게 된다. 휘판은 고양이 뿐 만 아니라 야행성 포유류를 포함하여 악어나 쥐 등 야간 시력을 활용해야 하는 많은 동물에 존재한다. 


고양이가 사냥감을 열심히 찾는 동안 그들도 가만히 당하고만 있지는 않는다. 풀숲이나 나무와 비슷한 색을 띠도록 진화한 피식자들은 주변 환경에 녹아들어 포식자의 시각적 탐지를 회피한다. 그러나 고양이는 수직 동공과 휘판을 통해 낮과 밤을 가리지 않고 사냥감을 더 잘 찾아낼 수 있도록 돕는다. 쉽게 말해, 고양이는 ‘위장을 뚫고 보는 능력(camouflage breaking)’을 갖춘 셈이다.


지능형 로봇을 위한 눈, 카메라의 진화

시장 분석 전문기관인 욜 디벨롭먼트(Yole Development)에 따르면, 2020년대 중반을 기점으로 전자제품 산업의 패러다임이 스마트 기기에서 ‘지능형 로봇’으로 이동할 것으로 전망된다. 이미 삼성, 엔비디아 같은 글로벌 기업들이 애완 로봇, 가정용 로봇 등 인간과 더 밀접하게 연결된 로봇의 개발을 본격화하면서, ‘지능형’이라는 수식어가 붙은 제품을 앞다투어 선보이고 있다. 여기서 ‘지능형’이라는 단어는 단순한 마케팅 용어가 아니다. 이는 로봇이 단순히 외부의 명령을 따르는 것이 아니라, 스스로 환경을 인식하고 판단하는 능력을 갖추게 된다는 의미를 포함하고 있다. 로봇이 스스로 판단하기 위해서는 무엇보다 정확한 감각정보가 필요하다. 이는 카메라에서 획득한 시각 정보일 수도 있고, 로봇 팔에서 얻어지는 촉각 정보, 혹은 향후 개발될 후각이나 미각 센서를 통해 감지된 데이터일 수도 있다. 모든 감각 정보가 중요하게 쓰일 수 있으나, 현재 시점에서 시각 정보가 가장 무시할 수 없는 중요한 정보라는 것은 누구나 알 수 있다. 


그렇다면 로봇에게 필요한 최고의 카메라는 어떤 모습이어야 할까? 많은 사람들이 상상하는 이상적인 카메라는 모든 방향에서 정보를 포착하고, 가시광선 뿐만 아니라 적외선과 자외선을 포함한 모든 스펙트럼을 감지하며, 극도로 높은 해상도를 제공하는 장치일 것이다. 사람들은 마치 그리스 신화 속 키메라처럼, 다양한 동물의 장점을 하나로 융합한 ‘완벽한 카메라’라를 꿈꾼다. 하지만 완벽한 카메라란 존재하지 않는다. 완벽한 카메라는 엄청난 양의 시각 데이터를 제공할 수 있지만, 이를 처리하는 데 막대한 시간과 에너지가 필요하다. 즉, 고성능의 카메라를 장착하면 로봇은 더 많은 계산 자원과 더 강력한 전력을 요구하게 된다. 결국 로봇이 실시간으로 데이터를 분석하고 판단하기 위해서는, 모든 것을 보는 것이 아니라, 필요한 정보만을 정확히 보는 ‘균형 잡힌 카메라’가 필요하다. 여기서 우리는 자연의 눈에서 해답을 찾을 수 있다.


다시 고양이의 눈으로 돌아가보자. 고양이의 눈이 갖고 있는 위장 해제 기술은 컴퓨터 비전(computer vision)에서도 중요한 연구 주제이다. 컴퓨터 비전은 카메라가 촬영한 이미지 속에서 의미 있는 정보를 찾아내는 기술인데, 현실에서는 여러 방해 요소가 많다. 예를 들어, 도심에서 회색 전봇대 앞에 회색 옷을 입은 사람이 서있다면, 카메라는 그를 다른 사물과 구별하기 어렵다. 군인이 숲에서 위장복을 입고 있다면 더욱 인식하기 힘들 것이다. 이를 해결하기 위해 연구자들은 물체의 색이나 무늬뿐만 아니라, 표면의 질감(texture)까지 분석하는 방법을 개발했다. 하지만 이 방식은 단순한 위장만 탐지할 수 있고, 자연처럼 복잡한 환경에서는 잘 작동하지 않는다. 이 문제를 해결하기 위해, 옥스퍼드 대 앤드류 지서맨 연구팀은 위장된 물체가 포함된 가상 이미지를 대량으로 만들어 인공지능(AI)에게 학습시켰다. 뿐만 아니라, ‘어떤 위장이 가장 효과적인가?’라는 새로운 질문을 던지며, 위장 패턴을 평가하고 자동으로 더 정교한 위장을 설계하는 방법도 개발했다. 이렇게 머신러닝(machine learning)과 딥러닝(deep learning)이 위장 해제 기술에 도입되기 시작했다. 


딥러닝은 이제 우리 일상에서 빠질 수 없는 기술이 되었다. 사진을 자동으로 분류하고, 음성을 인식하며, 자율주행차가 장애물을 피하는 등 다양한 곳에서 쓰인다. 특히 영상 처리 분야에서는 딥러닝을 사용하지 않는 일이 거의 없을 정도다. 하지만 딥러닝 모델이 아무리 뛰어나도, 결국 엄청난 양의 계산을 필요로 하며 전력을 많이 소모한다. 이는 카메라나 센서와 같은 하드웨어 설계자들에게 계산량(computational load) 절감이라는 중요한 과제를 남긴다. 


이 개념을 설명하기 위해 딥러닝의 대표적인 예시인 숫자 인식 문제를 살펴보자. 연구자들은 7x7 픽셀로 이루어진 손글씨 숫자 이미지(MNIST 데이터)를 학습시켜, 컴퓨터가 숫자를 자동으로 알아맞히도록 훈련한다. 딥러닝 모델은 이미지를 분석하여 중요한 특징을 찾아내고, 가장 가능성 높은 숫자를 선택한다. 예를 들어, 흔히 알려져있는 합성곱 신경망(Convolutional Neural Network, CNN) 모델을 활용하면 96% 이상의 높은 정확도로 숫자를 인식할 수 있다. 그런데, 만약 숫자 주위에 지저분한 배경이 섞여 있다면 어떨까? 카메라는 숫자와 배경을 함께 촬영하므로, 딥러닝 모델이 숫자를 정확히 인식하기 어려워지고 정확도가 88% 수준으로 떨어진다. 이는 컴퓨터 비젼 모델이 불필요한 시각적 정보에 의해 교란되는 대표적인 예시다. 여기서 다시 고양이 눈을 도입할 수 있다. 고양이처럼 수직 동공을 활용하면 불필요한 배경을 흐릿하게 만들고, 숫자는 또렷하게 보이도록 할 수 있다. 이렇게 하면 인식률을 다시 94%까지 올릴 수 있다. 즉, 지능형 로봇의 카메라가 고양이 눈을 닮도록 만들면, 불필요한 연산량을 줄이면서도 원하는 물체를 보다 정확히 식별하게 되는 것이다.


결국, 고양이 눈에서 영감을 얻은 기술이 인공지능과 만나면서 더 적은 계산으로도 효과적인 인식이 가능해지는 것이다. 자연의 진화가 만든 해법이, 기술 발전에도 중요한 아이디어를 제공하고 있는 셈이다. 마틴 뱅크스의 고양이 눈 수직 동공에 관한 연구는 2015년에 발표되었고, 이를 모방한 카메라 연구는 2024년에 우리 연구팀이 발표했다. 인류는 오랜 시간 고양이와 공존해 왔지만, 우리가 익숙하게 보아온 그 날카로운 눈이 왜 그렇게 진화했는지를 과학적으로 이해하기 시작한 것은 불과 10년도 채 되지 않는다. 그리고 이제 우리는 이 정교한 시각 시스템이 가진 잠재력을 막 탐구하기 시작한 단계에 있다. 앞으로 풀어야 할 과제는 여전히 많다. 


참고문헌

M. S. Banks et al., Why do animal eyes have pupils of different shapes?, Science Advances 1, e1500391 (2015)

M. S. Kim et al., Feline eye-inspired artificial vision for enhanced camouflage breaking under diverse light conditions, Science Advances 10, eadp2809 (2024)

E. Hedley, How the natural world is inspiring the robot eyes of the future, doi.org/10.1038/d41586-025-01660-5 (2025)

댓글 0
  • There is no comment.

댓글을 작성하기 위해 로그인을 해주세요

registrant
송영민
KAIST 교수