[Review] MoodCapture: Depression Detection using In-the-Wild Smartphone Images

[발표자] 최예인 (dev.yeinchoi@gmail.com)

[논문 제목] MoodCapture : Depression Detection using In-the-Wild Smartphone Images

[저자] Nepal & Pillai et al.

[학술대회/학술지] CHI ’24: Proceedings of the 2024 CHI Conference on Human Factors in Computing Systems

[URL] https://dl.acm.org/doi/10.1145/3613904.3642680


댓글

“[Review] MoodCapture: Depression Detection using In-the-Wild Smartphone Images”에 대한 6개 응답

  1. 우울증은 특정 순간에 명확하게 드러나는 병이라기보다는 본인조차 인식하지 못한 채 일상 속에서 서서히 스며드는 마음의 질병이라고 들어 왔습니다. 그렇기 때문에 통제된 실험실 환경이나 의도적인 자기 보고식 측정만으로는 우울증 신호를 포착하기 어렵다는 점에 공감이 갔습니다. 이런 특성 때문에 연구진이 전반적으로 강조한 ‘실제 환경’이라는 맥락이 우울증이라는 질병의 특성과 잘 맞닿아 있다는 인상을 받았습니다.

    우리가 가장 자주 사용하는 스마트폰의 전면 카메라를 활용해 평소의 자연스러운 얼굴 표정만으로도 우울증의 신호를 감지할 수 있다는 발상 또한 현실적인 동시에 설득력있게 다가왔습니다. 스마트폰의 카메라를 이용해 사용자가 인지하지 못할 정도로 이미지 수집을 하면 개인정보 차원의 문제가 발생하지 않을까 하는 우려가 들었는데, 연구진들은 이를 대비해 사용자의 받아들이는 정도를 조사하고 본 실험을 사용자들이 각자 다르게 받아들일 것이라는 결론까지 내려 수용성 또한 중요하다고 언급한 부분을 통해 디테일한 부분까지도 고려한 연구가 논문을 읽는 사람에게 중요하게 다가올 수 있다는 점을 알게 되었습니다.

    이 논문은 기술적으로 가능한지를 넘어서 왜 이런 기술이 지금 우리에게 필요한가를 잘 보여주는 연구처럼 느껴졌습니다. 우울증을 탐지하고 스스로를 돌아볼 수 있도록 돕는 기술은 앞으로 점점 더 중요해질 것이고, 그런 맥락에서 실제 사용 환경 속에서 자연스럽게 작동하는 감정 인식 기술은 가치 있는 방향이라는 생각이 들었습니다.

    좋아요

  2. 주변에 우울증을 겪는 사람이 있었던 경험이 있어서 이러한 연구가 실제로 진행되고 있다는 점이 인상 깊었습니다. 우울증은 일회성 평가보다 지속적인 관찰이 중요한 질환이라고 생각하는데, 항상 지니고 있는 스마트폰을 통해 환자의 상태를 탐지할 수 있다는 점은 매우 큰 장점이라고 느꼈습니다. 특히 통제된 실험실 환경이 아니라 일상생활 속 자연스러운 상황에서 실험을 진행했다는 점이 이 연구의 가장 큰 차별점이자 강점이라고 생각합니다.

    발표 영상을 보며 몇 가지 궁금한 점이 생겼습니다. 우선 얼굴 표정이 과연 우울증을 판단하는 데 있어 핵심적인 지표가 될 수 있는지에 대한 의문이 들었습니다. 일반적으로 알려진 우울증 환자의 모습은 다른 사람들과 크게 다르지 않으며, 오히려 웃고 있는 모습이 포착되는 경우도 많습니다. 이러한 표정들은 사회생활 속에서 나타나는 모습일 가능성이 큰데, 본 연구의 EMA 응답 과정에서 주로 혼자 있는 상황에서 데이터가 수집되었으므로 이러한 사회적 표정을 배제하여 판단한 것인지 궁금합니다. 

    또한 얼굴 표정을 기반으로 우울증을 탐지하는 구체적인 지표가 존재하는지도 궁금합니다. 우울증 환자의 얼굴 이미지를 사전에 CNN으로 학습시켜 특징을 추출한 뒤 이를 활용한 것인지, 그리고 우울증 집단에서 공통적으로 나타나는 얼굴 특징이 무엇이었는지에 대해 논문에서 충분히 언급되었는지 궁금합니다. 만약 단순히 표정만을 기준으로 판단한다면, 그날의 기분이나 일시적인 감정 변화에 따라 결과가 달라질 가능성도 크다고 생각하는데, 논문에서 이러한 변동성을 어떻게 고려했는지도 궁금합니다. 

    EMA 응답 시 얼굴 촬영이 이루어진다는 사실을 인지하고 있던 참가자가 있었다는 점에 대해 실험의 타당성과 관련해 의문이 들었습니다. 촬영 사실을 인지할 경우 의식적으로 표정을 조절할 가능성이 있기 때문에, 이러한 상황에서도 실험 결과를 충분히 신뢰할 수 있는지에 대한 생각이 들었습니다. 

    CNN 기반 딥러닝 모델만 사용하지 않고 랜덤 포레스트를 함께 사용한 이유가 무엇인지 궁금합니다. 딥러닝 수업을 통해 하이브리드 모델을 설계해본 경험이 있어, 이러한 조합이 특정 조건에서 성능을 보완하기 위한 전략이라는 점은 알고 있습니다. 논문의 한계점에서 언급된 것처럼 표본 규모가 제한적이어서, 이와 같이 데이터 수가 적은 상황에서 안정적인 성능을 확보하기 위해 이러한 모델 구성을 선택한 것인지 궁금합니다.

    전체적으로 영상을 보며 이미지 기반으로도 우울증을 탐지할 수 있다는 점이 매우 흥미롭게 느껴졌습니다. 이 기술이 우울증 환자만을 대상으로 하는 데 그치지 않고, 스스로 우울 상태를 인지하지 못한 채 힘들게 살아가는 사람들에게도 도움을 줄 수 있는 도구로 확장되면 좋겠다는 생각이 들었습니다. 또 데이터 처리 과정에서 조명과 색감까지 세심하게 고려한 점 역시 민감한 주제를 다루는 연구인만큼 좋았던 점이라고 생각합니다. 이번 논문 리뷰도 잘 들었습니다!

    좋아요

  3. 김예인

    MBTI 검사와 같은 설문을 할 때에도 ‘내가 보는 나’와 ‘남이 보는 나’가 다른 것처럼 설문은 항상 본인이 스스로 평가하기 때문에 주관이나 편향이 반영될 수 밖에 없다고 생각해왔는데, 이런 부분을 이미지 분석을 통해 해결하고자 한 점이 매우 재미있고 의미있다고 생각합니다. 또한 단순하게 분석을 진행하지 않고 모델 비교를 진행한 점이 흥미롭게 느껴지는 것 같아요.

    사실 영상을 보는 중에는 우울이 얼굴에 매번 드러나는가?, 기존에 가지고 있는 얼굴 특성이 우울로 판단될 수도 있는 것 아닌가? 라는 의문이 가장 많이 들었던 것 같습니다. 얼굴 캡쳐가 진행될 때 얼굴의 어떤 특성을 우울로 인식하는지, 항상 이 특성을 가진 사람들을 우울이라고 판단할 수 있는지, 우울증을 가지지 않은 사람들이 실험에 참여했을 때에는 어떤 차이가 생길지도 궁금해졌습니다.

    더 나아가, 설문 기반 평가의 주관적 편향을 줄이기 위해 도입된 이미지 캡처가 얼굴 형태, 촬영 각도 등 새로운 편향을 발생시킬 수 있다는 점에서 이러한 편향을 어떻게 완화하거나 보정할 수 있을지에 대한 논의가 향후 연구에서 보완되면 좋을 것 같습니다.

    좋아요

  4. 이 연구는 전통적인 우울증 평가 방식이 지니는 한계를 보다 효과적이고 창의적인 접근으로 보완하고자 했다는 점에서 인상 깊게 느껴졌습니다.
    궁금한 점은, 연구에서는 얼굴 이미지를 기반으로 우울감을 평가한다고 설명하고 있는데, 이때 입꼬리나 눈썹의 위치와 같은 얼굴의 특정한 특징이나 표정 변화가 주요 단서로 활용되는 방식인지, 혹은 우울증 환자의 데이터를 학습시켜 그 패턴을 기준으로 분류하는 방식인지 궁금합니다. 또한 겉으로는 밝아 보이지만 실제로는 우울감을 경험하는 경우도 많다는 점에서, 얼굴 표정만으로 우울증을 판단하는 것이 과연 충분히 유의미한지에 대한 의문도 함께 들었습니다.

    그럼에도 불구하고 일상적인 스마트폰 사용 과정에서 자연스럽게 수집되는 얼굴 이미지를 활용해 정신 건강 상태를 진단하려는 시도 자체는 창의적이라고 느껴졌습니다. 특히 이러한 기술이 온디바이스 방식으로, 가벼운 데일리 건강 체크 도구 형태로 구현된다면 개인정보 유출에 대한 부담을 줄이면서도 의미 있는 건강 진단 도구로 활용될 가능성이 있다고 생각했습니다. 다만 이렇게 얼굴 정보라는 민감한 데이터를 다루는 연구에서는 이를 별도로 저장하거나 외부로 전송하는 과정에서 사용자 프라이버시를 고려한 설계를 하는 것이 중요한 과제가 될 것 같다고 느꼈습니다. 좋은 논문 리뷰 감사합니다!

    좋아요

  5. 박서윤

    무드 캡처 우울증 탐지 시스템에 대해 전반적으로 흥미롭게 읽었으나, 몇 가지 아쉬운 점과 의문이 남았습니다.

    우선, 이 시스템이 어떤 원리로 얼굴 이미지를 활용하여 우울증을 탐지하는지에 대한 설명이 충분히 제시되지 않은 점이 아쉬웠습니다. 다은 학생의 의견처럼, 과연 표정 정보만으로 우울증을 탐지하는 것이 가능한지에 대해서는 여전히 의문이 남습니다.

    또한 이 연구에서는 피실험자들이 EMA 응답이라는 특정한 상황에서 얼굴이 촬영됩니다. 개인적으로는 설문 문항에 응답하는 상황에서 평소보다 더 집중하거나 진지한 표정을 짓게 될 가능성이 높다고 생각하는데, 이러한 경향성을 연구에서는 어떻게 보정하고 있는지 궁금합니다.

    더불어, PHQ-8의 리커트 척도를 0–100의 연속 척도로 재조정한 이유가 명확히 납득되지 않았습니다. 척도를 지나치게 세밀하게 조정할 경우, 오히려 응답자의 판단이 불안정해져 측정의 정확도가 떨어질 가능성도 있다고 느꼈습니다.

    개인적으로는 다수의 피실험자들의 응답처럼, 얼굴을 촬영한다는 점 자체에서부터 거부감이 들었습니다. 해당 이미지 데이터가 유출될 가능성 때문입니다.

    이 연구는 일종의 양날의 검처럼 느껴졌습니다. 피관찰자가 자신이 관찰당하고 있다는 사실을 인지하지 않아야 자연스러운 결과를 얻을 수 있다는 점은 이해되지만, 설령 이로운 목적이라 하더라도 명시적인 인지 없이 사진을 촬영하는 것이 과연 윤리적으로 정당한지에 대한 고민이 필요해 보였습니다. 이는 ‘하얀 거짓말은 도덕적으로 정당한가’라는 논쟁과 유사한 문제라고 생각합니다.

    마지막으로, 만약 해킹 등의 사고로 인해 이러한 민감한 정보가 외부로 유출된다면, 연구자나 시스템 설계자는 그 책임을 어떻게 질 수 있는지에 대해서도 의문이 들었습니다.

    좋아요

  6. Sera Park

    우울증 평가를 스마트폰 전면 카메라로 캡쳐해서 조기 탐지하고 증상을 평가한다는 방식이 새로웠습니다. 기존의 우울증 평가는 방문 진료도 해야하고 정신과 의사와 대화도 필요하고 설문지 평가도 필요하다고 예상하는데, 이러한 전통적인 방식을 깨고 본 연구는 상당 부분을 대체하거나 보완할 수 있다는 점에서 의미가 있다고 생각합니다. 하지만 결국 우울증의 최종적인 평가와 치료는 다시 대면 방식으로 이루어져야 한다는 점에서 과연 기존의 우울증 평가 방식과 본질적인 차이가 있는지에 대한 의문도 들었습니다. 또한 단순한 캡쳐만으로 우울증을 정확히 평가할 수 있을지에 대한 생각도 들었습니다. 그래서 조기 탐지를 넘어 실제 치료로까지 이어질 수 있는 후속 연구가 함께 진행되어 이 연구의 장점을 이어나갈 수 있으면 좋을 것 같습니다.

    연구 내용 측면에서는 VQA와 같이 이미지 내용에 대해 답변하는 AI 기술을 활용하면서도 여기서 피부색 정보를 제외한 점이 인종차별과 같은 윤리적 문제를 고려한 세심한 연구 설계라고 느껴졌습니다. 또한 결과에서 오른손잡이 사람들로 인해 오른쪽 얼굴 영역에 집중된 특징을 모델이 학습했다는 점은 흥미로웠고, 모델이 의미 있는 패턴을 잘 포착한 결과로 보였습니다.

    기술 수용성 측면에서도 말했듯이 사진 정보가 외부로 유출되거나 다른 용도로 사용될 수 있다는 보안 문제가 널리 사용되기 위해서는 이 연구가 앞으로 해결해야 할 문제라고 느껴졌습니다. 또한, 한계점에서도 말했듯이 일반인을 대조군으로 포함하여 이 기술이 실제로 우울증을 유의미하게 구분해낼 수 있는지에 대한 보다 명확한 근거가 제시되었으면 좋겠다는 생각이 들었습니다. 좋은 논문 리뷰 감사합니다.

    좋아요

김예인님에게 덧글 달기 응답 취소