Manning 가설을 비판하는 학자들 — Voracek, Berenbaum, Hönekopp이 말하는 것

2026-04-27 9 분 읽기

대중 콘텐츠는 종종 2D:4D를 "과학적으로 입증된 호르몬 지표"로 소개한다. 학계의 실제 분위기는 그보다 훨씬 갈라져 있다. Manning이 1998년 논문을 발표한 이후 25년간, 그의 가설을 직접 검증하면서 강하게 의문을 제기해 온 학자들이 있다. 이 글은 그중 가장 영향력이 큰 비판자들 — Martin Voracek, Sheri Berenbaum, Hönekopp & Watson — 이 무엇을 문제 삼는지 정리한다.

1. 비판의 출발점 — 가설의 핵심 주장

Manning의 가설을 단순화하면 다음과 같다. (1) 2D:4D 비율은 태아기 테스토스테론 노출량과 안정적인 상관을 가진다. (2) 따라서 성인의 2D:4D를 측정하면 그 사람의 태아기 호르몬 환경을 간접적으로 추정할 수 있다. (3) 이 환경은 성격, 운동 능력, 인지 스타일, 성적 취향 등 다양한 행동 특성과 연결된다.

비판자들의 공격은 주로 (2)와 (3)에 집중된다. "정말 그 정도로 강한 신호인가?"가 핵심 질문이다.

2. Martin Voracek — 가장 체계적인 회의론자

비엔나 대학의 Martin Voracek은 2D:4D 연구의 가장 일관된 비판자다. 그는 본인도 2D:4D 연구를 수행하지만, 다음과 같은 메타분석적 비판을 반복적으로 제기해 왔다.

Voracek의 입장은 "2D:4D 자체는 흥미로운 지표지만, 현재까지 발표된 행동 상관 연구의 상당수는 신뢰하기 어렵다"는 것이다.

3. Hönekopp & Watson — 효과 크기는 작다

2010년 Hönekopp & Watson의 메타분석은 가장 자주 인용되는 종합적 검토다. 그들의 결론은 이중적이다.

이 논문은 "성차는 진짜지만, 그것을 곧 개인의 호르몬 신호로 확장 해석하는 것은 무리"라는 학계의 균형 잡힌 합의를 만들어냈다.

4. Sheri Berenbaum — 호르몬 발달 전공자의 회의

Sheri Berenbaum(펜실베이니아 주립대)은 선천성 부신증식증(CAH) 환자를 통해 태아기 안드로겐 노출의 영향을 직접 연구해 온 학자다. CAH는 태아기에 비정상적으로 높은 안드로겐에 노출되는 조건이라, 진짜 호르몬 마커가 있다면 CAH 여성에서 분명한 차이가 보여야 한다.

Berenbaum과 동료들의 연구는 2D:4D가 CAH 여성에서 약간 더 낮게 나타나는 것을 보여주었지만, 효과 크기는 매우 작았다. 그녀의 결론은 "2D:4D는 태아기 호르몬과 어느 정도 관련은 있지만, 같은 호르몬에 노출된 사람들 사이의 변동이 너무 커서 개인의 호르몬 환경을 정확히 추정할 도구로는 사용할 수 없다"는 것이다.

5. 측정 문제 — 신뢰도 우려

비판의 또 다른 축은 측정 자체의 신뢰도다. 같은 사람을 두 명의 측정자가 측정해도 0.01~0.02 정도의 변동이 나오는 것이 보통이다. 이는 평균 성차(약 0.02)와 비슷한 크기다. 자가측정·사진 기반 측정에서는 변동이 더 커진다. Voracek은 이를 두고 "신호 대 잡음비(SNR)가 너무 낮아서, 작은 효과를 진지하게 다루기 어렵다"고 지적한다.

6. 인과 추론의 한계

2D:4D와 태아기 호르몬의 관계는 동물 모델(쥐 실험)에서는 비교적 분명하다. 그러나 사람에서는 직접 측정이 불가능하기 때문에 모든 연결은 간접 증거에 의존한다. Berenbaum, Wallen(2009) 같은 발달 호르몬 학자들은 이 점을 자주 강조한다 — "2D:4D가 태아기 호르몬과 상관이 있다는 것과, 그것이 개인의 호르몬 환경을 예측할 정도로 강한 관계라는 것은 다른 주장이다."

7. 비판자들은 모두 부정만 하는가?

중요한 균형: 위 학자들 중 누구도 "2D:4D는 완전한 의사과학"이라고 말하지 않는다. 성차의 존재, 그리고 일부 인구 집단 평균 차이는 비판자들도 인정한다. 그들이 거부하는 것은 "2D:4D로 한 사람의 성격·운명·정체성을 읽을 수 있다"는 확장 해석이다. 이 차이는 작지만 결정적이다.

8. 결론 — 합의된 입장은 무엇인가

2025년 시점에서 학계의 공통된 입장은 대략 다음과 같이 요약할 수 있다.

  1. 2D:4D의 성차는 진짜다. 하지만 효과 크기는 중간 정도다.
  2. 태아기 호르몬과 어느 정도 관련은 있지만, 개인의 호르몬 환경을 정확히 추정할 도구는 아니다.
  3. 성격·행동과의 상관은 대부분 효과 크기가 작고, 일부는 재현 실패가 보고되었다.
  4. 대중매체에서 흔한 "2D:4D로 성격을 안다" 식의 강한 주장은 학술적 합의가 아니다.

비판자들의 메시지는 결국 "흥미롭지만 겸손하게 다루어야 할 지표"라는 것이다. 본 서비스의 결과 역시 그 정도의 무게로 받아들여 주시기 바란다.

주요 참고 문헌

나의 호르몬 타입 테스트하기 →
← 블로그로 돌아가기