Manning 가설을 비판하는 학자들 — Voracek, Berenbaum, Hönekopp이 말하는 것
대중 콘텐츠는 종종 2D:4D를 "과학적으로 입증된 호르몬 지표"로 소개한다. 학계의 실제 분위기는 그보다 훨씬 갈라져 있다. Manning이 1998년 논문을 발표한 이후 25년간, 그의 가설을 직접 검증하면서 강하게 의문을 제기해 온 학자들이 있다. 이 글은 그중 가장 영향력이 큰 비판자들 — Martin Voracek, Sheri Berenbaum, Hönekopp & Watson — 이 무엇을 문제 삼는지 정리한다.
1. 비판의 출발점 — 가설의 핵심 주장
Manning의 가설을 단순화하면 다음과 같다. (1) 2D:4D 비율은 태아기 테스토스테론 노출량과 안정적인 상관을 가진다. (2) 따라서 성인의 2D:4D를 측정하면 그 사람의 태아기 호르몬 환경을 간접적으로 추정할 수 있다. (3) 이 환경은 성격, 운동 능력, 인지 스타일, 성적 취향 등 다양한 행동 특성과 연결된다.
비판자들의 공격은 주로 (2)와 (3)에 집중된다. "정말 그 정도로 강한 신호인가?"가 핵심 질문이다.
2. Martin Voracek — 가장 체계적인 회의론자
비엔나 대학의 Martin Voracek은 2D:4D 연구의 가장 일관된 비판자다. 그는 본인도 2D:4D 연구를 수행하지만, 다음과 같은 메타분석적 비판을 반복적으로 제기해 왔다.
- 출판 편향: 2D:4D 연구는 유의한 결과만 출판되는 경향이 강하다. 같은 가설을 검증한 미보고 무효 결과가 다수 존재할 가능성이 크다.
- 효과 크기의 인플레이션: 작은 표본일수록 더 큰 효과 크기가 보고된다(funnel plot 비대칭). 이는 측정의 진짜 신호보다 우연적 변동이 클 때 나타나는 패턴이다.
- 다중 비교 문제: 같은 데이터셋에서 수십 개의 성격·행동 변수를 함께 검사하면 우연히 유의한 결과가 한두 개 나오기 마련인데, 이런 결과만 선별 보고되어 왔다.
Voracek의 입장은 "2D:4D 자체는 흥미로운 지표지만, 현재까지 발표된 행동 상관 연구의 상당수는 신뢰하기 어렵다"는 것이다.
3. Hönekopp & Watson — 효과 크기는 작다
2010년 Hönekopp & Watson의 메타분석은 가장 자주 인용되는 종합적 검토다. 그들의 결론은 이중적이다.
- 지지하는 부분: 2D:4D의 성차(남녀 차이)는 통계적으로 분명하다. 오른손에서 d≈0.5 수준의 효과 크기가 안정적으로 재현된다.
- 비판하는 부분: 그러나 그 외의 행동·성격 특성과의 상관은 효과 크기가 매우 작다(d≈0.1~0.2). 이 정도는 통계적으로 유의하더라도 개인 단위 예측에는 거의 쓸모가 없다.
이 논문은 "성차는 진짜지만, 그것을 곧 개인의 호르몬 신호로 확장 해석하는 것은 무리"라는 학계의 균형 잡힌 합의를 만들어냈다.
4. Sheri Berenbaum — 호르몬 발달 전공자의 회의
Sheri Berenbaum(펜실베이니아 주립대)은 선천성 부신증식증(CAH) 환자를 통해 태아기 안드로겐 노출의 영향을 직접 연구해 온 학자다. CAH는 태아기에 비정상적으로 높은 안드로겐에 노출되는 조건이라, 진짜 호르몬 마커가 있다면 CAH 여성에서 분명한 차이가 보여야 한다.
Berenbaum과 동료들의 연구는 2D:4D가 CAH 여성에서 약간 더 낮게 나타나는 것을 보여주었지만, 효과 크기는 매우 작았다. 그녀의 결론은 "2D:4D는 태아기 호르몬과 어느 정도 관련은 있지만, 같은 호르몬에 노출된 사람들 사이의 변동이 너무 커서 개인의 호르몬 환경을 정확히 추정할 도구로는 사용할 수 없다"는 것이다.
5. 측정 문제 — 신뢰도 우려
비판의 또 다른 축은 측정 자체의 신뢰도다. 같은 사람을 두 명의 측정자가 측정해도 0.01~0.02 정도의 변동이 나오는 것이 보통이다. 이는 평균 성차(약 0.02)와 비슷한 크기다. 자가측정·사진 기반 측정에서는 변동이 더 커진다. Voracek은 이를 두고 "신호 대 잡음비(SNR)가 너무 낮아서, 작은 효과를 진지하게 다루기 어렵다"고 지적한다.
6. 인과 추론의 한계
2D:4D와 태아기 호르몬의 관계는 동물 모델(쥐 실험)에서는 비교적 분명하다. 그러나 사람에서는 직접 측정이 불가능하기 때문에 모든 연결은 간접 증거에 의존한다. Berenbaum, Wallen(2009) 같은 발달 호르몬 학자들은 이 점을 자주 강조한다 — "2D:4D가 태아기 호르몬과 상관이 있다는 것과, 그것이 개인의 호르몬 환경을 예측할 정도로 강한 관계라는 것은 다른 주장이다."
7. 비판자들은 모두 부정만 하는가?
중요한 균형: 위 학자들 중 누구도 "2D:4D는 완전한 의사과학"이라고 말하지 않는다. 성차의 존재, 그리고 일부 인구 집단 평균 차이는 비판자들도 인정한다. 그들이 거부하는 것은 "2D:4D로 한 사람의 성격·운명·정체성을 읽을 수 있다"는 확장 해석이다. 이 차이는 작지만 결정적이다.
8. 결론 — 합의된 입장은 무엇인가
2025년 시점에서 학계의 공통된 입장은 대략 다음과 같이 요약할 수 있다.
- 2D:4D의 성차는 진짜다. 하지만 효과 크기는 중간 정도다.
- 태아기 호르몬과 어느 정도 관련은 있지만, 개인의 호르몬 환경을 정확히 추정할 도구는 아니다.
- 성격·행동과의 상관은 대부분 효과 크기가 작고, 일부는 재현 실패가 보고되었다.
- 대중매체에서 흔한 "2D:4D로 성격을 안다" 식의 강한 주장은 학술적 합의가 아니다.
비판자들의 메시지는 결국 "흥미롭지만 겸손하게 다루어야 할 지표"라는 것이다. 본 서비스의 결과 역시 그 정도의 무게로 받아들여 주시기 바란다.
주요 참고 문헌
- Hönekopp J, Watson S (2010). Meta-analysis of digit ratio 2D:4D shows greater sex difference in the right hand. American Journal of Human Biology, 22(5).
- Voracek M, Loibl LM (2009). Scientometric analysis and bibliography of digit ratio (2D:4D) research. Psychological Reports, 104.
- Berenbaum SA et al. (2009). Fingers as a marker of prenatal androgen exposure. Endocrinology, 150(11).
- Wallen K (2009). Does finger fat produce sex differences in second to fourth digit ratios? Endocrinology, 150(11).