업계기사

연령 확인 시험 운영의 편향성 해명, 데이터 분석에서 의문 제기되다

작성자
marketing
작성일
2025-10-02 09:30
조회
618
16세 미만 연령 추정 정확도는 개선이 필요하지만, 업계도 그 점을 인지하고 있다

 

작성자: Joel R. McConvey

보도일자: 2025년 9월 29일

출처: Biometricupdate.com

 

연령 확인(age assurance)는 모두에게 공정한가? 이는 호주의 연령 확인 기술 시험(AATT)에 대한 가디언(The Guardian)의 새로운 분석이 제기한 질문이다.

 

좀 더 정확히 말하자면, 이는 가디언이 내린 결론을 위한 서론이다 – 그 결론은 “꼭 그렇지는 않다”는 것이다. 가디언에 따르면, 해당 시험에서 수집된 데이터는 “테스트된 연령 추정 소프트웨어가 원주민(Indigenous) 또는 동남아시아(Southeast Asian) 배경을 가진 사람들에게 덜 정확하게 작동한다는 사실을 보여준다. 이는 이들 배경을 가진 젊은이들이 나이 제한 이상으로 잘못 분류되거나, 실제로는 성인인 이들이 미성년자로 오인될 가능성이 더 높다는 것을 의미한다.”

 

이러한 분석은, 최종 공식 보고서가 발표한 다음과 같은 주장을 정면으로 반박한다: “피부색 그룹 전반에 걸쳐 오류율에서 유의미한 부정적 영향이나 체계적인 불균형의 증거는 없다”는 점, 그리고 “따라서 전반적으로 인구통계학적 그룹 간에 일관된 결과를 보였다고 평가할 수 있다”는 결론이다.

 

핵심적인 의혹은 AATT(연령 확인 기술 시험)가 자사가 평가한 시스템의 편향성을 축소 보고했으며, 공개 보고서에는 포함되지 않은 공공 정보 파일 속에 관련 데이터를 숨겨두었다는 점이다. 보도에 따르면, “ACCS(호주 아동 온라인 안전 위원회)가 발행한 보고서는 자동화 테스트를 통해 피부색별 연령 추정 소프트웨어의 성능만 분석했고, 인구통계학적 배경에 따른 정확도는 공개하지 않았다. 하지만 그 원시 데이터는 공공 파일에 포함되어 있었다.”

 

그럼에도 불구하고, AATT는 투명성 확보를 위해 노력했다는 입장이다. Biometric Update에 이메일로 보낸 코멘트에서 프로젝트 디렉터 토니 앨런(Tony Allen)은 다음과 같이 밝혔다: “우리는 가디언 기자들과 협력해 그들이 데이터를 이해할 수 있도록 도왔으며, 어떤 데이터를 본 보고서에 반영했는지, 어떻게 요약하고 다양한 수준의 독자들이 이해할 수 있도록 구성했는지를 설명했습니다. 물론, 데이터로부터 파생할 수 있는 모든 측면을 보고서에 담지는 않았습니다.”

 

AATT에 대한 비판, 글로벌 규제 흐름 속에서 더욱 확산

가디언(The Guardian)의 분석은 이번 AATT 시험과 그 방법론 전반에 대한 광범위한 비판 흐름과 맥을 같이 한다. 해당 비판은 항의의 뜻으로 사임한 이사진 일부와, 메타(Meta), 구글(Google) 등 실리콘밸리 대기업들을 대표하는 로비 단체로부터 제기되었다.

 

이 논쟁은 대체로 AATT 시험을 다음과 같은 이분법적 프레임으로 묘사해왔다: “나쁜 기술을 좋다고 평가한 실험.” 그러나 실제로 AATT는 연령 확인 기술이 완벽하지 않으며, “은탄환(silver bullet)이 아니고”, “아직 개발 중인 기술”이라는 점을 명확히 밝혀왔다. 또한, 가디언은 해당 시험에서 수집된 데이터가 “정부의 10대 소셜미디어 금지 정책을 뒷받침할 것”이라고 주장하지만, 시험 주최 측은 줄곧 이 프로젝트가 정부 정책에 대한 공식적인 입장이나 권고가 아니라, 현재 기술 수준에서 실질적으로 가능한 연령 확인·추정 기술들을 평가한 조사에 불과하다는 점을 분명히 해왔다.

 

실제로는, 온라인 안전 관련 법안이 지난 9개월 동안 전 세계적인 관심을 받으며, AATT 시험은 당초 예상하지 못했거나 어쩌면 정당하지도 않은 수준의 미디어 감시와 논란의 중심에 놓이게 된 것일 수 있다.

 

기술 내 편향성(bias)에 대한 해답을 찾고자 한다면, 나이 추정 알고리즘에 대한 지속적인 테스트를 진행 중인 NIST(미국 국립표준기술연구소)와 같은 표준 및 평가 기관에 문의하는 것이 가장 적절하다. 반면, 정부 정책에 대한 해답을 원한다면, 15세 미만의 소셜미디어 사용을 제한하는 규제를 주도하고 있는 eSafety 커미셔너 줄리 인먼-그랜트(Julie Inman-Grant)의 사무실이 그 대상이 되어야 할 것이다.

 

이 논의에서 기술은 핵심 요소이며, AATT 시험에서 수집된 데이터는 이 기술의 효과성을 판단할 수 있는 초기 주요 참고자료 중 하나다. 이 시험은 사적인(private) 동시에 효과적인 연령 확인 기술이 가능하다는 점을 제시하며, 참여 업체들 사이에서 어떤 기술이 시장에 더 가까이 와 있는지를 정리해 보여주었다. 이 시험은 결코 연령 확인 기술에 대한 완벽하거나 종합적인 요약을 목표로 하지 않았다. 다만, 이는 정부가 오프라인 세계의 연령 제한 규칙(에: 18세 미만은 성인잡지 금지)을 온라인 세계에 적용하려는 움직임 속에서, 해당 기술을 평가하고 규제하려는 노력의 일환으로 진행된 또 하나의 진전 지점에 해당한다.

 

표준, 그 이상을 향해

추가적인 발전도 곧 이루어질 예정이다. 연령 확인 시스템에 관한 ISO/IEC 국제 표준(27566-1)은 현재 승인 단계에 있으며, 곧 공식 발표될 예정이다. 가디언(The Guardian)의 이번 분석은 연령 확인 기술 업체들이 문제 영역에 집중하고 기술을 개선할 수 있도록 도움을 줄 것이다. 특히, 어두운 피부색을 가진 사람들에 대한 정확도 문제를 해결하려면, 보다 크고 다양한 데이터셋이 필수적이다.

 

이런 문제는 생체인식 업계에 새로운 소식이 아니다. 업계는 제품을 판매하기 위해 필요한 일을 해나가고 있으며, 정확도를 개선하기 위한 알고리즘 개선 작업은 계속되는 과제라는 점을 잘 알고 있다. AATT의 프로젝트 디렉터 토니 앨런(Tony Allen)은 가디언의 분석을 환영한다며 다음과 같이 밝혔다. “우리가 데이터 투명성을 최대한 확보하고자 했던 이유 중 하나는, 학계와 언론이 이 데이터를 보다 세밀하게 분석할 수 있도록 돕고 독려하기 위함이었습니다. 이를 통해 새롭고 의미 있는 시각과 통찰이 도출되길 바랐습니다.”

 

eSafety 커미셔너 대변인 역시 “우리는 만능 해결책(panacea)을 기대하지 않는다”고 확인했다. “정부 산하에서 Age Check Certification Scheme (ACCS)가 독립적으로 진행한 이번 시험은 다양한 기술에 대해 중요한 테스트와 평가 결과를 도출해냈습니다. 모든 연령 확인 도구 – 분류기(classifier)와 얼굴 기반 나이 추정 기술을 포함 – 는 정확도 향상과 개선을 위해 지속적인 학습과 재학습(training and retraining)이 필요합니다. 이는 특히 13~15세 연령대를 정확하게 구분하거나, 호주 사회를 반영하는 다양한 인종을 더 잘 식별하는 데 매우 중요한 요소입니다.”

 

한편, 소셜미디어에 대한 논의로 돌아가 보면, “연령 추정 기술이 언제나 모든 사람에게 제대로 작동하는가?”라는 질문만으로는 충분하지 않다. 이제는 전 세계 주요 소셜미디어 플랫폼의 소유권이 소수 억만장자에게 집중되고 있으며, 이들은 플랫폼을 지키기 위해 수단을 가리지 않고, 경우에 따라 허위 정보 유포와 사회 분열을 조장하는 도구로 사용하기도 한다. 그렇다면 우리가 진짜로 던져야 할 질문은, “소셜미디어가 이미 사회적 분열과 정치적 과잉 개입의 부식성 동력(corrosive driver)이 된 것은 아닌가?”, 그리고 “이러한 플랫폼을, 나이를 불문하고 과연 지금도 계속 사용해야 하는가?”일지도 모른다.