테크 기업, 저작권 침해 등 지속되는 법적 분쟁
대안은 저작권 명확화·합성 데이터…한계도 존재
인공지능(AI) 기술 개발의 선두 주자 오픈AI의 내부 고발자가 사망하면서 AI 기업들이 데이터 수집 관련 저작권 문제가 다시 뜨거운 감자로 떠오르고 있다.
19일 미국 지역 매체 머큐리뉴스 등에 따르면 오픈AI의 데이터 수집 방식에 문제를 제기했던 전직 연구원 수치르 발라지(Suchir Balaji)가 지난 11월 26일 샌프란시스코 자택에서 숨진 채 발견됐다. 샌프란시스코 경찰청과 검시관실은 현장에서 범죄 혐의점이 발견되지 않았다고 발표했다.
발라지는 지난 10월 뉴욕타임스와의 인터뷰에서 오픈AI의 데이터 수집 관행을 폭로한 인물이다. 그는 오픈AI에서 2020년 11월부터 지난 8월까지 기술 연구원으로 근무했으며, 재직 중 챗GPT 출시를 앞두고 개발을 위해 방대한 양의 데이터를 무단으로 수집하는 데 관여했다고 폭로했다.
발라지에 따르면 오픈AI는 전사 소프트웨어 '위스퍼'를 통해 유튜브 콘텐츠를 무단으로 수집했으며, 이를 GPT-4 모델 개발에 활용했다.
오픈AI 측은 수치르 발라지의 사망에 대해 "오늘 이 엄청나게 슬픈 소식을 접하게 돼 비통하다"면서도 데이터 무단 수집 논란에 대해서는 "우리는 공정 사용 및 관련 원칙에 의해 보호되는 방식으로 인공지능 모델을 구축하고 있다"고만 일축했다.
오픈AI는 그간 저작권이 있는 콘텐츠를 무단 도용했다는 이유로 출판사, 작가, 프로그래머, 언론사 등으로부터 잇따라 저작권 침해 소송을 당해왔으며, 이러한 법적 분쟁은 여전히 진행 중이다. 지난 12월 뉴욕타임스도 오픈AI를 상대로 저작권 침해 소송을 제기한 바 있다.
AI 저작권 문제는 오픈AI뿐만 아니라 구글, 메타 등 다른 기술 기업들도 직면하고 있다. 구글은 AI 이미지 생성기 'Imagen' 개발 과정에서 시각 예술가들의 저작물을 무단으로 활용했다는 이유로 소송을 당했다.
메타는 페이스북과 인스타그램 게시물을 포함한 인터넷상의 소설, 에세이 등 저작물을 무단으로 AI 학습 데이터로 활용했다는 의혹을 받고 있다. 메타 내부 회의 기록에 따르면 AI 학습 데이터 확보를 위해 저작권자의 동의를 받지 않은 콘텐츠를 요약해 사용했다는 내용이 포함되어 있다.
AI 학습에 저작권이 있는 콘텐츠를 사용하는 것이 법적으로 허용될 수 있는지, 공정 사용(fair use) 원칙이 적용 가능한지에 대한 논의는 여전히 진행 중이다.
일부 기업은 논란을 피하기 위한 대안을 모색하고 있다. 어도비는 저작권이 명확히 해결된 데이터를 활용하거나 라이선스를 구입해 AI 모델을 학습시키고 있다.
이런 가운데 오픈AI 등 일부 회사들은 데이터 고갈 문제 해결을 위해 AI가 생성한 데이터로 다시 AI를 학습시키는 '합성(synthetic)' 데이터 활용 방안을 연구 중인 것으로 알려졌다. 합성 데이터는 실제 데이터와 유사한 통계적 특성을 가지면서도 개인정보나 저작권 등 민감한 정보를 포함하지 않은 가상 데이터를 의미한다. 이 데이터는 개인정보와 저작권 등 법적 제약을 극복하면서 데이터 수집 비용을 절감하고, AI 모델 학습의 편향성을 완화할 수 있는 최적의 방안으로 주목받고 있다.
그러나 합성 데이터의 활용에도 한계는 존재한다. 하헌석 큐빅 CTO는 "원본 데이터를 너무 충실히 모방할 경우 합성 데이터만으로도 원본 데이터의 민감 정보가 노출될 가능성이 있다"고 지적했다.
결국 AI 기술의 발전과 저작권 보호 사이의 균형을 맞추기 위해서는 기술적 보완뿐만 아니라 법적·윤리적 기준을 명확히 마련하는 것이 필수적이라고 지적한다. AI 산업이 지속 가능한 성장을 이루기 위해서는 데이터 보호 기술과 윤리적 책임을 기반으로 한 새로운 생태계를 구축해야 한다는 목소리가 나온다.
Copyright ⓒ Metro. All rights reserved. (주)메트로미디어의 모든 기사 또는 컨텐츠에 대한 무단 전재ㆍ복사ㆍ배포를 금합니다.
주식회사 메트로미디어 · 서울특별시 종로구 자하문로17길 18 ㅣ Tel : 02. 721. 9800 / Fax : 02. 730. 2882
문의메일 : webmaster@metroseoul.co.kr ㅣ 대표이사 · 발행인 · 편집인 : 이장규 ㅣ 신문사업 등록번호 : 서울, 가00206
인터넷신문 등록번호 : 서울, 아02546 ㅣ 등록일 : 2013년 3월 20일 ㅣ 제호 : 메트로신문
사업자등록번호 : 242-88-00131 ISSN : 2635-9219 ㅣ 청소년 보호책임자 및 고충처리인 : 안대성