이슈
AI와 인간, 발전과 공존을 위한 정당한 보상
GPU에는 수백조를 쓰면서, 인간 창작물엔 어떤 보상이 있었나
여도관  ㅣ 한국방송협회 기획심의부장

Kobpra Webzine Vol.93

AI 시대의 공포와 선택:
유토피아와 디스토피아의 경계

아직 펼쳐지지 않은 미래를 예측하는 것은 유토피아와 디스토피아의 경계를 헤매는 것과 같다. 변화의 속도에 뒤처지는 사람이 많아지고 기술적 메커니즘에 대한 무지가 결합하면 미래는 그 자체가 공포로 다가온다. 지금 세계적으로 전개되는 AI의 광풍은 어떤 이에게는 성장과 발전의 기회가 되겠지만, 어떤 이에게는 도태된다는 두려움에 AI와 관련한 정보에는 오히려 눈과 귀를 닫아 버린다.

지금까지 창작자와 저작권이나 지식재산을 소유한 사람들에게 기술의 발전은 위기와 기회를 동시에 제공했다. 예를 들어 인터넷 네트워크와 MP3 기술이 결합한 P2P 음원 공유 서비스의 등장은 당장은 음반 구매의 감소로 나타났으나, 기존에 음반 산업에 종속되었던 창작자들에게 새로운 활동 공간과 음악 애호가들과 직접 소통할 수 있는 채널이 생겼고, 이를 통해 독립적이고 자신이 추구하는 음악에 전념할 수 있는 기반을 제공해 한류와 K-POP의 폭발적 성장을 이끌었다.

하지만 AI시대에는 다른 양상으로 전개될 것이다. 과거 인터넷과 디지털 기술의 결합으로 ‘대가 없이’ 원본과 동일한 복제물이 대량으로 생산되고 대량으로 유통되는 것이 문제였다면, 생성형 AI는 과거의 창작물들을 무제한 학습하여 새로운 창작물을 쏟아 낸다. 기존의 저작권을 무단으로 학습하여 미래의 저작권을 대체한다. 여기에 오리지널리티를 가진 ‘원본’은 없다.

GPU와 데이터:
AI 권력의 실체와 불균형

AI를 구성하는 필수 요소는 수십만 장의 GPU와 막대한 양의 데이터다. AI는 단순히 코드를 실행하는 프로그램이 아니라 많은 연산을 동시에 처리해야 하는 시스템이다. 특히 LLM 대규모 언어모델 생성형 AI는 텍스트, 이미지, 음성데이터 등을 수십억에서 수조 단위의 파라미터로 학습해야 하고, 여기서 GPU는 수천 개의 연산을 동시에 처리하여 AI의 성능을 높여준다. GPU가 연산해주지 않으면 AI의 응답 속도는 수십 초 이상 지연되고, 이미지를 생성하는 데에는 수 분 이상이 소요된다. 즉, GPU 없이는 “실시간” AI서비스는 제공될 수 없다. AI 서비스를 운영하기 위해 GPU 인프라는 선택이 아닌 필수다.

대규모 데이터는 AI가 다양한 패턴을 학습하고, 정교한 답변을 생성하는 데 필수적이다. 데이터가 많을수록 AI의 성능과 정확도가 높아지며, 데이터 수집·정제 역량이 곧 AI 경쟁력의 핵심이다. 인간으로 비유하면, GPU는 두뇌이고 데이터는 양질의 경험과 교육을 뜻한다. 물질인 GPU가 인간처럼 추론하고 창의적으로 문제를 해결하게 만드는 동력이 데이터인 것이다. 2025년 12월 현재 글로벌 7대 AI기업의 시가 총액은 약 2경9천조원이다. 올해 예상되는 EU의 GDP가 3경원 정도임을 감안하면 글로벌 빅테크 기업들은 이미 국가 단위의 부를 넘어섰다. 전 세계 GPU 시장의 90% 이상을 장악한 엔비디아 NVIDIA 의 기업 가치는 4조3,000억 달러 2025년 12월 1일 기준 시가총액 이고, 이 글을 쓰고 있는 시점의 엔비디아 매출액(2025년 3분기)은 570억 달러(약 83조원)에 달한다.

그렇다면 글로벌 AI기업들이 지난 3개월 동안 83조의 돈을 들여 엔비디아의 GPU를 사들이는 동안 그들이 학습용 데이터를 위해 저작권자들에게 지급한 보상은 얼마나 될까? 데이터가 AI를 구성하는 양대 축이라고 말하면서 도대체 인간이 몇천 년 동안 쌓아온 지식에 대해서는 어떠한 보상을 하고 있는가?

issue
모델 붕괴와 저작권 전쟁:
인간 창작의 가치와 국가의 책임

AI가 생성한 콘텐츠를 기반으로 학습한 생성형 AI모델의 성능이 저하되는 현상을 ‘모델 붕괴’라고 한다. 2024년 7월 네이처 Nature 에 게재된 논문 “재귀적으로 생성된 데이터로 학습한 AI 모델 붕괴 AI models collapse when trained on recursively generated data ”는 AI 모델들이 자신이 생성한 데이터로 학습될 때 발생할 수 있는 심각한 문제점을 밝혀냈다. 인간이 생산한 데이터보다 변동성 분포가 적은 AI가 생성한 데이터로 반복 학습하면, 종국엔 정보가 너무 많이 수렴되어 원 데이터의 다양성이 사라지며 AI모델이 붕괴한다. 앞으로 인터넷 공간에 인간보다 AI가 생성한 콘텐츠가 더 확산하고 이에 따라 AI학습에 AI가 생산한 데이터가 사용될 확률이 커지면서 모델 붕괴의 우려가 높아지고 있다. 인간이 순수하게 창작한 데이터의 가치는 점점 중요해 지는 반면, 더 이상 인간이 콘텐츠를 창작하기 위한 동기는 사라지고 있다,

2025년 1월 방송 3사는 우리나라 최초로 네이버를 상대로 생성형AI 저작권 소송을 제기했다. 방송사는 시장지배적지위에 있는 우리나라 대표적 빅테크 기업인 네이버가 방송사가 막대한 인력, 비용, 시간을 투입하여 수십 년간 축적해 온 ‘뉴스콘텐츠’라는 핵심 자산을, 아무런 허락 없이 대량으로 무단 이용하여 ‘하이퍼클로바’라는 자신들의 상업적 AI 상품을 개발하고 이익을 취한, 명백한 권리 침해 사건이며, 이는 저작권법과 부정경쟁방지법을 위반하였기에 침해금지 및 손해배상을 청구하였다. 네이버는 방송사와 맺은 뉴스 공급 약관에 근거하여 원고들이 제공한 뉴스콘텐츠를 생성형 AI 학습에 이용해 왔으며, 우리나라 저작권법상 시사보도를 위한 뉴스콘텐츠는 저작권법 보호대상에서 제외되고, 생성형 AI의 학습 과정은 ‘비 표현적 이용’이므로 저작권 침해행위에 해당하지 않는다고 주장하고 있다.

네이버는 2018년에 방송사와 맺은 약관의 한 문구 ‘새로운 서비스 개발을 위한 연구에 이용할 수 있다’를 근거로 면책을 주장한다. 인류 최초의 생성형 AI 학습 데이터 저작권 침해 소송은 2023년 9월 20일 제기됐다. 미국 작가협회 Authors Guild 는 소설 등 문학작품이 무단으로 AI 학습에 이용됐다며 오픈AI를 상대로 집단 소송을 제기했다. 이어 같은 해 12월 27일에는 뉴욕타임스가 자사 뉴스 콘텐츠가 무단으로 활용됐다며 오픈AI와 마이크로소프트를 상대로 최초의 뉴스 데이터 관련 소송을 제기했다.

하루 뒤처지면 한세대가 늦는다는 AI 부문에서, 저작권 분쟁이 본격적으로 발생하기 5년 전인 2018년에 체결된 약관을 근거로 뉴스 콘텐츠 학습에 대한 보상을 거부하는 것도 시대착오적이지만, 당시에는 지금과 같은 생성형 AI 서비스의 개념은 알려지지도 않았고, 고작해야 스피커를 통해 사용자가 요청한 정보를 음성으로 제공해 주는 정도에 그쳤었다. 세계적으로는 빅테크 기업들과 저작권자들 간의 보상 합의에 대한 뉴스는 간간이 들려오고 있으나 아직 우리나라에서는 이렇다고 할 진전이 보이지 않는다. 대한민국은 소버린 Sovereign AI를 통해 국가 경쟁력을 제고하는 방향으로 정책목표를 설정했다, 미국, 중국 등 앞선 국가를 따라잡기 위해 범정부 차원에서 GPU를 확보하고, 양질의 데이터를 제공하기 위해 공공데이터법이나 데이터 공정이용 규정 등 저작권 면책을 위한 법제화를 추진 중이라는 소리도 들려온다.

공정이용은 “공정”이라는 단어로 포장되어 있지만 사실 공짜로 사용하겠다는 뜻이다. 기술 패권에 뒤처져있다는 조바심에 정부까지 나서 창작자들의 재산권까지 제한하려 한다. 국가는 AI 주권을 세워 미래 대한민국의 비전을 만드는 것만큼, 국민이 만들어낸 창작물을 보호하고 새로운 창작 동기를 북돋는 일에도 소홀함이 없어야 한다.

issue
여도관
한국방송협회 기획심의부장