AI가 만든 코드는 저작권이 없는가 — Human Authorship 원칙이 AI 시대에 던지는 질문

AI가 코드를 쓰기 시작한 순간 등장한 질문

소프트웨어 산업은 오랫동안 인간 개발자의 창작 활동을 중심으로 발전해 왔다. 프로그래머는 문제를 분석하고, 알고리즘을 설계하고, 이를 코드라는 형태로 표현한다. 그 코드에는 개발자의 의도와 선택, 구조 설계와 표현 방식이 담긴다. 이런 이유로 소프트웨어 코드는 단순한 기술적 산출물이 아니라 하나의 창작물로 간주되어 왔다. 저작권 제도 역시 바로 이 전제를 기반으로 작동한다. 즉, 코드를 작성한 인간이 그 코드의 저작권을 가지며, 그 권리를 기반으로 다양한 라이선스 체계가 만들어진다. MIT, Apache, GPL 같은 라이선스들은 결국 “코드를 만든 사람이 그 코드의 사용 조건을 정한다”는 구조 위에서 존재할 수 있는 제도다.

하지만 지난 몇 년 동안 등장한 생성형 AI 도구들은 이 오랜 전제를 흔들기 시작했다. 이제 많은 개발자들이 코드를 직접 작성하기보다 AI에게 코드를 생성하도록 요청하는 방식으로 작업을 수행한다. 예를 들어 GitHub Copilot, ChatGPT, Claude Code 같은 도구들은 함수 전체를 생성하거나 테스트 코드를 작성하거나 심지어 복잡한 알고리즘 구현까지 제안한다. 개발자는 점점 더 코드의 작성자라기보다 코드의 검토자나 편집자의 역할에 가까워지고 있다. 이 변화는 생산성 향상이라는 측면에서는 매우 긍정적인 변화로 평가되지만, 동시에 법적 관점에서는 새로운 문제를 만들어낸다.

그 문제는 놀라울 정도로 단순한 질문에서 시작된다.

AI가 만든 코드에는 저작권이 존재하는가?

이 질문은 단순히 법률적인 궁금증이 아니다. 만약 AI가 만든 코드에 저작권이 존재하지 않는다면, 그 코드는 누구의 것도 아닐 수 있다. 반대로 AI가 만든 코드에도 저작권이 존재한다면, 그 권리는 누구에게 귀속되는 것인가라는 또 다른 질문이 등장한다. AI 모델을 만든 회사인가, 프롬프트를 입력한 사용자인가, 아니면 학습 데이터에 포함된 원저작자들인가. 어느 쪽을 선택하더라도 기존 저작권 체계와 충돌하는 문제가 발생한다.

이 문제는 이미 실제 사건 속에서도 등장하고 있다. AI를 이용해 기존 오픈소스 프로젝트를 다시 작성하고 라이선스를 변경하려는 시도, 또는 AI가 생성한 코드가 기존 프로젝트와 유사하다는 논쟁 등이 커뮤니티에서 지속적으로 발생하고 있다. 이런 사건들은 단순한 개발자 논쟁을 넘어, 소프트웨어 법 체계 자체가 새로운 기술 환경을 따라가지 못하고 있다는 사실을 보여준다. 그리고 바로 이 지점에서 우리는 한 가지 오래된 법적 원칙을 다시 보게 된다.

바로 저작권은 무엇을 보호하는 제도인가라는 질문이다.

저작권이라는 제도는 무엇을 보호하는가

AI 코드 생성 문제를 이해하려면 먼저 저작권 제도가 무엇을 보호하는지부터 이해해야 한다. 많은 사람들이 저작권을 단순히 “창작물을 보호하는 법”이라고 생각하지만, 실제로는 그보다 훨씬 더 구체적인 구조를 가진 제도다. 저작권은 창작물 자체를 보호하는 것이 아니라, 창작물에 담긴 표현(expression)을 보호한다. 반대로 말하면 아이디어 자체는 저작권 보호 대상이 아니다. 예를 들어 어떤 알고리즘의 개념이나 문제 해결 방식 같은 것은 누구나 사용할 수 있다. 하지만 그 알고리즘을 특정한 방식으로 구현한 코드의 표현은 저작권 보호 대상이 된다.

이 원칙은 소프트웨어 산업에서 매우 중요한 의미를 갖는다. 동일한 기능을 수행하는 프로그램이 여러 개 존재할 수 있는 이유도 바로 이 때문이다. 두 명의 개발자가 동일한 알고리즘을 기반으로 프로그램을 작성하더라도, 각각의 구현 방식이 다르다면 두 코드 모두 독립적인 저작물로 인정될 수 있다. 이 구조 덕분에 소프트웨어 산업에서는 경쟁과 재구현이 가능하다. 예를 들어 데이터베이스 시스템이나 웹 서버 같은 기술은 여러 회사와 프로젝트에서 독립적으로 구현되었지만, 각각의 코드 표현이 다르기 때문에 법적으로 문제없이 공존할 수 있다.

또 하나 중요한 점은 소프트웨어 라이선스가 사실상 저작권 계약이라는 점이다. MIT나 GPL 같은 라이선스는 단순한 선언문이 아니라 저작권자가 자신의 코드 사용 조건을 규정하는 계약 구조다. 저작권자가 있기 때문에 라이선스를 설정할 수 있고, 그 라이선스를 통해 코드 사용 방식이 결정된다. 예를 들어 MIT 라이선스는 비교적 자유로운 사용을 허용하는 라이선스이며, GPL은 파생 코드도 동일한 라이선스를 유지해야 한다는 조건을 가진다. 이 모든 구조는 코드에 저작권이 존재한다는 전제 위에서만 의미를 갖는다.

여기서 AI 코드 생성 문제가 등장한다. 만약 코드가 인간이 아닌 존재에 의해 생성되었다면, 그 코드에는 저작권이 존재할까. 그리고 저작권이 없다면 라이선스는 어떤 의미를 갖게 될까. 오픈소스 생태계는 저작권 위에서 작동하는 구조이기 때문에, 이 질문은 단순히 한두 개의 프로젝트 문제가 아니라 소프트웨어 산업 전체에 영향을 미칠 수 있는 문제다. AI 코드 생성 논쟁이 개발자 커뮤니티뿐 아니라 법학계에서도 큰 관심을 받는 이유가 바로 여기에 있다.

이 질문에 대한 단서를 찾기 위해 우리는 저작권법의 가장 기본적인 원칙 중 하나를 살펴볼 필요가 있다. 바로 Human Authorship, 즉 인간 창작 원칙이다.

“Human Authorship” 원칙 — 저작권은 인간에게만 존재한다

저작권법의 역사에서 매우 중요한 전제 중 하나는 저작권이 인간의 창작물에만 적용된다는 점이다. 이 원칙은 많은 사람들이 생각하는 것보다 훨씬 오래된 법적 전통이다. 미국 저작권청(U.S. Copyright Office)은 오랫동안 “저작권 보호는 인간의 창작적 기여가 존재하는 경우에만 인정된다”는 입장을 유지해 왔다. 즉 자연현상이나 기계적 과정에서 만들어진 결과물은 원칙적으로 저작권 보호 대상이 아니다. 이 원칙은 사진, 음악, 문학 작품뿐 아니라 소프트웨어에도 동일하게 적용된다.

이 원칙을 설명할 때 자주 언급되는 사건이 바로 Monkey Selfie 사건이다. 이 사건은 인도네시아 숲에서 촬영된 원숭이 셀카 사진으로 유명하다. 사진작가가 카메라를 설치해 두었고, 호기심 많은 원숭이가 카메라를 조작하면서 사진이 촬영되었다. 이 사진은 인터넷에서 큰 화제가 되었지만, 동시에 법적 논쟁을 불러왔다. 사진의 저작권이 누구에게 있는지에 대한 문제였다. 사진작가는 자신의 장비와 촬영 환경 덕분에 사진이 만들어졌다고 주장했지만, 법원은 다른 결론을 내렸다. 사진을 실제로 촬영한 존재는 인간이 아니라 원숭이였기 때문에 저작권을 인정할 수 없다는 것이다. 결국 이 사진은 특정 개인의 저작물이 아니라 사실상 퍼블릭 도메인에 가까운 상태로 남게 되었다.

이 사건은 단순한 흥미로운 이야기처럼 보일 수 있지만, 저작권법에서 매우 중요한 메시지를 남겼다. 저작권은 단순히 “무언가 만들어졌다는 사실”만으로 발생하지 않는다. 그 결과물이 인간의 창의적 선택과 표현을 통해 만들어졌다는 사실이 확인되어야 한다. 만약 창작의 주체가 인간이 아니라면, 법은 그 결과물에 대해 저작권을 인정하지 않는다.

이제 이 원칙을 AI 코드 생성 문제에 적용해보자. AI 모델이 코드를 생성했다면, 그 코드는 인간의 창작물이라고 볼 수 있을까. 아니면 원숭이 셀카와 비슷한 상황으로 봐야 할까. 만약 AI가 만든 코드가 인간 창작물이 아니라면, 그 코드에는 저작권이 존재하지 않을 가능성이 있다. 이 경우 소프트웨어 라이선스 구조 자체가 흔들릴 수도 있다.

바로 이 지점에서 우리는 다음 질문으로 넘어가게 된다.

AI가 코드를 생성하는 과정은 실제로 어떤 구조로 이루어져 있는가.

이 질문에 답하기 위해서는 먼저 AI 코드 생성의 기술적 구조를 이해할 필요가 있다. 그리고 바로 그 구조 속에서, AI 코드 저작권 논쟁의 또 다른 중요한 문제가 등장하게 된다.

AI 코드 생성의 실제 구조

AI가 생성한 코드의 저작권을 논의하려면 먼저 한 가지 기본적인 사실을 이해해야 한다. 우리가 흔히 “AI가 코드를 작성한다”고 말할 때, 실제로 AI가 무엇을 하고 있는지에 대한 이해가 상당히 단순화되어 있기 때문이다. 많은 사람들은 AI가 일종의 지능적인 프로그래머처럼 동작한다고 생각하지만, 현재의 대규모 언어 모델은 그런 방식으로 작동하지 않는다. LLM은 본질적으로 거대한 확률 모델이다. 이 모델은 방대한 텍스트와 코드 데이터를 학습한 뒤, 특정 입력이 주어졌을 때 다음에 등장할 가능성이 가장 높은 토큰을 예측하는 방식으로 동작한다. 코드 생성 역시 이 구조의 연장선에 있다.

이 구조를 조금 더 구체적으로 살펴보면, 모델은 먼저 인터넷에 공개된 방대한 코드와 문서를 학습 데이터로 사용한다. GitHub 저장소, 오픈소스 프로젝트, 기술 문서, 프로그래밍 Q&A 사이트 등 다양한 데이터가 학습 과정에 포함될 수 있다. 모델은 이 데이터들을 문자 단위가 아니라 토큰이라는 단위로 분해해 학습한다. 토큰은 단어일 수도 있고, 코드의 일부 구문일 수도 있다. 학습 과정에서 모델은 특정 문맥에서 어떤 토큰이 등장할 확률이 높은지를 통계적으로 학습한다. 이 과정에서 알고리즘, 코드 스타일, 함수 구조 같은 패턴들이 모델 내부의 가중치 형태로 압축된다.

코드 생성 과정에서는 이 학습된 패턴이 활용된다. 사용자가 “파이썬으로 HTTP 요청을 보내는 함수 작성” 같은 프롬프트를 입력하면, 모델은 그 문맥과 유사한 코드 패턴을 학습 데이터에서 찾은 뒤 확률적으로 가장 적합한 코드 조각을 생성한다. 중요한 점은 이 과정이 기존 코드를 그대로 복사하는 것이 아니라는 것이다. 대부분의 경우 모델은 기존 코드의 특정 부분을 그대로 재현하기보다 학습된 패턴을 기반으로 새로운 토큰 시퀀스를 생성한다. 그래서 생성된 코드는 기존 코드와 구조적으로 유사할 수 있지만, 완전히 동일한 코드는 아닐 가능성이 높다.

하지만 바로 이 지점에서 중요한 질문이 등장한다. 모델이 기존 코드를 그대로 복사하지 않는다면, 그 코드의 법적 지위는 어떻게 판단해야 할까. 모델이 학습한 패턴이 기존 코드의 표현을 재구성한 것이라면, 그 결과물은 독립적인 창작물인가 아니면 기존 코드의 파생물인가. 이 문제는 단순한 기술적 논쟁이 아니라 법적 판단과 직결된다. 왜냐하면 저작권법에서 가장 중요한 개념 중 하나가 바로 파생 저작물(derivative work)이기 때문이다.

AI 코드 생성 구조를 이해하면 자연스럽게 다음 단계의 질문이 등장한다. AI가 만든 코드는 단순히 “새로운 코드”라고 볼 수 있는가, 아니면 기존 코드의 영향을 받은 파생 저작물로 봐야 하는가. 바로 이 문제를 중심으로 AI 코드 저작권 논쟁의 핵심이 형성된다.

AI가 만든 코드에는 저작권이 없는가

앞서 살펴본 Human Authorship 원칙을 AI 코드 생성에 적용하면 한 가지 직관적인 결론이 나온다. 만약 코드가 인간이 아니라 AI에 의해 생성되었다면, 그 코드에는 저작권이 존재하지 않을 수도 있다는 것이다. 실제로 미국 저작권청은 여러 가이드라인을 통해 인간 창작이 없는 결과물은 저작권 보호 대상이 될 수 없다는 입장을 반복적으로 밝혀왔다. 이 원칙을 엄격하게 적용하면 AI가 생성한 코드 역시 저작권 보호 대상이 아닐 가능성이 있다.

하지만 이 결론은 생각보다 훨씬 복잡한 문제를 만들어낸다. 저작권이 없다면 그 코드에는 어떤 권리도 존재하지 않는다. 즉 누구도 그 코드의 소유권을 주장할 수 없으며, 누구도 그 코드에 대해 독점적 사용 권리를 주장할 수 없다. 이 상황은 법학에서 종종 copyright vacuum, 즉 “저작권 공백”이라고 불린다. 창작물은 존재하지만, 그 창작물에 대한 권리가 누구에게도 귀속되지 않는 상태다. 이런 상황이 발생하면 그 결과물은 사실상 퍼블릭 도메인에 가까운 상태가 된다.

여기서 흥미로운 역설이 등장한다. 오픈소스 라이선스는 저작권을 기반으로 작동한다. MIT 라이선스든 GPL이든, 모두 저작권자가 존재한다는 전제 위에서 코드 사용 조건을 설정하는 계약 구조다. 그런데 AI 코드에 저작권이 없다면 라이선스 자체가 법적으로 의미를 잃을 수도 있다. 예를 들어 AI가 생성한 코드를 MIT 라이선스로 배포한다고 해도, 실제로는 그 코드를 라이선스할 권리가 누구에게도 없을 수 있다. 이 경우 라이선스는 단순한 선언에 불과해지고, 법적 구속력을 가지지 못한다.

또 다른 문제는 ownership void, 즉 소유권 공백이다. AI 코드의 저작권이 존재하지 않는다면 그 코드는 누구의 것인가. 사용자에게 귀속된다고 보기에는 사용자가 실제로 코드를 작성하지 않았다는 문제가 있다. AI 모델을 만든 회사에 귀속된다고 보기에도 모델이 단순히 확률적 생성 과정을 수행했을 뿐이라는 반론이 존재한다. 이런 이유로 일부 법학자들은 AI 생성물이 결국 퍼블릭 도메인에 가까운 상태로 남게 될 가능성이 높다고 주장한다.

하지만 이 문제는 단순히 “AI 코드에는 저작권이 없다”라는 결론으로 끝나지 않는다. 왜냐하면 대부분의 AI 코드 생성은 완전히 독립적인 창작이 아니라 기존 코드 학습을 기반으로 이루어지기 때문이다. 만약 AI가 생성한 코드가 기존 코드의 표현을 재구성한 것이라면, 그 코드는 여전히 파생 저작물로 간주될 가능성이 있다. 바로 이 지점에서 다음 논쟁이 등장한다. AI 코드 생성은 과연 기존 코드의 재작성인가, 아니면 완전히 새로운 창작인가.

파생 저작물 문제 — AI는 기존 코드를 재작성하는가

저작권법에서 파생 저작물은 기존 저작물을 기반으로 만들어진 새로운 창작물을 의미한다. 예를 들어 소설을 영화로 각색하거나, 기존 프로그램을 수정해 새로운 기능을 추가하는 경우가 여기에 해당한다. 파생 저작물은 새로운 창작이지만, 동시에 원저작물의 영향을 받기 때문에 원래 저작권자의 권리가 여전히 적용된다. 바로 이 개념 때문에 GPL 같은 Copyleft 라이선스가 강력한 법적 효과를 갖는다. GPL 코드를 수정해 새로운 프로그램을 만들었다면 그 프로그램 역시 GPL을 따라야 한다.

AI 코드 생성 논쟁에서 가장 중요한 질문 중 하나는 바로 이 지점에 있다. AI가 생성한 코드가 기존 오픈소스 코드의 영향을 받았다면, 그 코드는 파생 저작물인가. 이 질문에 대한 답은 단순하지 않다. AI 모델은 학습 과정에서 수많은 오픈소스 코드를 접한다. 그 코드들에는 GPL, MIT, Apache 같은 다양한 라이선스가 존재한다. 모델은 이 코드들을 그대로 저장하는 것이 아니라 패턴 형태로 학습한다. 하지만 그 패턴이 실제 코드 표현을 재구성하는 수준이라면 법적으로 파생 저작물로 해석될 가능성도 존재한다.

이 문제는 이미 GitHub Copilot 논쟁에서도 등장했다. 일부 개발자들은 Copilot이 특정 오픈소스 프로젝트의 코드를 거의 그대로 재현하는 사례를 발견했다. 이런 사례가 실제로 발생한다면 단순한 코드 생성 문제가 아니라 저작권 침해 문제가 될 수 있다. 반대로 Copilot 개발팀은 모델이 단순히 코드 패턴을 학습한 것이며, 대부분의 경우 생성된 코드는 기존 코드와 동일하지 않다는 점을 강조한다. 이 논쟁은 아직 명확한 법적 결론이 나오지 않은 상태다.

이 문제는 단순히 특정 코드의 유사성을 판단하는 것만으로 해결되지 않는다. AI 모델의 학습 구조 자체가 기존 코드와의 관계를 복잡하게 만들기 때문이다. 만약 AI 코드 생성이 기존 코드의 재작성으로 인정된다면, AI를 이용한 코드 생성 전체가 라이선스 오염 문제에 직면할 수도 있다. 반대로 AI 코드가 완전히 독립적인 창작으로 인정된다면, 기존 저작권 체계는 AI 시대에 맞게 재해석될 필요가 생긴다. 바로 이 지점에서 우리는 또 다른 질문을 마주하게 된다.

AI와 인간이 함께 만든 코드의 저작권은 어떻게 판단해야 하는가.

이 질문은 실제 개발 환경에서 훨씬 더 중요한 문제가 된다. 왜냐하면 대부분의 코드 생성은 AI 단독이 아니라 인간과 AI의 협업 형태로 이루어지기 때문이다.

인간과 AI가 함께 만든 코드의 저작권

지금까지의 논의는 주로 AI가 “혼자” 코드를 생성하는 경우를 가정하고 진행되었다. 하지만 실제 개발 환경에서는 그런 상황이 거의 존재하지 않는다. 대부분의 코드 생성은 인간 개발자와 AI 도구의 협업 형태로 이루어진다. 개발자는 문제를 정의하고, 프롬프트를 작성하고, 생성된 코드를 검토하며, 필요에 따라 수정과 리팩토링을 수행한다. AI는 코드의 일부를 제안하거나 구현의 초안을 생성하지만, 그 결과물이 실제 프로젝트에 들어가기까지는 인간의 판단과 선택이 계속 개입된다. 이런 협업 구조는 AI 코드 저작권 논쟁을 더욱 복잡하게 만든다.

저작권법에서 중요한 개념 중 하나는 창작적 기여(creative contribution)다. 저작권은 단순히 결과물이 존재한다고 해서 발생하는 것이 아니라, 창작 과정에서 인간의 창의적 선택이 존재해야 인정된다. 예를 들어 사진 촬영에서도 카메라 셔터를 누르는 행위만으로 저작권이 생기는 것이 아니라, 촬영 구도와 조명, 피사체 선택 같은 창작적 판단이 중요하다. 이 논리를 AI 코드 생성에 적용하면, 인간이 프롬프트를 설계하고 결과를 선택하며 코드를 수정하는 과정 자체가 창작적 기여로 인정될 수 있다는 해석이 가능하다.

하지만 이 문제는 그렇게 단순하지 않다. 만약 인간이 작성한 프롬프트가 매우 간단한 수준이라면, 예를 들어 “HTTP 요청을 보내는 파이썬 함수 작성” 같은 입력만 제공했다면 그 결과물에 인간의 창작성이 얼마나 포함되어 있다고 볼 수 있을까. 반대로 복잡한 프롬프트 설계와 반복적인 수정 과정을 통해 최종 코드가 완성되었다면, 인간의 창작적 기여가 상당하다고 볼 수도 있다. 이런 상황에서는 AI가 단순한 도구인지, 아니면 창작 과정의 공동 참여자인지 판단하기 어려워진다.

이 문제는 과거에도 유사한 형태로 등장한 적이 있다. 컴파일러, 매크로 시스템, 코드 생성기 같은 자동화 도구들이 등장했을 때도 “도구가 생성한 코드의 저작권은 누구에게 있는가”라는 질문이 제기되었다. 당시의 결론은 비교적 명확했다. 도구는 단순한 도구일 뿐이며, 창작의 주체는 인간 개발자라는 것이다. 하지만 생성형 AI는 기존 도구들과 중요한 차이를 가진다. AI는 단순히 인간이 정의한 규칙을 실행하는 것이 아니라, 스스로 코드 구조를 생성하고 새로운 표현을 만들어낸다. 이 점 때문에 기존 법적 틀이 그대로 적용될 수 있는지에 대한 논쟁이 계속되고 있다.

결국 AI 코드 생성의 대부분은 “완전한 AI 창작”도 아니고 “완전한 인간 창작”도 아닌 중간 영역에 위치한다. 이 영역에서 저작권을 어떻게 해석할 것인가는 앞으로 법적 논쟁의 중요한 주제가 될 가능성이 높다. 그리고 바로 이 문제는 또 다른 흥미로운 질문으로 이어진다. 만약 AI 코드 생성에서 인간의 창작성이 충분히 인정되지 않는다면, 그 코드의 법적 지위는 어떻게 될까. 일부 학자들은 이 경우 AI 코드가 사실상 퍼블릭 도메인에 가까운 상태가 될 가능성을 제기하고 있다.

AI 코드가 퍼블릭 도메인이 될 가능성

AI 코드 생성 논쟁에서 가장 흥미로운 시나리오 중 하나는 AI가 만든 코드가 퍼블릭 도메인(public domain) 상태가 될 가능성이다. 퍼블릭 도메인은 특정 개인이나 조직이 독점적 권리를 가지지 않는 창작물을 의미한다. 누구나 자유롭게 사용하고 수정하고 배포할 수 있으며, 별도의 라이선스 조건도 존재하지 않는다. 고전 문학 작품이나 오래된 음악처럼 저작권 보호 기간이 끝난 작품들이 대표적인 퍼블릭 도메인 사례다.

AI 코드 생성의 경우 상황이 조금 다르다. 앞서 살펴본 것처럼 AI가 생성한 결과물이 인간 창작물이 아니라면 저작권이 인정되지 않을 가능성이 있다. 저작권이 존재하지 않는다면 그 결과물은 처음부터 퍼블릭 도메인과 유사한 상태로 존재하게 된다. 이 상황은 오픈소스 라이선스 구조와도 미묘한 관계를 가진다. MIT나 GPL 같은 라이선스는 저작권자가 존재해야만 의미를 가지는데, 저작권이 없다면 라이선스 자체가 법적 효력을 잃을 수 있기 때문이다.

이 시나리오는 소프트웨어 산업에 매우 큰 변화를 가져올 수도 있다. 예를 들어 AI가 대량의 코드를 생성할 수 있는 시대에, 그 코드들이 모두 퍼블릭 도메인 상태로 존재한다면 코드의 희소성 자체가 크게 감소할 수 있다. 지금까지 소프트웨어 산업에서는 코드 작성이 비용이 높은 창작 활동이었기 때문에 코드 자체가 중요한 자산으로 취급되었다. 하지만 AI가 코드를 쉽게 생성할 수 있고 그 코드가 독점적 권리를 갖지 않는다면, 코드의 가치 구조 자체가 바뀔 가능성이 있다.

이 변화는 오픈소스 운동과도 흥미로운 관계를 형성한다. 오픈소스 운동은 기본적으로 저작권을 유지하면서도 코드 공유를 촉진하는 방식으로 발전해 왔다. GPL 같은 Copyleft 라이선스는 코드의 자유로운 사용을 허용하면서도 수정된 코드 역시 공개하도록 요구한다. 하지만 AI 코드가 퍼블릭 도메인 상태로 존재한다면, 이런 라이선스 전략 자체가 의미를 잃을 수도 있다. 누구나 자유롭게 사용할 수 있는 코드라면 라이선스 조건을 설정할 필요가 없기 때문이다.

물론 이 시나리오는 아직 확정된 법적 결론이 아니다. 많은 법학자들은 AI 코드 생성에서 인간의 창작적 기여가 어느 정도 존재한다고 보고, 그 결과물에 저작권이 인정될 가능성도 있다고 주장한다. 하지만 최소한 한 가지 사실은 분명하다. AI 코드 생성은 기존 소프트웨어 저작권 체계가 전제로 삼았던 “창작의 희소성”이라는 개념을 약화시키고 있다. 그리고 이 변화는 저작권 제도의 미래에 대한 더 큰 질문으로 이어진다.

AI 코드 생성 논쟁은 단순히 특정 프로젝트나 특정 도구의 문제가 아니다. 이 논쟁은 저작권 제도 자체가 새로운 기술 환경에 어떻게 적응해야 하는지를 묻고 있다. 현재의 저작권법은 대부분 20세기 중반에 형성된 구조를 기반으로 하고 있다. 이 법은 인간이 창작을 수행하고, 다른 인간이 그 창작물을 복제하거나 배포하는 상황을 전제로 설계되었다. 하지만 생성형 AI는 이 전제를 근본적으로 흔들고 있다.

AI 모델은 인간보다 훨씬 빠른 속도로 콘텐츠를 생성할 수 있다. 코드뿐 아니라 글, 이미지, 음악, 영상 등 다양한 창작물이 AI에 의해 생성되고 있다. 이런 상황에서 저작권 제도가 기존 방식 그대로 유지될 수 있을지에 대한 의문이 제기되고 있다. 일부 학자들은 AI 생성물에 대해 새로운 형태의 저작권 제도를 도입해야 한다고 주장한다. 예를 들어 AI 생성물에 대해 제한된 보호 기간을 적용하거나, AI 모델 학습 데이터의 저작권자들에게 일정한 보상을 제공하는 방식이 논의되고 있다.

반대로 다른 관점에서는 AI가 창작을 자동화함으로써 오히려 저작권 제도의 필요성이 줄어들 수 있다는 주장도 존재한다. 코드 생성 비용이 극단적으로 낮아지면, 코드 자체를 독점하는 것보다 서비스나 운영 능력이 더 중요한 경쟁 요소가 될 수 있기 때문이다. 이런 관점에서는 AI 코드 생성이 소프트웨어 산업을 “코드 중심 경제”에서 “서비스 중심 경제”로 이동시키는 계기가 될 수 있다.

이 논쟁은 아직 결론이 나오지 않은 상태다. 법원 판례도 아직 충분히 축적되지 않았고, 각국의 저작권 정책도 서로 다른 방향으로 움직이고 있다. 하지만 분명한 것은 AI 코드 생성이 단순한 개발 도구의 변화가 아니라 법과 기술의 관계를 다시 정의하는 계기가 되고 있다는 사실이다. 그리고 바로 이 변화 속에서, 오픈소스 운동의 핵심 철학 중 하나인 Copyleft 역시 새로운 도전에 직면하게 된다.

AI가 코드를 생성하는 시대에, Copyleft는 여전히 의미를 가질 수 있을까. 아니면 코드 생성 기술의 변화 속에서 그 역할이 점점 약해지게 될까.

이 질문은 다음 글에서 다루게 될 또 하나의 중요한 주제다.

Copyleft는 AI 시대에 살아남을 수 있을까.

지금까지 우리는 하나의 질문을 중심으로 여러 층위의 문제를 살펴보았다. AI가 코드를 생성하는 기술적 구조, 저작권이 보호하는 대상의 범위, 인간 창작 원칙(Human Authorship), 그리고 파생 저작물과 라이선스 문제까지 이어지는 논의는 결국 하나의 결론을 향해 수렴한다. 그것은 생성형 AI가 단순히 새로운 개발 도구가 아니라, 소프트웨어 저작권 체계의 근본적인 전제를 흔들고 있다는 사실이다. 오랫동안 소프트웨어 산업은 인간 개발자가 코드를 작성한다는 가정을 기반으로 움직여 왔다. 코드의 작성에는 시간과 비용이 들었고, 그 결과물은 창작물로서 저작권 보호를 받았다. 이런 구조 덕분에 소프트웨어는 자산이 되었고, 그 자산을 둘러싼 라이선스 체계가 산업의 중요한 기반이 되었다.

하지만 생성형 AI가 등장하면서 이 구조는 점점 불안정해지고 있다. AI는 인간과 비교할 수 없을 정도의 속도로 코드를 생성할 수 있으며, 그 코드의 상당 부분은 실제 개발 환경에서 사용할 수 있을 만큼 완성도가 높다. 코드 생산의 비용이 급격히 낮아지는 상황에서, 코드 자체의 희소성은 점점 줄어들고 있다. 동시에 저작권의 전제가 되는 인간 창작의 개념도 모호해지고 있다. 인간이 작성한 프롬프트와 AI가 생성한 결과물 사이에서 창작의 경계를 어디에 두어야 하는지 명확하게 정의하기 어렵기 때문이다. 이 문제는 단순히 기술적인 질문이 아니라, 법적·철학적 질문으로 이어진다.

AI가 만든 코드는 누구의 것인가.

이 질문에 대한 답은 아직 확정되지 않았다. 일부 법학자들은 AI 생성 코드가 인간 창작이 아니기 때문에 저작권이 존재하지 않을 가능성을 강조한다. 반대로 다른 학자들은 인간의 프롬프트 설계와 선택 과정이 충분한 창작적 기여가 될 수 있다고 주장한다. 또 다른 관점에서는 AI 코드 생성이 기존 코드의 파생 저작물로 해석될 수 있다는 논쟁도 존재한다. 각각의 해석은 서로 다른 법적 결과를 낳는다. 어떤 해석을 선택하느냐에 따라 AI 코드의 라이선스 구조, 오픈소스 생태계, 심지어 소프트웨어 산업의 경제 구조까지 달라질 수 있다.

이 논쟁이 특히 중요한 이유는 소프트웨어 산업이 이미 AI 코드 생성 기술을 적극적으로 받아들이고 있기 때문이다. 많은 개발자들이 Copilot이나 Claude 같은 도구를 일상적으로 사용하고 있으며, 코드 생성은 더 이상 실험적인 기능이 아니라 실제 생산 환경의 일부가 되고 있다. 이런 상황에서 법과 기술 사이의 간극은 점점 더 커지고 있다. 법은 여전히 인간 창작을 중심으로 설계되어 있지만, 실제 코드 생산 과정은 인간과 AI의 협업 구조로 빠르게 이동하고 있다. 이 간극이 어떻게 해결될지는 아직 아무도 확신할 수 없다.

그러나 한 가지 분명한 사실은 있다. AI 코드 생성은 저작권 제도의 근본적인 질문을 다시 제기하고 있다는 점이다. 창작이란 무엇인가, 표현이란 무엇인가, 그리고 코드의 소유권은 누구에게 귀속되는가 같은 질문들은 이제 단순한 법률 이론이 아니라 현실의 기술 환경 속에서 다시 정의되어야 하는 문제가 되었다. 과거의 저작권 제도는 인간이 창작하고 인간이 복제하는 세계를 전제로 만들어졌다. 하지만 지금 우리는 인간과 기계가 함께 창작하는 시대에 들어서고 있다.

이 변화는 오픈소스 운동에도 중요한 영향을 미친다. 오픈소스 라이선스는 저작권을 기반으로 코드 공유를 가능하게 만든 제도다. 하지만 AI 코드 생성이 확산되면서 코드의 소유권과 라이선스의 의미 자체가 다시 질문받고 있다. 만약 AI 코드가 저작권 보호 대상이 아니라면, 라이선스 구조는 어떻게 유지될 수 있을까. 반대로 AI 코드가 기존 코드의 파생 저작물로 간주된다면, Copyleft 라이선스는 어떤 방식으로 적용될 수 있을까.

이 질문들은 결국 다음 글에서 다루게 될 또 하나의 중요한 문제로 이어진다.