본문 바로가기
AI 및 IT기술 이슈

"음악 제작의 혁신: Stability AI의 새로운 오픈 소스 모델"

by oddsilk 2024. 6. 10.

Stability AI, 새로운 오디오 생성기 Stable Audio Open 출시

Stable Diffusion이라는 AI 기반 예술 생성기를 개발한 스타트업 Stability AI가 새로운 오디오 생성 모델인 Stable Audio Open을 공개했습니다. 이 모델은 텍스트 설명을 바탕으로 최대 47초 길이의 녹음을 생성할 수 있으며, 전적으로 로열티 프리 녹음으로 학습되었습니다.

Stable Audio Open은 "로열티 프리" 음악 라이브러리인 Freesound와 Free Music Archive에서 약 486,000개의 샘플을 사용하여 학습되었습니다. 예를 들어, "처리된 스튜디오에서 연주되는 록 비트, 어쿠스틱 키트로 세션 드럼"이라는 텍스트 설명을 입력하면 해당 설명에 맞는 녹음을 생성합니다.

Stability AI는 이 모델을 사용하여 드럼 비트, 악기 리프, 환경 소음 및 비디오, 영화, TV 프로그램을 위한 "프로덕션 요소"를 만들 수 있다고 설명합니다. 또한 기존 노래를 편집하거나 한 곡의 스타일(예: 스무스 재즈)을 다른 곡에 적용할 수도 있습니다.

Stability AI는 블로그 포스트에서 "이 오픈 소스 릴리스의 주요 장점은 사용자가 자신의 맞춤형 오디오 데이터로 모델을 미세 조정할 수 있다는 것"이라고 밝혔습니다. 예를 들어, 드러머는 자신의 드럼 녹음 샘플로 모델을 미세 조정하여 새로운 비트를 생성할 수 있습니다.

 

제한 사항 및 상업적 사용 불가

하지만 Stable Audio Open에는 한계가 있습니다. 이 모델은 전체 곡, 멜로디 또는 보컬을 생성할 수 없으며, 이러한 기능에 최적화되어 있지 않습니다. Stability AI는 이러한 기능을 원하는 사용자에게 자사의 프리미엄 Stable Audio 서비스를 이용할 것을 권장합니다.

또한 Stable Audio Open은 상업적으로 사용할 수 없습니다. 서비스 약관에 따르면 상업적 사용이 금지되어 있습니다. 이 모델은 모든 음악 스타일과 문화에 대해 동일한 성능을 발휘하지 않으며, 영어가 아닌 언어로 된 설명에서는 성능이 떨어집니다. Stability AI는 이러한 편향이 훈련 데이터의 한계 때문이라고 설명합니다.

Stability AI는 모델 설명에서 "데이터 출처가 다양성이 부족할 수 있으며 모든 문화가 데이터 세트에 동일하게 반영되지 않습니다"라고 밝혔습니다. "모델에서 생성된 샘플은 훈련 데이터의 편향을 반영할 것입니다."

저작권 논란과 기업 내 갈등

오랜 기간 동안 어려움을 겪어온 Stability AI는 최근 저작권 논란에 휘말렸습니다. 자사의 생성형 오디오 부사장인 Ed Newton-Rex가 저작권이 있는 작품을 학습 데이터로 사용하는 것이 "공정 사용"에 해당한다는 회사의 입장에 동의하지 않아 사임한 것입니다. Stable Audio Open의 출시 배경에는 이러한 논란을 잠재우고, Stability AI의 유료 제품을 홍보하려는 의도가 깔려 있는 것으로 보입니다.

음악 생성기가 인기를 끌면서 저작권 문제와 이를 악용하는 AI 생성기 제작자들이 주목받고 있습니다. 5월에는 Sony Music이 700개의 AI 기업에 자사 콘텐츠의 "무단 사용"을 경고하는 서신을 보냈습니다. 또한, 3월에는 미국 테네시주에서 AI의 음악 남용을 억제하기 위한 첫 법안이 통과되었습니다.

 

 

 

결론: Stability AI의 Stable Audio Open에 대한 견해

Stability AI의 Stable Audio Open은 AI 기반 음악 생성 기술의 중요한 진전을 나타냅니다. 이 모델은 텍스트 설명을 바탕으로 짧은 음악 클립을 생성할 수 있어 음악 제작자와 콘텐츠 제작자에게 유용한 도구가 될 수 있습니다. 그러나 이 모델은 현재 전체 곡이나 보컬을 생성하는 데에는 한계가 있으며, 상업적 사용이 금지되어 있습니다.

Stability AI는 이 모델을 통해 사용자들이 자신만의 맞춤형 오디오 데이터를 활용할 수 있는 가능성을 열어주었지만, 모델이 모든 문화와 음악 스타일에 대해 균등한 성능을 발휘하지 못하는 점은 한계로 남아 있습니다. 이는 훈련 데이터의 다양성 부족에서 기인한 것으로 보이며, 앞으로 이러한 부분을 개선하는 것이 필요합니다.

또한, 최근의 저작권 논란은 AI 모델의 학습 데이터 사용에 대한 윤리적 문제를 다시 한 번 상기시킵니다. AI 기술이 발전함에 따라 저작권과 관련된 법적, 윤리적 문제는 더욱 중요해질 것입니다. Stability AI는 이러한 문제를 인식하고, 보다 책임감 있는 접근 방식을 채택해야 할 것입니다.

결론적으로, Stable Audio Open은 AI 기반 음악 생성 기술의 새로운 가능성을 열어주었지만, 그 한계와 윤리적 문제를 고려할 때 지속적인 개선과 책임감 있는 접근이 필요합니다. AI 기술이 더욱 발전하기 위해서는 이러한 문제들을 해결하고, 보다 포괄적이고 공정한 데이터를 사용하여 모델을 개선하는 것이 중요합니다.


원문링크:https://techcrunch.com/2024/06/05/stability-ai-releases-a-sound-generator/

 

Stability AI releases a sound generator | TechCrunch

Stability AI, the company behind Stable Diffusion, has released a sound-generating AI model called Stable Audio Open.

techcrunch.com