칼로 2.0 카카오 디벨로퍼스에서 만나보세요

2023. 7. 14. 12:58인공지능 개요

반응형

 

카카오브레인의 텍스트 형태의 제시어를 기반으로 이미지를 생성하는 인공지능(AI) 아티스트 ‘칼로’가 사실감 넘치는 이미지를 단 3초 안에 그려내는 초거대 AI 이미지 생성 모델 ‘칼로(Karlo) 2.0’으로 진화했습니다. 스테이블 디퓨전과 겨룰만한 프로그램이 될 지에 대해 알아보겠습니다. 

카카오브레인이 새롭게 선보인 ‘칼로 2.0’은 약 3억 장 규모의 텍스트-이미지 데이터셋을 학습한 초거대 AI 아티스트입니다다. ‘칼로 2.0’은 글로벌 Top Tier 수준의 언어 이해력을 기반으로 완성도 높은 그림을 생성할 수 있는 성능을 갖추었습니다. 이미지 생성과 함께 이미지 베리에이션 기능으로 추가 이미지들을 생성할 수 있으며 이미니 인페이팅 기능도 지원합니다. 

 ‘밝은 파란 눈동자를 가진 고양이 (A cat has light blue eyes)’와 같은 복잡한 프롬프트(명령어)를 입력해도 이를 명확히 이해하고 그려낼 수 있습니다. ‘칼로 2.0’의 해상도는 최대 2048x2048을 지원합니다. 생성하는 이미지의 해상도가 높을수록 다양한 이미지 사이즈로 작업이 가능해 사용자는 표현하고자 하는 이미지를 보다 심도 있고 섬세하게 그려낼 수 있게 되었습니다. 

 

 

칼로 1.4(왼쪽) 대비 단축돼, 3초 만에 사용자가 원하는 이미지 구현 ‘칼로 2.0’(오른쪽)의 해상도는 최대 2048x2048을 지원

 

이미지 상의 공간감, 입체감, 동물의 털과 같은 텍스처를 디테일하게 표현하는 세밀함 등이 보강돼 실사에 가까운 고품질 이미지 생성이 가능하다. ‘모던 아티스트’ 등을 포함한 각종 화풍 구현 능력도 탁월하며, 이미지 생성 속도 역시 기존 모델 칼로 1.4 대비 단축돼, 3초 만에 사용자가 원하는 이미지를 만들어낼 수 있습니다.

또한 카카오브레인은 국내 인공지능 생태계 발전을 위해 칼로 2.0 오픈 API(응용프로그램 인터페이스)를 카카오디벨로퍼스에 7월 10일 공개했습니다.

기존 칼로 1.4 모델로 제공하던 오픈 API를 칼로 2.0 모델로 업그레이드한 것. 칼로 2.0은 기존 칼로 1.4에 비해 다양한 크기 및 비율의 이미지 생성이 가능하며, 높은 프롬프트 이해도와 더불어 부정 명령어(Negative Prompt) 기능을 통해 이미지 생성 시 제외해야 하는 표현이나 키워드를 사전에 제어합니다.   

 

카카오브레인은 칼로 2.0 오픈 API를 선보이면서, 최대 500장까지 가능했던 무료 생성 이미지 수를 월 최대 60만 장까지 대폭 확대했습니다. 

일반 스타트업 기업 또는 개발자가 사용할 수 있는 무료 이미지 생성 횟수를 글로벌 최대 규모로 확대함으로써 칼로 기술을 활용한 다양한 가치 창출을 지원하겠다는 카카오브레인의 의지가 담겨있습니다. 칼로 2.0 API에 대한 자세한 내용은 카카오디벨로퍼스 My Karlo  페이지에서 확인할 수 있습니다. 

카카오브레인 김일두 각자 대표는 “인체 비율 및 구도, 공간감과 입체감을 표현하는 투시도 등 다양한 이미지 데이터 학습 및 기술 고도화 과정을 거쳐 칼로 2.0을 선보이게 됐다”며, “많은 데이터와 사용자 피드백을 학습시켜 실사 수준의 이미지를 생성하는 동시에 보다 다양한 사용자의 니즈를 반영할 수 있는 이미지 생성 모델로 발전시켜 나갈 것”이라고 말했습니다. 

 

카카오의 인공지능 API에는 KoGPT 와 함께 칼로가 진행되고 있습니다. 해외에서 만든 인공지능 프로그램들과 달리 네이버와 카카오에서 만들고 있는 인공지능 프로그램들은 한국어의 비중이 높아 우리나라에 더 적합한 인공지능 프로그램 서비스가 될 예정입니다. 카카오는 자회사인 카카오 브레인에 700억원규오의 유상증자를 통해 투자계획을 밝혔습니다. 인공지능 고도화를 통해 다양한 프로그램을 지원함으로써 새로운 사업 모델들을 제시할 걸로 기대합니다.

 

카카오브레인은 카카오디벨로퍼스를 통해 칼로가 공개된 이후 웹서비스,모바일 앱, 응용프로그램 개발에 필요한 플랫폼과 카카오의 프로그램들끼리 연계되는 부가기능을 제공하는 개발자 전용 웹사이트입니다. 무료테스트후 추가 제휴를 할 경우 유료 API 로 활용이 가능하며 카카오와 사용자 모두 수익모델로 발전할 수 있는 기회를 제공해 줄 예정입니다. 

 

 

마이크로소프트와 구글에 비해 덜 알려지긴 했지만 두 회사 역시 오래전부터 인공지능에 많은 투자를 한 만큼 조만간 우리에게 더욱 맞는 인공지능 서비스가 열릴 예정입니다. 

반응형