싸다파일

[해봤다] '고양이 그려줘'…구글 손잡은 카카오 'AI 화가' 실력은? – 테크M

 
구글이 과학기술정보통신부와 함께 개최한 '인공지능(AI) 위크 2023' 행사장에서 눈에 띄는 부스가 꾸려졌다. 카카오브레인이 개발한 AI 화가 '칼로'가 주인공이다. 칼로는 카카오의 연구개발 자회사 카카오브레인이 개발한 초거대 이미지 생성 AI 모델을 기반으로 탄생했다.  
칼로에 원하는 키워드를 입력하면 이미지를 몇 초 만에 그려낸다. "밝은 파란눈동자를 가진 고양이"와 같이 복잡한 문장도 이해한다. 이처럼 고도화된 모델을 만들 수 있었던 배경엔 구글 클라우드가 있다. 카카오브레인은 구글 클라우드 GPU를 이용해 컴퓨팅 효율을 강화했으며, 머신러닝 학습을 고도화했다.
 
13일 'AI 위크 2023' 행사장에 마련된 카카오브레인 부스를 찾았다. 원하는 그림은 무엇이든 그려주는 칼로가 방문객을 맞이하고 있었다. 구글 계정으로 접속한 뒤, 칼로에 "깜찍한 고양이 공"을 그려달라고 명령어를 입력해봤다. 여러 장의 그림이 순식간에 그려졌다. 
칼로는 '민달리', 'RQ-트랜스포머' 등 카카오브레인이 앞서 공개한 초거대 이미지 생성 AI 모델을 발전시켜 탄생한 AI 화가다. 대상, 화풍, 장소, 시간, 색상 등 원하는 제시어나 문장을 입력하면, AI가 스스로 이해한 맥락을 바탕으로 세상에 하나뿐인 이미지를 직접 그려준다.
카카오브레인은 최근 더욱 진화한 칼로 2.0을 선보였다. 약 3억장 규모 텍스트-이미지 데이터셋을 학습했다고 한다. 이미지상의 공간감, 입체감, 동물의 털과 같은 텍스처를 보다 정밀하게 표현하는 세밀함 등이 보강돼 실사에 가까운 고품질 이미지 생성이 가능하다. 3초 만에 이미지를 만들어낸다.
카카오브레인은 칼로의 머신러닝 모델을 학습시키는 데 구글 클라우드의 인프라와 솔루션을 적극 활용하고 있다. 칼로처럼 초거대 멀티모달(multi-modal) 데이터셋으로 반복 학습이 필요한 머신러닝 모델의 경우 대규모의 컴퓨팅 자원과 빠른 학습이 요구되기 때문이다.
구글 클라우드 GPU는 업계에서 유일하게 엔비디아의 A100 GPU 16개를 단일 노드로 운영할 수 있다. 카카오브레인은 클라우드 GPU를 활용해 GPU 자원을 노드 당 16개까지 묶어 사용함으로써 병목 현상을 줄였다. 이를 통해 성능 손실을 최소화하고 컴퓨팅 효율을 강화했으며, 비용 역시 절감할 수 있었다.
이외에도 클라우드 스토리지에 학습 데이터를 저장 및 관리하고, 컴퓨트 엔진의 GPU 인스턴스를 학습에 활용하는 등 칼로가 그림을 그리는 방법을 학습하고 향상해 나가는 핵심 과정이 구글 클라우드상에서 이뤄지고 있다. 카카오브레인은 "칼로를 비롯한 여러 프로젝트를 진행했다"라고 했다.
칼로의 AI 모델은 지금도 계속해서 진화하고 있으며 학습에 수반되는 데이터셋 규모 역시 커지는 중이다. 카카오브레인은 안정적으로 자원을 수급하고 비용 효율성을 강화하기 위해 구글 클라우드와 장기 계약을 체결한 것으로 알려졌다.  
한편 'AI 위크 2023' 행사는 구글과 과기정통부가 최초로 한국에서 함께 주최하는 최대 규모 AI 콘퍼런스로 주목받고 있다. 이날부터 15일까지 3일간 진행되는 이번 행사엔 60여명의 연사가 무대에 오르고 25개가 넘는 국내 기업이 참여해 AI 연구자, 개발자, 업계 종사자, 학생 등을 만난다.
이영아 기자 twenty_ah@techm.kr
 

source

Keep Reading

이전다음

댓글

답글 남기기