MS, 사진 한장으로 말하고 노래하는 영상 만드는 '바사-1' 공개 - AI타임스

마이크로소프트(MS)가 스틸 사진 한장으로 사람들이 말하고, 몸짓을 하고, 움직이는 실감나는 동영상을 생성할 수 있는 새로운 인공지능(AI) 시스템을 선보였다.
벤처비트는 18일(현지시간) 구글이 ‘바사-1(VASA-1)’라는 새 AI 프레임워크를 공개했다고 보도했다.
이에 따르면 바사-1은 얼굴 스틸 이미지와 음성 오디오 파일을 제공하면 주어진 음성에 맞춰 정확한 입 모양을 생성한다.
특히 감정 스펙트럼, 즉 얼굴의 미묘한 표정과 자연스러운 머리 움직임까지 생성할 수 있다는 것이 강점이라고 설명했다.
MS는 "핵심적인 혁신 부분은 얼굴의 여러 부분에서 작동하는 다이내믹스를 종합, 풍부하고 실제적인 표현을 가능하게 만드는 것"이라고 말했다.
더 중요한 것은 사용자가 생성을 직접 제어할 수 있도록 허용한다는 점이다.
사용자는 슬라이더 바를 위아래로 움직여 모션 순서, 눈을 응시하는 방향, 머리 거리 및 감정 표현 등을 조절할 수 있다.
또 학습 데이터셋에 포함되지 않은 콘텐츠, 예를 들어 예술 사진이나 노래, 비영어 음성과 같은 것들을 생성해 낼 수 있다.
물론 바사-1으로 생성한 동영상은 일부 아티팩트를 완벽하게 재현할 수는 없지만, 정지 이미지를 애니메이션화하는 기존의 사진-영상 변환 기술을 한단계 끌어올렸다는 평가를 받는다.
MS는 이 방법이 오프라인 배치 처리 모드에서 512×512 해상도의 비디오를 초당 45 프레임 속도로 생성하고, 온라인 스트리밍 모드에서는 최대 초당 40 프레임을 지원한다고 설명했다.
그러나 딥페이크 생성 위험을 고려할 때, 이 기술을 당장 공개할 계획은 없다고 밝혔다.
한편 구글과 일리바바도 최근 이와 비슷하게 사진 한잔으로 동영상을 생성하는 기술을 공개한 바 있다.
박찬 기자 cpark@aitimes.com

source

실시간뉴스!

시민의 눈으로 예술현장 모니터링해요 – 고양신문 5월 3, 2024

첩약 건강보험 시범사업…대상질환·의료기관 대폭 확대 – medicaltimes.com 5월 3, 2024

정부, 농수산물 도매시장 경쟁 촉진…유통비용 10% 이상 절감 – 뉴스핌 5월 3, 2024

‘보물찾기 식료품 쇼핑’ 나선 미국인들…高물가에 식료품 투어까지 – 조선비즈 – 조선비즈 5월 3, 2024

경기문화재단 이규석 신임 예술본부장 임용 – 경기신문 5월 3, 2024

1116회 로또, 제주서 2등 당첨자 4명 나와…각 '3940만원' – Headline jeju 5월 3, 2024

경기도, '해양레저스포츠 교육프로그램' 시작…체험에서 자격증까지 – 이코노뉴스 5월 3, 2024

명품백 '받은' 김건희는? 경찰, 명품백 '건넨' 최 목사 본격 수사 착수 – 프레시안 5월 3, 2024

‘자녀 낳으면 1억’ 부영 모델, 국민 조사서 63% “출산 동기 된다” – 조선일보 5월 3, 2024

대구시, '외식업소 밀키트 개발 컨설팅 지원사업' 신규 외식업소 모집 – 경북도민일보 5월 3, 2024

이 글 공유하기!

페이스북

Twitter

링크드인

admin

osexykorea.xyz

MS, 사진 한장으로 말하고 노래하는 영상 만드는 '바사-1' 공개 – AI타임스

이 글 공유하기!

admin

Keep Reading

댓글

답글 남기기 응답 취소