알리바바 "모바일 최적화 AI 공개"…中아이폰에 탑재?
멀티모달 AI…모바일·노트북 등 엣지 디바이스에 최적화
"실시간 텍스트 및 자연스러운 음성 응답 지원"

31일 회사 측에 따르면 이 모델은 텍스트, 이미지, 음성, 영상 등 다양한 형태의 입력 정보를 처리하고 실시간 텍스트 및 자연스러운 음성 응답을 지원함으로써 모바일 기기와 노트북과 같은 엣지 디바이스에 최적화됐다는 설명이다.
알리바바 클라우드는 "Qwen2.5-Omni-7B가 70억 파라미터(매개변수)의 컴팩트한 설계에도 불구하고 성능 저하 없이 강력한 멀티모달 처리 능력을 제공한다"면서 "지능형 음성 애플리케이션과 같이 실질적인 가치를 제공하는 민첩하고 비용 효율적인 AI 에이전트 개발에 적합하다"고 강조했다.
예를 들어 이 모델은 시각 장애인이 실시간 음성 설명을 통해 주변 환경을 인식하고 탐색할 수 있도록 지원하거나, 동영상 속 재료를 분석해 단계별 요리 가이드를 제공하는 데 활용될 수 있다. 또한 고객의 니즈를 이해하는 지능형 고객 응대 시스템 구현에도 적용 가능하다.
또 알리바바 클라우드는 "Qwen2.5-Omni-7B는 이미지-텍스트, 영상-텍스트, 영상-음성, 음성-텍스트, 텍스트 데이터를 포함한 방대하고 다양한 데이터셋을 기반으로 사전 학습돼 다양한 작업에서 강력한 성능을 보장한다"고 전했다.
Qwen2.5-Omni-7B는 현재 허깅페이스와 깃허브를 통해 오픈소스로 공개됐으며, 큐원 챗(Qwen Chat)과 알리바바 클라우드 오픈소스 커뮤니티인 모델스코프를 통해서도 접근할 수 있다. 알리바바 클라우드는 지난 몇 년간 총 200개 이상의 생성형 AI 모델을 오픈소스로 공개한 바 있다.
이런 오픈소스 정책은 딥시크(DeepSeek)와 함께 전 세계에 중국의 생성형 AI 경쟁력을 알리는 역할을 하고 있다.
한편, 최근 알리바바는 3년간 AI와 클라우드 인프라에 530억 달러(약 78조원)에 달하는 대규모 투자 계획을 발표했다. 최근에는 중국에서 애플과 아이폰에 AI를 탑재하는 파트너십을 맺었고, BMW와는 지능형 차량에 대한 협업을 확대하고 있다.
◎공감언론 뉴시스 odong85@newsis.com
Copyright © NEWSIS.COM, 무단 전재 및 재배포 금지