오픈AI, GPT‑4o 이미지 생성 기능 공개…텍스트 기반 고정밀 시각 출력 지원

오픈AI가 GPT‑4o에 텍스트 기반 고정밀 이미지 생성 기능을 기본 탑재하며 생성형AI 활용 범위를 확장했다.

현지시간 지난 25일, 오픈AI는 자사 멀티모달 모델 GPT‑4o에 이미지 생성 기능을 공식 도입했다고 밝혔다. 이번 기능은 텍스트 프롬프트를 기반으로 사실적이고 유용한 이미지를 정밀하게 생성할 수 있도록 설계됐다.

오픈AI는 언어 모델에 이미지 생성 기능이 필수라고 판단하고, GPT‑4o에 고도화된 생성기를 통합했다. 이를 통해 단순한 장식용 이미지를 넘어 정보 전달, 분석, 소통 등 실질적인 목적을 위한 이미지 생성이 가능해졌다고 밝혔다.

GPT‑4o는 텍스트와 이미지를 동시에 처리하며, 사용자 입력을 정확히 반영해 다양한 스타일의 시각 콘텐츠를 만들어낸다.

특히 텍스트 내 기호와 시각 요소를 조화롭게 결합해 이미지의 의미 전달력을 높이고, 여러 객체가 포함된 복잡한 장면도 정밀하게 구현할 수 있다.

이미지 생성 과정은 채팅 기반 멀티턴 방식으로 구성되며, 반복적인 요청에도 일관된 스타일을 유지한다. 사용자가 업로드한 이미지를 분석해 그 특징을 새 이미지에 자연스럽게 반영할 수 있어 시각적 연속성이 강화된다.

또한 GPT‑4o는 텍스트와 이미지 간 상호작용에 대한 학습을 통해 다양한 스타일을 반영하고, 현실감 있는 묘사도 가능하다.

가로 세로 비율, 색상 코드, 배경 처리 등 세부 지시사항까지 충실히 반영하며, 출력에는 최대 1분 정도가 소요된다.

생성된 이미지에는 C2PA 메타데이터가 포함되어 있으며, 내부 기술을 통해 이미지 출처를 명확히 식별할 수 있는 구조도 마련됐다.

오픈AI는 콘텐츠 생성 과정에서 안전성을 최우선으로 하며, 정책 위반 가능성이 있는 요청은 차단하고 있다. 아동 보호, 딥페이크, 폭력적 콘텐츠에 대한 제한 조치도 강화됐다.

이와 함께 사람이 작성한 안전성 기준을 토대로 학습된 추론형 언어 모델을 적용해 정책 해석의 명확성을 높였다.

한편 오픈AI의 GPT‑4o 이미지 생성 기능은 ChatGPT Free, Plus, Pro, Team 사용자에게 제공되며, 곧 Enterprise 및 Edu 버전으로도 확대될 예정이다.

개발자는 향후 API를 통해 이미지 생성 기능을 사용할 수 있으며, Sora 플랫폼에서도 지원할 계획이다.

넷플릭스, 오픈AI 기반 새 검색 기능 테스트 (0)	2025.04.14
구형 아이폰에서도 챗GPT 사용가능 (0)	2025.04.12
LG AI 리서치 ‘EXAONE Deep’ 출시 (0)	2025.03.18
앤쓰로픽 확장된 사고 기능 탑재한 AI 모델 클로드3.7 sonnet 출시 준비 (0)	2025.02.24
AI, 대량 살상 화학 무기 제조법 제공 논란 (0)	2025.02.24

DailySpace