Photo by Dominik Kempf on Unsplash AI가 듣고, 말하고, 번역까지 — 한 번에 풀렸습니다. OpenAI가 음성 인텔리전스 모델 3종을 동시에 공개했습니다. 70개 언어를 13개 언어로 실시간 번역하는 모델이 그중에 있습니다. 콜센터·회의·통화의 모양이 바뀌는 시작점입니다. [AdSense 상단] 무엇이 출시됐나 2026년 5월, OpenAI는 음성 인텔리전스 분야 신모델 3종을 API로 한꺼번에 풀었습니다. GPT-Realtime-2 는 자연스러운 음성 대화를 위한 모델입니다. GPT-5급 추론 능력을 기반으로 사용자의 복잡한 요청을 처리합니다. 단순 응답이 아니라, 실제 대화처럼 흐름을 잡는 것이 핵심입니다. GPT-Realtime-Translate 는 실시간 번역 모델입니다. 70개 이상 언어로 들어온 음성을 13개 언어로 화자의 속도에 맞춰 번역합니다. 회의 중간에 끊어 들을 필요 없이, 말하는 동시에 다른 언어로 흘러나옵니다. GPT-Realtime-Whisper 는 음성을 텍스트로 바꾸는 모델입니다. 초저지연이 핵심입니다. 라이브 자막·회의록·실시간 받아쓰기가 자연스럽게 느껴지는 수준입니다. 왜 이게 큰 변화일까요 지금까지 음성 AI는 두 가지 한계가 있었습니다. 첫째, 부자연스러운 응답 톤. 둘째, 실시간성 부족. 1~2초 늦게 반응하는 AI는 통화에서 답답합니다. 이번 3종은 두 한계를 모두 짚었습니다. GPT-Realtime-2는 자연스러움을, Whisper는 지연 시간을, Translate는 둘을 다국어로 확장했습니다. 특히 "70개 언어 → 13개 언어 실시간 번역"은 그동안 사람 통역사가 메우던 영역을 AI가 대체할 수 있다는 신호입니다. 실제 적용도 시작됐습니다. 미국 부동산 플랫폼 Zillow는 GPT-Realtime-2로 복잡한 음성 상담을 처리하고 있고, 통화 성공률과 규제 준수 측면에서 의미 있는 개선을 보고했습니다....
Photo by Andy Luo on Unsplash OpenAI가 ChatGPT를 조용히 바꿨습니다. 새 기본 모델 GPT-5.5 Instant가 나왔고, 환각이 절반 가까이 줄었습니다. 그런데 더 중요한 건 따로 있습니다. 이제 ChatGPT가 답을 어디서 가져왔는지 사용자에게 보여주기 시작했다는 점입니다. [AdSense 상단] 무엇이 바뀌었나 2026년 5월 5일, OpenAI는 ChatGPT의 기본 모델을 GPT-5.5 Instant로 교체했습니다. 가장 눈에 띄는 숫자는 환각률입니다. 의학·법률·금융처럼 잘못된 답이 실제로 손해로 이어지는 분야에서, 새 모델은 이전(GPT-5.3 Instant)보다 환각된 주장을 52.5% 적게 만들어냈다고 OpenAI는 자체 평가에서 밝혔습니다. 수학 추론(AIME 2025)에서는 점수가 65.4에서 81.2로 올랐고, 멀티모달 추론(MMMU-Pro)에서도 69.2에서 76으로 향상됐습니다. 속도는 이전 모델 수준을 그대로 유지했다는 게 OpenAI의 설명입니다. 그런데 진짜 변화는 모델 성능이 아니라 메모리 소스 표시 기능 입니다. ChatGPT는 이제 답변을 만들 때 참고한 과거 대화, 업로드 파일, 연결된 Gmail 정보를 사용자에게 보여줍니다. 사용자는 잘못된 출처를 삭제하거나 수정할 수 있습니다. 다른 사람과 채팅을 공유해도 메모리 소스는 본인만 볼 수 있습니다. 왜 이게 큰 변화일까요 지금까지 ChatGPT를 쓰면서 가장 답답했던 순간을 떠올려보면, 대부분 같은 종류의 답답함이었을 겁니다. "이 답이 도대체 어디서 나온 거지?" AI는 자신감 있게 답하지만, 그 자신감의 근거를 사용자가 검증할 방법이 없었습니다. 환각이라는 단어가 늘 따라다닌 이유입니다. 메모리 소스가 보이기 시작했다는 건, AI 답변에 처음으로 추적 가능한 흔적 이 생겼다는 뜻입니다. 비개발자 입장에서 이건 단순한 UI 추가가 아닙니다. 그동안 ...