OpenAI의 DevDay 2024: 새로운 AI 개발자 도구 4종 발표

OpenAI는 2024년 10월 1일DevDay에서 몇 가지 새로운 도구를 발표했습니다. 이 회사는 “실시간 API, 미세 조정 API에 대한 비전, API의 프롬프트 캐싱, 모델 증류 등을 포함한 제품 발표를 가져왔습니다. 또한, 개발자의 역량을 강화하고 커뮤니티 사례를 소개하는 데 주력해 왔습니다. 행사 후 케빈 웨일 최고 제품 책임자와 기자들과의 브리핑에서 미라 무라티와 밥 맥그로우는 최근 퇴사했지만 회사의 발전에는 영향을 미치지 않을 것이라고 밝혔습니다.

“먼저 밥과 미라는 훌륭한 리더였다는 점부터 말씀드리고 싶습니다. 저는 두 사람에게서 많은 것을 배웠고, 오늘날의 위치에 오르는 데 큰 역할을 했습니다. 또한, 저희는 속도를 늦추지 않을 것입니다.

실시간 API의 공개 베타 버전을 통해 개발자들은 앱에서 지연 시간이 짧은 멀티모달 경험을 구축할 수 있게 될 것입니다. 연례 개발자 컨퍼런스인 개발자데이에서 OpenAI는 개발자 역량 강화와 운영 비용 절감을 목표로 하는 중요한 발전 사항을 선보였습니다. 샌프란시스코 본사에서 열린 이 행사에서 OpenAI의 제품 책임자인 올리비에 고뎀먼트는 회사가 어떻게 AI 모델 운영 비용을 획기적으로 절감했는지에 대한 인사이트를 제공했습니다. “불과 2년 전만 해도 GPT-3가 이기고 있었습니다. 지금은 그 비용을 거의 1,000배나 절감했습니다.”라고 고뎀먼트는 말합니다. 그는 이러한 빠른 비용 절감의 희소성을 강조하며 “2년 만에 비용을 1000배 가까이 줄인 기술의 사례를 찾으려고 노력했지만, 그 사례를 찾을 수 없었습니다.”라고 덧붙였습니다.

DevDay의 주요 하이라이트 중 하나는 실시간 API의 도입이었습니다. 이 새로운 기능을 통해 개발자는 애플리케이션 내에서 실시간에 가까운 음성 대화형 상호작용을 생성하여 고객 지원, 가상 비서, 여행 계획 등의 분야에서 사용자 경험을 크게 향상시킬 수 있습니다. 실시간 API의 핵심은 내장된 음성 기능입니다. 개발자는 OpenAI가 제공하는 6가지 음성 중에서 선택할 수 있습니다. 그러나 이러한 음성은 ChatGPT에 사용되는 음성과는 다르며, 개발자는 저작권 침해를 방지하기 위해 타사 음성을 사용하는 것이 금지됩니다. 이러한 제한으로 인해 스칼렛 요한슨을 모방한 것으로 알려진 목소리는 어디에서도 사용할 수 없습니다.

이 새로운 기능의 잠재력을 보여주기 위해 OpenAI의 개발자 경험 책임자인 로맹 휴엣은 실시간 API를 사용하여 구축한 여행 계획 앱을 시연했습니다. 이 앱을 통해 사용자는 AI 어시스턴트와 구두로 상호 작용하며 런던 여행에 대해 질문할 수 있었습니다. 이에 대해 AI는 지연 시간이 짧은 답변을 제공하는 동시에 추천 레스토랑 위치를 지도에 표시했습니다. 또 다른 데모에서는 실시간 API가 전화로 사람과 대화를 나누며 행사 음식 주문에 대해 문의하는 시뮬레이션을 진행했습니다. 이 API에는 Google의 Duo와 같은 직접 통화 기능은 없지만 Twilio와 같은 통화 서비스와 통합할 수 있으므로 개발자는 중개 서비스를 통해 전화를 거는 애플리케이션을 구축할 수 있습니다. 이러한 AI가 생성한 음성의 사실성에도 불구하고 OpenAI는 모델이 스스로를 AI라고 자동 공개하도록 의무화하지 않았으며, 개발자가 캘리포니아의 새로운 법률과 같은 관련 공개법을 준수해야 합니다.

데브데이에서 발표된 또 다른 주요 개발 사항은 GPT-4o 모델에 대한 비전 미세 조정 기능의 도입입니다. 이 기능을 통해 개발자는 이미지와 텍스트를 모두 사용하여 애플리케이션을 미세 조정할 수 있으며, 시각적 입력을 해석하고 이에 반응하는 GPT-4o의 기능이 향상됩니다. 시각 미세 조정 기능이 추가되면 시각적 이해와 관련된 작업에서 모델의 성능이 크게 향상될 것입니다. 올리비에 고뎀먼트는 “제품을 설계할 때마다 기본적으로 스타트업과 대기업을 모두 고려합니다.”라며 OpenAI 제품 설계의 이중적인 초점을 강조했습니다. 그래서 알파 버전에는 새로운 제품의 새로운 모델인 API를 사용하는 수많은 기업이 있습니다.”라고 말합니다. 그러나 개발자는 미세 조정을 위해 업로드할 수 있는 이미지 유형에 대한 엄격한 정책을 시행하고 있다는 점에 유의해야 합니다. 저작권이 있거나 폭력을 묘사하거나 OpenAI의 안전 기준을 위반하는 이미지는 시스템에서 사용할 수 없습니다.

AI 모델 라이선스 분야의 경쟁사들과 보조를 맞추기 위해 OpenAI는 신속한 캐싱을 비롯한 몇 가지 새로운 비용 절감 기능도 공개했습니다. 이 기능을 통해 개발자는 API 호출 간에 자주 사용되는 컨텍스트를 캐싱하여 비용을 절감하고 대기 시간을 개선할 수 있습니다. OpenAI에 따르면 개발자는 프롬프트 캐싱을 통해 최대 50%까지 비용을 절감할 수 있으며, Anthropic과 같은 경쟁업체는 최대 90%의 훨씬 더 공격적인 할인을 제공합니다. 또한 OpenAI는 개발자가 o1-preview 및 GPT-4o와 같은 대형 AI 모델을 사용하여 GPT-4o mini와 같은 소형 모델을 미세 조정할 수 있는 모델 증류 기능도 도입했습니다. 개발자는 더 작은 모델을 실행함으로써 성능 저하 없이 상당한 비용 절감의 이점을 누릴 수 있습니다. 개발자가 미세 조정을 평가하는 데 도움을 주기 위해 OpenAI는 API 내에서 모델의 성능을 측정할 수 있는 베타 평가 도구를 출시했습니다.

데브데이 기간 동안 OpenAI는 몇 가지 중요한 기능을 소개했지만, 많은 기대를 모았던 발표는 없었습니다. 작년 데브데이에서 공개되었던 GPT 스토어는 업데이트되지 않았습니다. 이전에 가장 인기 있는 GPT 크리에이터들과 수익 공유 프로그램을 시범 운영한 적이 있지만, 그 이후로 OpenAI는 추가 개발 상황을 공유하지 않았습니다. 또한 이번 행사에서는 새로운 AI 모델도 발표되지 않았습니다. OpenAI의 o1 모델(프리뷰 또는 미니 버전이 아닌)이나 이 스타트업이 기대하는 동영상 생성 모델인 Sora의 출시를 기다리는 개발자는 조금 더 기다려야 할 것입니다.

OpenAI의 2024 개발자 데이에서는 사용자 경험을 개선하고 비용을 절감하기 위한 실시간 API, 비전 미세 조정, 모델 증류와 같은 강력한 새 도구를 개발자에게 소개했습니다. 하지만 새로운 AI 모델과 GPT 스토어 업데이트 등 기대했던 일부 발표는 눈에 띄게 누락되었습니다. 그럼에도 불구하고 OpenAI는 AI의 가능성의 한계를 계속 넓혀가고 있으며, 최신 기능을 통해 AI 분야의 개발자들에게 희망찬 미래를 예고하고 있습니다.

OpenAI의 DevDay 2024: 새로운 AI 개발자 도구 4종 발표

이제 모든 가입자가 ChatGPT의 Advanced Voice 모드를 사용할 수 있습니다

OpenAI, 2주 내 ChatGPT용 고급 문제 해결 기능을 갖춘 ”Strawberry” AI 모델 출시 예정

OpenAI 공동 창업자가 회사를 그만둡니다: 라이벌 스타트업 Anthropic에 합류

OpenAI, 1,000억 달러 이상의 가치로 투자 유치에 근접

Stable Diffusion 3 출시: Stability AI의 가장 진보된 모델

WWDC 2024 하이라이트: Apple, “애플 인텔리전스”를 통해 ChatGPT를 아이폰에 통합하다

유사한 게시물