OpenAI 发布全新旗舰生成式 AI 模型 GPT-4o：语音对话更流畅，免费提供

2024 年 5 月 14 日

OpenAI 发布全新旗舰生成式 AI 模型 GPT-4o：语音对话更流畅，免费提供

OpenAI今天凌晨发布会上，尽管备受期待的GPT-5和SearchGPT未亮相，但仍公布了数项重大更新。这些更新展示了OpenAI过去一年在工程能力上的显著提升，开启了多种AI应用场景的可能性，导致许多大模型应用公司失利。

主要更新内容包括：

GPT-4o发布：此模型集成了视觉、语音和文本处理能力，性能优于GPT-4及其他模型如Claude3和Gemini。
模型功能和访问开放：在提升速度和功能的同时，GPT-4o对所有免费用户开放，包括在GPT Store中访问上百万定制GPTs、网页浏览、数据分析和长期记忆等功能。付费用户仍享有使用量是免费用户五倍的优势。
语音能力升级：GPT-4o将响应时间减至0.2-0.3秒，支持实时对话和理解语气、语调，可以用作有情感的对话助手和同声传译。
Mac客户端发布：支持语音对话，并通过复制和分享屏幕内容等方式整合进用户的工作环境，辅助处理Excel、PPT、编程等任务。
摄像头功能加入：允许GPT-4o通过摄像头实时了解用户的环境，用于教学、博物馆导览和辅助视障人士等应用。该功能通过定期截图而非视频理解实现。

以上更新预计将在近日全面上线，除了需进一步测试的语音功能外。

发表评论
取消回复