OpenAI今天凌晨发布会上,尽管备受期待的GPT-5和SearchGPT未亮相,但仍公布了数项重大更新。这些更新展示了OpenAI过去一年在工程能力上的显著提升,开启了多种AI应用场景的可能性,导致许多大模型应用公司失利。
主要更新内容包括:
- GPT-4o发布:此模型集成了视觉、语音和文本处理能力,性能优于GPT-4及其他模型如Claude3和Gemini。
- 模型功能和访问开放:在提升速度和功能的同时,GPT-4o对所有免费用户开放,包括在GPT Store中访问上百万定制GPTs、网页浏览、数据分析和长期记忆等功能。付费用户仍享有使用量是免费用户五倍的优势。
- 语音能力升级:GPT-4o将响应时间减至0.2-0.3秒,支持实时对话和理解语气、语调,可以用作有情感的对话助手和同声传译。
- Mac客户端发布:支持语音对话,并通过复制和分享屏幕内容等方式整合进用户的工作环境,辅助处理Excel、PPT、编程等任务。
- 摄像头功能加入:允许GPT-4o通过摄像头实时了解用户的环境,用于教学、博物馆导览和辅助视障人士等应用。该功能通过定期截图而非视频理解实现。
以上更新预计将在近日全面上线,除了需进一步测试的语音功能外。
发表评论