
OpenAI发布了最新大语言模型GPT-5。OpenAI在上周四表示,新款生成式AI模型将免费提供给消费者使用,并为广受欢迎的聊天机器人ChatGPT的最新版本提供支持,它代表了“我们迄今为止最智能、最快速、最实用的模型,其内置的思考能力让每个人都轻松拥有专家级智能”。
如果你想知道OpenAI为何对该模型如此自信,以及与该公司之前的GPT模型(或与Claude、Gemini或Llama等竞争对手的AI模型)相比,GPT-5有哪些更出众的特性或不同之处,下文简要介绍了GPT-5中一些最重要的新特性和功能:
更容易使用
OpenAI 产品的近期版本曾强迫用户为不同任务选择要使用的模型类型——是选择 OpenAI的o系列“推理”模型用于复杂研究,还是选择标准GPT模型快速得出结果。GPT-5 使用了一个“实时路由器”来自动化这一过程,为合适的任务挑选合适的工具,因此用户无需再手动选择。
专属个性
ChatGPT将允许用户在与它互动时从四种预设的“个性”中选择,分别是:“愤世嫉俗者”、“机器人”、“倾听者”和“书呆子”。这些个性旨在让使用聊天机器人的感觉更自然、更符合语境。如果你想要多一点讽刺,就选择“愤世嫉俗者”;而如果你是为了工作使用,“高效而直率”的“机器人”个性可能更合适。
更少幻觉
OpenAI声称GPT-5不太可能编造信息或产生“幻觉”。据OpenAI称,在启用网络搜索并使用匿名提示的测试中,GPT-5出现事实错误的可能性比GPT-4o低 45%;在“思考”时,GPT-5出错的可能性比OpenAI o3低80%。但这仍未根除幻觉现象,正如Mashable网站所解释的那样,这意味着在处理常见任务时,GPT-5每十次仍会出现一次幻觉。
更出色的写手
据OpenAI称,GPT-5的写作能力远超前代模型,能创作出更具“吸引力、更能引起共鸣、具有文学深度和韵律”的文字。该公司并列对比了GPT-5与GPT-4o在婚礼祝酒词和诗歌创作等领域的文笔表现。
更优秀的编程工具
虽然之前的GPT版本已具备软件编程能力,但OpenAI表示,GPT-5使其“氛围编程”功能在易用性和成熟度上均有所提升,允许用户通过单一提示“创建美观且响应迅速的网站、应用程序和游戏”。
智能体能力
GPT-5与谷歌邮箱(Gmail)和谷歌日历(Google Calendar)集成,可协助处理日程安排、提醒、邮件跟进和其他效率管理任务。(此功能初期将仅限于该公司付费“专业版”会员使用。)
健康领域
大语言模型已成为人们获取医疗信息和健康建议的一种流行方式。OpenAI表示,在HealthBench测试中,GPT-5的得分高于其任何前代模型,并且它的表现更像“一个积极的思考伙伴,会主动标记潜在问题,并通过提问来生成更有帮助的答案”。当然,OpenAI 也指出它并不能替代专业医疗人士。
效果因人而异
以上只是部分新特性和改进,它们将为消费者和企业提供大量机会来试验最新模型,并将其与当前常用的模型进行比较。该模型究竟是代表了一次重大飞跃,还是一次迭代改进,在未来几天和几周内,随着外部专家对该模型的测试以及真实用户的使用体验,情况会逐渐明朗。路透社采访的早期测试者表示,从GPT-4到GPT-5的改进“不如”从GPT-3到GPT-4的改进幅度大。AI专家、常持怀疑态度的加里·马库斯表示:“粉丝们仍会找到值得欣喜之处,但GPT-5并非人们期待已久的巨大飞跃。” (*)
译者:刘进龙
审校:汪皓
OpenAI发布了最新大语言模型GPT-5。OpenAI在上周四表示,新款生成式AI模型将免费提供给消费者使用,并为广受欢迎的聊天机器人ChatGPT的最新版本提供支持,它代表了“我们迄今为止最智能、最快速、最实用的模型,其内置的思考能力让每个人都轻松拥有专家级智能”。
如果你想知道OpenAI为何对该模型如此自信,以及与该公司之前的GPT模型(或与Claude、Gemini或Llama等竞争对手的AI模型)相比,GPT-5有哪些更出众的特性或不同之处,下文简要介绍了GPT-5中一些最重要的新特性和功能:
更容易使用
OpenAI 产品的近期版本曾强迫用户为不同任务选择要使用的模型类型——是选择 OpenAI的o系列“推理”模型用于复杂研究,还是选择标准GPT模型快速得出结果。GPT-5 使用了一个“实时路由器”来自动化这一过程,为合适的任务挑选合适的工具,因此用户无需再手动选择。
专属个性
ChatGPT将允许用户在与它互动时从四种预设的“个性”中选择,分别是:“愤世嫉俗者”、“机器人”、“倾听者”和“书呆子”。这些个性旨在让使用聊天机器人的感觉更自然、更符合语境。如果你想要多一点讽刺,就选择“愤世嫉俗者”;而如果你是为了工作使用,“高效而直率”的“机器人”个性可能更合适。
更少幻觉
OpenAI声称GPT-5不太可能编造信息或产生“幻觉”。据OpenAI称,在启用网络搜索并使用匿名提示的测试中,GPT-5出现事实错误的可能性比GPT-4o低 45%;在“思考”时,GPT-5出错的可能性比OpenAI o3低80%。但这仍未根除幻觉现象,正如Mashable网站所解释的那样,这意味着在处理常见任务时,GPT-5每十次仍会出现一次幻觉。
更出色的写手
据OpenAI称,GPT-5的写作能力远超前代模型,能创作出更具“吸引力、更能引起共鸣、具有文学深度和韵律”的文字。该公司并列对比了GPT-5与GPT-4o在婚礼祝酒词和诗歌创作等领域的文笔表现。
更优秀的编程工具
虽然之前的GPT版本已具备软件编程能力,但OpenAI表示,GPT-5使其“氛围编程”功能在易用性和成熟度上均有所提升,允许用户通过单一提示“创建美观且响应迅速的网站、应用程序和游戏”。
智能体能力
GPT-5与谷歌邮箱(Gmail)和谷歌日历(Google Calendar)集成,可协助处理日程安排、提醒、邮件跟进和其他效率管理任务。(此功能初期将仅限于该公司付费“专业版”会员使用。)
健康领域
大语言模型已成为人们获取医疗信息和健康建议的一种流行方式。OpenAI表示,在HealthBench测试中,GPT-5的得分高于其任何前代模型,并且它的表现更像“一个积极的思考伙伴,会主动标记潜在问题,并通过提问来生成更有帮助的答案”。当然,OpenAI 也指出它并不能替代专业医疗人士。
效果因人而异
以上只是部分新特性和改进,它们将为消费者和企业提供大量机会来试验最新模型,并将其与当前常用的模型进行比较。该模型究竟是代表了一次重大飞跃,还是一次迭代改进,在未来几天和几周内,随着外部专家对该模型的测试以及真实用户的使用体验,情况会逐渐明朗。路透社采访的早期测试者表示,从GPT-4到GPT-5的改进“不如”从GPT-3到GPT-4的改进幅度大。AI专家、常持怀疑态度的加里·马库斯表示:“粉丝们仍会找到值得欣喜之处,但GPT-5并非人们期待已久的巨大飞跃。” (*)
译者:刘进龙
审校:汪皓
OpenAI has released its new LLM model GPT-5. The new generative AI model, which will be available to consumers for free and power the newest version of the popular ChatGPT bot, represents “our smartest, fastest, most useful model yet, with built-in thinking that puts expert-level intelligence in everyone’s hands,” OpenAI said on Thursday.
If you’re wondering what all the hoopla is about, and what makes GPT-5 better, or different, than the company’s previous GPT models (or from rival AI models like Claude, Gemini, or Llama), here’s a quick rundown of some of the most important new features and functions available in GPT-5:
Easier to use
Recent versions of OpenAI products have forced users to choose the type of model they wanted to use for different tasks – OpenAI’s o family of “reasoning” model for complicated research, or the standard GPT for speedy results. GPT-5 uses a “real time router” that automates the process, picking the right tool for the right job so you don’t have to.
Special personalities
ChatGPT will now let users choose from four different pre-set “personalities” when they interact with it: “cynic,” “robot,” “listener,” and “nerd.” These personalities are intended to make using the chatbot feel more natural and context-appropriate. If you want a bit more sarcasm, choose cynic, whereas if you’re using it for work, the “efficient and blunt” robot persona might be better.
Fewer hallucinations
OpenAI claims that GPT-5 is less prone to inventing information, or hallucinating. According to OpenAI, GPT-5 was 45% less likely to contain a factual error than GPT-4o in tests in which it had web search enabled and used anonymized prompts; when “thinking”, GPT-5 was 80% less likely to contain an error than OpenAI o3. But that still doesn’t eradicate hallucinations, and as Mashable explains, it means that GPT-5 will still hallucinate one out of every ten times on common tasks.
A better writer
According to OpenAI, GPT-5 is a much better writer than its predecessors, producing more “compelling, resonant writing with literary depth and rhythm.” The company provided side-by-side comparisons of GPT-5’s penmanship versus GPT-4o for things like wedding toasts and poems.
A better coder
While previous versions of GPT had software coding capabilities, OpenAI says GPT-5 brings improved ease and sophistication to its “vibe coding” functionality, allowing users to “create beautiful and responsive websites, apps, and games” in a single prompt.
Agentic capabilities
GPT-5 integrates with Gmail and Google Calendar to assist with scheduling, reminders, email follow ups, and other productivity tasks. (This capability will be initially limited to users of the company’s paid “pro” membership.)
Health
LLMs have become a popular way for people to get medical information and health advice. OpenAI says GPT-5 scores higher than any of its previous models on the HealthBench test, and that it acts more like “an active thought partner, proactively flagging potential concerns and asking questions to give more helpful answers.” Of course, OpenAI also points out that it does not replace a medical professional.
Your mileage may vary
Those are just a few of the new features and improvements, which will provide plenty of opportunity for consumers and businesses to experiment with the latest model and compare it to their current go-to models. Whether it represents a major leap forward, or more of an iterative improvement will become clear in the days and weeks ahead as outside experts test the model and real world users play around with it. Early testers interviewed by Reuters said the improvement from GPT-4 to GPT-5 is “not as large” as the one from GPT-3 to GPT-4. AI expert and often-skeptic Gary Marcus says: “Fans will still find something to rejoice in, but GPT-5 is not the huge leap forward people long expected.”