OpenAI深夜炸场!旗舰级GPT-4o全员免费开放、成本减半,视觉、推理全面升级,更能感知情绪!
在我们的深夜、太平洋时间的上午 10 点,OpenAI召开春季发布会,推出了一款名为GPT-4o的“旗舰级”生成式人工智能模型,并将在未来几周内在公司面向开发者和消费者的产品中迭代推出。该模型将向免费客户开放,这意味着任何人都可以通过ChatGPT访问 OpenAI 最先进的技术。GPT-4o 中的“o”代表“omni”,指的是 GPT-4o 的多模态。会前,OpenAI 首席执行官(CEO)萨姆·奥特曼(Sam Altman)神秘兮兮地发了一条推文,给整个发布会奠定了基调:此刻应该没有人想得到,OpenAI 真的把 ChatGPT 变成了一个“女机器人”。发布会全程回顾:她来了发布会的第一个“她”——OpenAI 首席技术官(CTO)Muri Murati 亮相直播间,迅速带来了关于 GPT-4o 以及 ChatGPT 最新特性的一系列介绍。ChatGPT 桌面版及用户界面优化会议首先介绍了 ChatGPT 桌面版的发布,旨在通过简化用户界面,提升产品的可用性和访问便捷性。新设计强调简洁直观,确保用户能自然流畅地与 ChatGPT 互动,无论何时何地。由于重头戏是 GPT-4o,这里就不多介绍桌面版 ChatGPT 有多酷了,我们等到后面第三部分讲 OpenAI 官方博客的时候再进一步深入。GPT-4o 模型发布Muri Murati 紧接着就把重点转向了GPT-4o 模型的发布,这是对现有技术的一次重大飞跃,首次将 GPT-4 级别的智能普及到所有用户,包括免费用户。GPT-4o 不仅在文本处理方面表现出色,还在图像和音频处理能力上实现了显著增强,标志着人机交互进入了一个更为自然和便捷的新时代。Murati 接着讲到,OpenAI 的核心使命之一是普及尖端 AI 工具,通过减少使用障碍,如无需注册即可使用 ChatGPT,以及推出桌面应用程序,让技术触手可及。这些努力是为了直观展现技术潜力,促进广泛的认知融合。GPT-4o 的发布标志着人机交互方式的革新,它能够处理对话的微妙细节,如自然语言理解、环境噪音过滤及多声部对话,这些都是传统上对 AI 模型的巨大挑战。通过内置转录、智能分析和文本转语音等功能,GPT-4o 大大降低了交互延迟,提升了沉浸式体验。以往仅对付费用户开放的一些高级功能,现在得益于 GPT-4o 的效率提升,将免费提供给所有用户。这意味着更多的用户可以享受定制化体验、视觉上传功能、记忆和浏览功能,以及高级数据分析服务。Murati 宣布,ChatGPT 的用户已经达到了1 亿。ChatGPT新增的视觉支持功能允许用户上传图片和文档,记忆功能确保对话连贯,浏览功能实现实时信息搜索,数据分析则处理图表和数据信息,提供即时答案,这些都极大增强了 ChatGPT 的实用性。此外,GPT 4.0 在 50 种语言上的表现得到了显著的速度和质量提升,这对于全球用户来说是一个重要的进步,确保了服务的广泛普及。场面话结束了,接下来将是见证“魔法”的时刻。科幻片上映——GPT-4o超强现场演示Murati 邀请了两位 OpenAI 的研究主管上台,他们是 Mark Chen(图左,推特:@markchen90)和 Barrett Zoph(图右推特:@barret_zoph)。未来教学人机交互史的时候,这两个人的名字可能会成为考试的一道问题。无延迟语音实时对话,还能打断发言Muri Murati 紧接着就把重点转向了GPT-4o 模型的发布,这是对现有技术的一次重大飞跃,首次将 GPT-4 级别的智能普及到所有用户,包括免费用户。GPT-4o 不仅在文本处理方面表现出色,还在图像和音频处理能力上实现了显著增强,标志着人机交互进入了一个更为自然和便捷的新时代。本次展示聚焦于 ChatGPT 应用的实时对话语音功能,通过现场演示,展示了用户与 AI 之间流畅无阻的交互体验。Mark Chen 通过手机上的应用程序,激活了 GPT-4o 的音频功能,与 AI 进行了实时对话,并体验了其即时响应与情绪感知能力。Mark 告诉聊天机器人,他对这次演示很紧张,请 ChatGPT 给他一些建议,帮助他冷静下来。然后,Mark 对着自己的手机大喘气模拟了一下深呼吸,ChatGPT 调侃了回去:“Mark,你又不是吸尘器!”Mark 特别指出了新功能与旧语音模式的主要区别:用户现在可以直接打断模型,无需等待模型完成发言即可插话,大大提高了对话的自然流畅度。此外,新模型消除了延迟现象,反应迅速,不再有尴尬的等待时间。更重要的是,它能够感知用户的情绪状态,根据用户的语气和节奏调整交流方式,展现出更人性化的交互体验。随后,ChatGPT 被要求用各式各样的腔调来讲述一个故事,在这段演示里,Mark 和 Barret 反复地打断 ChatGPT,并重新要求她换个腔调讲故事。她能够根据用户要求调整语音的语调和情感色彩,从平静叙述到充满戏剧性的讲述,再到以机器人的声线讲述故事,甚至通过歌唱来结束故事,极大地丰富了交流的互动性和趣味性:GPT-4o 加持的 ChatGPT 正在变得越来越“情绪化”。情绪感知是此次更新的一大亮点,ChatGPT 不仅能够识别用户的情绪,还能在对话中适时提出建议。这种能力让 AI 能够更贴近用户需求,提供更具针对性的帮助和支持。这与 Inflection.ai 开发的人工智能应用 Pi 非常相似,但 Inflection.ai 之前就已经被微软收购了(微软又和 OpenAI 有着难舍难分的关系)。视觉 + 推理GPT-4o 还改进了 ChatGPT 的视觉能力。ChatGPT 现在能“看见”事物并进行推理。通过手机摄像头,她看到了一道写在纸上的数学题,并帮助两位演示者解题:通过一个线性方程的实例(3x + 1 = 4),对话深入到具体的数学问题解决策略中。然后,Barret 在纸上又写了“我爱 ChatGPT”(I love ChatGPT)的字样,她的反应也是相当精彩:接下来,她又被要求解释一些计算机代码,顺带展示了最新的 ChatGPT 客户端Barret 分享的代码旨在处理特定地点及时间段的天气数据,通过移动平均法平滑温度数据,并可视化全年气温变化。在代码执行后,通过启用 ChatGPT 的视觉功能,双方共享了图表内容。图表展示了 2018 年全年温度变化,特别指出了 9 月末的大雨事件,以及 7 月和 8 月的最高温区间(约 25 到 40 摄氏度)。这一环节不仅验证了代码的正确执行,也突显了 ChatGPT 处理数据、生成图表和分析结果的能力。能言善辩、感知情绪Mark 之后演示了 ChatGPT 的即时翻译能力:每当他说英语的时候,ChatGPT 要翻译成意大利语并告诉旁边的 Murati;而 Murati 用意大利语回应时,ChatGPT 又得翻译成英语给 Mark 做解释:通过英语与意大利语的互译,展示了跨语言交流的便捷性,强化了其作为一个沟通桥梁的角色。在另一个互动环节中,通过一张自拍照,ChatGPT 被要求根据 Barret 的面部表情推断情绪,成功识别出他愉快和兴奋的情绪状态。发布会宣告尾声,三位演示者表示 GPT-4o 未来即将向更广泛的用户群体开放新功能,并对 OpenAI 团队和NVIDIA 团队的支持表达了感谢。会后“众生相”:像推土机一样摧毁行业!AI 春晚的影响力不可小觑,整个圈内都陷入了激动的状态,只可怜谷歌明天的 I/O 大会了。在众多反应里,几位 AI 圈的名人也先后出来展示了自己的看法:Andrej Karpathy曾担任特斯拉的人工智能和自动驾驶视觉总监,负责领导 Autopilot 团队,这是从 2017 年开始的,当时埃隆·马斯克从 OpenAI 将他挖角至特斯拉。在此之前,他还是OpenAI 的创始成员之一,拥有在斯坦福大学的学术背景,并且是“AI 教母”李飞飞的学生。这位大神第一时间分享了自己的 reaction:英伟达研究科学家Jim Fan是 AI 圈的“网红”,他一向走在 X 的资讯前沿,这次同样也是发表了相当深度的解析:现在你的动态可能满是诸如“不可思议的突破、《HER》、本次发布会你错过的十大特性、王者归来”这样的字眼。不妨静下心来,跟着我的节奏一步步剖析。高质量的数据至少可以从两个来源获得:1.来自 YouTube、播客、电视剧、电影等自然发生的对话。Whisper 可以被训练来识别对话中的发言者轮换或分离重叠的语音以进行自动标注。2.合成数据。使用最强大的模型运行慢速的三阶段管道:speech1->text1(ASR),text1->text2(LLM),text2->speech2(TTS)。中间的 LLM可以决定何时停止,也可以模拟被打断后如何接话。它可以输出未被口头化的额外“思维轨迹”(也就是它内心的想法),以帮助生成更好的回复。然后 GPT-4o 直接从 speech1->speech2 进行蒸馏,基于三阶段数据的可选辅助损失函数。蒸馏后,这些行为现在内置于模型中,不再输出中间文本。系统方面,如果每个视频帧都解压缩为 RGB 图像,则延迟将无法满足实时阈值。OpenAI 可能已经开发了自己的神经优先、实时视频编解码器,将运动增量作为 token 进行传输。通信协议和神经网络推理必须共同优化。例如,可以在边缘设备上运行一个小型、高能效的神经网络,如果视频有趣,它就会决定传输更多 token,反之则更少。我没想到 GPT-4o 会更接近传闻中的 GPT-5,即“Arrakis”模型,它能实现多模态输入和输出。实际上,它可能是 GPT-5 的一个早期检查点,尚未完成训练。品牌命名也透露出某种不安全感。在 Google I/O 之前,OpenAI 宁可超预期地推出 GPT-4.5,也不想因 GPT-5 的高期待而栽跟头。这算是一种争取时间的明智之举。值得注意的是,这个语音助手变得更加活泼,甚至有点轻佻。GPT-4o 正在努力(也许有点太努力了)让自己听起来像《HER》。OpenAI 在蚕食Character AI的市场份额,两者在形态上几乎完全重合,并拥有庞大的分销渠道。这是向更具情感、个性更强的人工智能发展的一个转折点,而 OpenAI 过去似乎一直在积极压制这一点。谁先赢得苹果,谁就将大获全胜。我认为与 iOS 的集成有三个层次:1. 放弃 Siri。OpenAI 为 iOS 精简出一个纯粹的设备端 GPT-4o,可选择付费升级以使用云服务。2.将摄像头或屏幕串流到模型中的本地功能。芯片级支持神经音频/视频编解码器。3.深度融入 iOS 行动接口和智能家居生态。Siri Shortcuts 曾遭冷遇,但这次,它将以十亿用户级别的 AI 助手身份华丽回归。智能手机的 FSD,具有特斯拉级别的数据飞轮。Jim Fan 文中提到的 HER 正是 Sam Altman 在发布会前暗示的那部电影。这部由 Spike Jonze 执导的电影《Her》是一部科幻爱情片,设定在未来不远的洛杉矶。故事围绕一位名叫西奥多·托姆布雷(Theodore Twombly)的男子展开,他是一名信件代笔人,专门为那些不善于表达情感的人撰写感人信件。西奥多生活在一个高度发达的科技世界中,人类与技术的互动变得日益亲密和复杂。而本次演示的 ChatGPT,其声音几乎和电影里的“Her”一模一样——电影的女主角正是一款先进的人工智能操作系统 OS1,这个系统具有高度发达的人格化特征,并自称萨曼莎(Samantha)。OpenAI 用非常浪漫的方式完成了一次致敬。如果你对这场直播还没看够,那么 OpenAI 联合创始人Greg Brockman肯定能满足你的需求。Greg直接在 X 上追加了五分钟的演示视频,让 ChatGPT 即兴创作了一首歌曲,歌词中巧妙融入了房间的装潢风格、在场人物的穿着特色以及其间发生的趣事:进一步解析:原来你就是 gpt2?发布会刚结束,OpenAI 技术人员 William Fedus 便在 X 上发布了一项重磅消息。此人师承“AI 三巨头”之一的 Yoshua Bengio,还曾在 Google Brain 镀过金。Fedus 表示,前段时间在“AI 竞技场” LMSys 打遍天下无敌手的“im-also-a-good-gpt2-chatbot”,其实就是 GPT-4o!并且,Fedus 还公布了一则更详细的数据:Fedus 说,ELO 评分最终可能会受到提示难度的限制(即,在诸如“最近怎么样”这样的提示上无法达到任意高的胜率)。且他们发现,在更难的提示集上——尤其是编程任务中——这种差距甚至更大:GPT-4o 相比 OpenAI 之前最好的模型,ELO 评分高出 100 多分。差距大到令人绝望。下一环节,让我们深入本次发布的详细内容,看看 ChatGPT 和 GPT-4o 未来的发布计划都有哪些。详细发布内容OpenAI 宣称,GPT-4o 在理解和探讨用户分享的图片方面已超越所有现存模型。举例来说,你只需拍摄一份外语菜单,GPT-4o 就能帮你翻译内容、了解菜品背后的文化故事并提供建议。未来,技术升级将实现更加流畅、实时的语音交互,以及通过实时视频与 ChatGPT 对话的能力。比如,我们可向 ChatGPT 展示正在进行的体育赛事,让它讲解规则。接下来数周内,OpenAI 将启动带有这些新功能的语音模式 Alpha 测试,Plus 用户将首批体验,随后逐步扩大覆盖范围。目前,ChatGPT 已支持超过 50 种语言,覆盖注册、登录、用户设定等多个环节。GPT-4o 正逐步向 ChatGPT Plus 和团队用户开放,企业版也将很快面世。同时,免费用户今日起也可体验,但设有使用配额。Plus 用户的消息发送上限将是免费用户的 5 倍,团队和企业用户则享有更高额度。借助 GPT-4o,免费用户将能体验:GPT-4 级别的智能互动结合模型与网络的回复数据分析与图表制作图片话题讨论文件上传以辅助总结、创作或分析探索并使用 GPT 及 GPT 商店利用记忆功能构建更佳体验根据使用量和需求,免费用户使用 GPT-4o 的消息数量将有限制。一旦达到上限,ChatGPT 将自动切换至 GPT-3.5,确保对话延续。无论是免费还是付费用户,OpenAI 都推出了全新的 macOS ChatGPT 桌面应用,无缝融入日常电脑操作。只需要简单快捷键(Option + Space)即可随时提问 ChatGPT,还能直接在应用内截图并讨论。从今天开始,用户就可以直接通过电脑与 ChatGPT 进行语音交流,初期会以 Voice Mode 形式呈现,未来将集成 GPT-4o 的音频视频新功能。无论是公司创意头脑风暴、面试准备还是话题探讨,只需点击桌面应用右下角的耳机图标即可开始语音对话。参数 pk 环节GPT-4o 能在 232 毫秒内对音频输入做出反应,平均反应时间为 320 毫秒,这与人类在对话中的反应时间相近。未来,就变成了我们讲话比ChatGPT 慢半拍了……GPT-4o在英语和代码文本方面的性能与 GPT-4 Turbo 相当,在非英语语言文本方面也有显著提高,同时在应用程序接口(API)方面速度更快,价格便宜 50%。与现有模型相比,GPT-4o 在视觉和音频理解方面尤其出色。真正“遥遥领先”的,显然是多语种交互、音频对话、视觉等方面。最后总结,从今天开始,GPT-4o 强大的文本理解与图像处理能力会逐步融入 ChatGPT。不仅限于免费用户群体,Plus 用户更能享受到高达标准用户 5 倍的消息发送限额。此外,一个整合了 GPT-4o 的语音模式 Alpha 版本,预计在未来数周内登陆 ChatGPT Plus。对于开发者而言,GPT-4o 现已通过 API 开放,成为可调用的文本和视觉识别模型。与 GPT-4 Turbo 相比,它在速度上快出两倍,成本减半,且请求频率上限提升至原来的五倍。最后的最后,以一个令人尴尬的推文结尾。
耗时18个月,开发者弃TypeScript投Rust,重写系统后痛批:这门语言烂透了!
曾经,我是一个年轻而充满希望的 Rust 狂热者。因为我一直听说,Rust 完美得像是上帝设计的编程语言:不仅很快,还是最安全的编程语言之一。如果在网上查找有关 Rust 的信息,你会发现认为 Rust 完美的人,远不止我一个:Medium 上的每一篇指南、Reddit 上的每一篇帖子、Stack Overflow 上的每一个答案……对 Rust 都是铺天盖地的正面评价。有鉴于此,我决定放弃 TypeScript,用 Rust 来重写我的开源算法交易系统 NextTrade。用 Rust 重写的好处是有,但代价巨大起初,NextTrade 是用 TypeScript 构建的,以注重可维护性、可读性和可重用性。然而,当核心交易逻辑开始出现严重的性能问题时,为了构建一个可扩展至数万用户的纸面交易和回测平台,有必要进行全面重写。于是,Rust 成为了最热门的候选者,并在经过我的大量研究后最终胜出,成为进行全面重写 NextTrade 的编程语言。前后花了 18 个月,最后的重写结果还不错。由 Rust 重写后的 NextTrade 变成了 NexusTrade,而 NexusTrade 在速度和可配置性方面明显优于重写之前:例如,在 NextTrade 上需要数秒才能完成的回溯测试,在 NexusTrade 上只需几百毫秒即可完成——这意味着性能提升了 1000 倍,平台也能支持更复杂的功能。有这些好处固然很好,但我付出的巨大代价也不容忽视。Rust 最大的优点,是完全消除了整类错误,而这同时也是它最大的弱点——借用检查器让这门语言变得异常困难,尤其是与 TypeScript 和 Go 这样的语言相比,入门门槛相当高。我根本无法像以前学习一门新语言那样边学边做,尤其是还要兼顾着一份全职工作:Rust 太难了!说实话,如果 OpenAI 没有推出 ChatGPT,我真的可能会转而使用 Go。所幸在 ChatGPT 的指导下,我克服了每一个障碍,深入了解了 Rust 的细微语法及其强大而复杂的类型系统。ChatGPT 就像一位经验丰富的 Rust 开发者在我身边,随时为我讲解生命周期的复杂性或匹配表达式的优雅性。综合以上,我当时对 Rust 的评价是中等,也没有真正爱上这门语言,并基于以上经历写了一篇博文。没想到这篇文章在 Reddit 上遭到了许多抨击,其中还有一条高赞评论骂我用 ChatGPT 写文章。看到这些评论后,我当时想着:可能是我还不够了解 Rust,对它的判断有失偏颇吧。于是,在那之后我虽然没有多喜欢 Rust,但我还是坚持使用了一段时间。如今 4 个月过去了,我终于可以自信地得出一个结论:Rust 这门语言,真的烂透了。可怕、冗长、不直观的语法和语义在我看来,所有说 Rust 没有残暴语义的人都是在撒谎。在某些情况下,如果你无法使用极其强大的大型语言模型,那么编写函数简直就是不可能的事情。但我真的不想花 90 分钟来弄清函数中的子句,我只想写出一个想写的函数而已!最后,我还不得不完全放弃辅助函数的想法,因为我真的无法让代码编译成功。人们所说的 Rust 最大的优点(严格的编译器可以消除错误),正是 Rust 最大的缺点之一。只要给我一个垃圾回收器,让我做我想做的事情就可以了!相比之下,如果我用 Go 编写这个完全相同的函数,它看起来会是这样的:虽然功能的核心相对不变,但这样你就不必翻来覆去地琢磨如何让代码正常运行了——它本身就能运行!Rust 确实能对错误进行很好的处理。只要避免出现不安全的错误,就能确保代码正常运行。NilPointerException 异常和未处理的错误再也不会发生了,对吧?不对!因为当你的数据出错或发生意外情况时,你会拼命去弄清楚到底发生了什么。也许我是个白痴,不知道如何启用堆栈跟踪。但当我的应用程序出现一个错误时,我却不知道为什么!相比之下,在 Python 这样的语言中,你会得到一些漂亮的、艺术般的堆栈跟踪,告诉你发生了什么,甚至精确到行号!即使在 Go 语言中,你也有 errors.Wrap(...) 这样的工具,能够让你查看整个应用程序的错误堆栈。或许我真是个笨蛋,只要我在 Rust 中遇到错误时,我就会陷入茫然,完全搞不清发生了什么。我需要在应用程序的各个地方都加上 eprintln!(...)。事实上?不,我不是白痴。这就是一种有缺陷的语言设计。Rust 社区有一个热评是:Rust 社区并不像他们假装的那样友好和冷静。更具体来说,我认为他们是一群自恋的家伙,尤其讨厌别人说 Rust 有缺陷。(有个 Rust 社区成员对我的问题给出了一个“有益的”建议)例如,我在 Rust 的 subreddit 上问了一个关于如何改进 MongoDB Rust crate 错误处理的问题,得到的回答包括:改用 Postgres。(笑死,难道我要因为一些糟糕的错误信息就重新设计整个数据库吗?)你为什么要用 MongoDB?(我喜欢,下一个问题?)MongoDB 在 Go 和 Python 中也很糟糕。(我不知道,但它在 TypeScript 中很好。你转移了话题并没有回答我的问题)出现一个真正有用的改进错误信息的建议。(非常罕见)在我目前接触的所有编程社区中,没有一个像 Rust 这样像个邪教。他们无视 Rust 的所有明显缺陷,比如陡峭的学习曲线、冗长的代码、可怕的错误信息、复杂的语法和有争议的语言设计选择——他们把这一切问题,都归结于开发者自己的技能问题。在我看来,这简直是疯了!总结尽管如此,Rust 还是有一些优点的。它运行速度很快……嗯,这基本上就是它的主要优点了。另外,它应该也很安全。如果我们把它和 C++ 比较,Rust 显然是更好的语言。但与其他语言(比如 Go)相比,Rust 的“安全性”对我来说更像是一种拖累。如果能把开发时间减半,那我宁愿应用程序的运行时间多加几十毫秒。好的一面是,如果我选择用 Go 编写应用程序,我可能也会有些后悔。我会想:“如果 Rust 能更快呢?” “又有一篇文章说 Rust 是最棒的语言。天啊,我是不是选错了!”至少,现在我学会了 Rust,我觉得自己可以学任何东西了。也许后面我会为了好玩去试试OCaml,它总不会比 Rust 更难学吧?
售价8688元起,微软重磅推出Windows 11 AI PC:将搭载GPT-4o,全面升级Copilot
AI 时代,不仅将颠覆现有 App 呈现形式,也将彻底改写 PC 形态。在 Build 2024 全球开发者大会前夕,微软于今天凌晨举办了一次前瞻发布会,面向消费者层面发布了一个 Windows PC 新品牌,官方将其称之为 Copilot+PC。让用户备受期待的是,这款新 Windows PC搭载了 OpenAI 最新的 GPT-4o 模型,该 PC可以直接在本地处理一些人工智能加速的工作负载(例如运行 AI 聊天机器人和图像生成)而不是依赖云。目前,微软已经联合戴尔、惠普、宏碁、华硕、三星和联想等重要 PC 制造商来生产 Copilot+PC,起售价为 8688 元。引入全新的系统架构:CPU+GPU+NPU对于这款进入 AI 时代的 PC,用微软自己的话来描述,Copilot+PC 是迄今为止最快、最智能的 Windows PC。之所以如此强大,一方面是因为微软在 Copilot+PC 中引入了全新的系统架构,将 CPU、GPU 以及全新的高性能神经处理单元(NPU) 的强大功能结合在一起,可以达到 40+ TOPS(每秒万亿次操作) AI 算力,实现过往很多 PC 无法做的事情。这也就是微软对 Copilot+PC硬件提出的第一个要求,即神经处理单元的性能要达到每秒 40 万亿次运算(TOPS)。就行业当前发展现状来看,市场上很多 NPU 只能提供 10 TOPS 的算力。如曾经率先配备了 NPU 芯片的英特尔,其基于 Meteor Lake 的酷睿 Ultra NPU 最高只能达到 10 TOPS,而 AMD 带有 NPU 的 Ryzen 7000 和 Ryzen 8000 台式机和笔记本处理器也只能达到 12 到 16 TOPS。虽然有消息称,英特尔和 AMD 都有计划在今年下半年推出新的芯片,让 NPU 算力达到 45 TOPS,但是就当前来看,还没有推出。不久之前,苹果最新发布的M4 芯片可以在每秒进行高达 38 万亿次运算(TOPS ),那时已经比多数 AI PC 的神经处理单元都要快了。如今,只有高通公司专门针对 AI PC 推出的 Snapdragon X Elite 和 X Plus 能够满足微软 40 TOPS 的要求。据微软透露,首批 Copilot+PC 将搭载Snapdragon X Elite 和 X Plus 处理器推出。更为值得关注的是,由于Snapdragon X 系列芯片是基于 Arm 指令集架构的,此次也是微软对自己最终成功过渡到 Arm 架构上充满信心的表现。另一方面,Copilot+PC系统至少需要16GB RAM 和 256GB 存储空间,用来满足大型语言模型(即使是所谓的”小型语言模型“,如微软的 Phi-3,也需要使用数十亿个参数)所需的内存和磁盘存储空间。在高要求之下,微软执行副总裁兼消费者首席营销官 Yusuf Mehdi 表示,第一代 Copilot+PC 笔记本电脑「轻薄且美观,令人难以置信」。整体而言,在运行人工智能工作负载方面,Copilot+PC 比普通笔记本电脑的性能提高了 20 倍,效率提高了 100 倍,并提供了业界领先的人工智能加速功能。与采用 M3 的 MacBook Air 相比,Copilot+PC 在持续多线程性能方面要高出 58%,同时提供全天电池续航时间。此外,微软表示,凭借惊人的效率,Copilot+ PC一次充电可提供长达 22 小时的本地视频播放或 15 小时的网页浏览。Windows11 新功能正如上文所述,Copilot+ PC 利用强大处理器可以实现很多 PC 过往无法实现的功能。为了贯彻 AI PC 的理念,全新的 Windows Copilot Runtime 拥有 40多个人工智能模型,它们是全新 Windows 11 层的一部分。据悉,这些模型将深度集成到 Windows 中,帮助它们更高效地访问硬件,并提供更强大的隐私和安全选项。微软表示,这些模型可以在任何应用程序中使用。如今,每台 Copilot+ PC 都配备了强大的个人人工智能代理,只需使用新的 Copilot 键在键盘上轻按一下即可。微软表示,Copilot 现在将通过精简、简单但功能强大的个性化设计,获得用户一直要求的完整应用体验。只需要轻点一下,就可以用 Copilot 调用最新的 AI 模型。对此,Mehdi 透露,上周 OpenAI 推出的最新旗舰级 AI 模型 GPT-4o 也将很快集成到 Copilot。在发布会上,他还演示了 GPT-4o 如何在 Windows 的电脑游戏《我的世界》中指导玩家如何在游戏中建设、躲避僵尸。此外,Windows 上也迭代了很多非常实用的 AI 功能。第一个功能就是传言已久的 Recall 功能(回顾),你可以将它视为 Windows 10中”时间轴“功能的更高级版本,它可以让电脑拥有前所未有的”记忆“能力,能够记住用户所有的交互行为。借助 Recall,Copilot+ PC 可以像人类一样根据每个人的经历所特有的关系和关联来组织信息。这个功能可以帮助你记住可能忘记的事情,这样你只需使用你记住的提示即可快速直观地找到你要查找的内容。你可以跨时间滚动,在任何应用程序、网站、文档等的时间轴中查找所需的内容。使用快照与 screenray 进行直观交互,帮助你使用基于对象识别的建议操作采取下一步行动。然后回到原来的位置,无论是 Outlook 中的特定电子邮件还是 Teams 中的正确聊天。在安全隐私上,微软也做足的准备。Yusuf Medhi 表示,Recall 中使用的快照归用户自己所有,只会保留在本地电脑上。NPU 将在本地处理所有这些需求,让用户数据保持“私密、本地和安全,仅在设备上”。在配备最低 256GB SSD 的 Copilot+ PC 上,微软表示,Recall 将占用约 25GB 的磁盘空间并存储大约三个月的事件。第二个值得关注的功能是Cocreator,它是一款用于逐步生成图像的工具。微软表示,「自 Image Creator 推出以来,已生成近 100 亿张图像,帮助更多人通过使用自然语言描述他们想要创造的内容,轻松地将他们的想法变为现实。然而,当今的云产品可能会限制用户可以创建的图像数量,让大家在艺术品处理过程中等待,甚至会出现隐私问题。」通过使用神经处理单元 (NPU) 和强大的本地小语言模型,微软基于Cocreator 带来全新的 AI 体验。简单来看,当你绘制一张草图时,然后用Cocreator 进行改进,你对草图改进的同时,Cocreator 也会对生成的图片试试改进,如新增一些背景、效果等等。这项功能基于扩散的算法实现,可通过最少的步骤优化最高质量的输出,让用户感觉像是在与人工智能一起创作。正如下图所示:其次,在 Restyle Image 的协助下,用户可以结合图像生成和照片编辑功能,以全新的风格重新构想个人照片。比如使用 Cyberpunk 或 Claymation 等预设风格,改变背景、前景或整张照片,或使用照片中的图像生成器启动下一个创意项目,获得视觉灵感。在 Copilot+ PC 上,用户可以免费、快速地生成无穷无尽的图片,还能根据自己的喜好对图片进行微调,并将最喜欢的图片保存到收藏夹中。除此之外,微软还和 Adobe、DaVinci Resolve Studio(视频编辑工具)、Cephable(辅助功能)、Liminar Neo(图像编辑)、WhatsApp(社交)和 CapCut(视频和图像编辑)等公司和主流工具合作,利用 NPU 的强大功能提供全新的创新性 AI 体验。起售价 8688 元,微软推出了自家两款 Copilot+PC在这场短暂的发布会上,微软将 Copilot+ PC 视为「高端」设备,性能以及 AI 体验均优于旧款 Windows PC,以及配备性能较低 NPU 和搭载英特尔、AMD 和高通处理器的硬件。对于 AI PC 的普及,微软也十分有信心。微软消费者营销主管 Yusuf Mehdi 表示,微软预计明年将售出 5000 万台 AI PC。同时,Mehdi 称,直接在 PC 上运行更快的人工智能助手将是“很长一段时间内升级 PC 的最令人信服的理由”。在 Copilot+PC 品牌下,微软推出自家新一代 Surface Pro 平板电脑和 Surface Laptop 笔记本电脑。新款 Surface Laptop 性能较前代 Surface Laptop 5,速度快了 86%。显示屏有 13.8 英寸和 15 英寸两种尺寸可供选择。它的电池续航能力,15 英寸的 Surface Laptop 可提供长达 20 小时的视频播放时间。起售价为 11188 元。全新的 Surface Pro 比 Surface Pro 9 的速度快 90%。它的起售价为 8688 元,配置了 LCD 屏幕和一颗 X Plus 处理器。如果要购买 X Elite 芯片和 OLED 屏幕的话,最少要花费 11088 元。微软同时公布,全新 Surface Pro 和 Surface Laptop 将于 5 月 21 日起在微软中国官方商城以及首发合作伙伴京东自营官方旗舰店进行预售,并于 6 月 18 日起正式开售。写在最后毋庸置疑,Copilot+PC 是微软发力 AIPC迈出的重要一步,有人表示看好与期待:回看最初 Windows ARM 的第一次迭代没有任何 x86 模拟层,因此从一开始就注定失败。第二次迭代做到了,但它最初无法运行 64 位应用程序,而且性能很差。他们现在确实支持 64 位,而且听起来模拟性能已经取得了长足的进步。与在同一硬件上运行的 Windows 11 23H2 相比,Windows 11 24H2 的新 Prism 模拟器将应用程序翻译速度提高了 20%,已经有了不错的效果。微软现在正以更好的性能和更长的电池寿命与苹果积极竞争。这一点很重要。苹果公司在推出 M1 方面领先多年,微软与之的竞争似乎终于迎头赶上。当然,所有这些都必须在现实生活中得到证明。不过,争议依然存在。其中,对于微软发布的重磅功能之一——Recall,马斯克转发这条新闻并评论道,「这是《黑镜》的一集。绝对要关闭这个”功能“」。最后,放眼消费者,又有多少人愿意为最新的 AI 体验来买硬件的单呢?
挑战英伟达!00 后哈佛辍学小哥研发史上最快 AI 芯片,比 H100 快 20 倍
自 2022 年底以来,在由ChatGPT掀起的这场席卷全球的 AI 浪潮中,作为 AI 底层算力“霸主”的英伟达(Nvidia),可谓是最大受益者之一:不久前,英伟达一举超越微软和苹果,以 3.34 万亿美元的市值成为全球最有价值的公司。归根结底,是因为英伟达在 AI 芯片市场占据着近乎垄断的地位:强大性能的 GPU 产品如 A100 和 H100 芯片,是大模型训练上的“硬通货”;CUDA 软件生态也几乎是英伟达的“护城河”。因此谁也没想到,敢对着市值超 3 万亿美元、拥有 2.8 万名员工、处于垄断地位的英伟达高调“下战书”的,会是一支由 3 名大学辍学生创立、目前仅 35 名员工、刚筹集了 1.2 亿美元的团队:Etched。ChatGPT 问世前的一场“豪赌”从网上资料来看,Etched 是由三位哈佛大学辍学生 Gavin Uberti、Robert Wachen 和 Chris Zhu 在 2022 年创立的。最初,Gavin Uberti 和 Chris Zhu 在大学暑期实习时进入了一家芯片公司,接触到底层硬件领域并为之吸引后,便决定从哈佛大学退学,又拉上了 Uberti 的大学室友 Robert Wachen,共同创立了 Etched 公司——据悉,当时 Gavin Uberti 正在攻读数学学士学位和计算机科学硕士学位。 (从左到右:Robert Wachen、Gavin Uberti 和 Chris Zhu)Etched 初步成立后,三位 00 后创始人在 2022 年 6 月、ChatGPT 还未问世前就对 AI 进行了一场“豪赌”:“我们打赌,Transformer 将席卷全球。”基于这个设想,他们推测专用 ASIC 芯片(专为特定架构设计的 AI 芯片)是一种必然趋势。事实上,当时的 AI 模型种类繁多,有用于自动驾驶汽车的 CNN、用于语言的 RNN,还有用于生成图像和视频的 U-Nets 等等。而 Uberti 他们注意到,Transformer(ChatGPT 中的“T”)是第一个可以扩展的模型。现阶段看来,他们似乎(暂时性)赌赢了:如今每一个最先进的 AI 模型都基于 Transformer,包括 ChatGPT、Sora、Gemini、Stable Diffusion 3 等等。GPU 遭遇瓶颈,唯一方法是 ASIC如开头所说,在这场 AI 大模型的全球竞赛中,大多数企业都离不开 GPU,这也是英伟达能成功垄断市场的原因之一。然而,Etched 在博文中指出:这四年来,GPU 本身并没有多少提升,即芯片单位面积的计算能力(TFLOPS)变动不大,只是芯片面积变得更大了。不论是英伟达的 B200、AMD 的 MI300,还是英特尔的 Gaudi 3 和亚马逊的 Trainium2,都是把两张芯片算作一张,以此实现所谓的“双倍”性能。基于这个发现,Etched 确定了其发展路线:随着摩尔定律的放缓,提高芯片性能的唯一方法就是专业化——但在 ChatGPT 出现之前,Etched 认定的这个方向几乎没有市场。当时,Transformer 还没风靡全球,许多公司都构建了灵活的 AI 芯片和 GPU 来处理数百种不同的架构,例如英伟达的 GPUs、Amazon 的 Trainium、AMD 的加速器、Graphcore的 IPUs、D-Matrix 的 Corsair 和英特尔的 Gaudi 等。如此背景下,自然没人想要制造专为特定架构设计的 AI 芯片(ASIC):Transformer 的市场不大,而芯片项目的成本为 5000 万至 1 亿美元,还需要数年时间才能投入生产。但突然之间,ChatGPT 的全球爆火令情况发生了巨大变化:(1)前所未有的需求:在 ChatGPT 之前,Transformer 推理的市场约为 5000 万美元,现在则已达数十亿美元。所有大型科技公司都在使用 Transformer 模型(OpenAI、谷歌、亚马逊、微软、Meta 等)。(2)架构逐渐趋同:AI 模型过去变化很大,但自 GPT-2 以来,最先进的模型架构几乎保持一致。OpenAI 的 GPT 系列、谷歌的 PaLM、Meta 的LLaMa、甚至特斯拉的 FSD 都是基于 Transformer。全球第一款专为 Transformer 设计的专用芯片 Sohu朝着这个方向,Etched 花了两年时间,打造出了全球第一款专为 Transformer 设计的专用芯片,名为 Sohu,并于昨日正式官宣:认识一下 Sohu,这是史上最快的 AI 芯片。据 Gavin Uberti 介绍,Sohu 采用台积电的 4nm 工艺制造,只有 1 个核心,每张芯片配有 144GB HBM3E 高带宽内存,可提供比 GPU 和其他通用 AI 芯片更好的推理性能,且耗能更少、成本更低。为了更直观地衡量 Sohu 的强悍性能,Gavin Uberti 把英伟达作为参照:在运行文本、图像和视频转换器时,Sohu 的速度比英伟达下一代 Blackwell GB200 GPU 还要快一个数量级,且成本更低;700 亿参数 Llama 3 吞吐量能达到每秒 50 万 tokens;一台 8xSohu 服务器可取代 160 个 H100 GPU……对于需要专用芯片的企业领导者来说,Sohu 将是一个更经济、更高效、更环保的选择。而之所以 Sohu 能实现如此性能,正是因为它的“专用性”:无法运行大多数传统的 AI 模型,如为 Instagram 广告提供动力的 DLRMs、AlphaFold 2 等蛋白质折叠模型、Stable Diffusion 2 等较老的图像模型,也无法运行 CNN、RNN 或 LSTM——专为 Transformer 设计,只能运行 Transformer。基于这个特点,作为 ASIC 芯片的 Sohu 在设计之初就直接摒弃了与 Transformer 无关的硬件组件,极大简化推理硬件和软件管道,以此最大程度地提高性能。Etched 在博文中提到,相较之下,通用 AI 芯片如英伟达的 H100,虽拥有 800 亿个晶体管,却只有 3.3% 用于矩阵乘法(大模型推理时最常见的运算):“这是英伟达和其他灵活的 AI 芯片有意为之的设计决策。如果你想支持所有类型的模型(CNN、LSTM、SSM 和其他),这种方案固然是最好的。”Gavin Uberti 指出:“我们无法运行 CNN、RNN、LSTM 和其他 AI 模型,但对于 Transformer 来说,Sohu 就是有史以来最快的芯片,甚至没有竞争对手。”Etched 能否打败英伟达?对于能否打败英伟达这个问题,Etched 首席运营官 Robert Wachen 的回应如下:“过去,AI 计算市场是分散的,人们使用不同种类的模型,如 CNN、DLRM、LSTM、RNN 和其他数十种跨领域的模型,每种架构的花费都在数千万到数亿美元之间,通用芯片(GPU)有着庞大的市场;但现在,市场正在迅速整合为一种架构:Transformer,那么专用芯片就是大势所趋。我们的芯片在大多数工作负载上都无法击败 GPU,因为 Sohu 无法支持它们。但是,对于Transformer 专用芯片来说,我们将会占据这个市场。”除此之外,Thiel Fellowship 主任 Alex Handy 也在一份声明中表示:“投资 Etched 是对 AI 价值的战略押注。他们的芯片解决了竞争对手害怕解决的可扩展性问题,也挑战了同行中普遍存在的性能停滞不前的现象。”目前来看,Etched 受到业界的广泛关注和许多支持,但正如 Gavin Uberti 所说,这场豪赌还没有结束:“如果未来 Transformer 消失或被取代了,我们就会死;但如果他继续存在,我们就会是有史以来最大的公司。”
Win10 寿命延长 5 年!曾为 Win7 续命 2 年的它,宣布再次“接棒”微软
对于许多 Windows 用户来说,2025 年 10 月 14 日是一个很特别的日子:那一天,Windows 10 会正式退役,自此微软将不再提供官方支持。也就是说,只剩下不到 500 天,Windows 10 就要变成“野孩子”了。然而,近日 0patch 公司重磅宣布,届时他们将无缝接棒微软:等微软终止支持 Windows 10 之后,0patch 会额外提供 5 年的安全补丁!0patch目前仍在为Windows 7提供支持在进入正题前,我们先大致了解一下 0patch 这家公司。从官网介绍来看,0patch 自诩是“解决巨大安全问题的微观解决方案”,主要向全球计算机和其他设备发送微型代码补丁(“微补丁”),以修复各种甚至闭源产品中的软件漏洞:“有了 0patch,打补丁时无需重启或停机,也不用担心大规模的官方更新会破坏生产。”据悉,0patch 所提供的微型代码补丁非常轻便和简单,让软件打补丁变得几乎“难以察觉”:能把补丁部署时间从几个月缩短到几个小时,另外审查微型补丁的成本很低,且在本地或远程即时应用和删除补丁的能力也极大简化了生产测试。除此之外,0patch 还是一家致力于为过期产品提供安全更新的公司。记得在 2023 年 1 月,当时微软通过ESU计划为 Windows 7 提供了最后一批安全更新,0patch 便立刻宣布将为 Windows 7 以及 Windows Server 2008 R2 设备提供微补丁服务至 2025 年 1 月:“我们决定继续为 Windows 7 和 Windows Server 2008 R2 提供安全补丁,以修补可能被利用的关键漏洞。”考虑到以上情况,此次 0patch 宣布为 Windows 10 继续提供 5 年安全补丁的决定,似乎也就在意料之中了。不想/不能升级Windows 11,有两种方案事实上,尽管微软一个劲儿地在强调 Windows 10 即将退役、为了安全需尽快升级到 Windows 11,但对于不少用户而言,其实并没有太多实感。如果没有其他支持,那么等到 2025 年 10 月 14 日究竟会发生什么呢?或许可以参考早在 2020 年 1 月结束支持的 Windows 7:一台在 2020 年经过最后一次更新的 Windows 7 电脑,若没有额外的安全补丁则很容易就被入侵,目前光是公开已知会影响 Windows 7 的关键漏洞,就有 70 多个了。以此类推,如果 2025 年 10 月之后 Windows 10 电脑不打补丁,很可能一个月内就会出现第一个关键漏洞,然后在随后的几个月内出现越来越多漏洞,并无限期地存在于电脑中。最后随着时间的推移,电脑被入侵的风险必然会逐渐增大,除非你不联网。因此微软建议,让 Windows 保持安全的唯一“免费”方法,就是升级到 Windows 11——但 0patch 说出了许多人的心声:“我们中的许多人,不想或根本不能升级到 Windows 11。”不想升级,是因为我们已经习惯了 Windows 10 的用户界面。不想去搜索某个按钮被移动到了哪里,也不想知道为什么我们每天都在用的应用不在了。现有的 Windows 10 已经能满足我们的一切需求。不想升级,是因为 Windows 11 中臃肿软件、开始菜单广告和严重的隐私问题等情况越来越多,也不想让 Recall 这样的功能不断记录我们在电脑上的活动。不想升级,是因为有些应用可能无法在 Windows 11 上运行,例如医疗设备、制造设备、POS 终端、特殊用途设备和 ATM,它们运行在 Windows 10 上,无法轻松升级。不能升级,是因为我们的硬件根本可能不符合升级到 Windows 11 的条件。据 Canalys 估计,全球有 2.4 亿台计算机不符合 Windows 11 硬件要求,缺乏可信平台模块(TPM)2.0、支持的 CPU、4GB 内存、具有安全启动功能的 UEFI 固件或支持的 GPU。在这种情况下,多数用户有两种方法可以确保 Windows 10 继续安全运行:扩展安全更新(ESU)或者 0patch。0patch更便宜、承诺提供更长时间的支持其中,扩展安全更新(ESU)是微软官方给出的一种临时解决方案,主要是针对组织和企业从 Windows 10 过渡到新的操作系统时使用:如果你想继续安全地使用 Windows 10 ,就必须要付费。目前,ESU 的定价只针对企业和教育组织,面向个人消费者的定价尚未公开。其中教育组织的收费很便宜, 三年只需 7 美元,而企业则相对贵了许多:第一年每台 PC 将收取 61 美元(人民币约 443 元)的费用,第二年 122 美元(人民币约 886 元),到了第三年要为每台 Windows 10 设备支付 244 美元(人民币约 1772 元)的价格来获得安全更新。0patch 指出,按照扩展安全更新(ESU)的收费标准,如果企业中有 1 万台 Windows 10 电脑,则需花费 400 万美元。“如果有一种方法,可以花更少的钱得到更多的东西就好了……”出于这个想法,0patch 宣布从 2025 年 10 月起,他们将为 Windows 10 提供至少 5 年的关键安全补丁——如果市场有需求,时间甚至会更长。在官方博客中,0patch 介绍自己是 Windows 唯一的非官方安全补丁提供商,并具体描述了其补丁的特点:针对 2025 年 10 月 14 日之后 Windows 10 中可能被利用的重要漏洞,0patch 将提供“微补丁”。这些补丁非常小,通常只有几条 CPU 指令,并可应用于内存中正在运行的进程,而不会修改二进制文件的任何字节。下载补丁后无需重启计算机,因为在内存中应用补丁只需短暂停止应用、打上补丁,然后让它继续运行即可,用户甚至不会注意到他们在编写文档的时候就已经打上了补丁。不过与微软的 ESU 一样,0patch 也不是一项免费服务,只是它承诺提供更长时间的支持和更多好处,例如更快、干扰更少的补丁,修复制造商未触及的漏洞,以及为非微软产品提供补丁等等。据悉 0patch 按年订购,面向个人和小型企业的 0patch PRO 每台电脑 24.95 欧元(人民币约 192 元)+税,而适用于大中型企业的 0patch Enterprise 每台电脑 34.95 欧元(人民币约 271 元)+税。0patch 也补充道,未来这个价格可能会调整,但任何以当前价格订阅的用户都可以在两年内继续以此价格订阅。
什么是Unity?解锁Unity引擎技术,掌握行业领域趋势!
作为全球领先的实时3D内容创作和运营平台,Unity一直致力于推动创作大众化,通过提供一系列3D创作工具和―整套全面的解决方案,将内容从二维、离线和单向的传播形式转变为三维、实时和深度交互的形式。Unity已经赋能了全球―半以上的游戏,如今也被应用于工业、汽车、消费文旅等行业,为更广泛的用户提供实时3D体验在尝试踏入Unity开发时,对Unity引擎的了解仍停留在表面。为了更深入地掌握Unity游戏引擎的相关知识,接下来,我们将从“什么是Unity”、“Unity引擎技术介绍”、“Unity应用领域”三个维度进行分析,带大家了解Unity游戏引擎的相关知识。什么是Unity?Unity是世界领先的实时3D互动内容创作和运营平台。专注于软件研发、技术支持、项目实施、云服务及运营等多个方面。提供一整套全面的解决方案来创建和运营交互式实时2D和3D内容,可部署到包括移动端、PC、主机、增强现实和虚拟现实设备等多个主流平台。作为一款广泛使用的游戏开发引擎,Unity在游戏行业中占据着重要的地位,与国内外的一些大厂,如EA、腾讯、网易、完美世界等都有着长期深度的合作。Unity引擎技术介绍1、物理引擎Unity中的物理引擎应用主要由两个方面组成,分别为游戏物体碰撞检测和游戏物体刚体模拟。在实际游戏开发中,一般使用碰撞检测的相关逻辑就可以处理大部分的游戏需求;游戏物体的刚体模拟只有在譬如车辆、仿真等强物理模拟需求的游戏中才会使用。刚体模拟需要大量的数学计算来求解动力学方程,因此如果游戏设计不涉及真实物理仿真需求,应该尽量避免在游戏开发中使用相关技术,以便降低物理引擎的计算开销。通过Unity的物理引擎,开发者可以轻松地创建出逼真的运动、碰撞和交互,从而创造出更加有沉浸感的游戏体验。2、动画系统Unity的Mecanim动画系统,是一套基于状态机的动画控制系统,是一个面向动画应用的动画系统。对于动画的制作编辑(Animation窗口)功能相对有限。重在如何从资源中提取动画,配置融合动画,应用动画,复用动画,以及为实际开发提供可视化的GUI编辑和监视功能。Unity的动画系统可以实现各种动画效果,如角色动画、场景动画、特效动画等,对游戏视觉效果和用户体验的打造起到关键作用。3、声音系统Unity中与声音相关的组件(或类)除了常用的Audio Clip,Audio Source,Audio Listener,还有Audio Filters(各种音频过滤器),Audio Reverb Zones(音频混响区域),Audio Effects(各种声音效果)以及Audio Mixer(音频混音器)。Unity的声音系统支持各种声音效果,可以帮助开发者为游戏添加高质量的声音效果和音乐,提升游戏的沉浸感和表现力。4、脚本系统脚本是附加在游戏物体上用于定义游戏对象行为的指令代码。脚本就是Unity中写代码的东西!Unity支持三种高级编程语言:C#、JavaScript和Boo Script(Unity4以前支持的)Unity的脚本系统是Unity引擎的重要组成部分,它为游戏开发者提供了一个灵活且高效的方式来实现复杂的游戏逻辑、交互和自定义功能。5、网络系统Unity的网络系统可以实现多人游戏、实时通信等功能,使得游戏具有更强的交互性和社交性,有利于提高用户粘性和活跃度。在Unity中创建实时网络游戏最简单的方式就是使用Multiplaver服务,它实现方式快捷,而且支持高度自定义。Unity提供的服务器和配对服务能够确保玩家可以轻松找到对方并一起玩游戏。6、工具集Unity提供了一系列工具集,如地形编辑器、粒子编辑器、材质编辑器等,可以帮助开发者快速创建和编辑游戏资源。Unity界面简介Unity的界面由几个主要部分组成,包括工具栏、场景窗口、层级窗口、项目窗口、游戏窗口和检视器窗口。这些窗口都可以根据个人喜好进行自定义布局。工具栏:提供常用工具的快捷访问方式;Sccene视图(场景视图):用于设置场景及放置游戏对象,是构造游戏场景的地方;Hierarchy视图(层级窗口):用于显示当前游戏场景中所以游戏对象的层级关系;Project视图(项目窗口):整个工程中所有可用的资源,例如模型、脚本等;Game视图(游戏窗口):由场景中相机所渲染的游戏画面,是游戏发布后玩家所能看到的内容;Inspector视图(属性窗口):用于显示当前所选择的游戏对象的相关属性与信息;游戏对象(Game Object):对于场景中所有的物体我们都可以称之为游戏对象,如:灯光、粒子、模型、UI等。组件(Component):每个游戏对象都是由多个组件组成的,可以简单的理解为游戏对象的属性。Unity优势1、渲染能力GPU交互:支持OpenGL、WebGL、DirectX、Vulcan等底层GPU编程规范;效果:URP(通用渲染管线)支持所有平台,HDRP(高清渲染管线)带来高保真电影级画质;性能:向下兼容硬件能力,充分释放硬件性能与表现;2、产品体验交互性:简洁友好的交互操作界面;实时性:所见即所得,实时发布;易用性:开发者友好:C#编程语言简单易学;设计师友好∶通过原生可视化编程功铃进行无代码开发;3、平台建设开放性:支持多种数据格式、支持不同格式的接口和协议;兼容性:向下兼容不同版本;扩展性:—次开发,跨平台跨终端部署;版本快速迭代,供开发者体验最新功能。Unity应用领域Unity以游戏开发而闻名,但它的应用并不限于此。Unity的灵活性和跨平台特性使其在多个领域都找到了应用很多小伙伴对于Unity的了解还停留在“3D游戏引擎”这个概念上,其实,除了传统的游戏开发领域,Unity在游戏开发、汽车及高端制造、建筑制造、影视文娱等领域也有着广泛的应用。1、游戏开发Unity在游戏行业有着不可撼动的市场地位,世界上绝大多数热门的游戏都是使用Unity的工具创作的。一些市面上热门的游戏,如王者荣耀、英雄联盟、原神、糖豆人、江南百景图、崩坏3等,都是使用Unity引擎制作的。2、汽车及高端制造Unity公司正在利用自身在游戏软件开发方面的专长,帮助汽车企业打造更智能、更沉浸式的车载体验。比如,Unity帮助蔚来开发ES8的智能座舱系统,实现车联网、自动驾驶辅助等功能;还与小鹏汽车合作开发了3D导航和虚拟助理等数字化座舱体验。Unity引擎车机版大幅简化了开发流程,已被多家车企使用。Unity开发的虚拟配置器也应用于4S店的销售过程,通过AR/VR技术让客户体验车内空间。3、建筑制造Unity能够提供建筑设计可视化、虚拟现实漫游、建筑模拟与分析等技术,使建筑工程的实施更加高效、更加可视化,像是布鲁克林的最高建筑9 Dekalb,就是美国纽约的建筑公司SHoP Architects使用Unity的技术建造而成的。4、电影和动画制作Unity的高级图形渲染和实时动画制作工具被用于创建电影预览、动画短片甚至是全尺寸的电影。Unity还可以和其他流行的图形软件(如Maya和Blender)无缝地集成,提供了一种快速、高效的电影制作流程。5、文化娱乐场景Unity也被广泛应用到文化娱乐场景,例如:卡塔尔世界杯、迪拜世博会、世界杯、北京冬季奥运会等大型元宇宙项目。6、VR和ARUnity是VR和AR开发的主流平台。由于其强大的3D图形渲染能力,无论是Oculus Rift,HTC Vive,还是Microsoft的Hololens,苹果的Vision眼镜,Unity都提供了官方支持,使得Unity在VR/AR内容的开发中占据重要地位。正是由于Unity产品体系和技术的不断创新,各行各业的开发者才能更智能、更高效、更经济地呈现创意。张俊波表示:“我们坚信,世界会因有更多创作者而更加美好。Unity非常荣幸被广大开发者所使用,帮助开发者解决最困难的共性问题,降低内容创作的成本,打造丰富且极具活力的创作者经济。”也期待Unity为开发者提供一个适用性更广泛、功能更加强大、使用更加便捷的实时3D引擎,让开发者更加专注于内容创作本身。
Unite游戏发行专场 | 游戏发行的新出路在哪里
unity 最初只是一家初创小公司,但是我们的愿景却很宏大:普及游戏开发,让任何人都能够创作游戏并获得成功。直至今天,Unity 已经驱动了全球超过 50% 的游戏,在全球排名前 1000 的移动游戏中,更有 73% 用 Unity 开发。随着越来越多的人用 Unity 创作出精美游戏,我们也发现了开发者对游戏发行的急切需求。经 Unity 中国观察,每年都有大量游戏被打包,但实际上与用户见面的,却少之又少。如何在版号收紧的大环境下做游戏发行,是此次 Unite Shanghai 2024 将探讨的重点。我们希望更多的开发者做出精品游戏,也希望助力更多的开发者商业化成功,Unity 中国和大家共同期待更好的游戏生态。本次 Unite 游戏发行专场活动,我们荣幸邀请到了游戏行业内资深嘉宾,共同探讨游戏发行的新趋势与未来。Unity 中国发行产品总监项鹏玉将为我们带来游戏开发者生态及发行服务介绍;天津经济技术开发区电子信息产业促进局副局长王熙娜的出席,则体现了政府对游戏产业的坚定支持与期望。同时,我们还邀请到了诸多行业领袖共襄盛会,已确定的嘉宾有TapTap 运营负责人曹雄峰、雷霆游戏发行经理刘纯一、游民星空营销与游戏发行负责人暗哨、数数科技售前解决方案负责人祝运祯、Supersonic from Unity APAC 发行负责人 David等等,他们将从各自的角度探讨游戏发行的创新之道,共同为游戏产业的繁荣发展献计献策。期待您的参与,共同见证游戏发行的未来。