2024-04-01

No.37

宫崎骏看完AI制作的动画：强烈感受到对生命的侮辱

主理人：

欢迎收看最新一期的 Hunt Good 周报！

在本期内容你会看到：

5 条新鲜资讯
3 个有用工具
1 个有趣案例
4 个鲜明观点

Hunt for News｜先进头条

GPT Store 开启分钱计划

本周，OpenAI 在社交平台 X 上发帖称，正在与一部分美国开发者合作，基于用户使用情况为开发人员发放奖励，以创建「一个充满活力的生态系统」。

OctaneAI 首席执行官 Matt Schlicht 透露，他已收到 OpenAI 的邀请邮件，邮件中提到OpenAI 正在积极寻求 GPT 货币化的方法。

Matt Schlicht 在社交平台 X 上兴奋地表示：「OpenAI 这么做，会推动大量的创新和竞争。我爱死它了！」

值得注意的是，该计划目前仅对居住在美国的开发者开放。同时 OpenAI 尚未披露开发者参与测试的细节、收入分成的条款，以及后续时间表。

https://twitter.com/OpenAI/status/1773032605002203559

最强开源大模型一夜易主

大数据软件公司 Databricks 本周发布了一款开源大语言模型 DBRX。

根据发布的细节，DBRX 在语言理解、编程和数学方面的表现超越了目前市场上的几个主要开源模型，包括 Mixtral MoE、Llama-2 70B 和 Grok-1 等。

DBRX 的推理速度比 LLaMA2-70B 快了两倍，同时其总参数规模仅为 Grok-1 的 40%。在长上下文任务处理和 RAG 基准测试中，DBRX 的表现也超越 GPT-3.5。

尽管 DBRX 的性能出色，但其训练成本却相对较低。该公司仅投入了 1000 万美元，并在两个月内完成了 DBRX 从零开始的训练。

https://twitter.com/databricks/status/1772964336970940629

xAI 正式发布 Grok-1.5

近日，马斯克旗下的 xAI 团队发布了 Grok-1.5 大模型。

从基准测试的结果来看，Grok-1.5 在 MATH 基准测试中取得了 50.6% 的得分，在 GSM8K 基准上，Grok-1.5 获得了 90% 的得分，这两个测试都涵盖了从基础算术到高级数学的广泛领域。

此外，Grok-1.5 在评估代码生成和解决问题能力的 HumanEval 基准测试中得分为 74.1%，超越了 GPT-4。

Grok-1.5 另一个比较大的升级是其上下文窗口扩展至 128K，飙升 16 倍，提升到了与 GPT-4 Turbo 相同的档次，能够处理相当于 300 页的文本，相当于可以塞进一部中篇小说。

此外，马斯克在 Grok-1.5 正式推出后，发文表示 Grok 2 正在训练中，并且将在所有指标上超越当前的人工智能。

https://mp.weixin.qq.com/s/Fs4c0wNH5wQ1GRdo3Tn7sQ

豪掷 1000 亿美元！微软 OpenAI 联手打造超算

据 The Information 报道，微软将与 OpenAI 计划联手投资 1000 亿美元，打造名为「星际之门」的超级数据中心。

这一项目预计将在 2028 年启动，旨在为人工智能提供前所未有的计算能力，以推动 AI技术的发展。

与现有数据中心相比，「星际之门」的成本高出百倍，该超算将配备数百万枚专用服务器芯片，预计总成本高达 1150 亿美元，而微软将承担这一巨额投资。

为满足超算的能源需求，微软和 OpenAI 正考虑采用核能等替代能源方案。此外，如何有效连接和冷却高密度 GPU，以及选择合适的网络电缆，也是项目成功的关键。

https://www.theinformation.com/articles/microsoft-and-openai-plot-100-billion-stargate-ai-supercomputer?rc=qmzset

OpenAI 发布 Voice Engine，配音演员警报拉响

OpenAI 昨日公布了其最新语音生成模型——Voice Engine，该技术能够根据文本输入和 15 秒音频样本生成近乎原生的自然语音。

自 2022 年底开发以来，Voice Engine 已在包括 Heygen 在内的少数公司进行了测试性使用。

Voice Engine 的主要功能包括生成自然听起来的语音，通过一个简短的音频样本，创造出既富有情感又真实的语音输出，显著提升了合成语音的自然度和真实感。

此外，该模型支持多种用途，覆盖教育援助、内容翻译、提升偏远地区服务质量等多个行业，甚至能够帮助非语言人士和帮助患者恢复声音。

Voice Engine 的另一大特点是在内容翻译时保留原始发言者的本地口音，确保翻译后的语音既流利又具有原声音的特色。同时，该模型支持多语种输出，满足全球化需求。

https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices

Hunt for Tools｜先进工具

眼见不一定为实！Heygen 新功能发布

Heygen 公司最近推出了一项名为 Avatar in Motion 1.0 的新功能。

该功能不仅能够精准地实现口型与语音的同步，复制语音语调，还能够保留背景声音，极大地增强了虚拟角色的真实感。

Avatar in Motion 1.0 的最大亮点在于其身体的动作捕捉，它能够精确识别并追踪用户的手部动作和手势。

用户现在可以通过简单的文本输入控制虚拟角色，使其不仅能够模仿用户的动作和姿态，并且还能流利地说出多种语言。

https://twitter.com/HeyGen\_Official/status/1773119891068883240

让你的手机「活」起来

LOOI 是一款集成了仿生行为系统和 ChatGPT 对话技术的桌面机器人。

它能够实时感知用户及其周围环境，通过手机展示富有表情的互动画面，还能与用户进行智能对话。

LOOI 不仅能够提醒用户关注重要信息，还支持远程控制和动画发送功能。用户即使身处远方，也能利用它与家人保持温馨互动。

当你手机没电时，该机器人可以变身为无线充电器。此外，LOOI 可能还将搭载更多 AI 功能，如情感识别和自适应互动等。

附上官方地址：https://looirobot.com/

https://twitter.com/BrianRoemmele/status/1773479285157978203

Hume AI 推出情感感知 AI EVI

Hume AI 近日发布了具有情感感知能力的对话 AI EVI。

EVI 采用了情感大语言模型（eLLM）技术，这是一种结合了大型语言模型的语言理解和表情测量技术的情感感知能力。

它不仅能够像真人一样进行自然对话，还能感知用户说话时的微妙情绪并做出恰当反应。

EVI 在对话中特别注重避免尴尬和中断，如果用户突然打断它，EVI 会像真人一样停下来倾听用户说话。

体验地址：https://demo.hume.ai/

https://twitter.com/imxiaohu/status/1773184663571603931

Hunt for Fun｜先行

画漫画，有 AI 漫画工厂就够了

AI Comic Factory 利用 LLM 和 SDXL 技术，能够根据用户简单的文本提示自动创建充满情感和故事性的漫画面板。

用户只需提供创作提示，如漫画主题和人物对话，AI Comic Factory 便能生成包含对话和场景描述的完整漫画内容。

这一平台不仅支持多种配置，包括不同的语言模型引擎和渲染引擎，以满足用户的个性化需求，还具备用户交互功能。

AI Comic Factory 的另一大亮点在于其多语言内容创作能力，此外，平台还能批量生成多个漫画变体，为用户提供多样化的选择。

https://twitter.com/imxiaohu/status/1773255641563533542

Hunt for insights｜先知

️ 莫言：作家独具个性的形象、思维，是 AI 无法替代的

近日，著名作家莫言在微信公众号发表了一篇文章，针对 AI 是否会对文学未来构成威胁这一问题提出了自己的见解。

莫言表示，文学永远不会随着科学的进步而消亡，而且只能是每一次科学的进步都会给文学插上新的翅膀。

现在 AI 的出现，也不会让文学产生多么大的危机，作家这个职业也不会就此终止。

在很长一段时间内，作家独具个性的形象、思维，是 AI 无法替代的。

莫言认为，至少在有生之年，「我们是不会失业的，我们的创作还会让电子计算机无法模仿。」不过，他也提醒，作家们需要不断地挖掘更具个性和形象化的思维方式，以保持文学的生命力和创造力。

https://mp.weixin.qq.com/s/iVVygnOlqh7ED9KHEYU1RA

台积电董事长预测：十年内 GPU 晶体管数将破万亿

近日，半导体制造公司台积电董事长刘德音和首席科学家在 IEEE 发表文章中指出，半导体技术的进步是 AI 能力提升的关键因素。

为了维持 AI 革命的当前速度，半导体行业需要在未来十年内提供拥有万亿晶体管的 GPU，这是目前典型 GPU 晶体管数量的十倍。

为了实现这一目标，半导体技术需要在新材料、光刻技术、新型晶体管和先进封装等方面取得进展。

通过集成芯片（Chiplets）和 3D 系统整合，行业正在超越传统的 2D 缩放，构建包含更多晶体管的紧密集成、高度互联的系统。

文章还指出，随着技术的发展，未来的数据中心将能够通过光接口实现更高效的服务器间通信，使得数百台服务器能够像一个巨大的 GPU 一样运行，共享统一的内存。

https://spectrum.ieee.org/trillion-transistor-gpu

宫崎骏：感受到对生命的侮辱

据《你想活出怎样的人生》电影官方透露，曾经有 IT 企业的人员向宫崎骏展示他们用 AI 制作出的动画作品。

IT 企业员工介绍道：「这些 AI 可以做出人类无法想象的动作，我们最终的目的就是创造出一个能和人一样画画的机器。]

画面中「只用头和脚行动，没有痛感」的 CG 模型，让宫崎骏难以认同。他坦率地表达了自己的观点「我强烈感受到对生命的侮辱。」

据介绍，宫崎骏想用他的人生告别之作《你想活出怎样的人生》证明：「拍电影是为了传递世界的美丽，从未被注意到的美丽。」

https://weibo.com/1742566624/5017609545977212?wm=3333_2001&from=10E3393010&sourcetype=weixin&s_trans=1278535071_5017609545977212&s_channel=4

前研究员：OpenAI 正在构建「LLMOS」系统

近期，Stephanie Zhan 对 OpenAI 前研究员 Andrej Karpathy 进行了深入访谈，内容涉及 LLM 操作系统等多个领域。

Karpathy 提到，OpenAI 正在构建一个名为「LLMOS」的系统，旨在为不同公司和领域提供定制化 AI 应用，同时支持丰富的第三方应用生态。

在谈到 AI 模型发展的关键因素时，Karpathy 强调了模型规模的重要性，同时也指出数据质量、算法选择和训练技巧等其他因素的作用。

谈及马斯克，他表示从其身上学到了宝贵的管理经验，包括打造高效、激情的工作环境，以及重视工程师的意见和快速决策。

对于 AI 的未来，Karpathy 表达了他对整个生态系统健康发展的关注，期望看到一个繁荣的 AI 创业生态。

https://twitter.com/stephzhan/status/1773027310587056433

彩蛋时间

《春天的乘客》

作者：@SmokeAwayyy

工具：Midjourney

链接：https://twitter.com/SmokeAwayyy/status/1770708563775615359