2024-03-28

No.17

AI精选（17）-人工智能领域内的最新进展

主理人：

今日精选，深度丰富、精彩纷呈！我们诚邀大家继续关注并订阅我们内容，AI时代不落后，让每一天都充满启发和价值。

一、微软刚刚推出全球首款AI笔记本电脑。

Surface Pro 10 和 Surface Laptop 6。这两款设备都采用Intel Core Ultra CPU，同时整合了AI功能，5G 连接 (Pro 10)、Copilot Key、增强的安全功能等提高性能

以下是您需要了解的一切：

1.AI Copilot Key 使用专用键盘按键即可轻松访问 AI 工具。

2.AI相机 Window Studio 效果利用新的 NPU 来提供： - 自动取景， - 眼神接触， - 背景模糊， - Surface Pro 10 具有 114 度视野，- Surface Laptop 6 具有 1080p 全高清摄像头

二、NVIDIA 刚刚发布了免费的人工智能在线课程

1. 生成式人工智能解释你将学到什么： • 生成式人工智能并解释生成式人工智能的工作原理。 • 各种生成式人工智能应用程序。 • 生成人工智能的挑战和机遇链接： https://courses.nvidia.com/courses/course-v1:DLI+S-FX-07+V1/…

2. 10 分钟构建大脑你将学到什么： • 探索神经网络如何使用数据进行学习 • 了解神经元背后的数学原理链接： https://courses.nvidia.com/courses/course-v1:DLI+T-FX-01+V1/

三、Wear-Any-Way

Wear-Any-Way是一个新的虚拟试穿框架，支持用户精确操控服装的穿着风格。该方法使用户能够拖动袖子将其卷起、打开外套以及控制褶皱的样式等。

项目地址： https://mengtingchen.github.io/wear-any-way-page/…

四、Airen 4D

全新的 Cinema 4D AI 渲染引擎 Merkvilson 的新工具采用 AI 作为渲染引擎，能够在 Cinema 4D 内快速创建图像、烘焙等功能。

地址：https://lesterbanks.com/2024/03/airen-4d-is-a-new-ai-render-engine-for-cinema-4d/…

五、Claude 3 Opus在 7 万人的竞技场投票中超越GPT 4

甚至连Claude-3 Haiku 在用户偏好中都达到了GPT-4的水平，其速度、能力和上下文长度在模型市场上无出其右！

Starling-LM-7B-beta，经过34B奖励模型的PPO（近端策略优化）处理，在排行榜上迅速上升。现在是最佳的7B开放模型！超越GPT 3.5…

OpenAI开始全面落后…

但也预示着GPT 5要来了…

查看排行榜：https://huggingface.co/spaces/lmsys/chatbot-arena-leaderboard

六、MoneyPrinterTurbo：一键自动生成1分钟长的短视频

你只需要输入一个主题或几个关键词就能自动生成短视频。比如，你只需要告诉它你想制作一个关于“如何制作咖啡”的视频它能自动为你准备好一切所需内容——从文案到视频片段，甚至还包括字幕和背景音乐。最后自动组合成一个完整的视频。而且是开源的！

主要功能

1、全自动生成视频元素：基于输入的视频主题或关键词，自动生成视频文案、素材、字幕和背景音乐。

2、支持多种视频尺寸：包括竖屏（9:16, 1080x1920）和横屏（16:9, 1920x1080）格式。

3、批量视频生成：一次性生成多个视频，用户可以从中选择最满意的一个。

4、视频片段时长设置：允许用户调节素材切换频率，控制视频节奏。

5、多语言支持：支持生成中文和英文视频文案。

6、多种语音合成：提供不同的语音合成选项，增加视频的多样性和吸引力。

7、字幕生成与自定义：用户可以自定义字体、位置、颜色和大小，还支持字幕描边设置。

8、背景音乐选择：可以随机选择或指定音乐文件，并设置背景音乐音量。

9、高清无版权素材来源：确保视频素材质量的同时，避免版权问题。

10、支持多种模型接入：包括OpenAI、moonshot、Azure、gpt4free、one-api等。

GitHub：https://github.com/harry0703/MoneyPrinterTurbo

七、Awesome-Generative-AI-Guide: 一站式AI最新研究更新、面试资源、免费课程等综合库

最新研究更新：提供每月最佳生成式AI论文列表，包括各项研究的摘要和主题。免费课程列表：超过65个与生成式AI相关的免费课程。

面试资源：面试准备材料，特别是针对生成式AI领域的面试问题。

课程材料：《Applied LLMs Mastery 2024》课程材料。

代码库/笔记本：提供开发生成式AI应用的代码库和notebook列表。

特别适合生成式AI研究者、学习者、面试准备者以及对AI最新进展感兴趣的任何人的理想资源。无论是准备面试、寻找最新的研究论文，还是寻找实际操作的代码示例和笔记本，这个项目都提供了一站式的解决方案。项目定期更新，因此用户可以期待获取到最新的资源和信息。 GitHub：https://github.com/aishwaryanr/awesome-generative-ai-guide

八、NoLang：输入任何主题或者网页链接直接生成视频

它支持文字、网页链接、PDF、提问等直接转视频也就是你输入文字、链接NoLang能以视频形式快速回答。输入PDF文件，会先给你总结内容，然后根据总结的内容在生成一个解答视频。还可以对生成的视频进行继续追问。还有个Chrome扩展，装上后，在任意网页点击即可生成视频。

我测试了下网页，没有成功，目前访问量太大，服务器扛不住了。

目前只支持日语和英语。总体上就是文字配图转语音的套路，不过思路很惊奇。

在线体验：http://no-lang.com

九、AniPortrait：根据音频和图像输入生成会说话、唱歌的动态视频

它可以根据音频（比如说话声）和一张静态的人脸图片，自动生成逼真的人脸动画，并保持口型一致。支持多种语言，同时支持进行面部重绘和头部姿势控制。主要功能：

1、音频驱动的动画合成：AniPortrait能够利用音频文件驱动，生成逼真的肖像动画。这意味着用户可以提供一个音频文件和一张参考的肖像图片，AniPortrait将根据音频中的语音和声音的节奏来动态地生成说话或表情变化的肖像动画。

2、面部再现：除了音频驱动动画之外，AniPortrait还支持面部再现功能，通过分析给定视频中的面部表情和动作，AniPortrait可以在另一张参考肖像上再现相同的表情和动作。例如用户可以提供一段视频，实现在新的肖像上复现视频中人物的面部表情和动作。这项技术可以用于创造逼真的虚拟角色动画，使其复现真人的表情和动作。

3、头部姿势控制：用户可以指定头部姿势，或者选择预设的姿势配置，来控制生成动画中的头部动作，使动画效果更加自然和多样化。

4、支持自驱动和音频驱动的视频生成：项目不仅支持音频驱动的动画生成，还可以进行自驱动的视频生成，即不需要外部音频输入，而是根据预设或随机生成的动作来创建动画。

5、高质量动画生成：niPortrait旨在生成高度逼真的肖像动画，无论是从视觉质量还是动作自然度方面，都力求接近真实人物的外观和表现。

6、灵活的模型和权重配置：项目提供了一套预训练的模型和权重配置，用户可以根据自己的需求下载和配置，包括用于去噪、参考生成、姿势指导、动作模块和音频到网格转换的模型。包括StableDiffusion V1.5、denoising_unet、reference_unet、pose_guider、motion_module和audio2mesh等。

十、Figma新推出的CreatieAI刚刚落地

旨在彻底改变您设计用户界面的方式。

自动布局、原型设计、开发模式、自动风格指南——一切都是为了优化用户体验设计师的工作流程而设计的。

地址：https://www.figma.com/