2024-08-08

AI精选（142）-人工智能领域内的最新进展：宇树科技开源了一个项目

主理人：

今日精选，深度丰富、精彩纷呈！我们诚邀大家继续关注并订阅我们内容，AI时代不落后，让每一天都充满启发和价值

一、宇树科技开源了一个项目

通过使用使用 Apple Vision Pro 远程操作Unitree H1_2 人形机器人。可以提高仿人机器人数据收集的便利性。演示视频显示同步情况非常好，几乎是实时同步，视频为1倍数播放。

GitHub：https://github.com/unitreerobotics/avp_teleoperate

二、Palo Alto Networks集成ChatGPT以确保安全的生成式AI使用

集成背景：Palo Alto Networks宣布与OpenAI合作，将ChatGPT Enterprise Compliance API整合到其平台中，旨在利用外部领先的AI解决方案，同时保持强大的数据和威胁保护措施。

AI访问安全：此次集成建立在Palo Alto Networks于5月推出的AI访问安全功能之上，帮助组织安全地利用生成式AI应用程序。该功能能够分类并映射数百个生成式AI应用程序，生成定制的风险评分，协助信息安全团队做出快速、明智的决策。工具允许企业监控AI应用程序的采用和使用情况，防止敏感数据泄漏，并防御AI生成的恶意响应。

来源：https://cybermagazine.com/articles/palo-alto-networks-integrates-chatgpt-for-secure-gen-ai-use

三、OpenAI更新的Mac版ChatGPT应用程序使多任务处理变得更加容易

应用程序更新：OpenAI推出了最新版本的ChatGPT应用程序，专为Mac用户设计。多任务处理改进：更新后的应用程序特别强调了多任务处理功能的改进，使用户能够更加高效地在不同任务之间切换。

用户界面优化：新版本对用户界面进行了优化，界面更加直观，操作更为流畅，用户体验得到了显著提升。集成功能增强：应用程序与Mac生态系统的集成度进一步提高，支持更多快捷操作，并与其他应用程序的兼容性也得到了增强。

性能提升：新版应用程序在性能方面也进行了优化，运行速度更快，响应时间更短，从而提高了整体使用效率。

来源：https://9to5mac.com/2024/08/06/multitasking-with-chatgpt-on-the-mac-just-got-a-lot-better/

四、ChatGPT通过日本医疗和卫生专业国家资格考试的潜力：文献综述

系统评估ChatGPT（GPT-3.5、GPT-4和GPT-4V）在日本国家医疗和卫生专业执照考试中的学术潜力，并考虑其优缺点。使用PubMed/Medline、Google Scholar和ICHUSHI等电子数据库系统检索相关文献，最终纳入了22篇研究文章进行分析。

主要发现：GPT-4的表现：大多数评估GPT-4的研究表明，GPT-4可以通过大部分仅包含文本的考试。然而，尽管通过了考试，其成绩通常低于实际考生的表现。图像识别能力的不足：GPT-4V在涉及图像的题目上表现不佳，特别是在需要识别图表或表格的问题上，正确率较低。

GPT-3.5与GPT-4的比较：相比GPT-3.5，GPT-4在各类考试中的表现更为出色，尤其是在语言处理和复杂指令处理方面表现更佳。

学术限制：尽管GPT-4通过了大多数考试，但在医学实践中可能选择不当选项（如建议安乐死），这表明其在处理伦理和法律问题时存在局限性。

来源：https://www.cureus.com/articles/279372-potential-of-chatgpt-to-pass-the-japanese-medical-and-healthcare-professional-national-licenses-a-literature-review?score_article=true

五、Endava与OpenAI合作在全公司部署ChatGPT Enterprise

合作背景：Endava是一家全球提供数字化转型、敏捷开发和智能自动化服务的公司，宣布与OpenAI达成战略合作协议，将ChatGPT Enterprise许可证部署到其全球11,000多名员工中。

合作目标：此次合作标志着Endava致力于利用先进的AI技术推动客户成果的又一重要步骤。公司将重点利用ChatGPT的高级语言模型和功能来增强运营、推动创新，并帮助客户实现加速的影响。

技术优势：通过ChatGPT Enterprise，Endava可以访问企业级的安全性和隐私保护，这是ChatGPT迄今为止最强大的版本。

内部整合：Endava的团队中已经有一批“ChatGPT冠军”在多个业务功能中进行了技术试点，并将其与内部系统集成，以建立最佳实践，为全公司范围内的无缝整合铺平道路。

来源：https://www.romania-insider.com/endava-partners-openai-deploy-chatgpt-enterprise-throughout-organisation

六、Deep-Live-Cam：实时换脸和一键视频深度伪造工具

只需单张图像即可实现人脸替换提供实时预览功能，能够立即看到替换效果。还支持实时人脸增强，同时能够处理同一图像或视频中的多张人脸，而不仅仅是单一人脸的替换。支持在能够在各种硬件配置上运行，无需专用硬件加速。 Apple Silicon、DirectML、OpenVINO都可以...

github：https://github.com/hacksider/Deep-Live-Cam…

七、Matting by Generation：利用图像生成模型来实现更高质量的图像抠图

无需任何额外输入，仅凭单张输入图像即可自动提取前景并生成高质量的边界细节。在处理复杂的边界细节（如头发、鞋带等）方面表现出色，能够生成接近真实感的边界效果。该方法利用了潜在扩散模型取代回归神经网络，并结合了大量预训练的知识，使得抠图结果更精确，细节更丰富。该方法还可以使用多种辅助信息，比如文本描述、简单的图像标记、涂鸦等。通过整合这些信息，模型可以更准确地识别前景和背景，生成的图像效果更好。例如，可以用一句话描述图像中的前景，或者用简单的线条标记出前景区域，模型就能根据这些提示生成更准确的前景图像。

论文：https://arxiv.org/pdf/2407.21017

八、OpenAI 推出 GPT-4o 模型新型号：GPT-4o-2024- 08-06 同时又降价了

相较于之前的模型，新模型在输入和输出方面分别便宜了50%和33%。此外，GPT-4o 支持结构化输出，确保模型输出完全符合用户提供的 JSON 架构。通过支持结构化输出，

GPT-4o 提供了更高的控制和精度，满足了需要严格数据格式的应用场景的需求。 - 格式一致性：模型输出的数据严格按照用户提供的 JSON 架构来生成，确保每个字段都符合预期的格式和类型。 - 减少后处理工作：由于输出数据已经是结构化的，用户无需进行额外的数据清洗或格式转换，可以直接使用这些数据进行进一步的处理或存储。 - 提高可靠性：对于需要严格数据格式的应用场景，比如数据库录入、API 响应等，结构化输出可以避免因格式不一致引起的错误，保证数据的可靠性和一致性。