AI精选(142)-人工智能领域内的最新进展:宇树科技开源了一个项目

主理人:
今日精选,深度丰富、精彩纷呈!我们诚邀大家继续关注并订阅我们内容,AI时代不落后,让每一天都充满启发和价值

一、宇树科技开源了一个项目

 

通过使用使用 Apple Vision Pro 远程操作Unitree H1_2 人形机器人。 可以提高仿人机器人数据收集的便利性。 演示视频显示同步情况非常好,几乎是实时同步,视频为1倍数播放。 

GitHub:https://github.com/unitreerobotics/avp_teleoperate

 

 

二、Palo Alto Networks集成ChatGPT以确保安全的生成式AI使用

集成背景:Palo Alto Networks宣布与OpenAI合作,将ChatGPT Enterprise Compliance API整合到其平台中,旨在利用外部领先的AI解决方案,同时保持强大的数据和威胁保护措施。

AI访问安全:此次集成建立在Palo Alto Networks于5月推出的AI访问安全功能之上,帮助组织安全地利用生成式AI应用程序。该功能能够分类并映射数百个生成式AI应用程序,生成定制的风险评分,协助信息安全团队做出快速、明智的决策。工具允许企业监控AI应用程序的采用和使用情况,防止敏感数据泄漏,并防御AI生成的恶意响应。

来源:https://cybermagazine.com/articles/palo-alto-networks-integrates-chatgpt-for-secure-gen-ai-use

 

 

三、OpenAI更新的Mac版ChatGPT应用程序使多任务处理变得更加容易

应用程序更新:OpenAI推出了最新版本的ChatGPT应用程序,专为Mac用户设计。多任务处理改进:更新后的应用程序特别强调了多任务处理功能的改进,使用户能够更加高效地在不同任务之间切换。

用户界面优化:新版本对用户界面进行了优化,界面更加直观,操作更为流畅,用户体验得到了显著提升。集成功能增强:应用程序与Mac生态系统的集成度进一步提高,支持更多快捷操作,并与其他应用程序的兼容性也得到了增强。

性能提升:新版应用程序在性能方面也进行了优化,运行速度更快,响应时间更短,从而提高了整体使用效率。

来源:https://9to5mac.com/2024/08/06/multitasking-with-chatgpt-on-the-mac-just-got-a-lot-better/

 

 

四、ChatGPT通过日本医疗和卫生专业国家资格考试的潜力:文献综述

系统评估ChatGPT(GPT-3.5、GPT-4和GPT-4V)在日本国家医疗和卫生专业执照考试中的学术潜力,并考虑其优缺点。使用PubMed/Medline、Google Scholar和ICHUSHI等电子数据库系统检索相关文献,最终纳入了22篇研究文章进行分析。

主要发现GPT-4的表现:大多数评估GPT-4的研究表明,GPT-4可以通过大部分仅包含文本的考试。然而,尽管通过了考试,其成绩通常低于实际考生的表现。图像识别能力的不足:GPT-4V在涉及图像的题目上表现不佳,特别是在需要识别图表或表格的问题上,正确率较低。

GPT-3.5与GPT-4的比较:相比GPT-3.5,GPT-4在各类考试中的表现更为出色,尤其是在语言处理和复杂指令处理方面表现更佳。

学术限制:尽管GPT-4通过了大多数考试,但在医学实践中可能选择不当选项(如建议安乐死),这表明其在处理伦理和法律问题时存在局限性。

来源:https://www.cureus.com/articles/279372-potential-of-chatgpt-to-pass-the-japanese-medical-and-healthcare-professional-national-licenses-a-literature-review?score_article=true

 

 

五、Endava与OpenAI合作在全公司部署ChatGPT Enterprise

合作背景:Endava是一家全球提供数字化转型、敏捷开发和智能自动化服务的公司,宣布与OpenAI达成战略合作协议,将ChatGPT Enterprise许可证部署到其全球11,000多名员工中。

合作目标:此次合作标志着Endava致力于利用先进的AI技术推动客户成果的又一重要步骤。公司将重点利用ChatGPT的高级语言模型和功能来增强运营、推动创新,并帮助客户实现加速的影响。

技术优势:通过ChatGPT Enterprise,Endava可以访问企业级的安全性和隐私保护,这是ChatGPT迄今为止最强大的版本。

内部整合:Endava的团队中已经有一批“ChatGPT冠军”在多个业务功能中进行了技术试点,并将其与内部系统集成,以建立最佳实践,为全公司范围内的无缝整合铺平道路。

来源:https://www.romania-insider.com/endava-partners-openai-deploy-chatgpt-enterprise-throughout-organisation

 

 

 

六、Deep-Live-Cam:实时换脸和一键视频深度伪造工具

只需单张图像即可实现人脸替换 提供实时预览功能,能够立即看到替换效果。 还支持实时人脸增强,同时能够处理同一图像或视频中的多张人脸,而不仅仅是单一人脸的替换。 支持在能够在各种硬件配置上运行,无需专用硬件加速。 Apple Silicon、DirectML、OpenVINO都可以...

github:https://github.com/hacksider/Deep-Live-Cam…

 

 

七、Matting by Generation:利用图像生成模型来实现更高质量的图像抠图

 

无需任何额外输入,仅凭单张输入图像即可自动提取前景并生成高质量的边界细节。 在处理复杂的边界细节(如头发、鞋带等)方面表现出色,能够生成接近真实感的边界效果。 该方法利用了潜在扩散模型取代回归神经网络,并结合了大量预训练的知识,使得抠图结果更精确,细节更丰富。 该方法还可以使用多种辅助信息,比如文本描述、简单的图像标记、涂鸦等。通过整合这些信息,模型可以更准确地识别前景和背景,生成的图像效果更好。 例如,可以用一句话描述图像中的前景,或者用简单的线条标记出前景区域,模型就能根据这些提示生成更准确的前景图像。

论文:https://arxiv.org/pdf/2407.21017

 

 

 

八、OpenAI 推出 GPT-4o 模型新型号:GPT-4o-2024- 08-06 同时又降价了

 

相较于之前的模型,新模型在输入和输出方面分别便宜了50%和33%。 此外,GPT-4o 支持结构化输出,确保模型输出完全符合用户提供的 JSON 架构。 通过支持结构化输出,

GPT-4o 提供了更高的控制和精度,满足了需要严格数据格式的应用场景的需求。 - 格式一致性:模型输出的数据严格按照用户提供的 JSON 架构来生成,确保每个字段都符合预期的格式和类型。 - 减少后处理工作:由于输出数据已经是结构化的,用户无需进行额外的数据清洗或格式转换,可以直接使用这些数据进行进一步的处理或存储。 - 提高可靠性:对于需要严格数据格式的应用场景,比如数据库录入、API 响应等,结构化输出可以避免因格式不一致引起的错误,保证数据的可靠性和一致性。