OpenAI 寻求合作伙伴生成用于训练 AI 模型的数据集

服务机器人 2025-05-12 09:14www.robotxin.com女性服务机器人

据IT之家报道,OpenAI近日宣布了一项新的数据合作伙伴计划,旨在与各类组织合作生成公共和私有数据集,以训练AI模型。这一合作关系的核心目标是让更广泛的组织参与引导AI的未来,并从更精准的模型中获益。

在OpenAI的官方博客中,他们明确表示:“为了让AI最终更加安全并造福全人类,我们需要AI模型能够深入理解所有主题、行业、文化和语言。而这需要尽可能广泛的训练数据集。”

作为该计划的一部分,OpenAI将着手收集那些能够“反映人类社会”的大规模数据集,这些数据集在当前并不容易在线访问。OpenAI的这项计划涵盖了图像、音频和视频等多种模式,特别关注的是那些能够跨不同语言、主题和格式“表达人类意图”的数据,比如长篇写作和对话内容。

为了保证数据的隐私和安全,OpenAI表示将与合作组织使用光学字符识别和自动语音识别工具对训练数据进行数字化处理,并在必要时删除其中的敏感或个人信息。

值得一提的是,OpenAI计划创建两种类型的数据集:一种是可以供任何人在AI模型训练中使用的公开开源数据集;另一种是专为那些希望保持数据私密性但希望OpenAI的模型能更好地理解其特定领域的私有数据集。

目前,OpenAI已经与冰岛、Miðeind ehf以及自由法律项目等组织展开了合作。比如,通过与冰岛的合作,GPT-4的冰岛语能力得到了显著提高;与自由法律项目的联手,则提高了模型对法律文件的理解能力。这样的合作模式无疑为OpenAI推动AI技术的深入发展铺平了道路。

Copyright © 2016-2025 www.robotxin.com 人工智能机器人网 版权所有 Power by