陈根:AI辩论最新进展,接近人类专家
比尔盖茨曾言:“语言理解是人工智能上的明珠”。自然语言处理(NLP)作为语言学与计算机科学的交汇点,正致力于将人类的语言转化为机器可理解的代码。这不仅是实现人机间信息交流的关键,更是人工智能、计算机科学和语言学领域共同追求的前沿领域。在这个领域里,技术的先进与否,实质突破的有无,决定着谁在人工智能的竞赛中占得先机。长久以来,科学家们梦寐以求的目标便是让计算机拥有近似于人类的语言理解和处理能力。
最近,IBM的AI研究团队在Project Debater项目上取得了重要进展。这个系统已经具备了与人类专家进行体面且有的现场辩论的能力。它的知识库包含了4亿篇新闻报道和维基百科页面,能够自行组织开场白和反驳论点。
在研究成果的展示中,研究人员设定了一种类似于学术竞争性辩论的辩论形式。当“辩论动议”主题公布后,Project Debater和人类选手都有15分钟的准备时间。双方准备完毕后,轮流进行发言。
为了评估Project Debater的表现,研究人员选择了78个动议,观察其与人类专家在各种辩题下的表现。每次演讲都有15位评审员进行评分,以判断其是否能作为支持辩题立场的优秀开场白。评估结果显示,Project Debater的表现明显优于其他系统,并且与人类专家的得分非常接近。
在进一步的评估中,研究人员使用相同的78个动议,模拟真实的听众环境,让一组人群阅读三篇辩论演讲,但不告知其演讲的来源。结果显示,在所有动议中,Project Debater的平均得分均高于中立的3分。在78个动议中,有50次的平均得分达到或超过4分。这意味着在至少64%的动议中,群众评审员认为Project Debater的表现“良好”。尽管其得分仍低于人类专家,但已显著超越了其他系统和对照组。
自然语言处理的发展道路并非一帆风顺,但作为计算机科学、人工智能和语言学交汇点的明星学科,其近年来在图像识别和自然语言生成等领域的成果令人振奋。人工智能对人类语言的理解已经展现出前所未有的可能性。我们期待着这一领域的未来带来更多惊喜和突破。