来自查尔斯大学、vanda剧院和布拉格表演艺术学院的研究人员目前正在研究一个有趣的研究项目,该项目将人工智能和机器人技术与戏剧相结合。他们项目的主要目标是利用人工智能创造创新的戏剧表演,预计将于2021年1月首演。
进行这项研究的研究人员之一Rudolf Rosa告诉TechXplore:“我们研究的主要想法来自创新者Tom Studen k,他注意到戏剧《RUR》即将迎来它的100周年纪念日。”“这是机器人技术的关键时刻,因为卡雷尔恰佩克和他的兄弟约瑟夫发明了机器人的概念,包括“机器人”这个词,他还写了这部剧。托马斯认为应该适当庆祝,提出了这一观点。他的想法是扭转局面:100年前,一个人写了一部关于机器人的戏剧;今天,如果机器人写一部关于人类的剧,会怎么样?”
在开始该项目之前,研究人员查阅了之前的文献,并探索了人工智能技术在诗歌、音乐、绘画或其他形式的艺术创作中的潜力。虽然有大量与机器制作艺术相关的论文,包括一些利用计算技术生成戏剧对话或故事构思的论文,但自动生成整个戏剧表演是一项非常复杂的任务,很少有人尝试过。
罗莎和她的同事们决定把她的剧本分成几个小部分。他们的计划是使用一种叫做“分层生成”的方法,这种方法需要将大量文本的生成分成更小的可管理的部分。在过去,当其他研究团队使用这种方法生成对话、脚本或其他文本时,很少有人尝试使用它来制作整个脚本。
罗莎解释说,“因为即将到来的周年纪念日,我们的主要目标是明确和固定的:到2021年1月,我们需要为首映做好准备。”「由於该剧将由专业剧团演出,我们需要在九月准备剧本,以便有足够时间进行改编、排练等工作。因此,即使我们正在开发一个生成脚本的通用工具,目前,我们只需要生成一个脚本。”
到目前为止,研究人员已经开始尝试一种名为GPT-2的预训练语言模型。这是OpenAI联盟开发的开源模型,接受了大量的在线英文文本训练。他们测试的第一个结果总结在arXiv的一篇预先发表的论文中。
GPT-2是一个生成性语言模型,这意味着经过适当的训练后,它可以使用相似的语言并覆盖相关的主题来完成未完成的文本。例如,如果为新闻的第一段提供内容,模型将尝试使用相同的文本作为灵感来源,并为新概念生成句子,从而为同一主题生成一些其他段落。
“当我们为GPT-2提供几行场景设置和戏剧脚本时,它会生成更多相同风格的线条,并专注于输入脚本块的主题,”罗莎解释道。“这样一来,我们还没有训练出什么东西,因为我们已经限制了发电机完成任务,不会扩散到其他地方。因此,我们可以使用训练有素的大型GPT-2模型长时间阅读非常大的单词,我们没有能力训练我们的硬件,因为现在只有最大的技术公司才能训练这样的模型。”
虽然研究人员使用预先训练的GPT-2模型进行的实验产生了令人满意的结果,但他们不适应该模型或在剧院剧本中对其进行专门训练的事实使其更难控制其操作和性能。现在他们计划通过在现有的剧院脚本上训练来微调GPT-2,因为对他们来说,这比开发新的语言生成模型更可行,他们应该为他们的游戏制作更高质量的脚本。
罗莎说,“我们也明确配合循环中人的概念。”“基本上,所有计算机生成的‘艺术’(如果我们想这么叫的话)都是由人类以某种方式触摸和装饰的,但通常它不是很透明。在我们的工作中,我们试图清楚地解释什么是机器的工作能力,什么是人类的工作能力,让它们的合作成为系统设计不可或缺的一部分,而不是事后被修改。”
目前,罗莎和她的同事们通过回顾以前的作品开始他们的项目,并试图确定制作戏剧剧本的最有效方法。当他们决定使用哪种方法时,他们才刚刚开始将其应用于戏剧创作。
罗莎说,“我们的项目仍处于初级阶段,但我们对采用预先训练的GPT-2模型的基本方法的效果感到惊讶。”“我们只是从剧本中获取了几行台词,然后利用这些信息生成了或多或少合理的台词,从而获得了它的体裁、结构、主题和角色名称。这是在没有任何改编或微调的情况下实现的:我们只是使用了该模型,并可以在网上下载,这表明GPT-2模型真的非常强大。”
目前,Rosa和她的同事还在尝试所谓的“纯文本生成”,即机器学习模型一次为脚本生成一行。然而,他们很快希望开始使用分层生成方法来创建他们剧本的简要摘要,将其扩展为详细摘要,并最终将其翻译为对话。理想情况下,他们计划使用的模型将生成一个连贯而有效的脚本,遵循一个共同的想法,同时创建一个背后意义明确的文本。
“我们仍然需要确保生成的脚本是连贯的,不重复或矛盾,不要过于频繁地引入新的随机字符,以及次要但有趣的事情,例如阻止角色离开场景但继续说话,”罗莎说。“我们的第一部戏应该在2021年1月首映。我们会看看它进展如何,接收情况如何,然后希望我们的观察能促进我们进一步的研发。”
在研究的这个阶段,Rosa和她的同事仍然认为参与游戏的机器人需要大量的人工监督。但是,在未来,他们希望制作一个完全可以由机器人表演的剧本,不需要任何人工表演或人工指导。