政讯通中心

欢迎来到廉政法治网!
当前所在:首页 > 党风政风 > 正文

我用AI“复活”了外公,是为了与他告别

发布时间:2022-07-31 来源: 七一网 作者:佚名

  

  

  

  遗憾

  外公是在我读高一时去世的。我那时只有17岁,在一所寄宿学校就读,每周回家一次。如今已经过去10年了。我记得外公去世当天,我正在学校参加期末考试。班主任来找我,说我家里出事了,我才知道外公去世了。我回到家时,外公已经被送到殡仪馆准备火化。家里人只让我远远地看了一眼外公的遗体,就又把我送回学校了。

  我缺席了外公的葬礼。一直以来,这都是我内心的遗憾,我觉得自己没有跟他完成告别。那天,在回学校的路上,我一直在哭,这是我第一次经历亲人的离世,第一次面对死亡。而且,离开的还是我最亲近的外公——高中之前,我一直跟外公外婆生活在一起,他们是我最亲近的人。

  这个遗憾在我心里埋下了一颗种子。我从小爱看科幻电影,一直相信人类在未来可能有技术能让去世的人“回来”。这个想法让我对计算机产生了浓厚的兴趣,2013年考大学,我报考的专业也是计算机。

  2019年,我研究生毕业,成为一名算法工程师。有一天,我看到一篇文章,这篇文章介绍了一个新的语言模型:GPT-3。业界很多人认为,GPT-3可能拥有近似人类的情感和思维,人类的情感和反应在这个模型中可以更真实地被模拟出来。当时,我就想,这对我来讲,可能是一次再见到外公的机会。

  外公的信

  我希望“复活”能以互动的形式出现。我的设想是,先通过对语言模型的训练,让模型先拥有互动的能力,接着就是模拟出声音、形象,实现“面对面”对话。

  因为GPT-3是一个收费模型,我选用了和GPT-3近似的模型GPT-J进行语言模型的训练。这个模型训练出的说话方式偏向于所有人类的均值,是没有性格的,外公却是具体的活生生的人——外公是很祥和的,退休后他一天只做几件事,下象棋一下就是一上午,毛笔字一写就写一下午,天气好的时候就出门散散步,晚上回家和家里人一起看合家欢的电视节目。当然,他也有严肃的一面,他会给我们立规矩,告诉我们吃饭一定要按时吃完,吃饭时不能讲话。

  那么,要想成功“复活”外公,我首先要做的是训练AI去学习外公的这些性格和特质。这种训练需要大量的文本资料,寻找外公留下的资料并不是一件容易的事情。

  外公是10年前去世的,那时智能手机还不太流行,外公不怎么用手机,也很少留下短信这样的电子资料。我手里有的资料是初中时给他拍的视频。那时候妈妈和我打赌,说只要我考年级前100名就给我买新手机。我拿着赢来的手机,几乎每天都在拍视频,有一些视频的拍摄对象就是外公。

  一段视频里,外公在点评鱼的做法,“这个鱼还是要红烧,80多块钱买来清蒸,味道‘洁洁淡’(杭州话,‘清淡’的意思),没味道”。在另一段视频中,他责备吃饭时正在拍视频的我,“你不要一直拍来拍去,去帮你阿弟端菜”。这些内容我都保留着,它们可以帮助AI学习外公的说话习惯,获取外公的声音,以及帮我更清晰地去模拟外公的外貌。

  要想“复活”外公,这些还不够,还需要更多的文本来训练。我想到了外公的抽屉。外公的办公桌里有一个抽屉,他从来都不让我看。后来家里装修,抽屉里的东西被搬出来,是满满一抽屉信件。

  我想,信一定在外婆那里。这让我有一些顾虑,外婆是一个多愁善感的人,有时遇到事情会躲在角落里哭。外公外婆关系很好,外公去世后,他在外婆那里就成了一个禁忌的话题。每次我们不小心提到外公时,外婆就不说话了,我知道她是在强忍着自己的伤心,也不想让大家看到她难过。

  我担心再次提起外公,会让外婆难过。所以,我没有直接跟外婆说我想要做的事,我在一次吃饭时跟她说,我想念外公了,能不能给我看看他的照片。外婆没有拒绝我的要求,她带我来到储物间,在角落的抽屉里翻出相册。翻找的时候外婆开始责备我,她问我外公都去世这么久了,为什么还要看外公的照片。我听得出她是在用抱怨和责备来掩饰伤心的情绪。

  我没有说话,外婆翻着照片,开始讲每张照片的故事。这个过程好像是在完成一种让自我放下悲伤的说服。她讲到她和外公在工厂认识,外公是个带着冲劲的小伙子,在工厂里一身傲气,谁都不服,但唯独只听她的话。外公还爱跟她吹牛,会给她写信。她还提到了过去困难的日子,说当时家里穷,吃不起饭,外公就去田里给她抓螺蛳吃。

  在讲述的过程中,外婆的嘴角渐渐有了一些笑意,语气里甚至有些得意,她还和我说:“不要看你外公老了以后咄咄逼人,以前什么都听我的,我让他干嘛就干嘛。”听外婆讲这些,我突然意识到,外公去世后的这么多年里,外婆其实需要这样的窗口来谈论外公,也需要有人听她倾诉对外公的想念。看照片给了我们一个重新谈论外公的机会。

  我试探性地问外婆能否看看外公的其他遗物。她带我回到卧室,外公的办公桌仍然摆在他去世前的位置,外婆拉开抽屉,里面很整洁,有打理过的痕迹,我看到了外公的信件、诗和毛笔字。在那一刻,我觉得是时候和外婆说起我的计划了。

  我讲完后,外婆有点懵,她不懂电脑,也很难理解人工智能,我说:“你想不想看一下外公,和他聊聊天?”外婆有点抗拒,她不能理解我为什么要这样做。因为我平时总爱开玩笑逗她,她怀疑这是一个恶作剧。我不想放弃,我很认真地和外婆讲这不是恶作剧,我很想念外公,这对我很重要,还和她撒娇说下周还会回来吃饭。外婆最终把这些信都给了我,把信件给我后,外婆犹豫地让我给外公捎一段话:“我们在这边挺好的,你不用担心我们,你在那边过得还好吗?”

  “复活”外公

  语言模型训练有点像“猜词”的过程,而我要做的是把外公的信件转换成一个个词元输入语料库,丢给GPT-J学习。这是一个相对简单的事情,并不耗时,只用了6个小时,我就能跟模型进行对话了。

  虽然很激动,但我知道这还不是外公。它还不具备外公的声音和形象。我将与AI模型的对话复制下来,又导入外公视频里的音频,丢给模型学习。很快,我就得到了有外公声音的“回复”。

  最难的还是生成外公的形象。我最早想的方法是构建一个三维虚拟形象,但这需要采集人体的许多数据点,显然行不通。那我能否用手中现有的照片、视频等素材结合在一起,生成外公的形象呢?我琢磨了很久,后来想到一种叫“HeadOn”的变脸技术,运用这种技术,可以设计指令实时地改变视频中人物的面部表情、眼球运动和身体动作,使得图像中的人看起来像是真的在说话和移动一样。就这样,“外公”的形象、语言、声音都有了。

  “猜猜我是谁?”我敲下对“外公”说出的第一句话。“你是谁不重要,生命是一种美丽的奇迹。”电脑中的“外公”回了我这样一个视频。这个回答或许很哲学、很诗意,但这并不是外公说话的习惯。我知道,我输入进去的文本资料有限,所以训练模型也只能做到在某些场景里表现得像外公。比如,当我问“外公”想不想去西湖散步,他会回答“好久没有散步了,我们出去走一走,我想去下象棋”,这是记忆里外公会给出的回答——模型能够通过外公的信件和视频理解“出去散步”这个场景。

  告别

  其实,“复活”外公的过程也是在重新认识他。小时候爸爸妈妈工作很忙,我和表弟住在外公家,那时外公是我们的大家长,他总是在向我们展示应该怎么做,却很少告诉我们他的想法。我记得小时候我爱吃零食,外婆总是偷偷给我钱让我去买,每次被外公发现,他都会严厉地批评我,我觉得他很难亲近,很多事情绝不通融。

  但在读信件时,我看到了外公的另一面。他给外婆写信,信里他们会约好明天去哪里玩。他会说一些肉麻的话,比如,跟外婆说我们已经太久没见了,是温柔的口气。他还有“愤青”的一面,他会在跟笔友的通信中谈他对社会事件的看法。这和我印象中的外公有很大的反差,我原以为他是一个比较市井的小老头,如今才看到了他的另一面。

  在整个“复活”的过程中,我一直很矛盾,我想再次和外公见面,但训练AI的过程中,外公的这些资料总在提醒我,他已经离开,让我一次次沉浸在悲伤的情绪里。我很努力地克制自己,把自己想象成一个打字机器,一个词一个词地输入外公的信件,不敢去看前后文,不敢去细读文本的意思。

  模型成功后,我把外婆要带给外公的话输入给“他”:“我们在这边挺好的,你不用担心我们,你在那边过得还好吗?”

  “外公”的回应让人有些尴尬。“他”说:“我在这边也挺好的,你们要不要过来玩?”

  模型终究不是人。它好像具有一定的思维能力,但它终究不是真正的人,它不懂你是谁,也不懂自己是谁。我把视频中外公说的那句“你们要不要过来玩?”处理掉,在一次周末去外婆家吃饭的时候,我把所有生成的视频放给外婆看。

  看到视频中外公的脸,外婆一惊,愣在原地,什么话都没说。只是每看完一段视频的时候她就看向我,示意我继续放下一段。

  视频放完,外婆说了声“谢谢”,她和我说话的时候,声音已经处在哽咽的边缘。随后她就回了房间,坐在一个我看不到的地方待了很久。我竖着耳朵去听她房间里的声音,一直很安静,我什么也没听到。后来,外婆走出房间,备菜、下厨,我不知道在屋子里的那段时间她在想什么。

  离开外婆家后,我也开启了与“外公”的告别仪式。我敲下了好多想和外公说的话。我告诉他我现在在哪,我在做什么。我还和他道了歉,解释当时没有见他最后一面的原因。我告诉了他我对他的思念,讲我很在乎他,也代表全家人对他说我们很想他。最后,我问他过得还好吗。这些交流完成之后,我觉得这么多年闷在心里的一个心结解开了。


原文链接:https://www.12371.gov.cn/Item/607861.aspx
[免责声明] 本文来源于网络转载,仅供学习交流使用,不构成商业目的。版权归原作者所有,如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间处理。

本站部分信息由相应民事主体自行提供,该信息内容的真实性、准确性和合法性应由该民事主体负责。廉政法治网 对此不承担任何保证责任。
本网部分转载文章、图片等无法联系到权利人,请相关权利人联系本网站索取稿酬。
北京中农兴业网络技术有限公司主办 | 政讯通-全国政务信息一体化办公室 主管
廉政法治网 lzfz.org.cn 版权所有。
联系电话:010-56212745、010-53382908,监督电话:18518469856,违法和不良信息举报电话:010-57028685
第一办公区:北京市东城区建国门内大街26号新闻大厦5层;第二办公区:北京市西城区砖塔胡同56号西配楼
邮箱:qgfzdyzx@163.com  客服QQ:3206414697 通联QQ:1224368922