首个元宇宙建筑学论坛 | 未建成世界节选：《AI创世》

*以下为我的演讲《AI创世》部分的节选，论坛的完整内容请点击文末的“阅读原文”进行浏览哦！

| 从现在到末日 |

很荣幸跟各位老师一起分享自己的作品和研究经历。我是建筑、人工智能、生物的跨领域研究者以及创作者，现在奥地利因斯布鲁克大学（UIBK）博士在读，硕士毕业于伦敦大学学院（UCL），同时也是这两个学校的技术课程助教以及特约评图嘉宾。

今天我要分享的第一个故事是“从现在到末日”，在这个故事中我会跟人工智能一起带大家穿越到人类在不同平行时空中的末日。这边所有的图片都是我们创作内容的一部分，同时，PPT里面所有的图片和动画都是由AI生成的（特地注明的除外）。

我们现在来到第一个故事，“从现在到末日”，首先想提醒一下大家的一点是，我们现在能够坐在这里，包括能和电脑前收看直播的各位朋友一起交流，并不是理所当然的，而是一种幸运，因为生存本身就是一种幸运，这也是为什么我们人类在能观测到的所有的范围内都没有看到其他生命的存在。既然生存是一种幸运，那么毁灭就是一种必然。既然是一种必然，讨论末日就是一件很有意义的事情。我一直是有一点末日情节的，想把脑海中的末日场景具现化。但这件事情是一直是比较困难的，毕竟我们还是要把有限的精力投入到当下的事务里边去，直到这两年AI技术的进步，让我们能够在比较短的时间内，用相对较低的成本，创造出139幅终极未来图景。接下来就请大家跟我一起穿越所有的末日，直到宇宙的尽头。

“生存本来就是一种幸运，过去的地球上是如此，现在这个冷酷的宇宙中也到处如此，但不知从什么时候起，人类有了一种幻觉，认为生存成了唾手可得的东西。”

——《三体》 by 刘慈欣

随AI穿越所有末日，直至宇宙尽头。

我和AI，

把世界线变动的每一刻制成标本，挑选出其中人类幸存的那些切片，在你眼前徐徐铺展开来，

这是我能想到，最酷的事情。

首先我们会来到五十年后，在五十年内世界如果毁灭，最有可能还是因为核武器，毕竟核武器威慑平衡这个东西谁也说不好，搞不好就擦枪走火了。这里是AI生成的一个被核打击的城市，我们可以看到满目苍夷。而且没有任何的生机在里面。

50年后：

——“核平”的世界

在未来50年之内，核武器仍然是毁灭地球的最大威胁，因为在紧张而又微妙的对峙中维持着的核威慑平衡，并非总是那么可靠。

如果遭遇核打击，比较有可能的一种情况是，我们把城市转移到地下去，这是AI生成的地下城市，虽然里面没有阳光雨露，但是可以看到里面闪烁着灯光，还是很有烟火气的。

如果能够跨越50年直达一百年后，我们可能要面对极端气候的威胁，这个威胁可能来自于人类的污染也，有可能来自于地球本身运转的规律。那么我们的城市需要在里面幸存，仅仅做到碳中和是远远不够的，更好的办法是把城市融入到现有的生态循环中去，增加它的韧性。

这是AI生成的与自然融合的城市图像，可以看到这个城市本身已经跟植物花卉都融合在一起了，非常的美丽。

如果我们能跨越一百年，到了两百年后，我们可能看到被AI接管的城市。这可能不仅仅是因为我们对AI的伦理制定的失败，更有可能是因为AI超越了某个技术奇点之后，它的决策能力或者说智商可能远远超过人类，在这样的情况下，我们把重大决策的权力让渡给AI可能是一个更理智不过的选择。在AI的掌控下，可能会遵循效率最优的原则生成巨大而混沌的城市，我们可能现在没法理解这个城市，但是我们隐约可以感受到它背后的逻辑和美学。

200年后：

——只有AI、服务器和电子人

的世界

AI从弱人工智能迈入强人工智能，甚至突破超人工智能的技术奇点，可能来得比我们想象的都要快。AI接管这个世界将变得无法避免，这并非仅仅是由于人类可能在AI技术伦理制定上失败，其更可能的原因是，当AI做任何决定都比人类更“正确”的时候，将所有决策权让渡给AI，是最理性的选择。

在这种情况下的另一种可能是，届时效率最高状态是类似黑客帝国式的场景，我们可以直接把人类思维上载到服务器或者电子人里面去。这里有28个AI生成的只有AI服务器和电子人的城市。这里面有很多各种各样不同的城市，但是唯一的共同点是我们看不到传统生物学意义上的人类在里面。

28 个 AI 生成的“只有 AI、服务器和电子人的世界”

如果能到达一千年后，因为地球运转的规律，可能很多城市已经浸没到海底，这是AI生成的一个海底城市。这里我们并没有看到预想中可能会出现的，能够把城市保护起来的透明隔水罩。或许是因为，AI认为在那个时候人类已经有能力跟整个生态环境甚至是水下环境融合在一起，与海洋生物共生，我也是这么认为的。

1000年后：

——海平面上涨的世界

如果前面提到的全球变暖趋势无法被遏制，经过测算，1000年后海平面会上升超过30米，作为人类文明精华的大部分沿海城市将浸入海底；而对于一些地势较低的国家，如荷兰、孟加拉国和马尔代夫等，更将是灭顶之灾。除了移居到地势更高的地方，或许当时的人类已经有足够的技术条件在海底生存。

因为演讲时间的关系我跳过了一些节点，直接到达130万年后流浪太空的世界。因为130万年的时间尺度非常长，已经是一个地质甚至天文时间尺度。在那么长时间里面很多事情可能发生，小行星撞击也好，天体运动也好，随便什么事件都有可能把人类的文明给毁灭。所幸在这么长的时间里面，人类应该已经具备了恒星际航行的能力，我们应该能够自由地穿梭在各个不同的星际之间。所以这里创作了35个太空城市。每一个都不相同，里面有璀璨的星河，有巨大的飞船，还有敌人和战争，但是我相信我们的未来终将是星辰大海。

130万年后：

——流浪太空的世界

在如此漫长的岁月中，地球很有可能被偶然经过的巨大天体抛入深空、成为星际行星，并有 300万分之一的几率会被另一颗恒星俘获。这个旅程一旦发生，无论过程如何，都将会摧毁地球上的所有生命。如果人类此时还存在的话，毫无疑问已经成为恒星际文明。

现在，我们将直达宏观宇宙的终结。现在的科学家预测，我们宇宙终结的时间点大概是在200亿年后。关于宇宙的终结有不同的假说，包括大撕裂和大坍缩，但是不管是哪一种，大家达成的共识是届时可能没有任何的星系、天体，甚至没有任何宏观物质的存在。

200亿年后：

——宏观宇宙的终结

关于宇宙的终结，存在着不同的假说。根据“大撕裂”模型，宇宙膨胀的速度将不断加速，并在未来有限的时间内达到无限大。

那么在这种情况下，我们的城市要怎么幸存呢？存在的一种可能性是，经过漫长的时间，人类可能会拥有神一样的技术水平，我们可能能进入一些还没有毁灭的平行宇宙里面。我们在那些宇宙里面构建的城市，能够以高维概率云的形式重新映射回我们当前的宇宙里面。这是AI生成的一张高维概率云城市，我很喜欢这张图。它的感觉有点像是把城市在不同时间空间存在的可能性的侧面投影出来，然后一起平铺在了我们当前的次元里面。

如果我们能够跨越宏观宇宙的终结，未来会是怎么样呢？100万亿年，或许是我们能到达的最大时间尺度。这个时间尺度已经超越了人类现有知识体系能够预知的极限。我们不知道这时候是否还存在空间和物质，还是甚至连时间都不复存在。即便我们有能力进入到不同的平行宇宙里面，根据光锥和世界线收束理论，我们能达到的平行宇宙是有限度的，有可能在所有我们能够到达的平行宇宙里面，所有的东西都已经回归虚无。

100万亿年后：

——无法预知的世界

这个时间尺度，已经超越了人类目前已有知识体系能够预知的极限。我们不知道届时是否还残存着物质和空间，还是连时间都不复存在。根据世界线收束理论，从我们当前的时空坐标点出发所构造的光锥，能够覆盖的平行世界是有限的，因此可能连我们能够观测到的所有平行宇宙都已回归虚无。

如果我们足够幸运，在某个宇宙里面还有一点点物质残留着，那么这种物质最有可能就是最基本的粒子形态。如果真如超弦论所说，宇宙中存在十个维度，宏观世界中有三个，剩下七个蜷缩在微观粒子里面，那么可能真的就像诗中所说的一样：“一沙一世界，一花一天堂”，我们有可能能够在微观粒子中去构建我们的量子城市。

100万亿年后：

——无法预知的世界

若幸运如此，能够有少许的物质幸存，那么最可能是最基本的粒子形态。如果真如超弦论所说，宇宙中存在着十个维度，除去宏观的三个维度，剩余的7个维度都折叠在微观粒子之中。那么可以想象，届时唯一可能存在的城市形态，只能是蜷缩在微观粒子中的量子城市。

最后就请大家跟随我去穿越重重量子迷雾来到我们平时无法见到的微观世界。这里只是节选，整篇文章很长，如果大家感兴趣可以扫码收藏这个文章过后再来阅读。那么现在就是我们第一部分的结束。

“

扫码收藏后阅读余下全文

AI 生成 37 个量子城市

如果你们觉得第一部分有意思的话，我希望再用一点时间来跟大家讲一下我背后的经历，就是我如何从普通的建筑设计进行AI跨界冒险，学习用人工智能做从低维到高维的内容生成的过程。

我关于人工智能的研究最早是从2017年开始的，当时出了一个算法叫做Pix2px & cycleGAN，它是一个基于监督学习对抗神经网络的图像生成算法，简单说就是，你给它两套图，每一套图内部有相似性，互相有关联性，比如说你给它两百张包包的线稿，再给它两百张包包的图像，它就能学习如何从线稿去映射最后的设计成品。

线稿 to 效果图

Pix2pix & cycleGAN 基于监督学习对抗神经网络的图像生成

因为我不是程序员，很难去重新造轮子，但是比较幸运的是，在计算机视觉和人工智能领域，最好的轮子通常都是开源的。所以当时我做了一件事情，跟北京数字甲板公司（Dream Deck）一起去尝试做一个研究，我们直接拿草图大师建的模型，不经过渲染，用人工智能的模型直接映射成效果图。大家可以看到这个效果图跟我们想象之间还有一些差距，但是我们想了一些办法把两个图混合，可以得到比较好的效果。我们本来想上线这个产品，但是由于种种原因最后没有上线。

左直接输出效果图右 su原始截图

图像重新混合结果

但是在这个过程中我们衍生出了很多艺术创作的副产品。比如说用AI对一个线稿进行不同风格的上色，这些东西我们整理之后参加了全球AI艺术大赛获得了一些奖项。

2017-2018：

——线稿 to 效果图

基于人工智能的数据集外的建筑

速写线稿生成测试

到了19年的时候，我参加了清华大学建筑学院徐卫国老师举办的一个参数化研习班，在这个研习班里面，有一位来自南加州建筑大学的导师M.Casey Rehm，他教给我们的方法能够超越上一个算法的一些限制，可以通过分割图像再整合的方式，实现图像一对一的转换。于是我跟我们的团队就设想能不能用AI去代替某一些设计工作流，比如我们拿到一张场地图片，然后学习在这个场地图片上可能存在的城市，直接把它生成出城市设计的卫星图。这是我们生成的结果，是一个沙漠的图片，它学习的是洛杉矶，因为洛杉矶建在沙漠旁边嘛。

这张图虽然有点模糊但是放大来看它其实还是很有说服力的。它有说服力的点在于，我们可以看到所有的道路都是沿着场地等高线走，所有的植被、建筑都是均匀地分布在道路旁边。

我们接着这个工作流，继续把它转换成了一个带建筑平面的大范围的首层平面图。

然后我们截取其中一小部分，结合参数化的方法，就可以得到一个比较复杂的城市建筑的体量模型。

然后我们把建筑的体量模型的材质经过一个同样方法的训练，就能够得到一张赛博朋克风格的建筑立面图，最后贴回建筑里面去，就可以得到一个还蛮有感觉的赛博朋克的三维建筑模型。

到2020年的时候，我跟着我原来的导师开始读博。我的博士项目就是接着我的硕士项目，就是对这个多头绒袍菌（physarum）生成城市设计的研究。

基于多头绒泡菌（physarum）生物算法及对抗生成网络图片转换

模型的非人类智慧城市设计

这个多头绒袍菌是一种具有群体组织性的真核生物，它虽然是微生物，但是它根据食物输入的点生成的网络跟我们人类的一些网络，比如交通路线有很高的相似性。

然后我们就选择了一块在沙漠里的场地，它有很多可再生资源。

我们用生物3D打印的方式，把这些信息全部导入到培养基里面，通过实验就可以对它进行观测。

最后我们通过实验观测记录，得到了黏菌生成的图案，再把它重新拼合回原来的场地里面，并且通过人工智能的方法把它重新映射成道路、建筑、以及风能和太阳能发电站。

然后我继续通过人工智能方法对它进行细化设计。这套设计比较有意思的点在于，我们最大程度地去减少了人类的主观在设计中的干预，而是借助了非人类的智能，包括生物和人工智能，去完成了这个设计，以此来挑战靠传统设计工作流的可能性边界。这是设计最终达到的一个可视化的结果。

到2021年的时候，出来一个新的算法叫styleGAN2，这个算法特点在于它是一个自监督模型，你只要给它一大堆相似的图片，它就能生成高分辨率、类似但又不相同的图片。这四张人脸全部是不存在的，但是非常的真实。

我借助这个算法设计了一个我称之为“建筑立面永动机”——能够生成很多建筑立面的模型。

建筑立面生成及语义操作

基于styleGAN2的非监督学习对抗生成网络图片生成

这一个模型最有意思的点在于，它具备一定的可解释性。这里的每一张图在512维的高维空间中都有一个对应的特征向量。我通过降维的方法把这个高维空间进行了可视化。我们可以看到类似内容的图片的分布位置是相近的，而且当你移动它对应的特征向量的位置时，它的图片内容也会发生相应的改变。

在掌握这个规律之后，我们可以做到对建筑立面图片的高维特征编辑。大家可以看到随着我拖动这个滑块，这个建筑从简约现代不断地往复杂传统方向去改变。这个是不需要手工直接干预的，而且我们还可以对不同的建筑立面进行同样的语义特征操作，这在传统的设计软件里是非常难以想象的。

到了今年出现了一个新的算法叫做VQGAN，它跟前面最大的不一样在于，前面的算法是需要为每种内容单独训练一个模型的，而VQGAN一个模型就可以同时生成很多不同的图片，就是“一招打天下”。

文字 to 图像

基于VQGAN（Taming Transformers for High-Resolution Image Synthesis）的非监督无分类图像生成

但是它也带来了问题，就是我们怎么从这个模型的输出中找到我们想要的图片。这里就涉及到另外一个算法，openAI公司开发了CLIP: Connecting Text and Images，就是连接图片和文字的工具。它能够把图片和非常长的一段话进行关联，来判定两者之间有多少相似度。所以我们就可以用这个算法去指挥上一个算法。大家刚刚看到前面呈现的AI生成的城市用的都是这一套方法。

文字 to 图像

CLIP: Connecting Text and Images 基于天量图片文字对（亿级）训练具备零次学习能力的图片语义识别模型

文字 to 城市

6个AI生成的未来赛博朋克城市

当然我不会止步于用AI生成简单的二维影像，目前正在尝试用AI去生成三维建筑模型。这个是图片加上AI基于深度估计去做的三维模型的重建。当然现在还停留在比较早期的阶段，我们会想办法把它完善得更加细致。

左 AI 生成赛博朋克图像

右基于 AI 深度估计的三维重建

除了建筑物之外，AI也可以用来生成一些幻想生物。这是我非常喜欢的一个系列，关于使用AI去生成幻想神兽。

既然可以生成生物，那我就可以把前面的末日系列拓展一下。因为前面的末日系列通常只是有建筑的场景，我们可以把里面的生物、人物、交通工具都生成出来。这是一个我用关键词“在核战争中能够幸存的赛博格水母”生成的，这水母看起来就非常地厉害对吧？它自己还有个反应炉。

当然这水母还比不上这只生蚝。因为这个生蚝的反应炉，你看它光的颜色，就知道它的功率肯定比水母高。它们两个打架这个水母肯定打不过生蚝的。

我们扯回来一下吧。我最近在开发的系列叫做AI构建平行宇宙。这个是伦敦的一个地标建筑。我们可以把这个图作为条件输入到模型里面，去用AI生成这个图的一个孪生建筑。就有点像我们在不同的平行宇宙中可能会存在的伦敦城。

AI生成平行宇宙伦敦

这个是昨天刚刚完成还没有微调的平行宇宙中的故宫。

我们既然能做室外，就也能做室内。我们在太和殿也可以找到在平行宇宙中的样子。

AI 生成平行宇宙故宫—太和殿

最后我埋了一个彩蛋。最近我跟Style3D时尚数字引擎公司正在开发一个虚拟时装秀。现在这个场景就是AI生成的，跟虚拟时装秀整合在一起。我们的一个终极目的就是从场景到人物到服饰全部都是用人工智能生成。

2021：

AI X Fasion

AI生成平行宇宙时装秀与“数字时尚引擎”Style3D 合作扫描关注Style3D公众号

我的演讲就到这里了。最后我可以说一下，如果大家对这个工作流感兴趣，我有一个5分钟的上手教程，你们可以直接在网页上用文字生成图片。这个文章在我的B站账号、微信公众号都会有。我的演讲就到此结束啦，感谢大家。

展览出品人：Six

策展人：胡胡

建筑电影导演：和小雅

联合出品人：连晓刚、李思遥

学术顾问：周融荣

设计总监：向田晟、陈维祯

建筑元宇宙负责人：胡胡

策展助理：陈明

展览团队：林寰，张海若，赵英楠，金欣，李紫珂，莫唐筠，钱凌云，唐紫晔，南天，蔡斯巍、刘瞻远、刘今、于咏正、邬宛珈、殷子衡、透明包子、VIOLA、赵超颖、吴婧娴、屈胤喆、李锦、王亚川、周朔、马远哲、任晨嘉、罗思果、武素素、钟沛禧、李明熹、张子皓、刘诗楠、肖雅、李思源、周千惠、赵潇潇、肖晗、陈烁逵、陈余胤柯、赵心怡、詹洪玥梦、杨颂南、邹丽晨、贺梦蝶等

特别感谢：堺墅、远届

北京城市建筑双年展

凤凰中心

星球日报

Bosie

7Hey

继续阅读

阅读原文

关键词

建筑学

地球

平行宇宙

方法

数字

首个元宇宙建筑学论坛 | 未建成世界 节选：《AI创世》

首个元宇宙建筑学论坛 | 未建成世界节选：《AI创世》