您好, 访客   登录/注册

采用生成式对抗网络(GANs)进行产品设计

来源:用户上传      作者:

  一、引言
  人工智能模拟人类思维过程的可能性不仅包括被动任务(目标识别)、反应性任务(自动驾驶),还包括创造性任务(文字音乐创作、图像生成等)。人工智能实现创造性任务的一个重要方法是靠人工神经网络(Artificial Neural Network,简称ANN)中的深度神经网络(Deep Neural Network,简称DNN)实现的。
  生成式对抗网络(Generative Adversarial Networks,下文简称GANs)是一种深度神经网络模型,由Ian J. Goodfellow等人于2014年10月在论文“Generative Adversarial Networks”中提出。GANs包含两个模型:生成模型(Generative Model,简称G),即以随机噪声作为输入并试图生成样本数据;判别模型(Discriminative Model,简称D),即以真实数据或者生成数据为输入,并试图预测当前输入是真实数据还是生成数据。生成模型与判别模型都极力优化自己的网络,直到双方达到一个动态的平衡即纳什均衡,迫使生成数据与真实数据在统计上几乎无法区分,从而生成与真实数据无法区分的数据。截止到2018年12月,GANs已经有了500多种变体,应用非常广泛,包括图片生成、音频生成、图像转换、图像合成、通过文字生成图像、图像修复等。
  鉴于GANs可以在计算机视觉环境下通过非监督学习实现生成照片般逼真的图像样本的特点,本文认为当以大量的特定产品的已知的图像作为训练数据时,GANs及其变体DCGANs(深度卷积生成式对抗网络, Deep Convolution Generative Adversarial Networks)、WGANs(Wasserstein GANs)、BEGANs(Boundary Equilibrium GANs)、3D-GANs等可以通过对训练数据的深度学习从大批量无标记图像中学习到良好的中间特征,从而生成与训练数据中已知的产品图像具有相似特征的、清晰的、逼真的图像,从而生成新的产品设计。
  二、采用GANs进行产品设计简述
  采用GANs进行产品设计是指让GANs从某产品已知的大规模无标记图像或视频中学习到良好的中间特征,在计算机视觉环境下创造出可以表达该产品特征与形态的图像以生成新的产品设计。其中,深度卷积生成式对抗网络(Deep Convolution Generative Adversarial Networks,以下简称DCGANs)是GANs的一个重要变体,比起GANs,DCGANs在机器训练上表现得更加可控和稳定。DCGANs的生成模型和判别模型无论是在对象个体还是场景方面都可以学习到丰富的层次表达,可以实现生成符合产品设计特点的图像。本文的实例便采用了DCGANs作为深度神经网络模型用于生成新款“女士大衣”的图像,以验证基于GANs的深度神经网络可以用于产品设计与创新。
  在最早提出DCGANs的篇论文(Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks)中,作者實现了采用DCGANs以273万张已知的卧室图像作为训练数据,经过了5次迭代(迭代,指的是DCGANs针对训练数据每完成一次深度学习便可以生成指定数量的输出,这个过程称为完成一次迭代,通常情况下随着迭代次数的增加,DCGANs可以从训练数据中更好地学习到特征并生成更好的输出)生成了新的卧室图像(图1)。
  我们可以看到,由DCGANs生成的图像并不像设计师绘制的卧室设计图那样清晰,甚至生成的图像有些混乱、怪异,以至于有些图像带有额外的斑块或缺失的元素。我们采用GANs进行产品设计的意义不在于追求比设计师的设计更加精美,而在于在没有向计算机输入任何关于产品定义、设计方法、设计步骤的情况下,由深度神经网络以已知的产品图像作为训练数据并从中学习到了特征和经验,模拟了人类设计师通过浏览大量的产品图像后进行创作的过程。将GANs应用于产品设计,一方面为产品设计的生成与创新建立了一个新的途径;另一方面对由GANs生成的产品图像我们需要打破思维定势和对产品的成见,尝试思考和理解其中的含义,吸取创造性灵感,促进产品创新。
  三、采用GANs进行产品设计的实现功能和意义
  (一)采用GANs实现无设计师情况下进行产品设计
  GANs是在无监督深度学习的环境下对图像的统计潜在空间进行学习,然后从这个空间中采样,创造出与模型在训练数据中所见到的图像具有相似特征的新图像,这个过程无需对产品设计进行定义、规划、分析,也无需对训练数据进行解释、描述或标注。鉴于GANs的工作原理,在产品设计领域可以实现在无设计师、无任何产品设计经验甚至无产品定义的情况下由GANs生成产品设计。
  本文运行了一个通过DCGANs进行“女士大衣”设计的实例。本实例由DCGANs通过对7980张从互联网采集并通过批处理规范为200像素*260像素分辨率的 “女式大衣”图像经过96800秒的深度学习,完成了300次迭代,以每次迭代生成64张100像素*130像素图像的方式生成了总计19200张新的服装设计图像,实现了采用DCGANs生成产品设计的目标。我们从19200张由DCGANs生成的图像中选择了18张图像为例,展示由DCGANs生成的“女士大衣”产品设计(图2)。
  这个实例是在一台配备NVIDIA(英伟达)GTX1080 Ti显卡以Windows 10作为操作系统并连接到互联网的计算机上实现的。本实例采用NVIDIA显卡是因为使用显卡的GPU加速后,神经网络训练速度要比使用CPU时快10-20倍,训练时间从数天甚至数周减少为仅需几个小时。本实例采用了在计算机安装Anaconda(一个用于科学计算的Python发行版)的方式,并在Anaconda中配置了Python 3.3、GPU版的TensorFlow(TensorFlow是一个基于数据流编程的符号数学系统,被广泛应用于各类机器学习算法的编程实现)、SciPy、Pillow等为DCGAN建立了生产环境。本实例的训练数据来源是通过图片搜索引擎以“女式大衣”为关键词进行了1000次图像搜索,从40万个图片搜索结果中使用大数据分析技术从中优选出具有“高清晰度”、“正面角度”、“款式受欢迎”、“具有良好销量”等特征的7980张图像作为训练数据。在此需要指出的是,用于深度学习的训练数据的版权与使用权问题有很多争论,本文的观点是深度神经网络是计算机模拟人类思维对训练数据进行学习的过程,凡是人类可以看到的或是可以通过合法途径获取的数据都可以作为训练数据,该问题不作为本文讨论的重点。   本实例验证了只需要一台装有DCGANs并连接到互联网的计算机便可以在无设计师参与的情况下由DCGANs成功生成19200个“女士风衣”的图像。经过300次迭代后,由DCGANs生成的图像已经非常清晰和逼真,部分图像可以直接用作新款“女士风衣”的设计图纸,或为设计师提供了创新思路和灵感。在实际的应用中,在更多数量和更高质量的训练数据、更强大计算能力的计算机、更优化的程序和参数、更多的迭代次数等因素的作用下DCGANs可以生成更高清晰度、更符合设计需求的产品图像。
  采用GANs实现无设计师情况下进行产品设计的意义:
  1. 实现了由人工智能模拟人类思维过程执行了创造性任务。GANs作为深度神经网络模拟了人类对未知领域的学习与认知过程并尝试进行创造性地输出,无论是面对生僻、繁重的任务,还是面对复杂困难的任务,GANs都可以从海量的训练数据进行认知和学习,替代或辅助人类执行创造性任务。GANs运行的整个过程没有人类经验与情感介入,更有机会从全新的角度生成有价值的输出。GANs可以更好地从大规模的、不局限于产品传统定义的、不受思维定式约束的训练数据中学习到良好的、广泛的、深层的特征,从而生成各种特征相互作用与融合的、更符合产品本质的或是更具有创新的产品设计。例如,当我们采用DCGANs设计一把椅子的时候,无论是传统的椅子图片,还是“所有可以为人们提供坐卧休息的物体”比如树林里的树墩子、交织的藤蔓、可以骑的动物、海边的沙堆等都可以作为训练数据,由此生成的“椅子”可能有藤蔓一样的椅子腿或是沙堆城堡一样的椅子背,生成的图像充满创意而且非常有趣。采用GANs进行产品设计必将成为一个具有广阔前景的研究与应用方向,是产品设计方式的革新。
  2. 实现大规模、高效率的产品设计。当面对数万个甚至更多的设计需求时,采用GANs可以在无需设计师参与的情况下对数万个设计需求分别建立GANs模型,实现自动化高效率设计。例如,需要为一部游戏设计1000棵树木、500个人物形象、200个房屋建筑、100个地形和600件人物服装时,可以为上述设计目标分别建立用于生成树木、人物形象、房屋建筑、地形、人物服装的5个GANs,并分别通过互联网采集、素材库、视频采集、专家知识库、数据购买等多种方式获取训练数据,从而由5个GANs分别自动生成对应的产品设计图像,完成产品设计任务。
  3. 建立“专家GANs”可以“模仿”特定专家或设计师的风格和经验生成新的产品设计。GANs的输出是建立在对训练数据深度学习基础上的,因此可以通过对训练数据的约束与引导实现特定风格的输出。通过以特定专家或设计师的历史作品或其认可、推荐的经典作品为训练数据可以训练出具有专家或设计师风格、经验的“专家GANs”,以用于替代专家或设计师延续其风格生成新的产品设计。例如,将达芬奇的历史作品作为训练数据训练“达芬奇GANs”,可以创作出具有达芬奇作品风格的新作品,成为达芬奇的“仿造者”。“專家GANs”是人工智能模拟了专家或设计师的设计风格与经验,具有了模仿其进行创造的能力,可以在无需专家或设计师参与的情况下生成新的设计。值得指出的是,“专家GANs”只能根据历史数据“模仿”专家或设计师的风格,不具备创造新风格或创造新元素的能力。
  (二)采用GANs实现大规模个性化产品设计
  GANs在深度学习过程中采用的是无监督学习,这意味着不需要对训练数据进行任何的解释、描述或标注等工作就可以由GANs生成新的产品设计图像,这个特点可以用来实现大规模个性化产品设计。通过为每一个用户分别建立个性化GANs的方式并采用对应的个性化训练数据,实现面对海量用户的大规模个性化产品设计。
  通过对用户浏览行为、分享行为、搜索行为、购买行为、用户偏好、点评打分等用户行为数据分析形成一个用户特征数据集,使用大数据技术对其进行洞察与挖掘,获取用户的个性化需求与偏好,最终在大数据分析结果的驱动下建立用户的个性化训练数据。例如,某个用户近1年来频繁浏览的2000件各种款式的大衣、曾经购买过的商品清单甚至喜爱的200位影视演员等都可以作为这个用户的个性化训练数据。
  采用GANs实现大规模个性化产品设计的意义:
  1. 个性化GANs可以实现面向海量用户进行大规模个性化的产品设计,满足用户个性化需求。目前,用户购买一件商品通常是在基于工业时代标准化设计和大规模机器生产出来的产品库中选择,用户只能购买到基本符合自己需求的产品。当今人类社会进入了大数据和人工智能时代,用户的个性化需求日益增长,大规模的工业化生产已无法满足海量用户的个性化需求,另外,为海量的用户进行个性化产品设计也是人力所不能及的。个性化GANs结合大数据技术可以实现获取用户的个性化需求与偏好并进行深度学习,为每一个用户生成符合其需求与偏好的产品设计。当个性化产品设计与个性化生产或3D打印技术结合后,将有比目前多数百万倍数量的个性化产品诞生。例如,当一个用户打算购买一辆汽车时,汽车的内部空间设计款式是非常有限的。个性化GANs可以为用户生成符合其需求和偏好的汽车内部空间设计,不同用户进入同一型号的汽车所看到的设计风格可以是不同的,有的采用了未来科技风格,有的则是采用了艺术风格,还有的采用了复古风格。如今的汽车内部空间设计大量的采用了“电子屏幕”,屏幕上展现的虚拟的仪表盘、人机交互操作界面取代了传统的机械仪表盘和按钮操作台。屏幕的广泛应用为个性化设计的实现带来了便捷的展现方式,个性化设计无需生产制造出来,而通过计算机视觉设计展现在屏幕上就可以了。当汽车车身装载了柔性屏幕时同样可以展现丰富的个性化设计,用户便拥有了个性化的汽车。从日常的个性化消费品到个性化香水配方、个性化生物制药等,个性化GANs都有望成为解决用户个性化需求的重要途径。
  2. 采用个性化GANs建立个性化“数字化世界”。个性化GANs可以为每一个用户生成符合其偏好的电脑游戏、数字电影、VR(虚拟现实)场景等。虚拟数字世界的景观、建筑、人物形象、动物、城市风格、科幻场景等都可以根据每一位用户的个性化偏好生成,不同用户在数字化世界的体验都是不同的。个性化GANs在数字世界的另一个应用是为用户打造专属机器人。机器人跨越了数字化世界和现实世界,个性化GANs可以为机器人生成符合用户偏好的外貌容颜、体型、动作、步态、穿着、声音等。建立个性化数字化世界是GANs非常重要而广泛的应用方向之一。   (三)采用GANs与大数据技术结合进行精准的产品设计
  大数据分析可以成为GANs的前置模块,为GANs提供数据支持,辅助GANs进行精准的产品设计。大数据分析是指采用大数据技术对产品的流行趋势、用户需求、产品销量、互联网舆情、社交网站表现、用户评论、用户情绪等等任何对产品设计具有指导价值的数据进行洞察,并从中获取有价值的观点和创新。例如,上文中的实例即采用DCGANs进行“女士大衣”产品设计,在建立训练数据时,以“大衣”作为训练数据不如以“女式大衣”更有针对性,而以“欧洲+女式+大衣”作为训练数据就进一步限定了产品的风格,当采用更全面的大数据分析时,例如,以“销量大于每周20万件”+“用户情绪倾向于赞美”+“每天在社交网站分享量达到1万次”的“女式+欧洲+大衣”等限定下,由DCGANs生成的“女士大衣”会更精准。GANs在大数据技术的驱动下对训练数据进行约束、筛选、挖掘和创新,使得生成的产品设计更精准、更符合用户预期以及更具有商业价值。
  (四)采用GANs实现面向复杂困难领域的产品设计
  在面对诸如自动驾驶、太空探索、医疗人工智能以及生物制药等复杂困难领域进行产品设计时,传统的产品设计人员可能需要数十年的知识学习和经验积累,并根据设计目标目前的发展状况进行深入学习才能够胜任;而且在一定时间内生成的产品设计方案有限,产品的进步受到人类思维能力、学习能力、创造能力和工作效率的限制。采用GANs进行产品设计是一个全新的方式,可以以更大规模和更高效率对海量的数据与复杂的情况进行深度学习并生成大量的并具有更多可能性的输出,辅助人类进行面向复杂困难领域的产品设计。
  在自动驾驶领域,当设计人员在训练自动驾驶神经网络时,通常让车辆在实际道路上行驶,通过摄像头采集行驶中的各种场景来进行自动驾驶的机器学习。这种训练方式受到很多制约,例如,训练数据量小、训练速度慢、缺乏极端环境数据、缺乏道路突发情况数据等,因此设计自动驾驶系统成为一个复杂的问题。GANs可以为自动驾驶系统的早日问世提供支持。GANs通过对已知的街道场景、车辆型号、行人轨迹、道路环境、天气情况等数据进行深度学习,从而生成数以万计的新图像。这些圖像数据量大,不受人类思维定势限制,充满各种可能性,可以生成丰富的道路场景、极端环境甚至突发情况,弥补了传统自动驾驶训练数据的缺陷,加速了自动驾驶技术的进步。在太空探索领域,人类在进行火箭、卫星、探测器等太空产品设计时,需要对太空环境、星体地形地貌等做出充分的学习、判断和预测。GANs可以采用基于天文望远镜拍照、卫星拍照、探测器拍照等方式对太空环境进行训练数据的获取,从而由GANs通过深度学习生成丰富的太空环境与星体图像,为太空产品设计提供大量的以及具有更多可能性的数据与图像,辅助人类进行太空产品设计。人类采用人工智能驱动太空探索可以以更大规模和高更效率从未知领域获取知识和规律,加速对未知领域的了解和发现。例如,采用GANs对由探测器拍摄的火星物体与场景的图像进行深度学习,从而让GANs尝试创造出火星的地形地貌、岩石、土壤、大气环境等,甚至可以仿造出一个火星。在医疗人工智能领域,采用GANs可以生成大量的疾病病灶图像,为医疗人工智能的机器学习提供丰富的训练数据。在生物制药领域,Insilico Medicine是一家总部位于约翰霍普金斯大学新兴技术中心的美国生物技术公司。该公司将基因组学、大数据分析和深度学习结合起来,采用GANs和强化学习,以产生具有所需特性的新型分子结构并预测化合物性质或产生新的分子结构辅助药物的研发。
  三、结束语
  2017年7月8日,国务院印发了《新一代人工智能发展规划的通知》,指出人工智能的迅速发展将深刻改变人类社会生活、改变世界。与此同时,互联网的高速发展以及人类每时每刻都在产生的海量数据为人工智能的快速发展提供了良好的数字化环境和丰富的应用场景。在人工智能领域,GANs被广泛认为是具有潜力又发展迅速的深度神经网络之一,未来可以广泛应用到产品设计领域,我们所消费的大部分消费产品或文化内容,其设计或创造过程可能都有GANs参与其中。
  工业革命利用电力驱动机器运转促进了工业的发展,实现了基于标准化设计的大规模工业化生产;21世纪,人类社会进入了“万物互联”并“实时在线”的互联网时代,涌现了海量的数据,大数据技术与人工智能的飞速发展将“数据”转换为“知识”和“经验”,并实现了由人工智能执行创造性任务,推动了包括从产品研发、产品创新到解决个性化需求、建立个性化数字化世界等领域的发展,为人类社会生产方式甚至生产关系带来新一轮的革新。在人工智能的深度神经网络领域,随着人们对GANs的关注以及GANs在实际生产中的广泛应用,GANs不但会为人类社会创造出丰富的产品,而且会加速产品迭代,辅助人类面对和解决各种复杂问题。
转载注明来源:https://www.xzbu.com/8/view-14716581.htm