AI提示优化:设计与可用性| Toptal®-欧博体育app下载

生成式人工智能(AI)看起来就像一个神奇的精灵. 因此，人们用自然语言来描述他们的“愿望”也就不足为奇了, 使用文本提示. 毕竟, 有什么用户界面能比简单地告诉软件你想要什么更灵活和强大呢?

事实证明，所谓的“自然语言”仍然会导致严重的后果可用性问题. 著名的用户体验研究员，尼尔森诺曼集团的联合创始人雅各布·尼尔森称其为发音障碍:对于许多用户, 以书面形式描述他们的意图——足够清晰和具体，以产生有用的结果生成的人工智能太难了. 尼尔森写道:“很可能有一半的人做不到。.

在这次圆桌讨论中，有四个 Toptal设计师解释为什么文本提示如此棘手，并分享他们解决生成式AI的解决方案 “空白页”问题. 这些专家站在利用最新技术改进设计的最前沿. 他们一起为讨论人工智能提示的未来带来了一系列设计专业知识. 一 kotorovic领导了Booking等客户的设计项目.com和澳大利亚政府，并且是General Assembly的首席用户体验讲师. 达尔文阿尔瓦雷斯目前领导Mercado Libre的用户体验项目, 拉丁美洲领先的电子商务平台之一. 达雷尔·埃斯塔布鲁克有超过25年的经验数码产品设计适用于IBM、CSX公司和CarMax等企业客户. 爱德华•摩尔•拥有超过二十年的用户体验设计经验，为谷歌设计获奖项目, 索尼, 和艺电.

为了清晰和篇幅的考虑，这段对话经过了编辑.

首先，你认为生成式AI的文本提示最大的弱点是什么?

一 可是ć: 目前，这是一条单行道. 作为提示符创建者, 你几乎被期望创造一个完美的提示概念来实现你想要的结果. 这不是创造力尤其是在数字时代. 微软Word相对于打字机的巨大好处是，你可以很容易地在Word中编辑你的作品. 就像打乒乓球一样，来来回回. 你尝试一些东西，然后你从你的客户或同事那里得到一些反馈，然后你再次转向. 在这方面，目前的人工智能工具仍然很原始.

达尔文 阿尔瓦雷斯: 文本提示不灵活. 在大多数情况下, 我得知道我到底想要什么, 这不是一个渐进的过程，我可以迭代和扩展我喜欢的想法. 我必须沿着线性方向走. 但当我使用生成式AI时，我通常对自己想要什么只有一个模糊的概念.

爱德华。 摩尔: 语言提示的伟大之处在于，说话和打字是我们许多人的自然表达方式. 但有一件事让它非常具有挑战性，那就是偏见你在写作中包含的内容可能会扭曲结果. 例如, 如果你问ChatGPT，辅助机器人是否能有效治疗成人痴呆症, 仅仅因为你在提示中使用了“有效”这个词，它就会生成假设答案是“是”的答案. 基于你如何使用语言的细微差异，你可能会得到截然不同或潜在不真实的输出. 有效使用生成AI的要求非常高.

达雷尔·埃斯塔布鲁克: 就像达米尔和达尔文所说的那样，文本提示并不完全是来回的. 视觉创意也很难用语言表达出来. 他们说一张图片胜过千言万语是有原因的. 你几乎需要这么多单词才能从生成AI工具中获得有趣的内容!

摩尔: 目前，这项技术是由数据科学家和工程师高度推动的. 粗糙的边缘需要锉平, 最好的方法就是让技术民主化，让用户体验设计师参与到对话中来. 马克·吐温曾说过:“历史不会重演，但它确实押韵。.“我认为这很合适，因为突然之间, 这就好像我们回到了命令行时代.

你认为在未来五年内，普通大众还会使用文本提示作为与生成式人工智能交互的主要方式吗?

摩尔: 的接口提示人工智能将变得更加可视化, 就像网站构建工具在原始HTML之上添加GUI层一样. 但我认为文本提示将一直存在. 如果您愿意，您总是可以手动编写HTML，但大多数人没有时间. 变得更加可视化是界面可能发展的一种方式.

埃斯塔布鲁克: 这件事有不同的发展方向. 文本输入受到限制. 一种可能是结合肢体语言，它在传达我们的意图方面起着很大的作用. 摄像头和人工智能识别将我们的肢体语言作为提示的一部分，这不是很有趣吗? 这种类型的技术在各种人工智能驱动的应用程序中也很有帮助. 例如，它可以用于医疗应用程序来评估患者的行为或精神状态.

人工智能文本提示可以产生不可预测的输出. 提示界面可能会变得更加可视化，输入可能会扩展到文本之外.

关于文本提示还有哪些可用性限制, 解决这些问题的具体策略是什么?

可是ć: 当前这一代人工智能工具是一个黑盒子. 机器等待用户输入, 一旦它产生了输出, 几乎没有任何调整可以做. 如果你想要一点不同的东西，你就得从头再来. 需要发生的是，这些神奇的算法需要被打开. 我们需要杠杆来精细地控制输出的每个风格方面，这样我们就可以迭代到完美，而不是被要求先施展完美的咒语.

阿尔瓦雷斯: 作为一个母语是西班牙语的人, 我看到了这些工具是如何针对英语进行优化的, 我认为这有可能破坏非英语母语者之间的信任. 最终, 当用户可以使用他们熟悉的语言时，他们将更有可能信任和参与人工智能工具. 大规模生产多语言人工智能可能需要对人工智能模型进行广泛的培训和测试, 让他们的反应适应文化的细微差别.

信任的另一个障碍是，我们不可能知道人工智能是如何创造其输出的. 它是在什么原始材料上训练的? 为什么它要以这种方式组织或组合输出? 我的提示对结果有什么影响? 用户需要知道这些东西来确定结果是否可靠.

人工智能工具应提供有关用于生成响应的来源的信息, 包括相关文件或网站的链接或引用. 这将有助于用户独立验证信息. 即使给它的回答分配一些置信度分数，也会告诉用户该工具对其答案的确定程度. 如果置信度得分较低，用户可以将该回答作为进一步研究的起点.

埃斯塔布鲁克: 我在图像生成方面有一些糟糕的结果. 例如, 我复制了我在网上找到的图像示例的确切提示, 结果截然不同. 为了克服这一点，提示需要更加依赖于一个来回的过程. 作为一名创意总监，我们与其他设计师在一个团队中工作，我们总是来回奔波. 他们生产了一些东西，然后我们评价它:“这很好. 加强,. 删除此.“你需要在形象层面上做到这一点.

A UI的策略可能是让这个工具解释它的一些选择. 也许让它说，“我把这个斑点放在这里，以为这就是你说的提示的意思.我可以说，“哦，那东西。? 不，我是说另一件事.“现在我已经能够描述得更详细了，因为AI和我有一个共同的参考框架. 而现在，你只是随机抛出一些想法，希望能找到一些东西.

设计如何帮助提高生成式AI对文本提示的响应的准确性?

阿尔瓦雷斯: 如果提示的限制之一是用户并不总是知道他们想要什么, 我们可以用一个启发式方法识别而不是回忆. We don’t 有 to force users to define or remember exactly what they want; we can give them ideas and clues that can help them get to a specific point.

我们还可以区分和定制交互设计对于一个 is 与不太懂技术的新手用户相比，他们更清楚自己想要什么. 这可能是一种更直接的方法.

埃斯塔布鲁克: 另一个想法是“扭转权威”.“不要让AI在你的应用中显得如此权威. 它提供建议和可能性, 但这并不能减轻这样一个事实，即其中一个选择可能大错特错.

摩尔: 我同意达雷尔的观点. 如果公司试图将人工智能呈现为权威的东西, 我们必须记住, 在这种互动中，谁是真正的代理人? 是人类. 我们有决策权力. 我们决定如何以及何时将事情向前推进.

我梦想的可用性改进是，“嘿，我能在输出旁边有一个按钮来立即标记吗? 幻觉?” 人工智能图像生成器解决了手的问题所以我认为幻觉的问题将会得到解决. 但是我们正处于中间阶段，没有接口可以让你说, “嘿, 这是不准确的.”

我们必须把人工智能看作一个助手，我们可以随着时间的推移进行训练, 就像对待真正的助理一样.

哪些可替代的UI功能可以补充或取代文本提示?

阿尔瓦雷斯: 而不是强迫用户编写或给出指令, 他们可以回答一项调查, form, 或者多步问卷. 当你面对一个空白文本字段，不知道如何编写AI提示时，这将会有所帮助.

摩尔: 是的，有些功能可以提供潜在的选择，而不是让用户思考它们. 我是说，这就是人工智能应该做的，对吧? 它应该会减少认知负荷. 所以工具应该做到这一点，而不是要求 更多的 认知负荷.

可是ć: 创造力是一种多人游戏，但目前的生成AI工具是单人游戏. 只是你在写提示符. 团队无法直接在AI工具中协作创建解决方案. 我们需要让AI和其他队友叉的想法在不丢掉工作的情况下探索其他可能性. 我们需要 Git-使这个创造性的过程具体化.

几年前，我曾与一位客户探讨过这样的解决方案. 我们提出了“Ideaverse”的概念.“当你调整左侧栏的创意参数时, 您将看到输出更新，以更好地匹配您所需要的内容. 你也可以放大一个创意方向，缩小看到更广泛的创意选择.

特斯拉汽车公司Ideaverse的截图显示了如何实时调整产品，作为协作提示优化的一个既定例子. — 设计师一 kotorovic为一位前客户创造了一款Ideaverse，用户在其中引导AI实时调整输出. 一可是ć)

《欧博体育app下载》允许使用这种特异性提示权重, 但这是一个缓慢的过程:您必须手动创建权重选择并生成输出, 然后调整并再次生成, 调整并重新生成. 每次都感觉像是重新开始创作过程, 而不是一些你可以快速调整的东西，因为你缩小了你的创作方向.

在我委托人的Ideaverse中, 我们还包含了一个类似github的版本控制功能，在那里你可以看到一个“提交历史”，这与github的版本控制功能没有什么不同 Figma的版本历史，它还允许您查看文件随时间的变化情况，以及谁进行了哪些更改.

改善提示体验, 人工智能可以通过调查用户来引导他们的查询, 允许版本控制, 或者提供多用户协作功能.

让我们来谈谈具体的用例. 对于文本生成任务(如创建文档)，您将如何改进AI提示写作体验?

阿尔瓦雷斯: 如果人工智能可以像Gmail一样被预测, 当我看到我要写的文章的预测时，我就会使用它，因为我可以看到适合我的结果. 但是一个由AI填充的空白文档模板——我不会使用它，因为我不知道会发生什么. 所以，如果人工智能足够聪明，能够实时理解我在写什么，并为我提供一个可以立即看到和使用的选项, 这是有益的.

埃斯塔布鲁克: 我几乎希望看到它以类似于文档中跟踪的更改和注释的方式显示. 如果能在我写的时候看到AI的评论，也许就在页边空白处，那就太好了. 它剥夺了这种权威，好像人工智能生成的材料将是最终的文本. 它只是暗示, “Here are some suggestions”; this could be useful if you’re trying to craft something, 而不是死记硬背.

或者有可选择的文本部分，你可以说, “给我一些替代内容.“如果我想更多地了解我正在写的这个或那个主题，也许它会给我提供研究.

摩尔: 如果你能说的话就太好了, “嘿, 我要在这一段画重点, 现在我想让你从另一个角色的角度来写.或者“我需要你用一种适用于不同年龄的人的方式来重新表述。, 教育水平, 背景,诸如此类的事情. 只要有这种细微差别，就能大大提高可用性.

如果我们生成一切，结果就失去了真实性. 人们渴望那种人情味. 让我们加速前90%的任务, 但我们都知道，最后的10%需要90%的努力. 这就是我们可以添加一些独特的东西的地方. 人们喜欢这样:他们喜欢文字写作，他们喜欢写作.

我们想要把这些完全交给人工智能吗? 同样，这取决于意图和背景. 如果你是为了娱乐或讲故事而写作，你可能需要更多的创造性控制. 但如果你就像, “我想为接下来的三个月创建一个社交媒体帖子的积压, 而我没有时间去做,那么人工智能是一个不错的选择.

如何改进生成图像、图形和插图的文本提示?

埃斯塔布鲁克: 我想给它提供视觉材料，而不仅仅是文字. 给它展示一堆品牌风格和其他灵感图像的例子. 我们已经用颜色这样做了:上传一张照片并获得调色板. 再次强调，你必须能够来回切换才能得到你想要的. 这就像是在说:“去给我做个三明治。.”“好的，哪一种?“烤牛肉，你知道我喜欢什么。.“诸如此类的事情.

阿尔瓦雷斯: 我最近参与了一个游戏代理的项目，使用AI生成器制作3D物体. 我们面临的挑战是为游戏创造纹理，因为每次从头开始并不划算. 所以该机构创建了一个积压，一个与所有游戏资产相关的信息库. 它会使用这个积压的纹理, 现有模型——代替文本提示为新模型或角色生成一致的结果.

可是ć: 我们做了一个叫做AI 设计 Generator的实验, 它允许在GUI中使用滑块实时调整视觉方向.

AI设计生成器提示图像调整，并显示最佳AI图像提示如何允许实时调整. — 为客户开发的实验性AI 设计 Generator可以使用滑动条调整生成的图像. 一可是ć)

这允许你混合不同的创意方向，并让AI在这两个方向之间创造几个中间状态. 再一次。, 这在当前的人工智能文本提示工具中是可能的, 但这是一个缓慢而平凡的手工过程. 你需要能够通读《欧博体育app下载》的文档并在线学习教程, 哪一点对大多数人来说比较困难. 如果人工智能自己开始提出想法, 它将开辟新的创造可能性，并使这一进程民主化.

摩尔: 我认为这方面的未来——如果现在还不存在的话——是能够选择输入机器的内容. 所以你可以明确地说，“这些是我喜欢的东西. 这就是我想做的事.就像你和助理、初级美术师或平面设计师一起工作一样. Maybe some sliders are involved; then it generates the output, 你可以标记零件, 说, “OK, 我喜欢这些东西. 重新生成它.”

一个更好的视频生成AI界面是什么样子的, 你必须控制随时间变化的图像?

摩尔: 再一次。, 我认为这在很大程度上归结为能够标记事物——“我喜欢这个, 我不喜欢这样”，并且能够在视频时间轴中保留这些偏好. 例如, 你可以点击你喜欢的镜头上方的锁定图标，这样它们就不会在随后的迭代中重新生成. 我想那会很有帮助.

埃斯塔布鲁克: 现在，它就像一个软管:你把它开到最大，它的末端就会到处流. 我使用跑道拍摄一个小行星带的场景，当其中一颗小行星经过相机前时，太阳从后面出现. 我试着在一个文本提示中描述它，并得到了这些非常奇怪的斑点在空间中移动. 所以锁定机制必须有一定程度的复杂性，与AI一样先进，才能实现你想要的东西. 比如，“不，把小行星留在这里. 现在把太阳向右移一点.”

阿尔瓦雷斯: 仅仅因为工具可以生成最终结果并不意味着我们有直接从想法跳到最终结果. AI应该考虑中间的一些步骤, 像故事板, 帮助我做出决定，逐步完善我的想法，这样我就不会对我不想要的结果感到惊讶. 我认为对于视频来说，考虑到中间步骤是关键.

人工智能文本提示可以使用文字处理功能. 用户可以使用图像来引导视觉任务，并能够锁定视频任务的资产.

展望未来，哪些新兴技术可以改善人工智能提示用户体验?

摩尔: 我在虚拟现实和增强现实领域做了很多工作, and those realms deal much 更多的 with using human bodies as input mechanisms; for instance, 它们有眼睛传感器，所以你可以用你的眼球作为输入机制. 我还认为，使用摄影测量或深度传感来捕捉环境中人们的数据，将以一种令人兴奋的方式来引导人工智能界面. 一个例子是“AI引脚”设备从一个名为人道的. 就像他们会点击的小通讯器 《星际迷航:下一代, 只不过它是一个有摄像头的人工智能助手, 传感器, 麦克风可以将图像投射到附近的表面，比如你的手.

我也做了很多关于易用性的工作, 我们经常谈论人工智能将如何扩大人类的代理. 想象一下，如果你有运动问题，不能使用你的手. 因为你不能使用键盘或鼠标，所以你与整个数字体验领域隔绝了. 语音识别技术的进步使人们能够将自己的提示语输入Midjourney等人工智能艺术生成器，从而创造出图像. 暂且不谈AI美术生成器的功能和训练方式, 它们仍然提供了一种新的数字交互，这是以前有可访问性需求的用户无法获得的.

一旦眼动追踪技术出现在PlayStation VR2等高端VR头显中，对于那些易访问性受限的用户来说，更多形式的人工智能交互将成为可能, Meta Quest Pro, Apple Vision pro也变得越来越普遍. 这将从本质上让用户通过检测他们的眼睛在看哪里来触发交互.

因此，这些类型的输入机制，由摄像头和传感器支持，都将出现. 这将是令人兴奋的.

关于总博客的进一步阅读:

了解基本知识

什么是AI提示?
人工智能提示指的是给语言模型的输入或指令，以生成所需的响应. 提示可以是一个句子、短语或一组特定的指令. 为了优化未来的人工智能迭代，提示还应该包括图像和协作功能.
人工智能中的提示技术是什么?
人工智能提示技术是用户通过特定输入(通常基于文本)引导人工智能模型生成电子邮件等内容的一种方式, 图片, 和视频. 提示对于人工智能语言生成和问题解决等各种应用至关重要. 虽然精心设计的提示通常需要特殊的知识才能正确书写, 它们让用户能够通过人工智能实现他们想要的结果.
如何优化提示?
为了优化提示，要清晰、简短、具体. AI会根据你提供的参数生成内容, 但许多用户都难以准确表达自己想要什么. 提供输出反馈以生成另一个迭代可以使AI更有效.

作者简介

Micah是一名数字设计师，曾与谷歌、德勤和欧特克等客户合作. 他也是Toptal设计博客的主编. 他的设计专长在 快速公司、TNW等著名出版物.

作者都是各自领域经过审查的专家，并撰写他们有经验的主题. 我们所有的内容都经过同行评审，并由同一领域的Toptal专家验证.

专业知识

AI UI 手机应用程序

以前的角色

数字设计师

工作经验

以前在

雇佣弥迦书

弥迦书鲍尔斯

专业知识

以前的角色

工作经验

以前在

有特色的专家

首先，你认为生成式AI的文本提示最大的弱点是什么?

你认为在未来五年内，普通大众还会使用文本提示作为与生成式人工智能交互的主要方式吗?

关于文本提示还有哪些可用性限制, 解决这些问题的具体策略是什么?

设计如何帮助提高生成式AI对文本提示的响应的准确性?

哪些可替代的UI功能可以补充或取代文本提示?

让我们来谈谈具体的用例. 对于文本生成任务(如创建文档)，您将如何改进AI提示写作体验?

如何改进生成图像、图形和插图的文本提示?

一个更好的视频生成AI界面是什么样子的, 你必须控制随时间变化的图像?

展望未来，哪些新兴技术可以改善人工智能提示用户体验?

关于总博客的进一步阅读:

了解基本知识

什么是AI提示?

人工智能中的提示技术是什么?

如何优化提示?

标签

作者简介

专业知识

以前的角色

工作经验

以前在

如何避免用户研究中的5种认知偏差

Toptal设计师

By 弥迦书鲍尔斯

专业知识

以前的角色

工作经验

以前在

有特色的专家

首先，你认为生成式AI的文本提示最大的弱点是什么?

你认为在未来五年内，普通大众还会使用文本提示作为与生成式人工智能交互的主要方式吗?

关于文本提示还有哪些可用性限制, 解决这些问题的具体策略是什么?

设计如何帮助提高生成式AI对文本提示的响应的准确性?

哪些可替代的UI功能可以补充或取代文本提示?

让我们来谈谈具体的用例. 对于文本生成任务(如创建文档)，您将如何改进AI提示写作体验?

如何改进生成图像、图形和插图的文本提示?

一个更好的视频生成AI界面是什么样子的, 你必须控制随时间变化的图像?

展望未来，哪些新兴技术可以改善人工智能提示用户体验?

关于总博客的进一步阅读:

了解基本知识

什么是AI提示?

人工智能中的提示技术是什么?

如何优化提示?

标签

作者简介

专业知识

以前的角色

工作经验

以前在

Toptal设计师

弥迦书鲍尔斯