XM注册

一年过去了,AI 创作工具依然难用,但有机会(2025年01月21日)

XM

从2023年底的AI热潮至今 ,在很多领域,无论是创投圈还是产品圈,都是遍地开花 ,有大量的产品现象出现 。我自己在关注的有几个:

AI硬件 ,尤其2025年即将到来的百镜大战。手头有Meta和雷鸟V3,晚些多体验下,再分享。

AI Coding ,从OpenAI到GitHub,从Cursor到Devin,都在飞速狂奔 。

AI创作 ,怎么降低普通人创作的门槛,无论是图文 、音频还是视频 。

AI硬件是作为消费者的好奇心驱动的领域。AI Coding和AI创作则是亲身入局感受的,还是纳瓦尔说的两个普通人最重要的杠杆:代码和内容。门槛的降低会重新改变业态 。

说到AI创作 ,门槛的降低带来的生态变化,我们感受过一波了:智能手机和移动互联网的普及,把主流媒体拉下了神坛。人人都可以是创作者。那更进一步的内容门槛降低 ,会不会再重置生态呢?

有关AI内容创作的工具,今年也体验过很多,有相似的感受 。其中百度的“自由画布”最有代表性 ,就以此为例讲讲目前大家都在做的事情、都有的通病 ,以及都面临的挑战。

“自由画布 ”看官方的说法是这样的:

读完之后,也许还是一脸懵逼,似乎什么都想做 ,但似乎也不知道到底要做什么。一块白板,塞进去各种多模态的AI功能,这不是一种偷懒的做法吗?

抱着“实事求是”的态度 ,还是体验了一下具体的功能 。

打开页面,的确就是一张干干净净的画布,周围有一些功能图标。

看起来的确挺“自由”的 ,那么这个工具到底可以做什么呢?

泾渭分明出现了几个区域:

在素材工作区,可以把素材都丢进去。比如,我的“人工智能风云录 ”的书稿:

可以看到右边和下边出现了新的操作区内容有变化 。既能跟这个长文做对话、做总结 ,也能根据这篇长文进行写作,甚至做出PPT。

比如这样是总结的效果:

总结当然是AI文档/创作最常见的功能了。让我眼前一亮的是制作PPT的功能 。

根据长文给出指令,会生成一份提纲:

接下来 ,可以对提纲中不满意的地方进行修整 ,再进行下一步生成 。能提高容错率:

这个效果坦白说,还是非常惊艳的。

相关的功能就不一一枚举了,关于产品的测评大家也可以找更多资料参考 ,或者自己体会。我这边做一个整体的梳理,可以理解“自由画布 ”是这样的:

画布的核心单位都是一个个的卡片,卡片的来源是各种素材生成而来 ,或者是AI生成的,或者是我们投喂的,或者是在处理卡片的时候继续出现的 。

而卡片的处理过程 ,有了AI协助,能够进一步优化迭代。比如可以借助卡片A的风格,根据卡片B的内容 ,生成卡片C。

比如这是用一个相声风格的文本卡片,按照我的书稿的内容,生成的一段相声文本:

个人的体感 ,还是很有意思的 ,有点超出预期 。再适当调整的话,是能到可用的程度的。

那么问题就来了,这么多看似花里胡哨的功能 ,好像有的确实有用,可是都堆在一块,真的有意义吗?或者换句话说 ,这种自由画布真的不是缝合怪吗?

各位知道我有一档播客“半拿铁”,前几天刚刚拿到一些各平台年度的奖牌。在我跟超哥/乐克的茶品牌“三五杯”关门之后,已经成了我最重要的饭碗 。

半拿铁我们都是要写动辄几万字的逐字稿的 ,要搜集的资料也相当繁杂。以第133期讲中外BBS简史的那一期为例,我搜集了至少以下这些材料:

对于我来说,自由画布解决了一大痛点 ,就是串联相关的信息,并且做出整合和梳理。

从任务处理的流程来说,最重要的区别就是:单线程变成同个界面的并行线程 。你可以在视频解析的继续去搜集更多材料;也可以在让AI帮你做时间线梳理的继续手打自己的文稿。

就像一个手艺人的工作台一样 ,对我来说 ,要用的材料都以卡片的形式摆在一块了。

这一堆资料能变成我的临时素材库,在做这一期播客文稿的过程中,我可以用搜索 、问答的办法去定向获取信息 。

更关键的地方就在于“自由画布 ”的自由度够大 ,“缝合”了很多功能,因此我可以直接把一个全英文的视频丢上来,让它帮我理解 。而不是再去别的地方折腾 ,折腾完再复制粘贴过来。

像这个就是全英文且没有字幕的纪录片《BBS The Documentary》的一个part。如果我耐心把全部视频都看完,效率会极低;在画布里大致得到核心信息,可以进一步摘取其中的部分 ,又形成一个“卡片” 。对这个“卡片 ”就能进一步处理操作了。

而视频解析过后,也可以有一份完整的带有时间节点的预览文本:

说到这里,我是能体会到“自由画布”的独特价值的。至少对于我写稿子来讲 ,工作台的形式特别棒,能辅助的工作也挺多,往大了说 ,是有给创作者的OS的感觉的 。哪怕PPT 、帮助写作这些功能不怎么用 ,对我而言也足够了。

但是,作为AI创作工具,“自由画布”也依然面临重要的挑战。这个挑战也是我观察到的AI工具都会面临的 。

刚才在讲我自己使用体验的时候 ,各位不知道有没有想到一个关键问题:半拿铁逐字稿这样的场景,到底适合多少人?

“自由画布 ”对我来说,自然是能帮到不少忙。可是有定期一两周就写几万字稿件、需要搜集大量信息资料的朋友 ,到底有多少?这会是一个问题。

“自由画布”提供的是工作台,提供的是车间,而可能对于多数内容创作的朋友来说 ,需要的其实是单一功能的工具,比如顺手的钢笔(编辑器)、好用的颜料盘(素材库) 。

能想到的直接可以上手的朋友,可能会是:

多年经验的内容创作者 、自媒体人

有复杂材料整理需求的学生 ,可能主要是研究生

文书和PPT工作比较多的打工人,比如大厂要经常写周报的朋友

这将会是AI创作工具普遍面临的挑战:使用门槛高,导致暂时只会有少部分人能接受。而真正的普及 ,需要迈过一个early adopters的坎儿(图里是chasm ,鸿沟)。

过去大多数人的内容处理工作,就是打开一个word页面做处理,其它的输入都是在浏览器里 ,搜索框和现成的材料是起点,更多时候工作流是线性的 。

而如果在一个空白画布上开展工作,接下来可以做的事情有海量的选项 ,既可以搜索网页,也可以输入问题,还可以跟AI问答 。这种多任务的工作流对于创作者本身的任务判断就有挺高的要求。

从战略角度而言 ,“自由画布”是背靠百度文库和百度网盘的,文库里大量的文档数据,在国内少有 ,有其独特性。网盘里的个人资料,在能确保隐私没问题的情况下,也是独特的个人数据资源 。这也能让“自由画布 ”有单纯功能之外的壁垒。

“自由画布”和各种AI创作工具要怎么跨越鸿沟 ,怎么找到比现在的交互更体贴的方式 ,比现在的用户画像更破圈的人群,就需要拭目以待了。

对于AI创作的未来,我依然是充满乐观的 。就像十几年前 ,连在电脑上怎么使用回收站、怎么设置快捷方式都是少数人才懂的技巧,今天大多数年轻人,已经都是智能手机的原住民。

最后再用一下之前画过的这张图。AI还是会在各个场景下带来新的界面(Interface) ,就看鸿沟之后,是谁能留下来了 。

“自由画布”也提供了一种可能,就是前文说到“操作台 ”的可能性。现在的AI工具逐步都在做AI in all ,在过去,大家都戏称这是百宝箱或者全家桶,是因为过去的产品主要还是靠十六宫格和八大金刚这样的设计来聚合 ,而AI提供了新的可能性,在一个工作流里,适时出现、适时隐藏。等到有了新的Interface ,也许经过迭代的 、更加清爽的、交互更优异的画布 ,也是未来的形态呢?