体验完腾讯最新的 AI 应用「元宝」,我发现了其他 AI 助手都没有的一个惊喜功能
AI 还处于一个萌芽期,未来三十年 AI 会有什么样的发展路径,没人能够预判。
著名科技与未来趋势评论者凯文·凯利曾这样评价如今的行业发展状况。
也正是在如今 AI 广泛走进应用的背景下,很多厂商对于 AI 的模样及功能组合都处在探索的阶段,很有「百家争鸣」之势。
在这种背景下,腾讯作为坐拥庞大的用户群体和应用生态的「往日王者」,似乎略显低调。
不过事实上,腾讯旗下的混元大模型其实早已经悄无声息地进入到我们的生活中。
例如微信读书基于混元大模型推出的 AI 问书、AI 大纲等新功能,以及腾讯会议基于混元大模型推出的 AI 小助手等等,都取得了不错的口碑。
还有很多视频、图文报道中,都能找到它的身影。
今天,腾讯正式上线了腾讯元宝 App,这款应用基于混元大模型,集成了AI 搜索、AI 总结、AI 写作等功能。
这些功能也基本是 AI 助手的标配,在国产大模型 AI 助手轮番卷性能卷价格的当下,就算是背靠腾讯庞大的生态,也要面临不小的压力。
在元宝 App 正式发布之前, APPSO 已经提前体验了几天,一句话总结,对于我这样的内容工作者来说,元宝是一个很得力的工作搭子。
至于它还有哪些实用的功能,跟其他 AI 助手有什么不同,下面我将结合真实场景的体验来给大家介绍。
不只是 AI 助手,还是微信的新入口
在互联网时代,我们的不同需求常常会对应到不同的 app 上,例如「搜索——浏览器」、「新闻——新闻客户端」,但腾讯元宝将多个功能进行了「大融合」。
例如在这个起始界面上,我们不仅可以看到 AI 助手常见的对话框,还可以看到实时新闻推送。从早间新闻到晚间专栏,不同时段推送新闻,涉及科技、民生、娱乐、国际等各个方面,不仅速度快,而且量大管饱。
▲ 元宝 App 界面在早中晚时段会为我们提供不同新闻
以亲身经历而言,作为一名内容编辑,找选题是每天非常重要的工作,不仅要找到优质的信源,还要判断信息真伪及重要程度,而元宝的这项功能就能为我减少很多工作负担。
例如今天一早我看到 OpenAI 在其官网上发布了一则消息,在通勤路上使用元宝搜索了一下,就得到了不少相关信息,美滋滋。
▲ 最早新闻出现在清晨 6 点钟,深表佩服
当前其实有很多中文能力不错的 AI 应用,都在尝试为其 AI 助手添加新闻功能。例如 perplexity 的「发现」板块,显然就是新闻模块,但内容往往较少而且主要侧重于科技行业,比较单一,时效性也较弱。
▲ perplexity 上的「发现」功能
而元宝依托腾讯新闻平台及微信公众号平台的庞大资源,再加上海量的知识储备积累,使其在内容的及时性和丰富度方面有着得天独厚的优势。
相信不少人一定和我一样,经常使用微信的「搜一搜」功能,毕竟微信公众号的文章质量相较其他平台还是公认更好一点。
这方面元宝就像个「增强版」微信,仔细看元宝的 AI 搜索的结果不难发现,其中很多信息源都是来自公众号,这恐怕是很多 AI 搜索做不到的,也是腾讯生态的优势所在。
而且未来元宝也可能像发布会上所说的那样,由公众号内容赋能的同时,为优秀文章带来更多曝光量,促进内容生态的正向循环。
说不定将来元宝会替代微信,成为公众号的新入口?
▲ 搜索的时候常常找到惊喜
不得不说,生成内容的质量对于一款 AI 应用而言实在是太重要了,但很多 AI 搜索不仅不能做到「在繁杂的信息之海中辨别真伪」,还会变身「人工智障」,倾情为你「火上浇油」。例如不久前 Google 的 AI Overview,就因为建议用户吃石头、给披萨加胶水等操作让不少人表示失望。
▲ Google AI Overview 声称奥巴马是美国的第一任穆斯林总统
为了避免出现这种问题,我通过元宝的「创建智能体」功能,一键生成了几个「老师」,以便从不同角度提供解读新闻的见解。从他们头像人物淳朴的笑容、眼镜片的厚度以及稀疏的毛发就可以看出,他们已在这一行业里浸淫多年。
▲ 通过不同智能体的「互搏」来获取更多灵感以及验证信息准确性
当然,元宝里的「创建智能体」不只能给你带来写文灵感,还能化身健身教练、超级小说家,甚至是变身各种角色,无聊的时候和他们聊聊,也能为生活增添乐趣,如果将来能在其中加入更多剧情或许会更有趣。
▲ AI 智能体「角色扮演」
此外,在日常新闻编辑工作中,我们常常还要涉及现场采访、外文编译等内容。
而且 AI 领域的技术、材料多是英语,由于新技术层出不穷,常常还会出现一些难懂的专有名词,动辄数十页甚至上百页的外文专业论文更是让人头大。
这个时候「超级翻译官」就派上了用场,文本、文件及照片都不在话下,并支持中文、英文、阿拉伯语、日语、韩语、西班牙语等多种语言。
遇到采访、对谈等环境,还能点击下方的「小灯泡」进入同声传译模式,点击屏幕上下方即可快速转换,速度和精准度都有不错表现,在结束后还能生成全程记录,方便后期整理。
▲ 支持多种语言、多种专业领域的超能翻译官
当然,作为一名新时代的「超级个体」,时时保持学习是必不可少。腾讯元宝除了能让你「临时抱佛脚」,还能成为英语口语陪练,提升口语水平。
点击「小灯泡」我们可以切换难度和话题,或者把对话收藏进你的「笔记本」中,使元宝成为「错题本」。
既然是学习,内容就不仅局限在外语学习这一个方面,元宝还有一个略微有些抽象的「每日一问」功能。
从「多喝热水的起源」到「为什么麦当劳鸡块只有四种形状」,总能从一些刁钻的角度突然勾起我的好奇心,让我脑海里常常会跳出楚云飞的那个表情包:「你呀,总能给我整出点新花样。」
让我们一起,对这个世界保持好奇吧。
▲ 点击「每日一问」会自动跳转到相应问题界面
One More Thing
前段时间爆火的 remini 不知大伙有没有玩过,这款 App 凭借「黏土动画」风格滤镜一夜刷屏很多人的朋友圈,也为我们展示了 AI 在文生图片领域的潜力。
腾讯元宝同样为我们提供了多样化的玩法,只需输入个人自拍照片,就能生成多种风格的 AI 头像。
还有卡通贴图功能也很有趣,例如「创意贴贴贴」,能把你的猫猫狗狗变成萌宠贴图,「万物贴图」则能把宠物、卡通人物,甚至是锅碗瓢盆等日常用品,一秒变成萌物。
不过目前可能由于 App 还处于早期阶段,相关的功能还比较少,期待后续元宝为我们带来更多有趣玩法。
▲ 猜中间下面绿色卡通人物是由什么生成的,提示:体育用品
还是说回我的日常工作,在新闻编辑和内容创作过程中,视觉元素的使用是不可或缺的,但有的时候常常会遇到一些抽象概念或难以找到的图片。这个时候元宝的文生图功能就能提供不少帮助。
例如,当我需要一张关于人工智能的插图时,只需输入“未来城市中的智能机器人”,元宝会在几秒钟内生成一张符合想象的图片。这不仅节省了寻找和购买版权图片的时间,也确保了图片内容的独特性和相关性。
生成图片后,点击下方图标还能调整风格、比例、分辨率。点击图片不仅能看到具体的描述词并进行修改,还能以生成的图片作为参考图再生成新的图片。如果不满意,还可以点击刷新按钮重新生成。
▲ 文生图可根据需要调整参数,还能以原图为参照生成新的图片
性能+生态,腾讯 AI 应用的杀手锏
不难看出,元宝在自然语言处理能力、逻辑推理能力、多模态生成能力等方面都有不错表现,而这要归功于其背后的腾讯混元大模型。
今年 5 月,在国内大模型评测机构 SuperLUE 最新发布的《中文大模型基准评测 2024 年度 4月报告》中,腾讯混元大模型位列第一梯队,位于「卓越领导者」象限,在「基础能力」和「应用能力」方面都表现不错。
一同发布的还有关于各项具体能力的得分图,腾讯混元大模型在语义理解、角色扮演、安全能力、计算、逻辑推理、长文本等能力中处于国内一流的水平,SuperCLUE 的评价也是「一个很有竞争力的通用大模型」。
在全球增长咨询公司弗若斯特沙利文发布的《2024 年中国大模型能力评测》中,腾讯混元与文心一言、通义千问、日日新·商量等一同处于国产大模型第一梯队。
▲ 模型综合竞争力气泡图,来自沙利文《2024 年中国大模型能力评测》
这里给大家快速总结一下腾讯混元大模型的几个特性:
- 算力上,自研的星脉计算网络,为 AI 大模型带来 10 倍通信性能。
- 训练和推理框架上,自演的机器学习平台训练速度是主流框架的 2.6 倍。
- 算法上,采用混合专家模型(MoE)结构,使其在复杂场景和多任务场景中表现更好。
- 万亿级参数规模,为其在中文理解和多模态能力上提供了强大的支持。
值得一提的是,升级后的混元文生图大模型采用了与 Sora、Stable Diffusion 3 一致的 DiT 架构,这意味着该模型不仅可以支持文生图,还可以作为视频等多模态视觉生成的基础。
后续如果能为我们带来视频生成的功能,无疑将会让它向着「超级 App」更进一步。
其实从近期 OpenAI、Google 等厂商的新动态我们不难看出,当前很多厂商已经开始从追求模型能力的阶段,进入到追求应用的阶段。
在这一阶段中,模型能力之间的差距正在逐渐缩小,内容生态就成为了直接影响到使用体验的关键。而说到内容生态,这方面腾讯这个移动互联网时代的王者恐怕难逢敌手。
在 5 月 17 日的「腾讯云生成式AI产业应用峰会」上,我们看到了一种更为务实的态度,腾讯集团云与智慧产业事业群 CEO 汤道生表示:
大模型的打造只是起点,把技术落地到产业场景,创造价值才是目标。
虽然技术的进步令人兴奋,但如何真正服务普通人,才是 AI 助手们最重要的价值。