9人团队跨界做AI硬件,比LOVOT更有生命感的国产陪伴机器人出现了?

做一款有“初代iPhone”意义的陪伴机器人,总共分几步?

老人和孩子同时挤在展台前,只为与一个柚子大小的萌物互动,这是云栖大会上,糯宝机器人展台前的一幕。粉色白色相间的身体配色,毛茸茸的皮肤,灵动的大眼睛,浑圆的躯体随时随人转动,糯宝机器人一经亮相便吸引了大量人驻足围观。

机器人毕竟不是人,但AI技术的融入已经让机器人展现出一定的类人的生物本能表现,糯宝在类人行为的表现和交互理解层面已经具备了相当高的“人性化”特点,它从身体到语言都能够实现和人类的互动,让人能够感受到其并不是一个冷冰冰的玩具,而是具有温度的陪伴者。


糯宝会是中国版的LOVOT吗?对于糯宝的定位,其产品创始人汤祺表示,团队更愿意将糯宝定位为实版的“哆啦A梦”,这是一个具备“极致生命感”的AI陪伴机器人,其身体虽然是冰冷的零部件构成的机器,但是从其交互能力上,人们可以感知到糯宝是一个具备自己灵魂的小可爱。

而值得一提的是,糯宝的创始团队此前并没有智能硬件产品的深度工作经验,他们的团队曾创立并运营社交应用美篇,如今,在AI浪潮席卷各行各业的环境下,团队all in AI,从糯宝开始,走上智能陪伴机器人赛道的新征程。

近日,新智独角兽采访了糯宝机器人创始人汤祺,听他讲述团队在智能陪伴机器人领域,从0到1的增长经验。

以下为新智独角兽与汤祺的对话内容,在不改变原意的情况下经编辑整理。

关于硬件研发与供应链
 

新智独角兽:您和团队是纯互联网背景,如今跨界做智能硬件,在供应链和产品生产上面临了哪些挑战?

汤祺:坦率的说,在做智能陪伴机器人之前,我们过于乐观了,这个项目已经跑了大半年的时间,硬件产品的研发和生产难度远超我们的想象。

可能很多人会认为,我们中国的供应链是非常成熟的,做智能硬件产品只需要像拼乐高一样,把零部件组装就行,但是,当我们真正投入到这个行业中发现,如果在做产品的过程中,你要追求iPhone级的精致和划时代的体验,那么你会对零部件的规格、性能、体积等有极高的要求,每一个环节都不能将就。在完成这个产品的过程中,扬声器、电机摄像头各种零部件都要反复选型定制调试。

再举个例子,机器人可动会产生电机、风扇等噪音,这会导致机器人的收音效果远差于手机,就需要我们在软件上做大量额外的降噪处理。

我们没法现成的整合解决方案,因为这些解决方案离我们体验要求差距过大,我们的整套硬件结构和系统都是独立研发的。


糯宝和用户互动(图源:糯宝机器人)

新智独角兽:您认为,当下市场的用户对智能机器人硬件产品的期望值是否过高,您和团队如何平衡实际生产与用户预期?

汤祺:用户期望值高这是一个现实,这种过高的期望值,可能源于用户对AI的了解还不够充分容易通过科幻电影想象但事实上,整个行业成熟度没到那一步,实际的产品和用户期望之间是存在落差的,越不了解行业的用户对产品的期待越高要做用户期望值管理,关键是找到当前AI能力已经可以很好解决的场景,在这些场景上深挖,用户交付超出预期的使用体验。我们团队一直在讨论这个点,持续基于这个逻辑规划我们的产品方向和交互设计。

产品设计与生命感打造
 

新智独角兽:您一直提到生命感,那么您的团队为追求机器人的“极致生命感”做了哪些努力?

汤祺:我们是产品体验驱动的公司,我们产品交互设计第一性原理一切以人类行为模式为参考和目标我们在产品研发的方方面面充分贯彻了这一原理因为哪怕很多地方都真实只要细节没做好,很容易“破功”让用户觉得生命感荡然无存。具体的设计实践可以举几个例子:

1. 眼睛功能纯粹化:市面上很多产品把眼睛当屏幕用,显示二维码、电量、Wifi等图标,但是这是一种很破坏生命感的设计,有生命的生物眼睛里不会出现二维码。所以,我们在立项初期就确定“眼睛就是眼睛”,虽用屏幕硬件,但是这个屏幕只承担眼睛的功能,不做其他用途

2.无可见按钮:活着的生命体不会有按钮,我们的产品没有开关机键、音量键、配网键,通过自然语言实现相关操作,比如对着糯宝说一句“声音大点”,或者“嘘”一声,就能调节糯宝的音量。机器人放上充电座就自动开机,关机直接说“你关机或者休息即可

3. 简化App依赖:既然我们给机器人的定位是有生命感的个体,那么,其一切设置都应能通过自然语言交互视觉理解完成,比如用户昵称、性别年龄偏好、机器人称呼能通过自然对话获得无需App繁琐操作

4. 多人对话系统:桌面机器人更多的会应用在家庭场景中,那么就会存在机器人和多人互动的场景,我们以人类行为为设计目标,通过声纹识别+人脸识别,让机器人在两人对话时专注当前对象忽略其他语音只有第三方喊它名字,它才会通过声源定位转头响应,避免“认错人”破坏生命感。

5. 肢体与眼神系统:为了避免糯宝身上出现传统机器人的机械感,我们期望糯宝动某一个部位时实现“牵一发而动全身”的效果,比如人在抬手时,其实人的上半身、头、腰都是会配合移动的因此,我们所有动作的设计都不自由度的运动,而是全身整体运动。同时,也用预制动画循环,这会带来很强的机械感。我们是基于场景、情绪、对话内容自动匹配动作序列,实现动作连贯性和泛化性,这是我们的核心技术资产。


糯宝和用户互动(图源:糯宝机器人)

新智独角兽:糯宝与用户的理想关系是什么样的?如何实现这种关系?

汤祺:理想的关系是实版的哆啦A梦,我们认可糯宝机器人的身份,但它的行为更接近人类,它和用户是双向互动的好朋友、好伙伴,用户可以玩,它也可以主动用户互动要实现这一点糯宝需要具备适当场合、适当时机主动发起互动的能力,这就需要多模态融合——以视觉、听觉、触觉、运动感知(陀螺仪和加速度计)四维度多模态输入为整体通过拟人的“思考-记忆-性格-情绪”中枢处理,在极短时间生成多模态回复信息控制机器人实现眼神、肢体动作与语音内容的输出联动这个多模态输入输出能力目前没有现成解决方案,我们做了大量的工程工作整合了一系列优秀大模型能力

市场定位与目标群体
 

新智独角兽:如何看待陪伴类机器人的三种关系(助手、朋友、宠物)?糯宝的目标群体有哪些考虑?

汤祺:助手型的机器人,它本质上是工具,所以并不在“陪伴”类的象限之列;朋友型和宠物型的机器人更有市场空间,但是当前AI水平难支撑虚拟朋友走进成年人内心,做儿童朋友更合适,因为儿童对AI能力缺陷的敏感度低,这个产品只要热闹好玩、对话自然就机会获得儿童的青睐。不过,现在市面上对话产品普遍长期留存较低我们认为主要原因可能对话体验本身没有做到足够好同时因为没有肢体运动眼神交流,很难让用户产生带入情感投射也是我们团队选择优先打造机器人极致生命感重要原因生命感后续所有场景应用的前提  

对于我们来说,团队先聚焦把“极致生命感”做好后续会把产品融入到具体场景中,比如面向成年人,我们可能设计基于大模型的养成机制,随着用户的互动和投入,会有持续的变化成长;面向儿童,我们可能做“超级故事机”,结合语音情绪、肢体动作和眼神,讲故事变成表演故事带来全新的体验还能和用户共创故事,甚至可以家长设置想要植入故事价值观。目前这是一些选项,未来分产品矩阵针对不同人群。

新智独角兽:糯宝对比日本LOVOT有什么优势?

汤祺LOVOT有很强的生命感,它有13运动自由度,眼睛设计出色,让用户感性上把它当生命体,在日本高消费人群中粘性高,但它不能对话,更像宠物或婴儿。糯宝的定位是哆啦A梦式朋友,它融合了肢体运动、眼神和语言,语言是无穷尽且可泛化的,是大模型擅长的,整体生命感会比LOVOT更强,且能对话互动,更符合“陪伴朋友”的定位。

产品进展与商业化
 

新智独角兽:糯宝这款产品目前处于什么阶段?预计何时上市?对产品有什么定位和销售期许?

汤祺:糯宝目前处于工程样机阶段,它还有很多硬件和软件功能需要开发优化,预计明年4月会正式上市。

我们对第一代产品的定位期待很高,希望它有“初代iPhone”的划时代意义,因为市面上目前没有兼具极致生命感和多模态输入输出能力的产品

在销售上,我们不追求短期销量,核心目标是实现长期留存,先打磨好产品,让用户有持续使用的价值,再放量,相信留存做好后销量会水到渠成团队也不担心短期冲量的竞品,毕竟一款产品如果没有用户留存的话,短期销量反而会损害产品口碑。

新智独角兽:担心大厂进入赛道竞争吗?

汤祺:担心,大厂的核心目标是AGI,他们不会把陪伴机器人当成核心业务,可能只是“旁线”尝试,而我们是all in这个方向,我们会持续构建自己的竞争力。此外,硬件开发周期比较长,一般要6-12个月,在这个层面,我们率先进入市场,能先获取用户反馈并迭代,有先发优势

市场与创业转型
 

新智独角兽:当前陪伴机器人硬件市场的现状如何?

汤祺这两年做陪伴机器人硬件的非常多,尤其是今年以来冒出来的更多,这在预料之中,也说明这个市场有机会,大家都看好。

新智独角兽:您和团队从美篇应用跨界到做陪伴机器人,这个赛道的跨度较大,原因是什么?

汤祺:美篇是典型的互联网公司,它是我在2015年业余时间启动的项目,2016年我开始全职创业,至今已经有10年美篇的创业,搭上了移动互联网高速发展的末班车和微信公众号时代的红利获得了快速的用户增长,我们拿了多轮融资,现在稳定的收入利润。在AI技术发展的大趋势下,我们决定all in AI,正在聚焦排版功能的AI超级智能体产品,但我们觉得AI应用产品始终被大模型吃掉”的风险所以我们同步押注硬件赛道因为硬件与大模型结合是反过来的——模型每一次升级会让硬件更强,互补而不是竞争关系之所以选择陪伴机器人这个方向,是源于去年ChatGPT上线的视觉对话能力我们觉得大模型有了视觉后能分析推理、识别情绪理解环境,像人类睁开双眼,这种革命性进化与硬件结合,让我认为我们有机会做出有极致生命感的机器人,因此我们成立了一家独立的智能硬件公司主攻这个方向

团队与技术
 

新智独角兽:目前糯宝团队的规模和构成是怎样的?技术团队有什么特点?

汤祺:我们智能硬件公司整个团队只有9个人,我们追求极致的人才密度,AI时代更是应该以一当百具体在人员岗位分布方面是4个开发、2个产品经理、1个运营,以及2个创始人偏产品,也懂技术,亲自写代码在我们团队,几乎每个人都写代码。技术思路上,我们简单采用当下已经成熟AI技术套硬件外壳,而是立足长期主义,激进采用当前最先进技术甚至预判未来技术进展倒推现在的工作因为只有最新的技术才有可能打造出我们想要极致生命感。我们通过工程手段整合当下优秀的各种模型实现产品可用状态,目前我们的样机可用性已OK,未来大模型迭代后会从可用变好用。

新智独角兽:您的技术背景对现在的工作有什么帮助?作为技术转型创业者,您认为技术人员转型到创业,您所收获的重要的经验是什么?

汤祺:我是学计算机出身,我本人在在华为的研发部门工作8年,从基层技术做到项目管理、技术管理。过往的技术经历让我对技术有认知、预判和了解,并且辅助做产品决策我创业后更多的时候会站在产品视角去思考问题,但是技术背景的积累,让我更懂如何用技术实现产品目标。  

作为技术转型创业者,其实我认为重要的是不做“典型程序员”,我虽然爱写代码,但是在写代码的时候,我也在设计产品。我从大学写游戏、做游戏引擎开始,就始终站在用户(或开发者)视角思考问题写每一行代码都想“用户怎么用更好”,而非单纯追求技术完美

资本与成本
 

新智独角兽:公司目前的资本情况如何?是否愿意接受新资本介入?

汤祺我们团队是二次创业,已经由美篇公司投资了千万元种子轮,现在正在进行新一轮融资。

新智独角兽:硬件行业烧钱吗?从产品立项到量产,1000万的资金是否够用?

汤祺:硬件行业早期烧钱多,中后期相对少,因为量产需要垫资,还需搭建线下机制,比较复杂。我们团队在花钱方面是比较谨慎的,每分钱都会掰成两半前面也提到,我们的人员虽然精简,但都是精兵强将,人员成本不低,但当前资金和人员配置足够支撑到产品量产拿到初步市场反馈当然,我们也积极寻求资本支持,加快产品迭代速度

本文源自「私域神器」,发布者:siyushenqi.com,转载请注明出处:https://www.siyushenqi.com/69305.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 28分钟前
下一篇 28分钟前

相关推荐

发表回复

登录后才能评论
联系我们

联系我们

+86 132-7601-9273

邮件:siyushenqi@gmail.com

工作时间:周一至周日 9:30-20:30

添加微信
添加微信
email Email Telegram
分享本页
返回顶部

私域神器:一站式全网全渠道拓客营销软件
备用域名:https://www.nodgame.com