说干就干。接下来几天,小李团队化身“街头录音师”
,拿着设备到处跑。我偶尔也跟着去,坐在公园长椅上,看他们怎么跟大爷大妈套近乎。
最有意思的是在菜市场。小刘假装买菜的,跟一个因为菜价太贵而抱怨的大妈聊了半天,偷偷录下了她“愤怒”
的语音。后来大妈发现他在录音,不但没生气,反而来劲了:“小伙子,你是不是搞研究的?我跟你说,现在的菜价啊,真是气得人肝疼!我年轻时候。。。”
最后大妈贡献了长达二十分钟的“情绪语音”
,从愤怒到无奈到感慨,情绪层次丰富得能当教学案例。
样本收集得差不多了,新的问题又来了:怎么标注?哪些声音算“高兴”
,哪些算“生气”
?团队内部先吵起来了。
小张认为应该用算法自动标注,小李觉得该请专业心理学人士,小刘提议众包——找网友来听,投票决定。
三个人争得面红耳赤,最后跑来找我评理。我听完,问了一个问题:“你们这个产品,最后是谁用?”
“用户啊。”
三人异口同声。
“那为什么不直接问用户?”
我说,“做个简单的测试程序,让用户自己标——听到这句话,你感觉说话人是什么情绪?高兴就点笑脸,生气就点生气脸。。。”
小主,这个章节后面还有哦,请点击下一页继续阅读,后面更精彩!
三个人面面相觑,然后几乎同时掏出本子开始记。
“陆老师,您这思路太绝了!”
小李激动地说,“让用户参与标注,既解决了标注问题,还能让用户有参与感!”
“还能收集更多数据!”
小张补充,“用户每标一次,都是在帮我们完善数据库!”
方案定下来,团队又忙活开了。我也没闲着,把“老家伙导师团”
里懂技术的老伙计都叫来,开个“诸葛亮会”
。
老王第一个发言:“要我说,你们搞得太复杂。什么情绪识别,老百姓用音箱,不就是图个方便?能听懂话,能办好事,就够了!”
老周不同意:“老王你这思想落伍了。现在讲究的是用户体验,是情感共鸣!产品要有温度!”
两人争起来,我在旁边听得津津有味。最后老李打圆场:“要我说,能不能折中?基础功能要稳定,情绪识别作为增值功能,让用户自己选要不要开启?”
我觉得这个主意好。就跟电视机一样,基础功能是看节目,那些花里胡哨的智能推荐,愿意用的就用,不愿意用的就关掉。
这个建议反馈给小李团队,他们觉得可行。于是产品设计分成了“基础模式”
和“智能模式”
。基础模式就是简单的语音指令,稳定可靠;智能模式才开启情感识别、个性化推荐这些高级功能。
但技术难题还是没完全解决。情绪识别的准确率提升到了百分之八十五,但离团队目标的百分之九十五还差得远。卡在最后的百分之十,就像爬山最后那段最陡的坡,看着近,爬着难。
那几天,小李团队天天熬夜,黑眼圈一个比一个重。小张有次在调试时趴在桌上睡着了,手里还攥着电路板。我看着心疼,但又帮不上忙——技术的事,我真不懂。
转机出现在一个周末。孙子来我家玩,看见桌上那个半成品的音箱,好奇地摆弄。他对着音箱说:“小音箱,我爷爷今天不高兴。”
音箱没反应——它还没装外壳,处于调试模式。
孙子又说了一遍,这次加了动作——他皱着眉头,撅着嘴,一副生气的样子。
我忽然想到什么:“安安,你怎么知道爷爷不高兴?”