Chatbot.jpg

 

假设你现在站在忠孝敦路口,想查附近有什么餐厅,并知道餐厅有什么好吃的招牌菜色,你会怎么做?一般人会利用 Google Map 或上网搜寻关键字。但这样做,可能会得到数十页的食记,光是阅读食记可能就得耗上几小时。这时候,一台读过十多万篇美食食记,建有几千家餐厅资料的美食聊天机器人,也许就是饥肠辘辘的你的最佳救星。

 

从十多万篇食记开始 四个月养成美食智慧大脑

台湾人工智慧学校台北总校第二期的结业典礼上,五位来自不同领域的学员,推出了号称拥有「美食智慧大脑」的箱子,吸引了所有人的目光。更让人惊艳的是,他们从学习人工智慧技术到做出成品,才花了4个月的时间。


负责主揪整个专案的 Wayne 是 PIXNET 的研发工程师,发想出「美食智慧大脑」的灵感,主要来自公司数以百万篇的餐厅食记。他说:「痞客邦有许多的文章,是否可以应用机器学习,做一个特别的服务?」于是一个结合了餐厅搜寻与美食推荐的「美食问答机器人」的概念就这样成形了。

 

人工智慧的开始并不简单
不过,要开始人工智慧并不是一件简单的事情,光是15万篇文章的资料整理及分类,就耗去团队许多时间。但 Wayne 说,自己很幸运地拥有一群实力坚强的队友。例如,在来自知名作业系统公司 Ubuntu 的 YC ,对于系统建置十分擅长,便负责起 chatbot 所需的搜寻引擎建置。另外,本身为手机代工厂工程师的 Jazz 则负责菜单关键字的萃取及串接搜寻引擎的 API ( Application Programming Interface ) 。

 

团队将15万篇的痞客邦文章,逐步分类整理出2,500家餐厅,4百多万个句子,3000多个关键字,七万个食物名称等资料,并将文章内的餐厅地址转成经纬度,以利搜寻。除此之外,还使用爬虫将社群网站上相等对应的语句训练 model ,使其能准确的判断语句是正向,还是负向的评论。之后也利用转移学习,使用少量的训练资料使 model 能够判别该语句是对餐厅的食物、服务还是环境做评价。

 

学员自组_Food-AI-最懂美食的智慧大脑_Team29_完整版.png

 

Wayne 说,过程中团队遇到最大的难题是:「如何让电脑判定一个单词是否为食物?」虽然知道市面上有些软体可以处理,但都要价不斐。没想到,此时团队成员皮丘突然卯足全力,人工判定了十几万笔的单词。Wayne 说,由于这个题目没有其他的 label data ,所以皮丘做的这些 data 对于后续机器学习的过程十分重要。至于Ken则是负责了最具挑战性的句子分析与组成一块。

 

Wayne 说,他本来没有预料会是一人负责一大块的项目,没想到刚 好大家都对某一部份的工作感兴趣,也都投入了相当多的时间,有时候甚至半夜一两点,小组群组还在讨论。他笑说,原本还很担心成果做不出来,没想到大家一起合作出非常好的成果。过程中,还有一种创业的热血感。

 

至于专案结束之后,这个美食智慧大脑是否还有需要改善加强的地方。大家笑说还有很多,光是餐厅的资料就需要补齐。再来就是对话的流程设计可以再复杂一点。

 

学员自组_Food-AI-最懂美食的智慧大脑_Team29_完整版 (1).png

 

聚集有共同兴趣与能力的人,创造最大价值
问起四个月的学习心得,Wayne 认为,最大的收获就是和一群有一定资讯能力、各有专长,且对深度学习都有兴趣的人一起合作。当中一起讨论,一起合作的过程,就十分有价值。更重要的是,卡关还有助教可以求助。

 

Chatbot-1.jpg

 

本身是从事家电整合新创事业的皮丘,当初会选择这个题目的理由,是因为觉得未来 chatbot 很有机会会取代掉 App ,所以才想在这个领域多做著墨。原本是对文字处理相关技术比较有兴趣,但收获最多的反而是图像处理的部分,透过期中考前的范例,他才真正了解 CNN 的如何操作。较为可惜的是,在文字相关的课程中,就少了这一部份,但也让他发现这一块还有许多可以深入研究的部分。

 

设计手机游戏多年的 Ken 则笑说,4个月的学习加上专案之后,让他获得了许多工作上的灵感,知道了许多 App 应用的相关技术可以创作。

 

而同是物理背景出身的 Ken 及 Jazz 则认为,这段期间的学习补足了自己在程式应用与整合的能力,以及一些线性代数与统计方面的基础知识。Jazz 说,还能认识一堆写程式的同学,过程是满满的收获。

 

(新闻授权转载自:台湾人工智慧学校官网

查看原文 >>
相关文章