北京时间2月15日上午消息,一家美国创业公司开发了一种新型人工智能系统,可以使用少量数据达到与传统深度学习算法相似的效果,大大提升数据效率。
2012年,谷歌研究人员发现了一种新颖的方式来展示人工智能技术的潜力:他们训练电脑识别YouTube视频中的猫。该项目花费数年时间,动用1.6万颗计算机处理器分析了1000万张图片,才最终得以成型。这种人工智能技术被称作深度学习,亚马逊Echo和特斯拉无人驾驶汽车都在使用同类技术。
虽然这种软件看起来很神奇,但往往需要借助成千上万台电脑花费数月时间扫描海量数据才能最终实现。
毕业于麻省理工学院的计算机科学家本·维格达(Ben Vigoda)表示,他可以省去大量枯燥乏味的工作,在不使用谷歌那种庞大资源的情况下也能推进人工智能项目。他的公司Gamalon Machine使用概率模型教给电脑在几分钟内识别包括猫在内的各种物体,只需要花费几分钟时间向其展示几张图片即可。
“你可以在笔记本电脑上运行我们的软件,找到答案时所需的计算能力缩小100倍。”维格达说,他2013年创办Gamalon,但这却是该公司首次公开展示自己的产品。
传统的深度学习系统需要查看海量猫咪照片才能学会它们的特征。Gamalon的系统则用一种名为概率编程的新方法作为这一过程的起点。向其展示一张长尾猫和一张短尾猫的视频,它就能填补空白。“这种模式可以大幅提高数据使用效率。”纽约大学数据科学家布伦丹·雷克(Brenden Lake)说。
维格达之前的公司Lyric Semiconductor可以将概率函数直接嵌入计算机芯片。Lyric的技术已经应用到Echo和汽车中,帮助其猜测哪个人在说话。此外还应用到智能手机中,用于改进触摸和滑屏效果。在获得硅谷投资者的450万美元资助,并得到了美国国防部高等研究项目署的支持后,Gamalon的团队过去几年一直在改进概率技术,希望扩大应用范围。
十多年以来,学术界一直在研究基于概率的人工智能系统,但很少应用于实际。微软的TrueSkill Xbox玩家排名系统就使用了类似的技术,去年被Uber收购的创业公司Geometric Intelligence也在使用同类技术。
由于仍然需要人类从事复杂而耗时的数学计算,以便调整概率模型,所以类似的系统往往只能应用于特定领域,很难扩大范围。Gamalon则声称,该公司的软件可以调整自己的模型,相当于自动完成重新编程。
虽然维格达表示,这项技术可以得到广泛应用,但他的公司起初还是关注细分领域。该公司最先推出的Structure和Match两款产品可以扫描通用数据库,并修复一些歧义信息,例如客户姓名和地址的不同拼写。作为其早期的几家客户之一,通讯硬件制造商Avaya一直在使用该公司的软件从事类似的任务,每月的分析费高达1万美元。
有成千上万的公司负责代销Avaya的产品,而他们记录客户数据的方式也各有不同。为了保证数据库可以得到有效搜索,Avaya原本使用人工方式来过滤信息,每过几个月整理一遍,例如,需要将“St.”修改成“Street”,或者将“HP”修改成“Hewlett-Packard”。
Gamalon的软件则能在几分钟内匹配85%的数据。与普通的查找-替换搜索工具不同,该软件可以分析上下文信息,所以能将“St. Louis”中的“St.”修改成“Street”。如果能够得到更多的训练,并了解哪些地方有所遗漏,这套系统的效果还可以进一步提升。