青年创业网 - 青年创业中国强!
免费注册 | 登陆 | 高级搜索
  • 首页如何创业创业准备创业项目连锁特许职业生涯规划
  • 资讯创业指南网上创业开店创业创业培训ybc新闻图片
  • 政策大学生创业创业人物农村创业实用技术
  • 贷款创业计划书创业故事女性创业创业园区
  • 淘宝创业创业防骗企业创新企业管理热门人物
  • 创业测试创业点子市场营销小本创业创业融资
互联网 通信 传媒 软硬件·半导体 数码电子 医疗健康 教育培训 消费品·餐饮·酒店 环保新能源

搜索

热门标签

当前位置: > 热门行业 > 互联网 >

搜索的未来

时间:01-01 08:00来源: 作者: 点击: 次
   搜索技术的“圣杯”就是要了解用户的想法。更理想的状态是什么?那就是在用户进行搜索之前就已经完成了这项工作。

  作者:Amit Singhal 编译:吴倩

\"超越了文本和语言之后,再越过实时和智能的门槛,搜索会迎来“无声胜有声”、进入“没有搜索的搜索”境界吗?\"
        超越了文本和语言之后,再越过实时和智能的门槛,搜索会迎来“无声胜有声”、进入“没有搜索的搜索”境界吗?

  15年前,搜索由扫描文本页面和查找关键词构成。当时,对于普通人来说,网络上有限数量的信息并不是很有用处,而且数据传输的速度就像蜗牛一样慢。然而,尽管有这些不利的限制条件,网络最终还是成功俘获了我们的想象力。“网上冲浪”时,我们感觉自己就像太空探索者正在发掘广阔的未知领域一样。当时,科幻小说里的场景就好像在我们眼前生动地展现开来。

  时至今日,这一点也并没有改变,每天都有数十亿份的文件被添加到网络上,而且,人们的期望每天都在发生变化。我们希望信息能以所有不同的格式(视频、图像等)用世界上的各种语言提供,能够按照我们的喜好量身打造,而且,我们还希望能够即时获得这些信息。换句话说,搜索引擎必须不仅能处理快速增长的信息量,还要能应对用户行为与期望的快速和根本性的改变。

  超越文本和语言

  在 Google,当大家谈论组织整理全世界的信息时,其实并不只是指文本信息——图像和视频中也包含有大量信息。与文本不同的是,技术和机器无法简单地阅读一幅图像或一个视频,必须深入观察它们,找出像素信息,并把这些像素信息转化成一些有意义的东西。在很长一段时间里,我们都曾认为这是一个无法实现的“白日梦”,但通过梳理搜索方法和计算机视觉方面的各项技术突破,今天的搜索技术已经可以做到在视觉层次上匹配画面了。

  打破语言方面的障碍可以打开为新的信息领域,但不幸的是,让计算机去理解语言,要比教一个人学语言还难。人类是通过结合词汇和语法规则来学习语言的,但语言是很复杂的,语法规则中总有例外,例外中还会出现更深一层的例外。而且,这种方法的可伸缩性也不是很好。为了实现在每个可能的语言对之间进行转化,不管是日语到中文,北印度语到韩语,还是乌尔都语到斯瓦西里语,你的电脑都必须掌握大量的例外情况!

  所以,我们并没有试图给电脑制定大量的规则,而是选择向翻译引擎内输入成千上万份专业翻译文件,并使用各种统计搜索模型在这些文件中识别各种模式。这些模式帮助我们找到了无数的相互关系,从这些相互关系中,就可以开始做到预测某个特定单词、短语或文件的最佳翻译结果。

  你知道吗?如今每个人都拥有独属于自己的Google版本。你的Google不同于我的Google,我们的版本跟邻里朋友的也不一样。这一点是非常符合逻辑的,因为我们都有自己独特的兴趣与喜好。

  然而,创建一个定制的搜索引擎并不是件简单的工作,有许多因素会影响到在某一特定时间对你来说最有用的搜索结果。举例来说,Google在150多个区域市场都实现了本地化,当你站在前门大街搜索烤鸭店时,看到的结果是前门大街上的烤鸭店。听起来很简单吧?但是,随着用户模型越来越精细,工作的复杂度会呈指数倍增长。

  用搜索查询“lords”这个词语来举个例子。这个简单的词有好几个意思——比如上议院、城堡和宝剑,甚至一个非常流行的多人网络游戏。不过,作为印度板球队球迷的我,通常都是搜索并点击与板球有关的信息。所以,当我在Google上搜索“lords”时,我首先会看到的是关于伦敦最著名的板球球场——罗兹板球场(Lords Cricket Ground)的信息。

  实时+智能

  不久之前,大量来自政府的研究数据被刻录在了一些光盘上,人们花费了3到6个月的时间才把这些信息变成一些能用的东西。在信息制作完成后的几秒钟内即可进行访问的能力改变了所有人的观念,但对早期搜索领域的科研人员来说,实时搜索却几乎不可能实现。

  2009 年12月,Google推出了实时搜索业务,这是我有生以来经历过的最复杂的项目之一。我们开发了十多种新技术,以近乎即刻的速度决定最新信息的相关性,比如从经过缩短的URL中提取信息、从世博会新闻中提取有意义的内容,以及评估查询量的变化以找出热点话题等。去年加州爆发地震时,Google实时搜索开始显示这一信息的时间比美国地质调查局的官方报告整整提前了8分钟。

  计算机已经慢慢学习着翻译语言,但是,如何让计算机实际理解语言仍然是我们目前面临的最大挑战之一。在有关汽车的语境中,Google知道“GM”指的是通用汽车,在其他情况下,比如有关食品的语境中,GM就会变成“转基因(Genetically Modified)”。但遇到那些有多重意思的词语呢?当你想改变(change)笔记本电脑屏幕的亮度时,实际上是想“调节(adjust)”亮度,Google能理解到这一点;同理,如果你想把一份PDF文件转变(change)成一份Word文件,Google则可以帮助你了解如何“转化(convert)”那份文件。

  这些听起来也许像是简单的直接替换,但你要知道,计算机并不能像人类一样思考。给计算机编定程序,从词汇与语境中引申出意义,这在大约20年前几乎是无法想象的——回到那个时候,如果我们说希望能用这种方法处理世界上所有的语言会怎样?我们一定会被人当成疯子的。

  未来:没有搜索的搜索

  毫无疑问,我们已经走过了很长一段路。不过,当你追求完美的时候,不管你已经走了多远,也不管你解决了多少看似无法解决的难题,总是还会有许多工作要完成。在我的心目中,搜索技术的“圣杯”就是要了解用户的想法,不仅仅是匹配词汇,而是要实际匹配含义。更理想的状态是什么?那就是在用户进行搜索之前就已经完成了这项工作。(责任编辑:admin)

  • 共2页:
  • 上一页
  • 1
  • 2
  • 下一页
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
  • 上一篇:eBay全球CEO:电子商务的移动时代已经到来
  • 下一篇:电子商务机遇:物流业利好政策将集中出台
  • 收藏
  • 挑错
  • 推荐
  • 打印
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
最新评论 进入详细评论页>>
图片新闻
    有哪些不起眼但是很赚钱的工作
    有哪些不起
    最美青年创业者 央视聚焦泽楷数字营销ceo周子聪
    最美青年创
    网易教育、惠普强强联合 助力在线教育行业发展
    网易教育、
    2017年,中国在线教育行业趋势分析
    2017年,中
推荐内容
  • 美互联网创业公司估值疯
  • 前谷歌员工离职创业潮:
  • 淘宝网CEO陆兆禧向B2B员
  • 安居宝破发玄机调查:张
  • 京东商城融资5亿美元:
  • 2010年移动和社交游戏收
  • AOL宣布收购个人档案社
  • 优酷股价坐过山车 古永
赞助广告
热点内容
  • 永利高网络赌博集团3年吸金1000
  • 传优酷网赴美纽交所上市拟融资1.
  • 优酷普通员工期权价值2亿美元 人
  • 前谷歌员工离职创业潮:15家创业
  • 互联网垄断调查报告发布
  • 淘宝网CEO陆兆禧向B2B员工发公开
创业人物
    代运营商ShopEx:做电商界的“微软”
    代运营商Sh
    迅雷邹胜龙的硅谷流金岁月:以速度杀出一条血路
    迅雷邹胜龙
    骇客刘海涛:让“感知物联”成物联网Google
    骇客刘海涛
    神州租车陆正耀:租车行业的轻重资产之辩
    神州租车陆
  • 14岁早熟少女惊人的商业
  • 俞敏洪再创业:做创业“
  • 天使投资人徐小平:创业
  • 打不死的“小强”王兴:
  • 尹明善:47岁创业的亿万
  • 奇艺:百度迟到的赌注

关于我们 - 广告刊例 - 友情链接 - 网站地图 - 联系我们
Power by DedeCms

本站文章收集于网络,仅供会员浏览,版权归作者所有,如有不妥,请来信告知,我们将在24小时之内进行处理。
中国青年创业学院(cyxy.000956.com/) 业务QQ:892687788 E-mail:sj@mostgov.cn