7月1日,网易宣布正式启用“有道(www.yodao.com)” 作为旗下搜索引擎内核,从而彻底和合作了3年的Google分道扬镳。为何会选择独立研发搜索引擎,而且选在这个群雄逐鹿的时期加入战局,这是很多业内人士心中的疑问。而且,就在此不到20天前,新浪和Google达成战略合作,双方宣布将在搜索、资讯、广告三方面达成全方位的合作。两大门户短期内相悖的选择,又让业内唏嘘不已。带着这种种疑问,8月10日,赛迪网专访了网易有道搜索市场总监胡琛。
记者:现在互联网的应用都在抢占先发优势,像搜索领域,除百度和Google两大搜索巨头外,国内的几大门户除了TOM在线外均推出了搜索产品,新浪有爱问,搜狐有搜狗,腾讯有搜搜,而网易的有道也加入到这一阵营当中。而在不久前,前程无忧,沱沱网等网站也相继推出了搜索业务,面对日益增多的竞争者,网易作为后来者准备靠什么立足?是不是进了这个搜索市场已经晚了?
胡琛:这样的一个观点和评论很早就有,包含用户或者业内很多人士也提到这样的问题。我们05年开始做这个事情,那时候已经有人说晚了,直到今天我们再端上来这些产品,看似更晚了。这个事情我们自己也考虑过,举一个简单的例子,你有没有APPLE的随身听?想想APPLE做MP3播放器这一块业务,它也不是第一进来做的,有更多最早进入市场的公司已经被挤出市场了。而面对大众消费的IT产品,先发有先发的优势,后发也有后发的好处。对后发者而言,一些重复的路,一些错误的路都能规避,前期观念的普及的东西就不需要你来做了。大家对搜索的观念已经比前期更有认知了,有了前期科普工作的基础,后人成长的环境会更好。很多初期的教育工作不需要我们来做,特别是最基本的网页搜索,大家已经有了清晰的概念。
为什么还要做搜索?什么时候这个技术会真正的成熟化?我们发现任何一项技术和产品在最开始出现的时候只有小部分人知道,然后产生兴趣、传播,到后来大家都来用,继而选择某一个品牌。再往后就根本不在乎那个特定产品了,它已经融在你的生活中,有点像底层TCP/IP的互联网通信的技术,现在这个技术已经成为通用的标准,不会有人去深究TCP/IP是谁做的?其他的例子好比邮箱、IM等等,都已经成了大家上网的必要工具,这种状态就意味着这个技术已经真正的成熟化了。
目前来讲,我觉得搜索技术的普及教育上已经做了一些功课,但离中国所有的老百姓都能理解上网的应用大都通过搜索来完成还差很远,还有一大段路要走。这就需要先进的厂商和后进的厂商一起去把这个概念更大的普及化。如博客搜索可能就有很多人还没有理解它的用处,看上去跟网页搜索差不多嘛,为什么还要用博客搜索?这是给我们后来厂商的一个挑战,前面几家厂商把网页搜索的概念介绍的蛮清楚的,相对来说那些新的概念和新的应用,又会有什么市场意义?这反而是我们进入市场的时候会去考虑的责任。我们会尽力把这个概念给大家讲明白,因为我们自己真的发现了一些不一样的价值所在。
举一个例子,如果你去香港休假,旅行社给安排酒店,你不知道那家酒店的服务和设施到底怎样,把酒店名字放在百度里面搜,估计第一个结果是携程网,第二名是亿龙网。可你要找的不是订酒店的办法,可能这些网站上都有很模式化的宣称,比如24小时热水,宽带上网、卫星电话什么的。可是你想要知道的是,到底宽带上网贵不贵,它早餐是不是很难吃?而只有去过那家酒店的老百姓、我们所谓的独立个体,才会有这些意见给你。我们相信,一定存在这样的人,做了一件事情,把感受记录在博客上。博客是有观点的、凝聚与血肉之中的文章。
我觉得网页搜索是A4纸,因为网页上的内容可以太多的被转载,被复制,被粘贴。而博客的观点有着千差万别。博客搜索是可以帮人们分享生活经验的。你用网页搜索可能前十个搜索结果都是商家推广的产品、医院或者酒店。可是你想知道的是一个个人对某件事的体验,这时候博客搜索可以帮你把相关信息串起来,普通老百姓表达出来的各种情绪、意见,可能会更真实。
我们觉得搜索还没有到完全成熟的地步,没有到人人用搜索就像用水电一样。
这个市场本身是在不断膨胀的,你觉得这个市场蛋糕已经分完,我觉得没有。因为你只看到了表层的蛋糕,但这个蛋糕是N层的,把上面这层拿掉,下面接着吃。所以我觉得从用户端,从厂商端,从技术、从整个市场来讲,他们的机会都还是存在的。不是大家想象的已经瓜分到没有机会做,用户已经非常满意,厂商也没有机会挣钱的地步。我们根据自己过去几年的分析和以前的一些其他产品经验,觉得还是值得去做的。
所以我接着你后面的问题说为什么会和Google结束合作,就是这么一个想法吧。当企业是技术驱动的企业,特别是网易,我想从几家门户来讲,最早被大家定位成一个技术型代表的就是它。技术本身是我们很核心的一块东西,一直都是。另外,也正因为有这么多年的技术积累,网易一直在做一些大规模用户的聚集业务,最开始的网易社区,网易游戏,网易邮箱……请注意,这些东西都是大规模用户的应用。这些业务上的经验是可以被移植的,所以为什么我们做搜索为什么会有信心呢?因为在大规模应用的时候就考虑到很多的技术问题了,分布式存储、分布式开发、分布式计算,然后自然语言处理。所以我们做搜索一个是发现了市场机会,另外还是有一定的想法和信心去做。如果你光从我们自己的角度来讲,我们还是觉得蛮乐意去试一下,而且目前也觉得还不错。
记者:您刚才提到的博客搜索,海量字典,现在主要是想靠技术上的创新在搜索市场上占据一定的地位是吗?还有其他的哪些优势?毕竟要在这么多的竞争对手对抗,争取一定的份额还是比较难的。
胡琛:对,大家都看到了这个问题,但目前市场份额不是我们的首要目标。
我看你有一个问题问得挺好,就是问到名字的想法,为什么会用“有道”这个名字?先回答这个吧。
我们希望有一些中国的文化在其中,又希望带一点科技感,但是又想表现出我们自己的一些想法,那后来就觉得中国有一个字很妙,就是“道”。道在中文来说,有N多解释,首先一个是道路,我们认为搜索本身就是问题和答案的最短通路。如果你最近看过那个机器猫电影的话,这个通路就像那个任意门嘛,用户提一个问题,拉开门能找到答案,对吧。我们就是在试图搭建一个问题与答案之间的最短通路,让用户找到想要的东西。我们认为搜索是工具,而不是内容,所以“道”讲述的第一个想法就是通道的意思。
第二个想法代表方法—I have the way,我自有办法!门道的意思。前途是路漫漫,挑战是很大的,但是我们仍然有我们的办法,因为我们发现了新机会和用户的需求,因为我们做搜索是有备而来。
第三点,从企业精神来讲,自古以来有得道之人、有道之士,得道多助,那何谓得道?最简单讲就是信仰,我们会给自己一个很严格的立场和要求。有些事情可为,有些事情我们认为会破坏用户体验,或者说有碍结果公正的,我们就不想去做。
记者:比如呢?
胡琛:比如说自然结果和广告结果的混杂。一方面要考虑广告商的利益,另一方面要考虑用户体验。我们是希望做一个非常公平的表现,结果与广告非常的泾渭分明。
总体来说,我们自己有一个标杆,什么事情可做,什么事情不可做。我们看到有的厂商做得很好的地方,也看到他们对用户有些置疑的做法,我相信各家有各家的原因考虑。但是从我自己来讲还好,有道刚刚生出来,从小就做一个四有新人吧,有道德、有意思、有创意、有中国文化……所以有些事情就要更加的谨慎,也更希望公正一点。命名大概是有这么三点考虑。
刚才你问靠什么来立足。我们看到一些新的需求的创新的产品可以去满足,另一方面我们会把网页搜索定义为中国用户的基本需求。网页搜索是打基础,对于搜索引擎而言,三个判断标准是全面性、及时性、相关性。第四个是表现层的部分,有没有跟用户做了很好的交互,会不会让用户很别扭。我们认为这四点上,我们还有好多地方做得不够,还要做好。
技术流程上简单来讲就是抓取、索引、然后排序和呈现。你会发现网页搜索是一个特大的地基,只有这个做好了以后,博客搜索,图片搜索,辞典,甚至还有未来会看到一些应用才会很好的被扩展。所以如果说产品创新是一方面,那么创新的前提是先把地基做好,没有夯实的地基,后面的应用是空中楼阁,是危险的跳楼。技术创新是我们的方向,但我是想特别强调一点,创新有时候不等于大家看到的那一点点东西,我说的四要素,其实都需要很多同事在做搭基础的东西。
我们会用通用搜索打好地基,然后垂直搜索才能发挥作用。如果你没有通用搜索的地基就去翻跟头,结果会很可怕。因为一旦有通用搜索的厂商要做这个事情,你就没有跟头翻了。这个团队是金字塔形的,你看到的是冒出来的,还有很多看不得到。而那个东西,我们有自信说可以立足的原因是因为它来自于网易,一些大规模的应用产品的经验。
记者:那么您刚才也提到了早在05年的时候就建立起了开发部门,那么当时投入是怎样的规模?
胡琛:现在差不多100人左右。方方面面,我想简单说,我们认为做搜索不是简单和短期的事情,是有相当长的承诺和准备的。
记者:都是技术型的吧?
胡琛:搜索是技术驱动为主的,所以大部分是这样。
记者:你们一开始在做搜索的时候,如何发现不一样的东西?通过什么方法来发现搜索市场的新兴应用?
胡琛:首先可以通过网页搜索的日志发现用户的需求。在没有博客搜索的时候,就有很多人在搜比如徐静蕾或者其他的名人博客。网页搜索日志就像一个晴雨表,现在也有其他搜索厂商有类似的产品,风云榜啊趋势榜啊,也是在讲用户搜索的词,它可能就代表了人们的兴趣所在。我们在想,除了关键词统计外,是不是有更好的办法了解人们在关注什么呢?
另一方面要看互联网整个的发展,从Web1.0到2.0,2.0非常有代表性的产品类型就是博客了,真正大规模引入博客的概念是05年9月份的新浪开博,加上去年搜狐和网易三个门户一起把这个市场炒起来了。博客对整个互联网的影响使得其成为一个双面镜,以前是单向流通,现在有了新型媒体。所以说一方面通过我们网页搜索的日志,会发现用户的需求慢慢往这上面靠。另外是看到中国互联网和国际产品的整体发展趋势,这个具体就不讲了,大家自己可以总结到。所以博客搜索这个方向就是这么定下来的。
辞典的应用就更容易理解了,大家都说08年奥运来了,需要外语交流对吧?其实,英文一直是我们中国人对世界资源了解的一个小障碍。对于中国大部分普通的网民来说,这个还是有很大的障碍的。以至于现在你发现一些新产品新域名都用的拼音,对吧。因为中国大部分人还是认拼音的,英文是有障碍的。所以我们既然定位要做中文搜索引擎,那么中文用户最痛苦的是什么?答:中英文之间的沟壑。所以就是出于这么一个考虑去做海量词典。
如果你把变形金刚放到桌面词典里去搜,一定没有结果。而牛津朗文里的词是需要若干年在英文世界里的传播才会考虑收录进去。很多阶段性的词,比如说Orz——跪拜,比如说八荣八耻、和谐社会这样有中国特色的词就找不到。可是我们日常写总结、写报告,很多人又有这样的需要——我们甚至会发现搜索日志里有用户在把很多整句中文打进去,为什么?还是希望搜索引擎可以帮助他们解决这个问题啊!
而我们可以假设在互联网上,多次反复出现的距离最近的中英文对子可能就是正确的互为解释。这是05年的一个灵感,这个国内其他的厂商也在效仿,我们管这个技术叫做网络释义,是去年12月份最早推出来的。
记者:那在搜索的准确性上怎么判断?
胡琛:准确性是一个非常有趣的事情,实际上是一个几乎不可能的任务,就在一个输入框输如“荷塘”,可能是一个餐厅的名字,或者是散文的名字,或是一个曲牌的名字。那么用户想要的究竟是荷塘月色还是清华的荷塘餐厅呢?不同的用户对一个词的理解有时候会千奇百怪,但都希望搜索引擎出现的结果跟心里想象的是一模一样的。所以从准确性角度是很难去评估的,但是也会有一个相应的评判参照标准。比如说,可以用第一页结果的排序和满意度来看,就是说在第一页上用户能否找到他想要的东西。当然,这准确性判断不是这么简单,这只是其中一个维度的举例而已。
记者:博客搜索类似于现在的第三方点评?
胡琛:可能会有人觉得,像点评类网站。有一点,但也有不同的地方。
博客是一块自留地,可以在这里讲方方面面的意见。但对各类聚合垂直网来说,功能是比较准确和聚焦的,有评价吃饭的,有做书评的、影评的……你生活中还有360行,还有十万八千个各式各样的需求,都能有类似的网站吗?不一定。
比如1月份的时候我们的员工去泡温泉,那泡温泉这个概念去哪里找?有些需求就不一定是所有垂直网站都能满足的。垂直类还有一个问题就是需要注册,需要经常发贴……这些对某一个聚合网站来说,是对的,是需要这样维护用户粘度的;但从用户角度来讲,我需要找一个温泉,就去某一个温泉点评网注册和积累经验值吗?相比较而言呢,用博客搜索的门槛就特别低,用户所付出的成本就非常低。
博客搜索到底能帮到我们什么?总结一下,首先是衣、食、住、行这些生活经验的分享。其次是新闻事件的补充。你可以发现博客上有很多对新闻事件的感想甚至是现场的见证,特别是对媒体而言,有充实新闻角度和素材的作用。
最近我们做了07年博客春夏博客最热话题榜的统计,结果就很有意思。我们之前以为最热的也许是印花税或者某个选秀节目,但其实最高的,竟然是母亲节。
像这些信息的聚合和分析,就是我们可以通过技术实现的。这样的统计不仅有助用户了解整体信息,甚至可以辅助他们来做判断决策。
记者:那网易有道怎么样盈利呢?
胡琛:目前我们主要把精力集中在用户产品上。搜索引擎包含着一个三角关系,厂商、用户、还有广告主,我想这块的工作是未来考虑的事情。如果盈利的话,大家都想到了关键字竞价广告。至于是不是有一些新的模式,比如与其他网易产品的整合等等,今天先不谈了。
但是无论什么方式,前提是对用户体验的尊重,是肯定不允许破坏的,那个不是我们想做的事情。这也是我们创立这个品牌,给自己设定的规则。
记者:那你们今年有盈利的预期吗?
胡琛:我们现在唯一的挑战就是怎么让用户知道“有道”,多用我们的搜索产品,包括网页搜索和图片搜索这样的普及需求,以及新兴的博客搜索和词典。我们下半年全部的创新仍然围绕用户产品,以及怎样让用户认可我们的搜索。比如网页预览、网络释义这样的特色功能。
记者:网页预览和网页快照有什么区别?
胡琛:快照是当网页打不开的时候,可以用快照。但假设这个网页打开特别慢,或者有病毒和木马,假设网页打开以后你发现完全不是自己想要的,怎么办?我们的网页预览功能就像你玩牌时的杀手锏,不用把牌翻过来就可以透视看到。我们的界面上每个结果的左边有一个小框,鼠标放上去会在后台帮你把那个网页最核心的内容抽出来,这样你就知道网页大概内容,判断需不需要去了。
记者:那下半年采取什么样的措施让我们这些用户知道有道?让习惯百度、Google的用户真正认可你们?
胡琛:这肯定不是一蹴而就的,主要的想法是在他们最需要我们产品的时候能想到还有另外的选择。下半年可能会跟用户介绍很多从他们的角度出发的应用,博客搜索、海量辞典怎样帮到他们。
记者:有没有对so.163和有道的用户进行流量统计?
胡琛:从上线之后我们的最大的工作就是看原来的用户怎么用这个产品。
记者:那现在是什么样的情况?
胡琛:我们还觉得蛮高兴的,在so.163和有道这两个平台上都非常好。
记者:有没有大概的数字呢?比例呢?
胡琛:比例我没有做,目前两个平台的差距会比较大,这个也很正常。因为163是门户,假设你不知道163和有道之间的关系,请问一个诞生三天的网站它的流量是多少?肯定是有差距的。流量最近是月增长20%到30%吧,但没有翻倍,翻倍太夸张了,在我们没对有道做专门的宣传情况下,这样的增长我们是比较满意的。当然,后面就会加大力度了。
另外,辞典的老用户黏度特别高。这证明大家是非常喜欢我们这个产品创意的,而且说明它确实好用!
记者:网易的用户很多,有没有想过把他们引到有道去?像网易游戏、邮箱等成熟产品的用户。
胡琛:这个事情我想不能着急,而是要看用户的习惯和接受度。如果大家都呼唤这个事情,我们就会做得更快一些。如果对用户来讲是增值服务的,比如写邮件时你可能需要随手翻译,那么可能词典的出现就比较合适。但这样的集成还是要看用户需求,不能变成强制性的东西。这些优势资源我们会非常的珍惜,用很多的精力去想怎么结合,做到用户满意、我们开心。
记者:现在搜索普遍的讨论是隐私问题,还有博客抓取的问题,你们怎么考虑的?
胡琛:这个问题是非常关键的,讨论博客抓取问题分两层,一个是说我们跟BSP之间的抓取配合问题,第二个是用户跟BSP本身的权限设定。如果用户做了权限设定为不对大众公开,那我们肯定是尊重这个规矩,不会去抓取的——这个实现也很简单,因为从访问来讲,我们的抓取和陌生人是一样的,你如果不允许,就当然不访问了。
另外,如果是博客运营商,那么被博客搜索引擎收录会有助于流量的增加,如果文章质量较好,那么关注的人就越多。因此,我们和博客运营商的关系是互助互利的。我们和许多博客运营商已经进行了深度的合作,把内容的更新上从被动的骚扰变成主动告知,从呈现在搜索引擎的结果上、BSP耗费的带宽降低和运营效率上都会是件好事。
记者:涉及一些搜索结果的数据问题怎么考虑的?这方面也涉及到用户的隐私。
胡琛:你说是保存用户的搜索行为记录吧?目前来讲,我们的产品诞生的时间还不长,还没有到这个问题。总体来说,我们会遵循搜索引擎行业规范来确保不侵犯个人隐私;我们所需要做的,是基于用户个体行为的共同决定中发现一些现象,并改进调整我们的产品。
记者:有道对未来在搜索市场的地位有什么样的预期?
胡琛:要问自己的话,肯定是“有道,有信心!”了。
怎样叫预期呢?我希望我们用心做的产品用户会去尝试并喜欢,这是第一步吧。
我们希望一些特色功能可以使得用户的搜索行为变得更简单。自己用心做一些事情,预期希望这个目标能够被大家认可。