百度谷歌都作惡,但到底哪家技術更厲害?
創意、流程、執行缺一不可
DEVELOPMENT COMES FROM SERVICE
百度谷歌都作惡,但到底哪家技術更厲害?
發布時間:2018-08-19 關鍵詞:百度谷歌 點擊量:

AI 前線導讀: 前幾日,人民日報在推特和 Facebook 上發布歡迎谷歌回歸的消息,并強調前提是要遵守中國的法律。耐人尋味的是,這兩個平臺上的消息沒多久就全部刪除。

根據外媒 The Intercept 的消息,谷歌搜索極有可能是通過與中國企業“合作”的方式回歸中國。據知情人士透露,谷歌內部已經完成了一個可以通過中國政府審查的“閹割版”搜索引擎,內部項目代號“Dragonfly”。

雖然不知道這次谷歌回歸是否能成真,但在隨之而來的谷歌百度之爭中,大部分網友已經出現了對谷歌“一邊倒”的支持。誠然,百度一直以來故事與“事故”頗多而飽受批評,但作為很多人心中的“白月光”,谷歌其實也做過不少糟心事。

 

01

都在罵百度,那是你們忘了谷歌的惡

 

如果你是網絡老鳥,相信你還記得谷歌退出中國前給中國網民留下深刻不良印象的那件事兒。

 

簡單回顧一下:2010 年初,有用戶在谷歌自定義界面上的“搜索熱詞榜”上,看到了排名第一的熱詞竟然是“Chinese people eating babies”,意為:中國人吃嬰兒。

 

現在大家可能會會心一笑:嗨,不就是個梗嗎。但是在當時,這件事可是引發了軒然大波。只要搜索“中國人”就會出現“吃嬰兒”的頭條消息,仿佛是個中國人就會吃嬰兒一樣,簡直可以認為是惡意抹黑了。美籍華人維權社團從 2009 年開始就這一事件投訴谷歌,一直到 2016 年,谷歌方面才回復律師,詞條得以刪除。

 

還記得谷歌曾經的口號是“不作惡”,這樣看來,種族歧視似乎不在谷歌的“作惡辭典”之中?

 

百度在幾年前因“魏則西事件”受到了網友的強烈譴責與抵制,還因此牽出一堆違規經營的“莆田系”醫院,之后百度承諾要對搜索引擎進行整改,但仍然有眼尖的網友發現搜索的結果中“偶爾”會冒出一些莫名其妙的廣告。

 

有人會說百度是自討苦吃,觸碰了危險的底線:醫療,哪知道谷歌又何嘗不是在醫藥行業賺到過盆滿缽滿。

 

早在 2003 年,谷歌就因為網絡藥品廣告問題接到美國國會三個不同委員會的調查質詢。2004 年 7 月,就在谷歌上市前一個月,由于美國參議員計劃通過兩項監管網絡藥店的法案,谷歌負責全球網絡廣告的副總裁謝莉爾·桑德伯格 (SherylSandberg) 還趕赴首都華盛頓就這一問題作證。

 

但隨后發生的系列負面事件顯示,盡管谷歌高層早就意識 到非法藥品廣告的問題,但這家全球**搜索引擎依然會不時卷入負面消息。

 

2009 年爆出的大衛·惠特克 (David Whitaker) 事件則讓谷歌在這一問題上首次形象掃地,也讓谷歌真正意識到虛假網絡廣告的危害以及搜索引擎對公眾的責任感。同樣在那一年,百度也被曝出過虛假醫療廣告事件。

 

AI 前線注:2006 年,因為金融欺詐等罪名數次入獄的惠特克從美國偷渡到墨西哥,做起了開網店賣假藥的生意。惠特克把純凈水貼上類固醇的標簽,通過谷歌 AdWords 打廣告,以每瓶 1000 美元的價格從墨西哥賣給美國顧客。2008 年,惠特克被遣送回美國。他對美國司法部供述稱谷歌的客服在明知他的“藥品”不符合美國法律的情況下,主動指導他避開谷歌的審查機制,在網上投放假藥廣告。

 

 

2011 年 8 月,就在谷歌宣布收購摩托羅拉移動的那個月,谷歌與美國司法部就非法網絡藥店廣告一事達成和解,谷歌為此支付了當時企業高額的企業罰金——5 億美元。

 

經歷過一些事情,才能意識到什么是正確的路線,個人成長如此,對一家公司來說更是這樣。兩家搜索引擎在各種各樣的風浪中不斷前進著,雖然偶有互相超越,但總體態勢是向上的。可是,對于用戶來說,這些負面事件深深地刻進了他們的心里,這樣的搜索引擎,有些人表示再也不敢相信了。

 

02

搜索技術哪家好?看**怎么說

 

百度與谷歌都曾作過“惡”,人們似乎很容易用這些事情作為評判的標桿,按你胃(anyway),不管你想從什么角度來評價這兩家公司的好壞,那是你的自由,我們的任務是從技術層面上來告訴各位讀者如何來評判他們的區別。

 

2006 年,有人做過這樣的比較。

 

 

上圖是 2007 年有人做過的百度和谷歌用戶眼球追蹤的對比圖。簡單來說,圖上綠色的點就是用戶眼球瀏覽的記錄,從上圖能夠看出:百度用戶雖然很高的幾率下能夠在第一條結果就得到自己想要的答案,但是瀏覽整個頁面的概率遠高于谷歌。

 

十年前的比較,似乎谷歌在搜索結果的精準度上略勝百度一籌,但是十年過去了,事情還是這樣的嗎?

 

近幾日,一組百度和谷歌的搜索結果對比圖又火了。

 

 

同樣的詞匯,在谷歌搜圖上找到的就是雪白的場景或者顏色,而百度出現的確實各種不可描述(已打碼),雖然經過 AI 前線編輯的實測發現百度并沒有出現上述情況,不知道是因為“求生欲”還是其他原因。

 

但是,僅僅因為同一詞語搜出不同結果就判定搜索引擎的好壞未免太過武斷。AI 前線因此采訪到了一些技術**,請他們來幫忙解答一下:怎樣評價搜索引擎的好壞?

 

微博計算機大 V龍星鏢局 告訴我們:從技術角度來講,有一系列專業的做法去比較兩個不同搜索產品的各方面指標,如召回率,準確率,多樣性,停留時間等等,業界也有一些第三方機構、學術研究機構會做專業的評測,可以參考。

 

但要注意的是,搜索結果質量的評測是個值得好好討論的問題:一方面抽樣的 query 是否足夠多,代表了大部分用戶的需求;另一方面,相關性并不完全是一個可以說得清楚的標準,而且可能部分是因人而異的標準。如果有機構想從事評測這方面的工作,個人覺得利用“眾包”方式來解決以上兩個問題是值得嘗試的。

 

對于谷歌和百度兩家搜索引擎的排序系統,他認為從公開可見的技術方案來看差異不大,但也不排除有些核心機密沒有公開出來。但他認為 技術方案上的大差異不足以造成兩家明顯的不同,更多是產品、運營甚至公司文化上的差異。

 

他進而補充道:“另外我特別想說的一點是,用戶使用行為對搜索排序影響非常大,技術方案的先進性更多體現在猜用戶的意圖,擬合用戶的習慣。

 

據我了解,在中國,百度和谷歌的核心用戶是有天然差異的,這就可能造成即使同樣的技術方案,排出來的東西也是有差異的。”

 

而接受 AI 前線采訪的另一位來自達觀數據的**則表示:搜索引擎受語言種類的影響很大,谷歌作為覆蓋全球各類語種的搜索引擎,在索引庫的大小方面有天然的優勢,因此在搜索英文或其它非中文內容時效果比百度明顯領先。在中文搜索領域,百度和谷歌的系統對文字語義理解的方式也各不相同,因此結果也一定存在差異。

 

另外,達觀技術**認為,需要特別指出的是:搜索引擎給出的結果,是由兩部分合并組成的,一部分是從網頁庫中搜出的自然結果,另一部分是從廣告庫中匹配出的廣告。

 

搜索引擎會把這兩部分的結果合并在一起后終呈現給用戶。搜索引擎的主要利潤來自后者,因此廣告匹配技術的取舍非常重要,需要在保護好用戶體驗和贏得商業收入方面盡可能做好平衡。百度之前引起很大爭議的地方主要也是在這里。理想的方式是通過更精準優質的廣告匹配技術,讓用戶真正認可搜出的結果,幫客戶找到所需的信息。

 

有不少人認為:在中國環境和中文條件下,中國人研發的本土化搜索引擎或許更好用。對于這個觀點,達觀數據的**認為:中文自然語言理解有很多獨特的地方,中國人當然應該更懂怎樣讓計算機系統更好地解讀中文背后的含義,也更理解中文網民的搜索意圖。另外中國網民巨大的用量和積累的海量行為數據對訓練出更優質的搜索系統也大有裨益。

 

他補充道:“雖然我們歡迎國際巨頭積極參與市場競爭,促進行業健康發展,但也同樣期待核心技術能掌握在中國人手上。”

 

后,我們再回過頭來聊聊搜索結果的問題。

 

上文中,我們提到:不同的用戶搜索出來的結果可能不同。對此,達觀數據的**告訴我們:根據用戶的過往瀏覽行為實現“千人千面”的個性化結果是幾乎所有搜索引擎都在使用的技術。

 

龍星鏢局則進一步告訴我們:目前 各家搜索引擎都不同程度地考慮了個性化因素,搜出來的結果是受非個性化和個性化兩方面共同作用的。在確定性 query 上,個性化策略起的作用有限。但不確定性 query 上,個性化策略可能造成肉眼可見的差異。但無論如何,做不做個性化,個性化因素影響多少都不關鍵,關鍵的還是為用戶服務,找出來用戶更想要的內容。

 

到此我們簡單總結一下上述大 V **們的發言:

 

由于搜索引擎的個性化技術,導致了搜索結果的差異;

谷歌和百度各有各的技術專長,百度在中文搜索更勝一籌,谷歌則強在英文結果;

如何評價搜索引擎的好壞是很復雜的問題,僅憑搜索結果來下結論不是很嚴謹。

 

03

就算回來,谷歌還會是老大嗎?

 

8 月 6 日,人民日報在推特、Facebook 等海外社交平臺上發文,歡迎谷歌回歸中國,但是前提是要遵守中國的法律。隨后還附上了一篇名為《穩定是中國互聯網開放的前提》的文章鏈接。

 

文章提到:谷歌當初離開中國的選擇是一個失誤,這八年來中國互聯網的發展十分迅猛,我們十分歡迎谷歌回歸,但守法是前提。

 

正如這篇文章提到的,在谷歌離開中國大陸的這 8 年時間里,除了互聯網,谷歌的老對手百度也在不斷發展,李彥宏對此事也在朋友圈中進行了回復:2010 年,百度在國內的市場份額已占到 70%。

 

而現在,2018 年,百度所占的市場份額應該更高了。

 

從搜索引擎的使用人群來看,熱衷于使用谷歌的大都是技術從業者,或者是學生群體。這些人會使用一些“科學上網”工具,同時由于谷歌搜索結果里英文資料比較豐富,所以這一群體偏好谷歌更多。

 

圖片內容來自微博

 

通過對一些技術人的采訪,我們總結出了技術人對百度和谷歌的三種態度:

 

1 兩款搜索引擎當年都用過,百度當時確實對中文搜索體驗比谷歌好很多,一個“你可能還要找” 功能就已經強出太多了,這么多年過去了,百度的優勢只會更大。

 

2 不用非此即彼,兩個一起用沒有一點毛病,事實上現在我也是同時用百度/必應/谷歌。現在喊谷歌喊得兇的未必將來是真用谷歌的。

 

3 對于學術狗來說,谷歌回歸是大好事。

 

其實,對于國內的非研究或學術的一般用戶來說,百度其實也是夠用的,查一些中文資料,百度完全沒有問題。而這一類人群占到了百度用戶的大多數,他們當中有的或許完全沒用過甚至不知道其它搜索引擎的存在,這一類群體也給百度帶來了不小的市場。

 

但是,對于百度來說,谷歌這個對手的武器可不止搜索引擎這一項。

 

谷歌翻譯曾經被人詬病為“靈魂翻譯”,結果總是驢唇不對馬嘴,但是加入神經網絡的谷歌翻譯現在可謂是智能翻譯界的標桿產品,短篇文章翻譯幾乎不用人工校對。

 

此外,谷歌知名的深度學習框架 TensorFlow 已經占有了巨大的市場份額,百度出品的 paddlepaddle 想要趕超似乎有些困難。

 

與此同時,李飛飛、Jeff Dean 頻繁來到中國,在深圳、北京等地開展宣講會,與清華等知名高校的學生接觸,似乎也在不斷放出信號,人才資源的爭奪對百度來說也是一份壓力。

 

不過,對于百度來說,這份壓力或許是一件好事兒,大 V 龍星鏢局認為:首先肯定是歡迎谷歌回歸中國,服務中國用戶。不過,目前我只看到要回歸的消息,但具體什么時候回歸,哪些產品回歸,以什么樣的方式回歸都還沒有定論。但我始終認為拋開政治因素,谷歌遲早會重新撿起中國市場的,因為這里的商業利益太大了。

 

能否威脅到百度的地位不太好說,這個關鍵點要看能多大程度上奪得中國用戶的芳心。如果只是回歸中文搜索的話,個人認為比較難。百度的強大不止在于搜索,更在于圍繞搜索建立的周邊生態,如貼吧、知道、地圖、音樂、視頻等都是很好的護城河。

 

達觀數據的**也表示:從用戶的角度來看,一個存在競爭的市場是健康和有益的,也能夠推動整個搜索行業的技術和體驗以更快速度前進。谷歌如果回歸,一定會在短時間內搶占一塊可觀的市場份額,長期來看,則會起到“鯰魚效應”,擾動中國搜索市場往更健康的方向發展。

 

百度曾經有過不好,但是作為國內用戶,雖然嘴上說著一萬個不好用,但是心里還是希望它能更好,只是這樣的希望真的經不起三番五次的消耗,問題當然會出現,但正視問題,并積極處理問題才是關鍵。

 

而對于谷歌,雖然好用,但真的回歸之后,我們迎來的是否會是一個經過修剪、“閹割”的,不完整的谷歌呢?答案幾乎是必然的。

 

后,用達觀數據的**在采訪中的一段話作結:

 

搜索廣告本身并沒有錯,因為如果廣告內容就是能滿足用戶的需求,那是兩全其美的好事情。但是如果為了追求更高的廣告收益,而放松對所出廣告結果的管控,通過虛假方式騙取用戶對廣告的點擊,這就傷害用戶對搜索引擎的信任了。我們都希望掌握著巨大流量的搜索引擎,能扮演好到客觀公正的“知識領路人”的角色,而不是利益驅動的帶路黨。

猜你喜歡

CONTACT US
  • 咨詢熱線:0517-89892800 / 138-6167-2014
  • 公司地址:淮安市清江浦區淮安軟件園1號樓506室
  • 電子郵箱:hsw@zhechen.net
掃一掃二維碼關注我們
老神马马圈免费