搜索到的答案,每一條都會(huì)有用以綠、黃、紅三種顏色顯示可信度的高低;在答案的右側(cè)提供了幾條鏈接,用鼠標(biāo)劃過(guò),還能看到答案的來(lái)源……你可以看到,這個(gè)域名為“magi.com”的搜索頁(yè)面顯示,與主流搜索引擎全然相反:答案在正下方,鏈接則跑到了右邊。這是Magi和主流搜索引擎最大的區(qū)別所在:鏈接對(duì)于它不是結(jié)果,答案才是。
Magi.com
實(shí)際上,Magi并非搜索引擎,而是一個(gè)基于機(jī)器學(xué)習(xí)的知識(shí)引擎,能夠從開(kāi)放領(lǐng)域的純文本當(dāng)中提取知識(shí),并讓其可解析、檢索和溯源?!拔覀兊慕Y(jié)果的摘要比一般的搜索引擎都長(zhǎng),是的,我們是故意為之。這足以證明我們的結(jié)果不可能來(lái)自其他搜索引擎,”Magi創(chuàng)始人季逸超在官網(wǎng)上寫(xiě)道。
Magi創(chuàng)始團(tuán)隊(duì)Peak Labs,季逸超(中間)
和百度一樣,Magi來(lái)自中國(guó)團(tuán)隊(duì)Peak Labs,除自主開(kāi)發(fā)的全網(wǎng)規(guī)模搜索引擎以外,Peak Labs還開(kāi)發(fā)了基于注意力機(jī)制的神經(jīng)信息提取系統(tǒng),不依賴(lài)無(wú)界面瀏覽器的分布式抓取系統(tǒng)(爬蟲(chóng)程序MagiBot),以及支持混合處理170多種語(yǔ)言的自然語(yǔ)言管道。這四者結(jié)合在一起,才是Magi系統(tǒng)的全貌。
Magi輸入“知未科技”
magi.com會(huì)根據(jù)用戶(hù)輸入問(wèn)題、關(guān)鍵詞和表達(dá)式的不同,來(lái)以不同的方式呈現(xiàn)答案:比如,知未君輸入“金銀花和忍冬”,Magi系統(tǒng)會(huì)發(fā)現(xiàn)這兩個(gè)關(guān)鍵詞其實(shí)是同一件事物,就會(huì)以“斷言”的形式給出答案,隨后清晰地給出這種植物的文本描述、屬性,再給出與其緊密相關(guān)的信息。
Magi輸入“金銀花和忍冬”
百度輸入“金銀花和忍冬”
而同樣的關(guān)鍵詞,百度則更傾向于綜合網(wǎng)友的提問(wèn),把可能想知道的話題放在前面,其后是與金銀花相關(guān)的常識(shí),右邊則是大家所熟悉的相關(guān)事物欄目,通常會(huì)放上圖片和名稱(chēng),以此挖掘用戶(hù)潛在的更多興趣點(diǎn)。相比之下,Magi就像個(gè)認(rèn)真的學(xué)霸,先糾正你的疑惑,然后告訴你基本信息,再放出幾條知識(shí)點(diǎn)可供選擇。
Magi輸入“互聯(lián)網(wǎng)公司”
百度輸入“互聯(lián)網(wǎng)公司”
再比如,知未君輸入“互聯(lián)網(wǎng)公司”,Magi系統(tǒng)會(huì)把它知道的所有互聯(lián)網(wǎng)公司,以“集合”的方式列在答案里,右側(cè)則展現(xiàn)了更深層的新聞評(píng)論。而百度更傾向于把用戶(hù)感興趣的點(diǎn)羅列出來(lái),提供篩選。
Magi知識(shí)圖譜
當(dāng)然,相比在引擎界發(fā)展多年的百度,Magi還有很多改進(jìn)空間。Peak Labs在官網(wǎng)指出,目前Magi技術(shù)還沒(méi)有完全成熟,很多可以在主流搜索引擎中輕易找到的答案,magi.com給不出來(lái)(通常是因?yàn)樗€沒(méi)有學(xué)到)。
Peak Labs希望,未來(lái)的Magi系統(tǒng)能夠成為“知識(shí)領(lǐng)域的ImageNet”。它已經(jīng)展示出的開(kāi)放領(lǐng)域信息提取能力,能應(yīng)用于企業(yè)客戶(hù)所在的細(xì)分領(lǐng)域之中,逐漸發(fā)展為更龐大的信息抽取系統(tǒng),讓每一家企業(yè)都能打造屬于自己的知識(shí)圖譜。
聯(lián)系客服