售前咨詢:0311-8736 0077
售后服務(wù):0311-8736 0066
值班手機:189?3198?6878

百度框計算中的需求分析概述
發(fā)布時間:2011-07-07 點擊次數(shù):

 框計算的目標是為用戶提供基于搜索框的一站式搜索服務(wù)。舉例來說,當用戶在搜索框中輸入“非誠勿擾”時,系統(tǒng)就能明確該query有尋求電視節(jié)目視頻、電影視頻、查找影評、參與討論及查看相關(guān)新聞等需求,然后將這些不同的需求分配給最優(yōu)的內(nèi)容資源或應用進行處理,最終精準高效地將滿足這些需求的結(jié)果展現(xiàn)給用戶。圖1展示了“框”對query“非誠勿擾”的滿足情況。從上面的分析中,我們不難看出,框計算的第一步,就是識別出一個query具有哪些需求,而這正是需求分析要完成的任務(wù)。

  

\

 

  圖1 “非誠勿擾”的框計算結(jié)果

  需求分析是框計算的入口,因為只有分析出query的需求,才能更好地展現(xiàn)出相應的結(jié)果來滿足用戶的需求。因此對query的需求分析得越準確、覆蓋的query準多,用戶的滿意度則越大。需求分析是框計算中最重要也是難度最大的地方之一。

  識別query的需求,最容易想到的方法是查詞表。比如將所有的電影、電視劇名都事先收集起來,放到詞表中,只要用戶輸入該詞表中的詞,就能識別出一個query是否有尋找視頻的需求。這種方法的優(yōu)點是快,但缺點非常明顯:首先,這種方法只能將query劃分為2個維度,要么有視頻需求,要么沒有視頻需求。但很多視頻的名字,具有多方面的含義,在視頻上面只是其中一個微弱的含義,如果直接出視頻需求,則會極大地傷害用戶。比如,有一個廣告片的名字叫“百度一下”,這個廣告片可能60%以上的用戶都不熟悉,如果這60%以上的用戶輸入“百度一下”,直接給出一個名為“百度一下”的視頻觀看結(jié)果,則這60%以上的用戶會感覺非常困惑。其次,這種方法不能很好地滿足大部分用戶的需求。用戶在尋找視頻時,表述方法是多種多樣的,比如:士兵突擊全集、士兵突擊 高清、士兵突擊全集在線觀看等,這3個query都具有強烈的尋找視頻需求,但通過查表的方法,卻無法識別出該需求。再次,這種方法對電影、電視劇外的視頻需求無法滿足。有視頻需求的往往不止電影、電視劇,流行或新聞時效性的很多東西,都具有強烈的視頻需求。比如:西單女孩、中關(guān)村男孩、釣魚島撞船、朝韓炮擊等,多數(shù)用戶往往都有查看相關(guān)視頻的需求。最后,這種方法缺乏預測性,識別出的query數(shù)量有限。即對于詞表中的詞條,能夠識別出視頻需求,但詞表外詞條,無法識別出視頻需求。因此,如果詞表的規(guī)模為N,則最多只能識別出N個query具有視頻需求。

  從上面的分析中,我們可以總結(jié)出,一個好的需求分析方法,至少要滿足如下需求:1)具有很高的準確率以及召回率,即能在識別出90%以上query需求的同時,又能保證識別出來的需求,95%以上都是正確無誤的;2)具有良好的預測能力,即能夠準確地預測出未知query的需求;3)具有識別需求與解析字段功能,即在識別出query需求的同時,還能高效地從中解析出所需信息。

  下面是幾個典型的例子。通過這些例子,大家就能對需求分析要完成的任務(wù)有一些大體的了解了。

  在圖2中,需求分析需要完成的任務(wù)就是解析出query具有匯率轉(zhuǎn)換的需求,并解析出數(shù)額56.7,以及源貨幣為美元,目標貨幣為人民幣。

  


------------------------------------------------------------------------------------------
藍點網(wǎng)絡(luò)提供:
網(wǎng)站建設(shè)APP開發(fā)、微信小程序、400電話、軟件開發(fā)、服務(wù)器托管/租用等業(yè)務(wù)。
從2003年開始,我們始終堅守【網(wǎng)站建設(shè)】服務(wù),19年從未放棄?。?/span>


售前咨詢:0311-8736 0077 
 

售后服務(wù):0311-8736 0066 
 
值班手機:
189 3198 6878

專注網(wǎng)站建設(shè)19年,服務(wù)客戶超7000家! 售前咨詢:0311-87360077 售后服務(wù):0311-87360066 值班手機:189 3198 6878 早8:00—晚22:00(周一至周日) 在線咨詢