咸魚(yú)是中國(guó)較為知名且流行的二手交易平臺(tái)之一,各種商品應(yīng)有盡有,但分類(lèi)卻不夠詳盡,使得用戶(hù)找到想要的商品變得困難。因此,出現(xiàn)了一些幫助用戶(hù)整理咸魚(yú)龐大商品信息的軟件。那么,這些軟件是如何分類(lèi)咸魚(yú)的呢?
1.爬蟲(chóng)抓取
這類(lèi)軟件通過(guò)爬蟲(chóng)技術(shù),獲取咸魚(yú)的商品數(shù)據(jù),然后進(jìn)行整合分類(lèi)。他們通過(guò)一個(gè)龐大的數(shù)據(jù)庫(kù),搜索逐個(gè)商品名稱(chēng)、商品類(lèi)別等屬性標(biāo)簽,再按照各種分類(lèi)規(guī)則進(jìn)行整合,實(shí)現(xiàn)咸魚(yú)商品的分類(lèi)。
2.關(guān)鍵詞匹配
這類(lèi)軟件主要的實(shí)現(xiàn)方式是根據(jù)用戶(hù)指定的關(guān)鍵詞判斷商品分類(lèi)。在咸魚(yú)上,商品名稱(chēng)、商品描述、商品標(biāo)簽都包含有許多關(guān)鍵詞。這些軟件透過(guò)這些關(guān)鍵詞,將商品對(duì)應(yīng)到正確的分類(lèi)里。
3.人工審核
部分咸魚(yú)分類(lèi)軟件也會(huì)采用人工審核手段,例如社區(qū)審核、管理員審核等。由于此方法需要大量的人力,因此可實(shí)現(xiàn)分類(lèi)得更為細(xì)致,但操作成本較高。
4.機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)可以輕松地將數(shù)據(jù)劃分為彼此相似的類(lèi)別。因此,這類(lèi)軟件大多采用機(jī)器學(xué)習(xí)算法,對(duì)商品數(shù)據(jù)進(jìn)行分類(lèi)。最開(kāi)始,程序只能通過(guò)一個(gè)初始的分類(lèi),然后再通過(guò)數(shù)據(jù)訓(xùn)練,機(jī)器就會(huì)懂得如何對(duì)不同商品分類(lèi)。
5.分類(lèi)規(guī)則
分類(lèi)規(guī)則是指固定的分類(lèi)方式。咸魚(yú)分類(lèi)軟件通過(guò)預(yù)設(shè)的規(guī)則,對(duì)商品進(jìn)行分類(lèi)。例如按照品牌、材質(zhì)、顏色等規(guī)則分類(lèi)。由于商品非常繁多,因此分類(lèi)規(guī)則的分類(lèi)方式也會(huì)非常復(fù)雜。
6.采用集成的方式
除了以上提到的方法之外,也有部分咸魚(yú)分類(lèi)軟件采用多種方法組合,形成集成的方式進(jìn)行分類(lèi)。這種方法可以讓分類(lèi)上更加細(xì)致,避免失誤。
總之,咸魚(yú)分類(lèi)軟件運(yùn)作的方式有許多中,大多數(shù)軟件會(huì)采用多種方式組合實(shí)現(xiàn)分類(lèi)。通過(guò)分類(lèi),也能讓用戶(hù)更方便去瀏覽自己喜歡的商品。